visAware
面向 NVDA 用户的视觉辅助插件,帮助你理解屏幕截图、图片和界面内容。
当前状态
- 项目处于早期测试阶段。
- 官网暂不提供插件包下载。
- 源码和问题反馈在 GitHub 维护。
- 欢迎通过留言页提供使用场景和反馈。
它能做什么
图片描述
为图片、聊天截图和网页图片生成简洁说明。
屏幕理解
对当前窗口或全屏截图做整体描述,帮助判断界面内容。
OCR 与界面文字
识别截图里的文字、按钮、标题和可见提示。
追问细节
在简短描述之后继续追问布局、颜色、位置或操作目标。
适合谁
visAware 适合需要通过屏幕阅读器理解视觉内容的用户,也适合希望测试无障碍体验的开发者、文档作者和支持人员。
典型场景
- 想知道别人发来的图片里有什么。
- 需要理解软件界面截图。
- 希望快速检查视觉内容是否能被解释。
- 想把云端或本地视觉模型接入 NVDA 工作流。
原则
visAware 优先考虑清晰、稳定、可控的输出。官网也会尽量保持可访问、轻量、少干扰。