visAware

面向 NVDA 用户的视觉辅助插件,帮助你理解屏幕截图、图片和界面内容。

查看使用场景 · 查看开源项目 · 留言联系

当前状态

  • 项目处于早期测试阶段。
  • 官网暂不提供插件包下载。
  • 源码和问题反馈在 GitHub 维护。
  • 欢迎通过留言页提供使用场景和反馈。

它能做什么

图片描述

为图片、聊天截图和网页图片生成简洁说明。

屏幕理解

对当前窗口或全屏截图做整体描述,帮助判断界面内容。

OCR 与界面文字

识别截图里的文字、按钮、标题和可见提示。

追问细节

在简短描述之后继续追问布局、颜色、位置或操作目标。

适合谁

visAware 适合需要通过屏幕阅读器理解视觉内容的用户,也适合希望测试无障碍体验的开发者、文档作者和支持人员。

典型场景

  • 想知道别人发来的图片里有什么。
  • 需要理解软件界面截图。
  • 希望快速检查视觉内容是否能被解释。
  • 想把云端或本地视觉模型接入 NVDA 工作流。

原则

visAware 优先考虑清晰、稳定、可控的输出。官网也会尽量保持可访问、轻量、少干扰。