使用场景

理解图片

在聊天、网页、文档或应用中遇到图片时,使用 visAware 获取简洁描述。

读取界面信息

对全屏截图或当前窗口进行识别,帮助判断界面结构、按钮位置和可见文本。

追问细节

当简短描述不够时,可以继续追问,例如要求说明布局、颜色、位置、文字内容或操作目标。

开发和测试

开发者可以用它辅助检查界面截图,快速发现视觉内容是否对屏幕阅读器用户可解释。