应用介绍
VisionClaw 是一个为 Meta Ray‑Ban 智能眼镜打造的实时 AI 助手应用,结合 Gemini Live 的语音与视觉能力,让眼镜“看到你看到的、听到你说的”,并通过 OpenClaw 执行真实世界任务,例如发消息、创建提醒、搜索信息或控制智能设备。它也支持在没有眼镜时使用手机摄像头进行同样的实时视觉对话。
核心特性与功能:
实时语音与视觉理解 通过 Gemini Live API 实现连续语音对话,并以约 1fps 的频率发送眼镜或手机摄像头画面进行视觉分析。
可穿戴设备集成 与 Meta Ray‑Ban 智能眼镜深度集成,支持摄像头画面流、麦克风输入和触控触发。
Agent 工具调用能力 可选接入 OpenClaw,使 AI 能执行真实任务,如发送消息、管理清单、搜索网页或控制智能家居。
跨平台支持 提供 iOS 与 Android 两套完整示例工程,支持手机模式与眼镜模式。
实时音频处理 双向音频流:手机/眼镜麦克风输入 → Gemini → AI 语音输出播放。
WebRTC 实时直播 可将眼镜视角实时推流到浏览器,用于远程协作或共享视角。
本地可配置性 支持在应用内配置 Gemini API Key、OpenClaw Gateway 地址、WebRTC 设置等。

