MM-Navigator,一种基于GPT-4V的智能代理

86次阅读
没有评论

MM-Navigator,一种基于GPT-4V的智能代理

MM-Navigator,一种基于GPT-4V的智能代理,用于智能手机用户界面(GUI)导航任务。

MM-Navigator可以像人类用户一样与智能手机屏幕交互,并根据给定的指令确定后续操作。
该系统在生成合理的行动描述方面达到了91%的准确率,在iOS上执行单步指令的正确行动方面达到了75%的准确率,超越了以前的GUI导航器。

正文完
 
Windows12系统管理员
版权声明:本站原创文章,由 Windows12系统管理员 2023-11-20发表,共计191字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)