近年来,随着人工智能技术的迅速发展,越来越多领域对于人工智能技术的要求也在逐渐升级。传统的问答任务已不足以满足现实需求,于是“体验式问答”成为机器智能领域新的热点。为了测试AI在相关领域的能力,Meta AI 研究人员发布了一个新的开源基准数据集——OpenEQA。
OpenEQA数据集的主要目的是帮助对AI的体验式问答的技能进行全面测试。该数据集包含了超过1,600个关于180多个真实环境的问题。这些问题测试AI在对象和属性识别、空间和功能推理以及常识知识等技能方面的能力,从而更好地理解现实世界并回答自然语言问题。
以往的问答任务往往只针对具体的问题和答案,无法真正涉足现实世界。而“体验式问答”是指在足够了解环境的情况下,以自然语言回答关于环境的问题。这需要AI能够感知和与世界互动,与人类进行自然交流,并利用知识帮助人们日常生活。OpenEQA数据集正是针对这一目标而创建的。
研究人员在短期内看到了“体验智能”在两个主要应用方面的可能性。一种是嵌入增强现实眼镜或头戴式显示器中的人工智能助手,可以利用视频和其他传感器数据,实际上为用户提供了一种记忆力,能够回答诸如 “我把钥匙放在哪里了?" 之类的问题。另一种是移动机器人,可以自主探索环境以获取信息,例如搜索家中以回答 “我还有咖啡吗?" 这样的问题。
为了创建OpenEQA数据集,Meta AI研究人员首先收集了真实环境的视频数据和3D扫描数据。然后,他们向人类展示了这些视频,并要求他们提出他们可能想要问一个能够访问这些视觉数据的人工智能助手的问题。最终产生的1,636个问题全面测试了各种感知和推理能力。为了衡量人工智能代理的性能,研究人员使用大型语言模型自动评分,衡量人工智能生成的答案与人类答案的相似程度。
OpenEQA数据集的发布,为体验式问答任务提供了更加全面的方案与标准。同时,该数据集的创建也促进了人工智能与现实世界的深度融合。未来,这种技术将带来方便快捷的人工智能助手和能够自主探索环境的机器人,为我们的生活带来更多的便利与乐趣。
如果您对OpenEQA数据集感兴趣,欢迎发表评论分享您的看法和经验。我们还希望您能够关注我们的账号,以获取更多有关人工智能的实时资讯。
同时,如果您喜欢本文,也希望您能够点赞支持。感谢您的观看!