新方法帮助机器人导航使用语言基输入而不是昂贵的视觉数据-人人评车网

当前位置: 人人评车网 > 热点 新方法帮助机器人导航使用语言基输入而不是昂贵的视觉数据 时间：2024-06-18 11:09来源：盖世汽车阅读量：19334 盖世汽车讯有一天，人们可能希望自己的家用机器人把一大堆脏衣服搬到楼下，并把它们放进地下室最左边角落的洗衣机。机器人需要将指令与它的视觉观察结合起来，以确定它应该采取什么步骤来完成这项任务。 对于人工智能本体来说，这说起来容易做起来难。当前方法通常使用多个人工创建的机器学习模型来处理各部分任务，基于大量的人力和专业知识而构建。这些方法通过视觉表征(visual representation)来直接做出导航决策，需要大量的视觉数据来进行训练，而这些数据通常很难获得。 据外媒报道，为了克服这些挑战，麻省理工学院和MIT-IBM Watson AI实验室的研究人员设计了一种导航方法，将视觉表征转换为语言片段，然后将其输入大语言模型中，该模型可以实现多步导航任务中的所有部分。 免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。 推荐文章 盖世汽车2022第三届混动技术 引领高端公商务出行新风潮——宇 韩国充电设备企业Chaevi进

精选推荐

热文排行

网站地图 | RSS订阅 | 免责声明 | 联系我们

声明：网站内容来自于互联网或网友提供，仅代表个人观点，并不代表本站同意其观点，本站不承担由此引起的法律责任

邮箱：linghunposhui@163.com