DeepMind | 视觉语言模型作为成功检测器

NLP CV 论文

苦行僧 2023-03-14 11:52 分享

以下文章来源于arxiv.org

【推荐理由】这项研究中着重于开发利用大型预训练的视觉语言模型（如Flamingo）和人类奖励注释的强大成功检测器。

标题：Vision-Language Models as Success Detectors

作者： Yuqing Du, Ksenia Konyushkova, Misha Denil, Akhil Raju, Jessica Landon, Felix Hill, Nando de Freitas and Serkan Cabi

检测成功行为对于训练智能代理至关重要。因此，通用的奖励模型是代理能够学习推广其行为的先决条件。在这项研究中，本文着重于开发利用大型预训练的视觉语言模型（Flamingo，Alayrac等人（2022））和人类奖励注释的强大成功检测器。具体而言，我们将成功检测视为一个视觉问答（VQA）问题，称为SuccessVQA。本文在三个大不相同的领域中研究成功检测：（i）在模拟家庭中进行交互语言条件代理，（ii）现实世界中的机器人操作，以及（iii）“野外”人类自我中心视频。本文研究了基于Flamingo的成功检测模型在前两个领域中不可见语言和视觉变化的推广属性，并发现所提出的方法能够在具有任何变化的分布外测试场景中优于专门的奖励模型。在“野外”人类视频的最后一个领域中，展示了对未见过的真实视频进行成功检测是一个更具挑战性的推广任务，需要未来的工作。作者希望他们的初步结果能够鼓励在现实世界的成功检测和奖励建模方面的进一步研究。

论文链接： https://arxiv.org/pdf/2303.07280.pdf

点赞收藏评论分享到Link

沙发等你来抢

去评论

天下网标王泊头网站优化报价定制版网站优化潮州网站优化有哪些道里网站排名优化网站结构对于优化的影响秦皇岛商城网站优化服务优化网站保举火13星贺州市网站seo优化排名优化的让我重新做网站装修公司网站优化网站没有pc端怎么优化网站关键词优化是叫啥贵州三沙网站seo优化方案重庆市网站优化的企业泉州网站优化流程优化网站推广黔南网站优化报价淄博网站优化团队沙井网站优化哪家强闵行专业网站优化公司本地网站优化公司排名网站怎么优化关键词当涂县网站seo优化排名如何优化英文网站扬中网站优化价格新站seo网站优化工具南京网站推广优化怎么联系济南网站关键词优化衡阳网站搜索优化方案苏州标准网站优化信息中心香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户 315晚会后胖东来又人满为患了高校汽车撞人致3死16伤司机系学生张家界的山上“长”满了韩国人？张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲 “重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后原水城县长再被查凯特王妃现身！外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人多人受伤

天下网标王 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化