环球精选！人工智能探索将焦点从奖励转移到好奇心

您当前的位：首页 > 企业数据 > > 内容页

环球精选！人工智能探索将焦点从奖励转移到好奇心

来源：城市网 2023-06-23 08:18:16

由加利福尼亚大学伯克利分校(arXiv)的一组研究人员编写了一篇题为“通过自我监督预测的好奇心驱动探索”的论文。

不要被标题所吓倒，因为本文从习惯性的强化学习中探讨了他们进入人工智能的迷人之路。

本月早些时候发表的合着作者Pulkit Agrawal的视频摘要是他们的机器学习国际会议论文摘要。

(相关资料图)

他们一直在教电脑好奇。正如未来主义所说的那样，“研究人员成功地给了人工智能植入物。”

但作为作者在视频中提到的“内在好奇心”模型。他们在说什么?

麻省理工学院技术评论中的 Knight 是否会这样说。该模型由加州大学伯克利分校的研究人员开发，“即使在没有强反馈信号的情况下，也能使他们的学习算法工作。”

作者在GitHub上进一步解释。“当环境中的外部奖励稀少时，想法是培养具有内在好奇心动机(ICM)的代理人。令人惊讶的是，即使环境中没有可用的奖励，您也可以使用ICM，在这种情况下，代理人只能学习探索好奇心："RL没有奖励"。“

未来主义说：“这可能是人工智能与现实应用之间的桥梁。” Tom Ward说：“大多数现有的AI都是使用"强化学习"训练的 - 当他们执行一项帮助他们达到目标或完成一项功能的任务时，他们会得到奖励。”

Will Knight说，这被认为是一种有益的方法，因为它使“机器能够完成难以在代码中定义的东西”。

与此同时，奈特表示，它具有局限性。“Agrawal指出，学习任务往往需要大量的培训。”

该论文的作者是来自加州大学伯克利分校的Deepak Pathak，Pulkit Agrawal，Alexei Efros，Trevor Darrell。他们在视频中强调了这样一个事实：在现实世界中，奖励稀少或缺席。

“在许多现实世界的情景中，代理人的外在奖励极其稀疏，或完全缺席。在这种情况下，好奇心可以作为一种内在的奖励信号，使代理人能够探索其环境并学习以后可能有用的技能。它的生命。“

例如，他们的研究中的代理人学会了如何在没有任何外在奖励的情况下沿着走廊移动。他们提出的方法在两个环境中进行了评估：VizDoom和Super Mario Bros.

结果?Knight报道说，在这两款游戏中，“使用人工好奇心使学习过程更加高效。”

“虽然没有充满好奇心 "升级"的人工智能反复撞击墙壁，但好奇的人工智能探索了它的环境，以便学习更多，”沃德在未来主义中说。

为什么这很重要?如果他们确实让机器变得好奇，那么这会带来更好的复杂任务吗?观察这些研究人员的进一步工作将会很有趣。麻省理工学院技术评论说：“加州大学伯克利分校的团队热衷于在机器人身上进行测试，这些机器人使用强化学习来研究如何抓住尴尬的物体。”

本文由用户上传，如有侵权请联系删除！

关键词：

推荐阅读更多

环球精选！人工智能探索将焦点从奖励转移到好奇心

由加利福尼亚大学伯克利分校(arXiv)的一组研究人员编写了一篇题为“通

城市网 2023-06-23

黄子佼抢救成功已出院！将要去看心理医生，81岁父亲宣布断绝关系全球快播

黄子佼抢救成功已出院！将要去看心理医生，81岁父亲宣布断绝关系,出院,

可可灵妹妹 2023-06-23

粽情端午，深圳市宝安区文化馆举办欢乐体验活动

岁至端午，粽香袅袅。6月22日，端午佳节这一天，深圳市宝安区文化馆举

羊城派 2023-06-23

【世界热闻】大眼瞪小眼直播（大眼瞪小眼）

眼瞪小眼直播，大眼瞪小眼这个问题很多朋友还不知道，来为大家解答以上

互联网 2023-06-23

Scotto：格兰特预计向开拓者要价5年1.5亿美元的合同

Scotto：格兰特预计向开拓者要价5年1 5亿美元的合同,美记,名记,格兰特,

直播吧 2023-06-23

猪胰子是什么东西_猪胰子-天天聚看点

1、说起这黑色猪胰子，可以同白家馆子的肉丸子相媲美。2、在整整三十多

互联网 2023-06-22

x 广告

业界动态更多

宝安区发布重大空间发展战略打造深港先进制造业合作区

美的集团回应裁员传闻：暂缓非经营性投资未来三年是寒冬

他们，向“疫”而行！让青春在战“疫”中闪光

千年遗迹成“告白墙”？提高游客保护意识很重要

看到残缺的佛像，这位年轻人用代码干了件大事

行业数据更多

财务数据更多

88岁奶奶爱玩呼啦圈：最多能转70分钟肚子小了很多

x 广告

环球精选！人工智能探索将焦点从奖励转移到好奇心

由加利福尼亚大学伯克利分校(arXiv)的一组研究人员编写了一篇题为“通

黄子佼抢救成功已出院！将要去看心理医生，81岁父亲宣布断绝关系,出院,

岁至端午，粽香袅袅。6月22日，端午佳节这一天，深圳市宝安区文化馆举

眼瞪小眼直播，大眼瞪小眼这个问题很多朋友还不知道，来为大家解答以上

Scotto：格兰特预计向开拓者要价5年1 5亿美元的合同,美记,名记,格兰特,

1、说起这黑色猪胰子，可以同白家馆子的肉丸子相媲美。2、在整整三十多

88岁奶奶爱玩呼啦圈：最多能转70分钟 肚子小了很多

88岁奶奶爱玩呼啦圈：最多能转70分钟肚子小了很多