DeepMind新算法为其挑战雅达利游戏的AI增加记忆能力
在AlphaGo成名之前DeepMind团队早已使用49个雅达利的老游戏用来测试AI,但当时其AI尽管能够通过机器学习完成对每一个游戏的挑战,不过有个遗憾就是AI在学习新游戏玩法后就会很快忘记此前游戏的玩法,法从旧游戏中总结出解决新游戏的玩法,也就是说人工智能在运用过去的经验和知识方面是受限的。
现在DeepMind团队宣布其联合帝国理工学院已经开发出了命名为弹性权重固化(Elastic Weight Consolidation,EWC)的新算法,能够让AI通过机器学习记住并重新使用旧信息来解决新问题,也就是说拥有了初步的“记忆能力”。研究论文已经发布在近期的《美国科学院院报(PNAS)》上。
据研究论文解释,EWC算法所依赖的是“突触固化(synaptic consolidation)”理论,能够解决在被分配到新任务时产生“灾难性遗忘”这一人工智能难以克服的问题,人工智能会覆盖掉此前掌握和学习到的技能和知识。 论文称:“我们的方法是通过有选择性地减慢对重要权重值的学习,使机器能记住之前的任务。”
DeepMind的James Kirkpatrick称“人类和动物能够掌握大量知识的一个关键因素,就在于他们可以在以前知识的基础上不断学习新东西。”算法会选择运用它所学习的内容来玩一款游戏,然后保留其中学到的最为重要的部分。“我们只允许程序间非常缓慢地渐进式的改变,那样的话才总是会有学习新任务的空间,而同时这种改变不会覆盖我们之前学到的内容。”
在测试中,研究人员利用被新算法强化过的DQN深度神经网络随机玩10款Atari公司的游戏,几天之后,他们发现AI已经可以做到和人类玩家一样优秀了。
现在DeepMind团队宣布其联合帝国理工学院已经开发出了命名为弹性权重固化(Elastic Weight Consolidation,EWC)的新算法,能够让AI通过机器学习记住并重新使用旧信息来解决新问题,也就是说拥有了初步的“记忆能力”。研究论文已经发布在近期的《美国科学院院报(PNAS)》上。
据研究论文解释,EWC算法所依赖的是“突触固化(synaptic consolidation)”理论,能够解决在被分配到新任务时产生“灾难性遗忘”这一人工智能难以克服的问题,人工智能会覆盖掉此前掌握和学习到的技能和知识。 论文称:“我们的方法是通过有选择性地减慢对重要权重值的学习,使机器能记住之前的任务。”
DeepMind的James Kirkpatrick称“人类和动物能够掌握大量知识的一个关键因素,就在于他们可以在以前知识的基础上不断学习新东西。”算法会选择运用它所学习的内容来玩一款游戏,然后保留其中学到的最为重要的部分。“我们只允许程序间非常缓慢地渐进式的改变,那样的话才总是会有学习新任务的空间,而同时这种改变不会覆盖我们之前学到的内容。”
在测试中,研究人员利用被新算法强化过的DQN深度神经网络随机玩10款Atari公司的游戏,几天之后,他们发现AI已经可以做到和人类玩家一样优秀了。关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 习近平将发表二〇二六年新年贺词 7904141
- 2 2026年国补政策来了 7808738
- 3 东部战区:开火!开火!全部命中! 7712893
- 4 2026年这些民生政策将惠及百姓 7616985
- 5 小学食堂米线过期2.5小时被罚5万 7519709
- 6 解放军喊话驱离台军 原声曝光 7428214
- 7 为博流量直播踩烈士陵墓?绝不姑息 7327605
- 8 每月最高800元!多地发放养老消费券 7238391
- 9 数字人民币升级 1月1日起将计付利息 7141831
- 10 2026年1月1日起 一批新规将施行 7040675








有料
