Neurons字幕组 | 2分钟看强化学习如何优雅地解决地形穿越问题(附论文下载)

百家 作者:大数据文摘 2017-10-13 05:50:14


 时间轴 | 韩振峰    翻  译 | 数据酱

校  对 | 云 舟     后期 | Halo

  项目管理 | 大  力

Neurons字幕组

第5期作品震撼来袭!


Neurons字幕组源自英文单词Neuron,一个个独立的神经元,汇聚千万,成就了四通八达,传递最in最酷炫信息的神经网络。

来吧,和Neurons一起,玩点不一样的AI!


随着2016年3月AlphaGo与李世乭惊天人机大战的谢幕,深度学习逐渐走入了大众的视野,在这背后,则是AI基于与环境互动的目标导向的强化学习。作为一种机器学习算法,它不仅可以让电脑学习如何玩游戏,甚至学习其它一切具有时间序列性的行为,并在与我们生活息息相关的各种领域中都能有很好的应用。今天的Neurons小视频,就以可爱的虚拟狗狗为切入点,带大家看一下强化学习在地形穿越问题中的应用。


关注大数据文摘公众号,并在后台回复“神经元”,可直接下载本期论文。

 ▼ 请在WiFi下观看小视频,暂时无法观看的读者可以先收藏,或者下拉直接查看文字版要点,土豪请随意~

<iframe class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" data-src="http://v.qq.com/iframe/player.html?vid=y0560c72eqk&width=354&height=199.125&auto=0" width="354" height="199.125" data-vh="199.125" data-vw="354" style="display: none; width: 354px !important; height: 199.125px !important;"></iframe>

强化学习算法的侧重点并不在于分辨出我们在图像中看到的具体内容,因为具体答案并不重要,我们关心的是具有时间先后性的一系列动作。我们称强化学习的输入为状态,也就是我们目前所处的状态,还有我们周围的环境的状态。强化学习的输出我们称之为最佳后续动作,我们以一个虚拟狗狗的跑步动作为例子,在跑动过程中跳起来并跳到障碍物上,这一系列动作都由我们的算法来完成。

这个任务很难,因为狗身上有很多部位需要控制得当,动作才显得协调。这个算法需要决定很多事情,包括如何控制腿部的力量脊柱的弯度,还有肩膀、肘部、臀部还有膝部的角度。

狗狗的控制参数,从上往下分别是:前腿力、后腿力、脊柱弯度、肩膀角度、肘部角度、臀部角度、膝部角度、后蹄角度

当然,这个算法最厉害的地方,在于如果算法运用得当,它最后所得出的所有的动作,都会跟我们所想象的动物的动作完全相同。其实强化学习的本质就是:做得好,被奖励;做得不好,被惩罚;奖罚分明。而且用评分量化,分数增长,则代表算法的选择不错。学习过程就是自省的过程。通过分析最后的几步动作,来找出哪一些动作可以得到奖励。

我们举个可以拿到奖励的例子,比如这只狗可以在不摔倒的情况下跑多远。同时,我们还需要注意,如何用最少的代价来实现这个目标。简而言之,强化学习模仿了现实生活中的动物,甚至人类学习的方法,如果你这次做得不够好,尝试新的动作;如果你做到了,记住你是如何做到的,然后继续这样做下去。我们在这里只是用狗狗作为一个例子来解释这个算法,但是其实同样的原理也适用于人类。

强化学习被应用于很多控制领域,这些领域的难题很难用其它技术来解,比如,如何控制一个无人机。很高兴能看到这项技术所带来的成果,尤其是,在这项技术在某些领域其实还没有被很广泛的应用的情况下,比如说计算机图形学领域为什么会这样呢?是因为并没有太多的图像任务要求处理具有时间序列的动作?还是因为我们需要改变我们的思维方式来接受新的想法。从不同的角度来看待问题,然后才能用这个强大的算法来解决它,毫无疑问,这个改变将会是值得的。

很多人说,强化学习被认为是真正的人工智能的希望。看了今天的小视频,对于强化学习有没有想更深入的了解呢?

这里,带你看一篇详细的强化学习入门指南

论文下载

点击文章右上角关注“大数据文摘”,进入公众号,在后台对话框内回复“神经元”三个字,你将会得到我们送出的大礼包:往期所有Neurons字幕组2分钟小视频系列的原版论文合集!

感谢收看

下期再见

感谢以下同学参与翻译本期视频,最终采纳的版本为数据酱的作品

Ewan,王鸿儒,Queen

Zhang Yan,数据酱

雪梨兔,萌芽,10

Neurons招募正在开启!

我们已经拿到了一批有趣有料的视频授权,将在第一线直击AI和大数据的发展轨迹。

无论你是曾经在其他字幕组工作过的老司机,还是刚刚接触AI的小白,只要你有时间、有能力、愿分享,Neurons都欢迎你,现在加入,都有机会成为Neurons的元老哦!


我们希望你


  • 一定的英文翻译和听译能力

  • 有责任心、可靠、有耐心

  • 有时间(每周保证至少3小时工作量)

  • 最重要的,有探索AI和数据知识的强烈好奇心!


你可以获得


  • 第一时间接触独家授权视频等学习资料。

  • 视频发布时会上各位志愿者的字和贡献。

  • 有范儿有料科技大会的免费、优惠门票。

  • 优质公司和岗位的内推机会。

  • 和志同道合的小伙伴一起成长的机会。


    字幕组岗位


    1.听译:有较强的听译能力,能准确听写没有字幕的视频中的台词。

    2.翻译:翻译能力强,能按照中文的用语习惯流畅地翻译字幕,需要较强的语言功底和耐心

    3.校对:对翻译的结果进行校对和二次编辑,纠正专有名词、用语上的错误,需要有较强的领域知识和文字经验。

    4.时间轴:需要处理译文和时间的之间的关系,添加字幕持续时间并将译文调整为适合观看的字幕,需要对句子时间点进行准确的把握和判定。

    5.后期、压制:把翻译得出的字幕文件和片源打包压制成可播放的影片文件。需要懂得一定的计算机硬件环境并懂得使用各类压制影片的软件。


    如何申请


    聪明的人已经上车,

    你还在等啥?

    现在扫下方二维码

    「阅读原文」

    填写表单加入Neurons

    我们会在三个工作日内联系您

    志愿者介绍


    回复“志愿者”加入我们


    往期精彩文章

    点击图片阅读

    Neurons字幕组 | 2分钟带你看懂李飞飞论文:神经网络是怎样给一幅图增加文字描述,实现“看图说话”的?(附论文下载)


    关注公众号:拾黑(shiheibook)了解更多

    [广告]赞助链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    让资讯触达的更精准有趣:https://www.0xu.cn/

    公众号 关注网络尖刀微信公众号
    随时掌握互联网精彩
    赞助链接