• <tr id='GE7odW'><strong id='GE7odW'></strong><small id='GE7odW'></small><button id='GE7odW'></button><li id='GE7odW'><noscript id='GE7odW'><big id='GE7odW'></big><dt id='GE7odW'></dt></noscript></li></tr><ol id='GE7odW'><option id='GE7odW'><table id='GE7odW'><blockquote id='GE7odW'><tbody id='GE7odW'></tbody></blockquote></table></option></ol><u id='GE7odW'></u><kbd id='GE7odW'><kbd id='GE7odW'></kbd></kbd>

    <code id='GE7odW'><strong id='GE7odW'></strong></code>

    <fieldset id='GE7odW'></fieldset>
          <span id='GE7odW'></span>

              <ins id='GE7odW'></ins>
              <acronym id='GE7odW'><em id='GE7odW'></em><td id='GE7odW'><div id='GE7odW'></div></td></acronym><address id='GE7odW'><big id='GE7odW'><big id='GE7odW'></big><legend id='GE7odW'></legend></big></address>

              <i id='GE7odW'><div id='GE7odW'><ins id='GE7odW'></ins></div></i>
              <i id='GE7odW'></i>
            1. <dl id='GE7odW'></dl>
              1. <blockquote id='GE7odW'><q id='GE7odW'><noscript id='GE7odW'></noscript><dt id='GE7odW'></dt></q></blockquote><noframes id='GE7odW'><i id='GE7odW'></i>
                IT资讯
                当前位置:雪球网 > IT资讯 >  IT圈

                你的《超级马里奥兄弟》通关了没?AI 成功拿下 29 个关卡

                2020-09-15 11:49:12 雷锋网 贝爽 编辑:米雪 浏览数:45雪球网

                《超级马里奥兄弟》你能玩到第几关?说起这款 FC 时代的经典游戏,大家可能再熟悉不过了,大鼻子、留胡子,永远穿着背带工装服的马里奥大叔,成为了很多 80/90 后的童年回忆。看着画面中熟悉的马里奥大叔一路跌跌撞撞,躲避半...

                《超级马里奥兄弟》你能玩到第几关?

                说起这款 FC 时代的经典游戏,大家可能再熟悉不过了,大鼻子、留胡子,永远穿着背带工装服的马里奥大叔,成为了很多 80/90 后的童年回忆。

                看着画面中熟悉的马里奥大叔一路跌跌撞撞,躲避半路杀出来的毒蘑菇,锤子乌龟,头盔兔子、食人花,感觉又回到了小时候。

                最早发行的这版《超级马里奥兄弟》设置 8 个场景,每个场景分为 4 关,共 32 个关卡,相信很多朋友至今还没有完全通关。

                Viet Nguyen 就是其中一个。这位来自德国的程序员表示自己只玩到了第 9 个关卡。因此,他决定利用强化学习 AI 算法来帮他完成未通关的遗憾。

                现在他训练出的 AI 马里奥大叔已经成功拿下了 29 个关卡。

                不过,遗憾的是第 4、7、8 场景中的第 4 关卡未通过。Viet Nguyen 解释说,这与游戏规则的设置有关。在一场游戏结束后,玩家可以自行选择通关路径,但这可能出现重复访问同一关卡的情况,所以 AI 未成功进入到这三关游戏之中。

                Viet Nguyen 使用的强化学习算法正是 OpenAI 研发的近端策略优化算法(Proximal Policy Optimization,简称 PPO),他介绍,此前使用 A3C 代码训练马里奥闯关,效果远不及此,这次能够达到 29 关也是超出了原本的预期。

                现在 Viet Nguyen 已经将基于 PPO 编写的完整 Python 代码发布到了 Github 上,并给出了详细的使用说明,感兴趣的朋友可以体验一下:

                Github 地址:https://github.com/uvipen/Super-mario-bros-PPO-pytorch

                据了解,PPO 是 OpenAI 在 2017 年开发的算法模型,主要用来训练虚拟游戏玩家 OpenAI Five,这位虚拟玩家在 2018 年的 Dota2 人机对抗赛中,战胜过世界顶级职业选手,同时能够打败 99.95% 的普通玩家。

                复杂的游戏环境一直被研究人员视为 AI 训练的最佳场景。为了让 AI 掌握游戏规则,学会运用策略,强化学习是研究人员常用的机器学习方法之一,它能够描述和解决 AI 智能体(Agent)在与环境交互过程中通过学习策略实现特定目标的问题。

                近端策略优化算法(PPO)已成为深度强化学习基于策略中效果最优的算法之一。有关该算法的论文已经发布在 arXiv 预印论文库中。

                论文中指出,PPO 是一种新型的策略梯度(Policy Gradient)算法,它提出新的 “目标函数”可以进行多个训练步骤,实现小批量的更新,解决 PG 算法中步长难以确定的问题。固定步长的近端策略优化算法如下 :

                分享到:

                版权与免责声明:

                凡未注明"稿件来源"的内容均为转载稿,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性;


                本文地址:/yxe2gu/news/2020/09/15/338745394.html

                转载本站原创文章请注明来源:雪球网

                行业聚焦

                戴尔推出新款 G5 游戏本:8 核 i7

                IT之家 9 月 21 日消息 戴尔现已推出了新款 G5 游戏本,搭载了英特尔刚刚推出的 8 核处理器 i7-10870H,配以 RTX 2...[详细]

                阿里上季度比腾讯多赚 140 多亿,但 “炒股”真比不过

                今日晚间,阿里巴巴发布 2021 财年第一财季 (4 月至 6 月)财报,财报显示该季度营收 1537.5 亿元,同比增长 34%,高于市场预期的 1480.5...[详细]

                软银宣布拟出售日本子公司 1/3 股份,后者股价跌 3.4%

                在母公司软银集团(SoftBank Group)宣布计划出售其所持日本子公司软银公司 (SoftBank Corp.)约三分之一股份后,后者股价于周一下跌 3....[详细]

                盖茨看好电动车,但长途和重载需要其他环保燃料

                微软创始人比尔 · 盖茨(Bill Gates)一直致力于建立碳中和社会,以减少人类活动对气候变化的影响。当地时间周一,盖茨就未来如何在不排放温室气体的情况下继...[详细]

                平均年薪 15 万美元!亚马逊将再招约 3.3 万名新员工

                亚马逊宣布将于当地时间 9 月 16 日举办职业发展日(Career Day)活动,向所有求职者开放大约 33000 个工作岗位,平均年薪为 15 万美元。据亚...[详细]

                活动互动

                更多

                马斯克:为开发2.5万美元新款电动汽车,将降低电池成本

                 

                在今日的特斯拉电池日上,马斯克宣布,将大幅降低电芯和电池组的成本,新目标是生产出价格低至2.5万美元(约合17万元人民币...[详细]

                NASA 官宣!将在蓝色起源任务中第一次测试自动着陆系统

                 

                美国宇航局 (NASA)宣布将在即将到来的蓝色起源公司可重复使用亚轨道火箭新谢泼德号任务期间,首次测试全新的精确自动着陆...[详细]

                14 款游戏 App 涉隐私违规,《和平精英》、《开心消消乐》在列

                 

                1、在 App 首次运行时未通过弹窗等明显方式提示用户阅读隐私政策等收集使用规则,或以默认选择同意隐私政策等非明示方式征...[详细]

                华为 Mate 40 系列开模手机壳曝光:3.5mm 耳机孔、双扬声器

                 

                IT之家 8 月 27 日消息 华为 Mate 40 系列新机将在未来几周内亮相,现在网上曝光了新机的开模保护...[详细]

                外媒测试手机蓝牙耗电情况:近乎毫无影响

                 

                IT之家8月31日消息 关于手机蓝牙常开是否加快电量消耗这一问题,外媒 AndroidAuthority 做了...[详细]

                一周排行每月关注