经过7万小时训练,OpenAI宣布做出了最强的《我的世界》AI
视频是种潜力巨大的培训资源。
Open AI最近公布了一项他们在人工智能领域的最新成果——最擅长玩《我的世界》的AI。
厉害到什么程度?无论是建造地堡、金字塔这些复杂的建筑,跟游戏里的恶龙战斗,亦或是白手起家,制造出稀有的钻石工具都不在话下,这些任务即使是交给熟练的人类玩家来做,往往也需要数十分钟的流程以及上万个点击操作。
而该AI在经过训练后,则可以在没有任何外力辅助的情况下自主完成这一系列事件,这是此前其他AI都无法做到的。根据Open AI的介绍,能够实现这一成果,依靠的是在模仿学习(imitation learning)技术上的新突破。
在这项技术中,AI会被训练成通过观察并模仿人类的行为来完成相应的任务,此前很多效果都运用到了类似的原理,比如控制机械手臂或者驾驶汽车。
既然AI需要观察模仿,那么就势必需要一定量的素材,而单就熟练操作《我的世界》而言,各大视频网站上的学习素材其实已经非常多,完全能够满足AI的学习需要。
但问题是,还需要另一项额外的工作,即让AI准确理解视频里的内容。
《我的世界》是一款没有明确目标的游戏,虽然网上素材繁多,可并不能直接拿来当作学习资料,因为视频里的每个动作和操作,其实都需要人类为其贴上标签,也就是做出相应的注释,才能AI明白操作的含义。
如果每个动作都需要人工注释,那效率自然会降低,为了解决这个问题,研究人员想出了一项新方法——训练能够自动为视频操作贴标签的AI。
他们先是召集了一批志愿者玩家来操作游戏,并保留了玩家们的按键记录,在得到2000个小时的游戏数据后,研究人员训练了一个新的模型,并人工将按键操作与游戏里的效果一一对应,比如在什么情况下点击鼠标会让人物挥动斧头。
下一步便是用这个模型来处理网上海量的《我的世界》视频,为他们贴上让AI能够理解的标签。根据公布的数据,为了得到理想的效果,科研人员提供的视频素材长达70000个小时。
而这确实也获得了一定的成果,比如像开头说的那样,AI已经学会了如何自己制作钻石工具。而Open AI的负责人Bowen Baker表示:我们觉得《我的世界》是一个很好的研究领域。
由于《我的世界》没有明确的输赢且自由度极高,所以研究人员可以训练AI执行更多复杂的任务,而他们认为这些工作最终可以反哺到现实——如果AI能在游戏里设计一张桌子,那么在现实里没准也行。
这个由一家名叫OpenAI的公司开发出的聊天机器人,推出仅仅5天即吸引了超过上百万的使用者,在今年更是成为了有史以来月活跃用户突破1亿大关最快的应用程序。人们开始把目光转向其缔造者OpenAI。
OpenAI
OpenAI是一家非营利性人工智能研究公司,成立于2015年,致力于推动人工智能的发展和应用。OpenAI是如何创立和发展的?它是如何开发出一款可能改变人类未来学习、工作乃至生活的产品的?
创立
2015年,当时的硅谷明星企业家Elon Musk、Sam Altman、Greg Brockman、Ilya Sutskever、John Schulman等人共同投资10亿美元,创办了OpenAI。他们发起创立OpenAI的目的是为了在人工智能的研究和发展方面取得更大的进展,同时避免人工智能技术在未来可能出现的潜在风险。在OpenAI的官网上写着:以最可能的方式造福全体人类,通过人工智能技术彻底变革人类的未来。
2015年,埃隆马斯克和山姆奥尔特曼在峰会论坛上对话
但同时,马斯克同时也认为,AI是对人类社会最大的生存性威胁。这不是第一个有类似观点的名人,2014年斯蒂芬霍金就曾警告AI可能会终结人类。
马斯克在一场演讲上沉思
在OpenAI的官网声明中写道:很难想象人工智能在正确构建或使用的情况下可以为社会带来多大的好处,同样地,也很难想象它可能会在错误的构建或使用的情况下对社会造成多大的伤害。可见,对于AI带来的道德伦理问题、以及对社会未来发展的各种潜在影响,都在OpenAI的考虑范围之内。
早期发展
2016年起,OpenAI开始尝试研究各种人工智能技术,包括深度学习、强化学习等。同时,该公司也开展了一系列合作项目,与微软、亚马逊等公司合作,以推动人工智能技术的发展。
2017年,OpenAI推出了一个名为OpenAI Gym的开源项目,该项目是一个用于开发和比较强化学习算法的工具包。这个项目成为了开源社区中非常受欢迎的工具之一。当年晚些时候,OpenAI 也发布了 Universe,一个用于跨网站和游戏平台训练智能代理的工具包。
2018年,OpenAI发布了一份关于人工智能技术的道德准则,旨在指导人工智能研究人员和开发人员开发道德和负责任的人工智能。同时,该公司还在该年发布了一个名为GPT-2的自然语言处理模型,该模型在自然语言处理领域取得了重大的突破。
埃隆马斯克的退出
正当一切都按部就班顺利进行的时候,马斯克宣布从董事会辞职。
埃隆马斯克
对于马斯克退出的原因众说纷纭,官方的说法是由于汽车制造商同样专注于人工智能,因此通过离开董事会以消除未来潜在的冲突。但马斯克本人不是这么说的,他表示离开该公司是因为他不同意OpenAI团队想要做的一些事情,分开对双方都是更好的结果。至于具体这些事情是什么人们不得而知,但有一点是肯定的,当时OpenAI所做的事情并不是朝着马斯克期望的方向进行的。
OpenAI创立三年后,二者于2018年分道扬镳,但似乎孽缘并没有因分手而终结
但是2018年以来,马斯克似乎与OpenAI持续有些过节,尤其是与OpenAI的CEO山姆·奥尔特曼。2020年,马斯克在Twitter上表示,当涉及到安全问题时,他对OpenAI的信心不高。我认为OpenAI应该更加开放,这位亿万富翁在回应麻省理工科技评论对该公司的调查时发推文说道。对OpenAI的调查揭示了一种秘密文化,与这个非营利组织所声称的透明承诺背道而驰。
而最近,马斯克更是表示他暂停了OpenAI访问Twitter数据库以训练其软件。
需要更多了解治理结构和未来的收入计划,他在其推特上说。OpenAI始于开源和非营利,但现在两者都不再成立。
奥尔特曼与马斯克
进一步的发展和微软的入局
时间倒退回2019年,OpenAI推出了一个名为OpenAI Five的人工智能游戏团队,该团队的目标是开发出一支能够在Dota 2游戏中击败人类选手的AI战队。最终,OpenAI Five战队成功地在Dota 2比赛中击败了人类选手。
当年末,OpenAI迎来了一位巨头——微软的加入。微软向这家人工智能公司投资了10亿美元,OpenAI表示将与微软公司独家许可其技术。微软表示:通过GPT-3模型可以释放出的商业和创意潜力的范围是巨大的,具有真正的新能力-其中大部分我们甚至还没有想象过。直接在写作和作曲、描述和总结大量长格式数据(包括代码)、将自然语言转换成另一种语言等方面帮助人类创造力和创造力-可能性仅受我们带到桌子上的想法和场景的限制。
这个伙伴关系使得微软能够与谷歌的DeepMind人工智能公司竞争。
ChatGPT缔造者——OpenAI简史
科技之巅