本篇文章6655字,读完约17分钟
本文是首次在微信公共平台上发表:新智元。 文案是作者个人的观点,不代表网络的角度。 投资者据此,风险请自己承担。
【新智元领先】dota2的比赛激怒了openai。 关于open ai,我们知道它是一个非营利、开放的方法研究一般人工智能、给人类带来福利的研究机构。 elon musk是这个机构的最大股东之一,你可能知道现在他们正在募集10亿美元的融资。 但是,你可能不知道,有崇高理想的open ai和面具,从人才流动到商业模式,以及迅速发展的前景受到质疑。 open ai的初衷真的是为了更安全的ai吗? 成为口罩和其他利益集团的人才“后花园”了吗?
今年的dota2古典比赛ti7国际邀请赛让open ai大火:他们开发的self-play机器人在dota2v1比赛中战胜了人类顶级玩家dendi,在这个顶尖的dendi比赛中大放异彩。
说到open ai,通常被称为“口罩的open ai”。 作为open ai最大的投资者之一,口罩也在twitter上称赞了团队在这次与人类玩家对决的dota 2比赛中的勇敢表现。
后来,open ai的greg brockman证实了采用bota的bot api。 还有一些很棒的方法是他们自己手写代码,用硬编程的方法写在代理上。 他们确实也采用了一些反复试验的技术,比如加强学习。 一般来说,open ai这次参加dota 2的机器人确实有少量的人“指导”。
巴斯大学游戏ai研究者、经验丰富的dota玩家andreas theodorou解释了为什么这会带来不同的结果。 他说:“dota的关键之一是计算距离,知道一点[攻击]的行驶距离。” “api允许机器人包含范围的长度。 所以,可以说“500米以内有人就进攻吧”,但人类玩家必须自己计算,通过反复试验来学习。 如果机器人能得到人类玩家没有的消息,那就真的很有特点了。 “在1v1的比赛中,对抗shadow fiend这样的英雄特别有效。 玩家必须集中精力在正确的时机而不是整体战术上发动攻击。
那天的下一场比赛中,open ai的机器人输给了人类玩家50次,但此时在意这台人机对抗的人变少了。
dota2等游戏确实比围棋多得多,复杂得多,但需要的妙招和能力也在增加。 但是open ai的机器人对人类玩家的这场胜利的意义远远不及deepmind alphago战胜人类围棋职业棋手。
在技术方向和目标上,deepmind和open ai有很大的相似性:目前重点是强化学习( reinforce learning ),目标是开发具有人类能力的共同人工智能,他们现在正在开发人工智能
蒙特利尔会议: open ai诞生记
年12月星期五下午,特斯拉创始人musk和y combinator社长sam altman宣布了新的人工智能( ai )企业open ai。 当时,他们正在参加montreal ai会议。 会议结束时,他们发表了这个消息。
openai现在有60名全职研究者和工程师。 openai关注长时间的研究,在顶级机器学习会议上发表论文,发表开源加速ai研究的一系列软件工具,发表研究博客促进研究交流。
open ai的首要业务是机器人、许多复杂的电脑游戏和大量的电脑游戏。 机器人聚焦于机器人操作,机器人的研究主要涉及三个层次:移动( locomotion )、导航( navigation )和操作( manipulation )。
在研究中,openai把基础研究放在第一位,关注技术的长时间快速发展,最有代表性的是强化学习( reinforce learning )。
关于openai,最大的投资者有两个重大事实:面具和sam altman。 截至2005年5月17日,总融资额超过10亿美元。
除了口罩,open ai的创始人还有sam altman、breg brockman、reid hoffman、jessica livingston、peter thiel、wojciech zaremba。
sam altman被评为“商业周”中最好的年轻公司之家。 他是位置服务提供商loopt的联合创始人和ceo,去年3月被借记卡业务企业green dot收购。 年2月,sam altman接替了paul graham,成为yc的新掌门人。
breg brockman前stripecto,现在openai cto。
reid hoffmanlinkedin共同创始人,曾任paypal高级副总裁。 硅谷最有名的天使投资者之一,投资过facebook和digg等60多家创业企业。
jessica livingston y combinator创立合作伙伴。
他是peter thiel对冲基金管理者、paypal的合作作者之一,也是palantir的合作作者、对冲基金clarium capital的社长、畅销书《zero to one》的作者。
理想和感情很广
内幕人士表示,open ai的报酬不高,但可以提供其他激励。
无需在意产品和季度的利益,专注于面向未来的研究,最终可以与所有人共享很多研究成果。 开放一词可以认为是open ai的核心宗旨,也是其名字的来源。
open ai cto greg brockman向wired透露,实验室支付的工资没有谷歌和facebook等公司支付的多。 brockman还说open ai不想给太多工资。 这是用股票期权补偿研究者,最初可能用y combinator股票,将来用spacex股票。 但spacex与特斯拉不同,至今仍是民营企业。
wojciech zaremba是波兰人,专业是机器人。 在谷歌大脑一年,在facebook ai研究所一年,博士毕业于纽约大学,加入了open ai。
zaremba加入open ai后,谷歌和facebook都出天价挖过他。 但是,他在一次采访中说,“疯狂开价”使他转向,这是因为他尊重谷歌和facebook等公司,但一点点的公司以高价格抢人,是为了阻止open ai的成立,保护他们的业务,这是沙林巴的巨大使用 沙林巴说:“我意识到open ai是最合适的事务所。”
open ai成立后,崇高的目标和理想的研究环境迅速吸引了许多有实力的ai研究院。 其中包括ian goodfellow(gan理论的集大成者,加入Google大脑),andrej kapathy (后来加入特斯拉),ilya sutskever等。
ilya sutskever师是hinton,吴恩达斯坦福研究小组的博士课程后,Google大脑的顶尖研究者,加拿大历史上第一个google fellow,dnn research创始人……ilya sutskever是ai研究行业 现在他的身份是openai研究负责人。
崇高的理想:开放与巨头对抗
open ai从成立之初就对抗谷歌和facebook等巨头的“技术垄断”,以开放、开源的方式进行了研究。
openai的研究者认为ai研究是一个纯粹的世界,最高的理念不是由下一个产品的循环和利益驱动的。 至少没有完全被驱动。 研究者想让ai变得更好。 如果你拒绝分享最新的研究成果,ai就不能变得更好。
openai刚成立时,altman接受媒体采访时,谷歌也继续开放源代码。 你们的开源和他们有什么不同? 谷歌回答确实和公众分享了很多研究成果。 随着时间的推移,随着我们接近超越人类智能的东西,谷歌将与公众分享多少成果是值得怀疑的。
altman说,用openai研究的东西最终会超过人类的智能。 最重要的是成为开源,不仅仅是Google这样的人可以采用,谁都可以采用。 这个团体开发的东西向所有人开放。
如果你拿走后改变了一点,适应了其他用途,你就没有义务和公众分享你的成果。 但是,不管我们从事什么事业,都会对所有人开放。
现在大公司共有的ai的研究成果越来越多。 这是一个巨大的变化,谷歌的变化特别巨大,以前喜欢把技术秘密关在巨大的线神国内,近年来机器学习也进行了广泛的开源,例如tensorflow。 但是,根据外部评论,尽管如此,为了占据将来的高点,谷歌的核心技术依然保密。 马斯克等人的目标是进一步推进开放概念,一两家公司不希望支配未来的ai。
年4月28日,openai对外发布了人工智能开发平台gym。 gym平台的基本理念是,研究者建立自己的算法后,将该算法放在不同的环境中进行测试,并将测试的基本算法发布到gym平台上,展示给社区的其他人。 这个平台现在与开源人工智能工具(如Google的tensorflow )合作。
openai的开源继续进行,并于去年12月推出了openai universe。 根据官方博客,这是一个可以在几乎所有环境中测量和训练ai共同智能水平的开源平台,现在的目标是让ai智能体像人类一样采用计算机。 现在universe有1000种训练环境,微软、英伟达等企业参与建设。
universe适用于通过公共界面的各种场景。 代理捕获屏幕像素,生成对键盘和鼠标的命令,并操作远程桌面。 场景需要vnc服务器,universe库将代理转换为vnc客户端。
openai同行者deepmind
在这个世界上,如果要寻找类似于openai的机构,那一定是deepmind。
我投资deepmind只是为了更好地理解人工智能,经常看到其进展”。
让我们看看deepmind游戏上的开源。 年12月,deepmind在官网上发布了开源代理研究平台deepmind lab。
deepmind的deepmind lab是一个类似于3d游戏的平台,专为基于代理的ai研究而设计。 从自己的角度,通过模拟代理的眼睛来注意。 场景展现的视觉效果是科幻风格。 可用的操作使代理可以一边环顾周围一边在3d上移动。 代理的“身体”是浮游的球体,具备通过激活与期望的运动方向相反方向的驱动器来实现浮游和移动,同时在该主体周围运动,注意其旋转时的动作的照相机。 例如,收集水果、迷宫行驶、穿越危险通道、不要掉下悬崖、使用发射台在平台之间穿行、玩激光笔、迅速学习和记忆随机生成的环境等。
下面是代理在deepmind lab中如何感知和与世界对话的图表
openai在做什么? 一句话,他们努力创建安全的通用人工智能。
这里有两个。 安全,通用。
通用人工智能也被称为强人工智能,简单来说,就是让机器自己学会像人类一样行动。 如果安全的话,是openai,特斯拉ceo的埃隆·马斯克设立的人工智能实验室强调了这一点。
例如,openai的研究者dario amodei开发了一种可以自己玩老划船游戏“coast runners”游戏的系统。 哪艘船得分最高,能横穿终点是冠军。
openai,amodei和同事paul christiano一起,开发了可以通过几个小时的反复试验学习任务的算法,在这个过程中可以接受人类的诱惑。 他们相信这样的算法,即人与机器的混合,可以保证ai系统是安全的。
多年来,包括elon musk和其他专家、思想家、技术专家在内,ai都警告说,有可能脱离人类的控制,做出违背他们设计者初衷的行为。 像amodei这样的研究者努力走在风险面前,从某种意义上来说,把ai系统看作是被父母诱惑的孩子。
ai行业相信,多个专家加强学习是机器继续试行和学习特定任务,实现人工智能的方法。 研究者为机器设定奖项,机器随机执行任务,不断获得最大化奖。 例如,在划船游戏中,奖项是越来越多的分数。
如果ai能学会在游戏“横行霸道”中开车,研究者们相信ai在现实世界中也能学会开车。 如果可以使用web浏览器和其他app,也可以理解自然语言,开始对话。 在谷歌,在uc伯克利,机器人开始使用这样的技术学习开门、捡东西等简单的任务。
所以amodei和christiano致力于开发可以接受人类指导的强化学习算法。 这保证ai不会失控。
最近,他们和deepmind的研究者一起发表了一些相关的研究报告。 这两个顶级实验室从来没有合作过,他们现在合作开发的算法被认为是ai安全研究的重要一步。
uc伯克利的研究者dylan hadfield-menell说,这些共同研究验证了以前的想法,在今后5到10年是非常有前途的研究。
与openai、deepmind的开发团队致力于ai安全的研究一样,谷歌的大脑也发生了同样的事件,uc伯克利、斯坦福大学也在这些大型企业的实验室合作,致力于这种问题的研究
今年6月,openai与deepmind合作发表了共同计划的最初研究,没有技术经验的人向强化学习系统提供了反馈,避免事先为系统指定目标。 在某些情况下,这种方法足以在30分钟的反馈中训练系统。 这包括许多新的复杂行为,例如使模拟机器人向后空。
疑问声: open ai成了面具ai人才后花园?
今年6月,open ai著名研究者andrej kapathy加入了特斯拉,这个消息质疑了面具。
在hacker news上,有人开玩笑说andrej kapathy从口罩非营利组织( non-profit )组织跳槽到口罩营利企业( own for profit )。
andrej kapathy毕业于斯坦福大学的人工智能实验室,博士从李飞飞教授开始,在Google的大脑、deepmind实习,和吴恩达一起工作过,行业几个深度学习实验室都呆过。 更重要的是,他很高兴,善于分享自己的经验和见解。 推特和medium,被称为ai“网红”。
今年6月,特斯拉宣布andrej kapathy加入特斯拉,新任命的ai和autopilot vision总监karpathy将直接向musk报告,但与特斯拉jim keller密切合作,在特斯拉AUUU
对此,一位网民在网上评论说,open ai已经成为口罩吸引ai人才的“后花园”。 也许是一贯提倡“人工智能威胁论”,媒体一直怀疑口罩制作open ai的最初目的。 一家媒体此前报道说,open ai设立的会议上出现口罩是因为他和altman私交,自己的公司经营很多业务,ai对这些业务很重要,对将来的世界也很重要 自动驾驶车必然来,车需要ai。 spacex把人类送入太空。
有人警告说,如果系统足够强大,就可以自己学习,人类有可能失去系统的控制权。 警告者中口罩的噪音最高。
对musk的疑问也扩展到对openai的疑问:
客户randcraw说,openai的研究计划实际上没有很多人想象的那么诗情画。 a )他们从未承诺过“改变世界”,因为b )他们的项目最终必须为既得者服务。
他不喜欢openai长时间的任务计划。 “保持ai开放”( keeping ai open )看起来相当平坦,很难在现在这样的目的性和动态的文化气质中继续存在。 这样没有目的的曲折的结果可能没有达到AK(Andrejkarpathy )的最初希望。
特斯拉可能能拿出比kitt更多的东西吗? 面具的野心那么大。 我觉得karpathy在甜蜜的将来失去了头脑。
另外,open ai很奇怪,他们的研究通常比其他顶级实验室影响更大。 并不是说对媒体的影响很大,但团队确实有很多人才。 openai迄今为止最重要的研究成果是infogan,其他没有那么惊讶。 另一方面,开源的宗旨保持得很好,openai gym/universe和现有的测试模型非常优秀。
另外,也有传闻说openai有工程师裁员。 但这和之前说的又是两码事。
参考资料:
wojciech zaremba yc访谈: BLOG.y Combinator/An-AI-Primer-with-Wojciech-ZAR EMBA
electr ek.co/06/20/Tesla-auto pilot-Chris-latt ner-software-vision /
cs.toronto.edu/~ilya/
news.ycombinator/item? id=14599668 p=2
nytimes// 08/13 /技术/ artificial-intelligence-safety-training
复制源:微信公共平台新智元
标题:“【OpenAI对标DeepMind】马斯克要用开源对抗巨头,现在却饱受质疑”
地址:http://www.china-huali.com/cjxw/35078.html