原标题:微软麻将ai超越人类后,研究小组推出教材提高人类卡片技术来源:网易科学技术

(原标题:微软麻将ai超过人类后,研究小组说,其目的是拿出教材来提高人卡技术)。

情报记者王心馨沸腾了

人类今后可能想提高自己的麻将技能,必须以人工智能为师。

微软亚洲研究院开发的麻将ai系统suphx在国际知名麻将平台“天凤”上升了10档,拥有超过99.99%的人后,研究小组接受了澎湃情报( thepaper )的采访,日本出版社 如果你对麻将感兴趣,你可以学习如何在这本书里打麻将。

4月9日,微软亚洲研究院suphx研究开发小组通过在线直播,详细介绍了suphx的技术细节,该论文最近在arxiv平台上发表。 直播结束后,微软亚洲研究首席研究员秦涛、微软亚洲研究院高级研究工程师李俊杰在接受彭湃的信息采访时表示,团队目前正在与天凤平台进行协商,为提高人类卡片技术提供服务 例如,通过输入身体的现在的卡面,suphx告诉那个人应该打哪个卡,以及为什么应该打那个卡。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

值得一提的是,据两位研究者说,有日本出版社的联系,希望suphx发行的卡片出书。 “喜欢麻将的人称suphx为麻将教科书、suphx老师,因此对麻将感兴趣的同学们可以在这本书里学习如何打牌。 ”。

suphx如何提高显卡技术?

去年8月,微软亚洲研究院在世界人工智能大会上正式宣布,开发的麻将ai系统suphx成为第一个在国际知名的职业麻将平台“天凤”上升10级的ai系统。

过去半年多来,研究小组重新调整了suphx。 具体来说,一是重新优化整个系统体系结构,使其更快更好。 另一个是对“先知教练”这样的算法也进行了改进。 从博弈论的角度来看,麻将是大多数人的非完美新闻游戏。 麻将一共是136张卡,每人只能看到很少的卡片。 包括自己的13张手牌和所有人打的卡,越来越多的卡看不见了。 包括其他三个玩家的手牌和墙牌。 面对这么多隐藏的未知消息,麻将玩家不容易只根据自己的手牌作出好的决定。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

但是,通过先知教练,suphx将(1)玩家自己的私人手、(2)所有玩家的公开卡、(3)其他公共新闻、(4)其他三个玩家的私人手、(5)墙卡等所有消息 (1)只有(2)和(3)可以得到正常的玩家,但(4)和(5)只有“先知”可以得到追加的完美消息。

在suphx中,suphx研究开发小组首先采用包括完美新闻在内的所有特征强化学习训练“先知”,在这一步中控制“先知”的学习进度,不要太强大。 然后,通过在完美的特征中追加mask,使“先知”最终转移到正常的ai。 其次,继续训练正常的ai,进行一定数量的反复,用衰减学习率和拒绝采样的妙手调整训练过程,不断精进ai的技术。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

愿alphago最初以人为师,升级后,自己开始“左右互博”,不断提高。 秦涛在采访中,suphx也完全不使用人的数据尝试过训练,可以直接使用self-play,只是训练速度有点慢,这是背后的算法做了一点新的改变,让计算机学习得更快。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

将来可以用于股票主板

suphx打麻将只是第一步。 两位研究者表示,团队在金融领域和物流领域进行了一些尝试,使suphx技术落地制作了实际的应用场景。

金融业如果知道明天的股票行情,今天的投资一定会顺利的。 这在某种程度上是完美的消息。 例如,如果今天a股关闭,我们就知道今天所有的股票新闻。 回顾昨天,假设你在做昨天的决定时知道了今天的股票新闻。 那对股票操纵来说是完美的消息。 研究人员认为在这种情况下可以利用完美的消息更好地训练模型。 实际使用就像麻将一样,通过完美的消息,我们可以得到非常强大的老师——teacher model。 这样也可以很好地学习学生模型student model。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

在机器翻译行业,完美的消息也很有用。 例如在机器翻译中,如果知道一句上下文,那可能会成为更好的翻译,也就是完美的消息。 但是,实际上并不是所有的语言都知道它的上下文,如果在训练中能得到完美的消息,就能使翻译更好。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

那些还不够。

从这次发表的论文来看,suphx的技术表现是完美的。 但是,在两位研究者看来,未来的suphx还有进步的空之间。

“我们现在也经常使用高手的数据训练模型,达到强化学习,但麻将的平台和规则不同,并非所有的平台都能获得人类的数据。 在这种情况下,不需要别人的数据就可以直接从0开始,这是我们在做的。 ”秦涛说。

与围棋、象棋、dota游戏相比,麻将的随机因素很多,对模型的训练和测试有很大的影响。 研究小组表示,他们的模型在测试中基本上跑了一百万游戏,以确保知道谁更厉害。 这与围棋不同,围棋五次三胜,与麻将不同。 这种情况下,如何更迅速地完成游戏,得到可靠的结果,也是团队研究的问题。

【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

最后,团队认为suphx可以对不同的对手采取一点适应的战略。

全天候滚动播放最新的财经信息和视频,越来越多的粉丝福利扫描二维码备受关注( finance )。

标题:【热门】微软麻将AI超越人类后 研究团队要出教材提升人类牌技

地址:http://www.china-huali.com/gphq/2816.html