日前,微软亚洲研究院在arXiv平台上正式发表了关于麻将AI系统Suphx的论文,公布了Suphx背后的包括决策流程、模型架构、训练算法等核心技术细节。去年8月,微软亚洲研究院在世界人工智能大会上正式宣布由其研发的麻将AI系统Suphx成为首个在国际知名专业麻将平台“天凤”上荣升十段的AI系统,其实力超越该平台公开房间顶级人类选手的平均水平。
作为喜闻乐见的大众娱乐项目,麻将仅在亚洲地区就拥有上亿玩家。极高的普及度使得很多人都认为麻将是一项十分容易的棋牌类游戏。但麻将虽然入门容易,要真正打好麻将、精通麻将却十分困难。以国际知名专业麻将平台天凤(tenhou.net)为例,平台上超过35万的活跃玩家中,只有不到1%的玩家达到了专业7段及以上的高手水平。
图1:天凤玩家段位分布以及Suphx排名:Suphx成绩超过了99.99%的天凤玩家麻将AI 到底有哪些难点?Suphx这一在游戏AI领域具有跨越性的突破具体是如何实现的?近日,微软亚洲研究院Suphx研发团队在arXiv平台上正式发表论文,公布了Suphx背后的核心技术。
麻将AI面临的挑战
麻将AI系统Suphx主要基于深度强化学习技术。尽管深度强化学习在一系列游戏AI中取得了巨大的成功,但想要将其直接应用在麻将AI上殊为不易,面临着若干挑战。
挑战一:麻将的计分规则通常都非常复杂,在如天凤平台等竞技麻将中,计分规则更加复杂。
首先,一轮麻将游戏通常有8局甚至