RSSおすすめ記事です

スポンサーリンク

Microsoftが“麻雀AI”を開発。3カ月でプロプレイヤーの腕前に

ニュースAI, Microsoft

スポンサーリンク

Microsoftが“麻雀AI”を開発。3カ月でプロプレイヤーの腕前に

1 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:31:27.44 ID:0VDn38wM9.net

Microsoftは、同社の研究開発機関Microsoft Research Asia(MSRA)が開発した麻雀AI「Microsoft Suphx(Super Phoenix)」がオンライン麻雀対戦プラットフォーム「天鳳」において、AIとして初めて10段の段位を達成したと発表した。

Suphxは、2019年3月より天鳳に参戦し、5,000回の対局ののち同6月に10段へ到達。同プラットフォーム内における10段という段位は、最高位の天鳳位に次ぐ強さ。参考までに4人麻雀で天鳳位に到達したプレイヤーは13人、過去に10段に到達したことのある(降格したプレイヤーも含む)プレイヤー数は180人ほどだという。

麻雀はその複雑さゆえにAIが学習を行なう上での課題が多かった。まず、巨大な状況空間を必要とすること。牌の数が136個と多くプレイヤーの順序が変化するため、AIにボードゲームを学習させるさいによく使われる「モンテカルロ木探索」をそのまま適用できない。

次に、「不完全情報ゲーム」であること。ボード上の情報がすべて見えている「完全情報ゲーム」である碁やチェスなどに対して、麻雀は対戦相手の手牌など見えない情報が多い不完全情報ゲームであるのに加え、ランダム性が高く運の要素が排除できない。

さらに、報酬メカニズムが複雑であること。天鳳で採用されているルールでは、役がなければ上がれないのに加えて、点数の計算が複雑である。また、1ゲームが8局で構成されるため、意図的に対局を負けることでゲーム全体の得点を引き上げるといった大局的な状況判断が必要となる。

MSRAではこれらの課題を解決するため、新たなアルゴリズムを開発した。まず、持続的な探索が行なえる新たな探索戦略を採用し、巨大な状況空間の問題に対応。これにより、効率的にリアルタイムな戦略を立てられるようになる。

次に、自己対戦戦略を取り入れ不完全情報ゲームに対応した。自分が見えない情報をすべて知っていると仮定した上で、Suphx自身の選択が最適であるかを判断する。

さらに、長期的な報酬予測ネットワークを採用し複雑な報酬メカニズムの問題を解決した。前後のラウンドの予測スコアの差を利用して、各対局の最終得点を適切に予測する。

不完全情報ゲームはAIにとって解決が困難なゲームである一方、アルゴリズムを開発する環境としては理想的で、金融投資やスマートドライビングなどといった現実世界の複雑な問題へのAIの応用にもつながるとしている。

Impress
https://pc.watch.impress.co.jp/docs/news/1204268.html


スポンサーリンク

ネットの反応

2 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:31:55.07 ID:1bdx6e+x0.net
Left Caption

そもそも麻雀って運ゲーだろ

217 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:25:13.66 ID:M99oQuwp0.net
Left Caption

>>2
確率ゲーだよ
カウンティング使えばトータルでは負けない

10 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:35:20.47 ID:NvFnZmiO0.net
Left Caption

運は掴まないとやってこない
運を掴むには流れを読まなければ
流れを読むには情報分析が出来なければ
そういう意味ではAIは経験積ませれば強いはず

13 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:35:33.61 ID:CGPeIovS0.net
Left Caption

アメリカのMicrosoftが麻雀?と思ったが北京だった

14 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:35:49.35 ID:wdMIn05g0.net
Left Caption

これはデジタルが勝つんだよ
コンピューター要素高ければ高いほど期待とで計算するから

15 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:36:01.08 ID:8ZWAN33K0.net
Left Caption

アカギの次の相手が決まった!

18 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:37:24.33 ID:kqzfNU5z0.net
Left Caption

>>15
負けたらメモリを一本ずつ抜く

423 : 名無しのシステムエンジニアさん 2019/08/29(木) 22:29:19.97 ID:L3TK5U450.net
Left Caption

>>18
お、鬼や!あんた鬼や!

26 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:38:46.46 ID:TpyT4rzx0.net
Left Caption

ポーカーも相手の手札見えないけど、AIは相当強いらしいぞ。

131 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:00:36.45 ID:PJypTlVL0.net
Left Caption

>>26
ポーカーは昔からトラッカーソフトで研究されているからなぁ

29 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:39:35.75 ID:xQ/tUTXX0.net
Left Caption

ニューロンの数も多いんだろうな
ゲームで出してくれないかな
対戦してみたい

47 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:42:34.56 ID:2XAfQyHf0.net
Left Caption

単にアルゴリズム作るだけなら簡単そうだけどディープラーニングみたいなのだと大変そう。
相手をどこまで読むものなのか気になるぜ。

63 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:46:06.30 ID:k0xH0Fb00.net
Left Caption

河とそれぞれの手牌のカウンティングさえ出来たら強いだろ
問題はAIが他の手牌を予測出来るのかだろうけど

75 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:49:36.68 ID:4JRQIPDx0.net
Left Caption

これAIにする必要ある?

麻雀ゲームなんか数十年前からあるし
そもそも最善の選択をするようあらかじめプログラムしておくだけでいい
わざと小学生LVからスタートして、最終的に名人LVになるという
疑似成長プログラムとか?

96 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:53:21.22 ID:kualJvV/0.net
Left Caption

>>75
麻雀にAIが必要だから開発しているというよりは
AIの思考や学習パターン確立のために、ロジックだけの囲碁やチェス以外に、運要素のあるゲームが必要って事じゃないかな
確率的には有り得ないような不運に見舞われた時に、どう考えてどう行動するか、そこから何を学習するのかとか

126 : 名無しのシステムエンジニアさん 2019/08/29(木) 19:59:35.63 ID:q8WXltW+0.net
Left Caption

将棋ほどじゃないが、麻雀も長くやると実力どおりに収まるよな。

128 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:00:08.86 ID:ehc8mJmi0.net
Left Caption

桜井章一とどっちが強いか

139 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:01:26.30 ID:kualJvV/0.net
Left Caption

>>128
画像解析でイカサマ見抜けないと、つばめ返しでAIが飛ばされる

143 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:01:46.54 ID:E+ALfdBR0.net
Left Caption

麻雀って相手の実力に合わせて打ち方変えないと勝てないから難しそうだな
初心者の河を深読みしたら痛い目にあう

192 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:17:39.63 ID:6TPzMBVY0.net
Left Caption

AI「明日は晴れるかなあ」

234 : 名無しのシステムエンジニアさん 2019/08/29(木) 20:37:21.42 ID:EOz1LcX70.net
Left Caption

これでさらに顔認識で
感情を読み取ったり
呼吸を検出したり脈拍をカウントしだしたら
アカギでも勝てるか怪しいな

Posted by flac