AIと将棋 / 岩本 元

〇将棋のニュース

 2017年12月にプロの将棋棋士の羽生善治氏(現在は竜王)が七大タイトルの一つ竜王位を奪取し、永世七冠という前人未到の偉業を達成しました。羽生竜王は以前からAIに興味を持ち、DeepMind社のAI囲碁ソフトの開発者やNTT副社長と対談しています。

 2017年は他にも、将棋に関する多くのニュースで賑わいました。5月には最強の将棋ソフトの座に長期間君臨してきたポナンザが佐藤天彦名人と対戦し、2戦2勝で圧倒しました。ところが、その直前の将棋ソフト世界選手権でポナンザは新興ソフトのエルモに敗北しました。

 6月には史上最年少でプロデビューした中学生の藤井四段(当時。現在は五段)が、無敗のまま公式戦29連勝の新記録を打ち立てました。藤井五段が将棋ソフトを使って自らの対戦を分析する姿がテレビ番組で放送されました。

 そして12月、Googleの関連会社DeepMind社が発表したAIソフトAlphaZeroを応用した将棋ソフトは、24時間(以内)の短い学習後、エルモ相手に90勝8敗2引き分けの戦績を残しました。

 これらのニュースには全て、AIや将棋ソフトが登場します。

 

〇AI将棋の進化

 ポナンザは2014年に将棋ソフトとして初めて現役プロ棋士に勝利しました。2016年以降は1度もプロ棋士に負けることなく、2017年には七大タイトルの中で最も権威の高い名人を倒しました。

 羽生竜王によると、将棋ソフトの開発が非常に速いスピードで進んだ理由は2つあります。

 1つは、開発がオープンなことです。開発者は純粋に将棋ソフトが好きで、自分が作ったプログラムをオープンソースとして(GitHubに)公開しています。誰かが作成したソフトは別の誰かがすぐに改良します。エルモも他者の開発したソフトを内部で利用しています。

 もう1つは、様々な分野の優秀な人達が参入していることです。化学系から法学系のように異なる発想を持った人達がアイデアを出し合うことで大きな進化が生み出されます。その一方、ポナンザの開発者である山本一成氏によると、日本では個人やベンチャー企業が将棋ソフトを開発しているのに対し、海外では資本力の大きいGoogle(DeepMind)をはじめ大手IT企業が囲碁ソフトを開発し、より大きな成果をあげています。

 技術的な話になりますが、2016年までポナンザは古典的なAIである「機械学習」を用いていましたが、2017年からは最新のAIである「ディープラーニング」を用いています。山本氏によると、2017年版ポナンザは2016年版ポナンザに対して勝率6割であり、まだ成長途上とのことです。定石を介さない2017年版ポナンザに2勝したエルモは機械学習を用いた定石ベースの将棋ソフトのため、ディープラーニングの方が優れているとは言えない状況でした。2017年にディープラーニングを用いたAlphaGoで囲碁の世界チャンピオンとの7回戦を4勝1敗で制して一躍有名になったDeepMind社は、AlPhaGoを強化しAlphaZeroという名称で一般化してチェスと将棋に適用し、短時間の学習で当時世界一のチェスソフトと将棋ソフトそしてAlphaGoに大きく勝ち越しました。

 

 将棋ソフトは新たな手も生み出しています。佐藤名人に勝利した一局でポナンザの放った第一手・3八金はプロ棋士が思いつかない手でした。羽生竜王は次のように述べています。「金がここに上がるということは、まず自分の玉の守りから離れるという点でセオリーに反しています。もう1つは、飛車が十字に動ける場所にできるだけ駒は置かないというのが鉄則。守りも薄くなるし飛車も動きが悪くなる。人間は3八金を絶対に指さないということです」

 羽生竜王によると、新手よりは温故知新の手が増えているそうです。100~150年前によく指されたが現在は使えないと思われていた戦法が見直されるケースです。将棋ソフトが指す斬新な手や従来のセオリーに反する手は、人間の美意識が違和感を覚えて拒絶してしまうが、昔の戦法の再評価のハードルは低いです。

 このような手をなぜポナンザが思いつけるのか。開発者の山本氏自身も説明できないと述べています。新手や昔の戦法の再評価を生み出すのはポナンザ同士による7百万局以上の自己対戦です。人間が1年に3千局対局したとしても2千年以上掛かります。気の遠くなる経験を積んだAIは、将棋の歴史の中でまだ人間が発見していない未知の戦法にたどり着きます。

 

 ではAIによって将棋の全容は解明されたかと言うと、そんなことは全くありません。将棋は初手から終局までのパターンが10の220乗くらいあります。しかし、人間同士の対局でデータベース化された棋譜は十万局(10の5乗)程度しかありません。AI同士の対局は人間同士よりはるかに速いペースで生成できますが、まだ1千万局(10の7乗)程度しか蓄積されていません。山本氏は「将棋というものすごい

大きな海の中で、人間はまだ浅瀬、コンピュータはもう少し深いところにいるくらい」という例をあげています。実際のところ、オセロゲームですら先手が必勝か必敗か、引き分けなのか判っていません。

 

〇プロ棋士とAI

 最近の七大タイトル戦他では、棋士が1手指す度に先手と後手のどちらが有利か数値で評価されます。また、AIが指す手からの乖離が点数化されて表示されます。乖離が大きいと悪手とされますが、有名棋士の中で特に悪手率が低いのは羽生竜王です。また、藤井五段も悪手率が低いそうです。羽生マジックと呼ばれる他の棋士が思いつかない手を指す羽生竜王や斬新な手を指すと言われる藤井五段は、他の棋士よりAIに近い手を指しているということです。

 

 羽生竜王は日常的には将棋ソフトをほとんど使っていませんが、藤井五段を始めとする若い棋士の間では、将棋ソフトを分析に使用することは当たり前となっているそうです。そして、将棋ソフトがよく指す新手がプロ棋士の間で流行しています。例えば、初手に「飛車先の歩を突く」「角道を開ける」以外の手が指されるようになっています。左美濃急戦や「飛車先の歩は交換しない」等の新たな定石も生まれました。また、江戸時代に考案された雁木囲いが数多く見られるようになりました。

 

 羽生竜王によると、人間の場合に将棋が強くなっていくというのは、手をたくさん読まなくなることです。百通りの手があっても、瞬間的にその中から2つ3つに絞れるようになる。無駄なステップを端折ることが強くなることです。逆に手を狭めて読むことは発想の幅を狭くする可能性があります。AIが持っていて人間が持っていない発想やアイデアを勉強し、上達していくのが理想の姿ではないかと、羽生竜王は述べています。

 

〇Aiの課題

 一般に高スキルな職業はAIによって奪われないとされています。では既にAIに勝つことができない将棋のプロ棋士はどうでしょうか。また、東京株式市場の取引の8割はAIが処理しています。千分の1秒単位の値動きから法則性を見つけ、5分後の株価を予測し、利ざやを稼いでいます。答は人間の持つ汎用性と柔軟性にあります。棋士の役割が勝つことだけでなく手加減して楽しませること、金融トレーダーの役割が儲けるだけでなく顧客の趣味や嗜好を考慮して楽しませることであれば、現在のAIに奪わることはないでしょう。

 

 また、AIは、答は出すがその理由は示さない、言わばブラックボックスです。どんな場合でもミスや失敗、事故は起こり得るものです。そのときに現在のAIは失敗の原因や理由を説明できないでしょう。将棋のように負けることも多い、金融トレーディングのように損をする可能性もあるものにはAIを適用しやすいですが、医療のように基本的に失敗が許されないものにAIを適用するのは難しいようです。

 

 (参考)

・山中伸弥、羽生善治(2018)、「人間の未来 AIの未来」、講談社

・情熱大陸「山本一成」 http://www.mbs.jp/jounetsu/2017/05_21.shtml

・NHKスペシャル「天使か悪魔か 羽生善治 人工知能を探る」

 http://www6.nhk.or.jp/special/detail/index.html?aid=20160515

・NHKスペシャル「人工知能 天使か悪魔か 2017」

 http://www6.nhk.or.jp/special/detail/index.html?aid=20170625

・NHKスペシャル「徹底解剖 藤井聡太~“進化”する14歳~」

 http://www6.nhk.or.jp/special/detail/index.html?aid=20170708

・NHKスペシャル「天才棋士 15歳の苦闘 独占密着 藤井聡太」

 https://www6.nhk.or.jp/special/detail/index.html?aid=20171008

・AIとディープラーニング~中小企業でも活用するべきか?/杉村 麻記子

 https://www.itc-kyoto.jp/2017/05/15/ai%E3%81%A8%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0-%E4%B8%AD%E5%B0%8F%E4%BC%81%E6%A5%AD%E3%81%A7%E3%82%82%E6%B4%BB%E7%94%A8%E3%81%99%E3%82%8B%E3%81%B9%E3%81%8D%E3%81%8B-%E6%9D%89%E6%9D%91-%E9%BA%BB%E8%A8%98%E5%AD%90/

 

-----------------------------------------------------------------------

■執筆者プロフィール

 岩本 元(いわもと はじめ)

 

 ITコーディネータ、技術士(情報工学部門、総合技術監理部門)

 &情報処理技術者(ITストラテジスト、システムアーキテクト、プロジェクトマネージャ、

 システム監査他)

 企業におけるBPR・IT教育・情報セキュリティ対策・ネットワーク構築のご支援