/

将棋ソフトがプロ棋士を制圧する日 対局ごと進化が加速

ジャーナリスト 新 清士

 将棋のコンピューターソフト同士が対戦する「将棋電王トーナメント」が11月2~4日、都内で開かれた。これは来春、プロ棋士と将棋コンピューターソフトが対戦する「第3回将棋電王戦」の団体戦に出場する将棋ソフトを決める大会だ。予選を勝ち抜いた12の将棋ソフトが争い、上位5位までがプロ棋士への挑戦権を得た。今春の第2回電王戦では将棋ソフトが5戦中3勝し、「コンピューターが人間を破った」と話題になった。将棋ソフトはどこまで強くなれるのか。今大会4位の「やねうら王」にスポットを当て、進化し続ける将棋ソフトの現状を取材した。

最善手を絞り込む力がポイント

「将棋電王戦」の公式ページ

やねうら王を開発したのは、やねうデザイン社長の磯崎元洋氏。同氏は「やねうらお」のハンドルネームで活動する天才的プログラマーとして知られる。磯崎氏は自身のウェブサイトで将棋について「最善手を選ぶためのくじ引きをしているようなもの」と表現している。

人間も将棋ソフトも、将棋の強さは日本将棋連盟が運営に関わる「将棋クラブ24」というサイトで対局することで計測できる。結果は「レーティング(R)」というスコアで出され、客観的な判断が可能だ。当然、高いスコアを取る人やソフトほど強いということになる。

R評価が高い人やソフトは対局中、次の指し手として数多くの選択肢のうちどれが最善かを迅速に見抜く力があるといえる。例えば、R500程度の人が次の手を20手の中から選ぶとすれば、R1000の人はさらに先を読むことで10手まで絞り込む実力があり、R2000だと5手、R3000なら3手ぐらいまで絞り込むことができるという。

対局の様子を見つめる磯崎元洋氏(左)

磯崎氏は「ハイレベルな対局では素人が思うほど指し手に自由度はない。広大な砂漠で一粒の種を探すかのように、悪手ではない手を探さなければならない」とその難しさを説明する。

平均的なプロ棋士のR評価はR2800程度。これに対し、一部の将棋ソフトはR3000を超え始めているという。そのため、R評価を基準にすると、理論上は将棋ソフトの実力がプロ棋士を上回りつつあるといえる。

将棋より指し手の選択肢が少ないチェスの場合、IBMのスーパーコンピューターが人間のチェスチャンピオンを初めて破ったのが1996年。だが、今やスマートフォンに搭載されたチェスアプリでも人間に圧勝するほどコンピューター側は進化してしまった。将棋の世界でもいずれ人間は将棋ソフトにかなわなくなるとの見方が有力だ。

 将棋ソフトの強さは、次の手がどれだけ最善手なのかを読み切れるかで決まる。現在の戦況を、過去の対戦記録である膨大な量の棋譜データベースに照らし合わせ、今後の指し手として最適と思われる手をうまく発見できるかがポイントなのだ。

なぜAIが強くなるのかはナゾ

最善手を見つける場合、1手先から2手先、3手先と増えれば増えるほど選択肢はどんどん膨らんでいく。場合によっては何億通りもの膨大な指し手を組み合わせ、善しあしを判断する必要がある。磯崎氏によると、1手先を将棋ソフトが思考し、うまく成功するごとにソフトの頭脳であるAI(人工知能)はR200ほど強くなるという。

将棋電王トーナメントの会場の様子

将棋ソフトが人間に匹敵する実力を持つようになった大きな要因は、コンピューターの性能向上により膨大な量のデータ処理が短時間で可能になったことだ。非常に複雑な思考や判断を、ハードウエアとソフトウエアの"力業"でこなせるようになり、読める手数が飛躍的に増えたのだ。

ところが磯崎氏によると、将棋ソフトのAIが対局で1手先を読み、最善手を検索することでなぜ強くなっていくのか、その原理的な説明は今のところ誰もできないという。データ処理というデジタルな理由だけでは説明できない不思議な状況にある。将棋ソフトは根幹の考え方を理解するには難易度が高く、また深い世界でもあるといえるだろう。

実は、磯崎氏は将棋ソフト開発に関して3年間のブランクがあった。しかも今回、やねうら王を改善・強化する時間はわずか半月余りしか確保できなかった。そこで大会で勝つためには、ソフトをうまく活用する作戦を練る必要があった。正面からまともに勝負を挑めば、すでに高い実力を持つ他の将棋ソフトには勝てないと考えたからだ。

序盤の雑な戦い方が弱点

今の将棋ソフトは序盤に弱点があるといわれている。プロ棋士からみても将棋ソフト開発者からみても、序盤は必ずしも良い手ばかりではなく、雑な戦い方をするソフトが多いというのだ。ところが中盤から終盤になるに従い、先の手を読むために必要な計算量が減り、将棋ソフトの分析精度がどんどん高まっていく。終盤にある程度形勢が決まると将棋ソフト同士の争いでも、もはや逆転は難しくなってしまうのだ。

そこで、磯崎氏はこうした将棋ソフトの弱点を突き、序盤で優位に立って一気に押し切るという作戦をいくつか用意した。その一つが「やね裏定跡」という方法論だ。これは、可能性のある指し手すべてに総当たりして次の手を考えるという現在主流の方法ではなく、将棋ソフトの対戦結果の「時間」に着目する考え方だ。

やね裏定跡は過去の棋譜データベースの記録のうち、ある将棋ソフトが次の手を指すまでに要した思考時間に着目する。思考時間が長いということは、局面を有利にしようと最善手を探し、より多くの思考を重ねたからと考えることができる。

つまり、時間をかけて将棋ソフトが差した手こそ優れた手であると考え、同じ局面が盤上に登場するとそれを定跡として捉える。そして序盤の定跡を独自に生みだしていく。こうして序盤を優位に進め、定跡をなぞるように展開することで一気に勝ちパターンに持ち込もうという作戦なのだ。

 今大会、やねうら王は予選8戦で5勝し、4位で予選通過した。磯崎氏はやね裏定跡の方法論が適切に機能したのはそのうち4戦と分析している。ただ、やねうら定跡のおかげで勝てたのは2戦だけという。ただ、この方法は、将棋ソフトが持つ序盤の欠点をあぶり出して攻める方法論のため、将棋ソフト以外には通じない。そのため人との対局には、もっと別の新しい対策が必要になるだろうと感じているようだった。

思考量を増やして強敵に対抗

やねうら王(先手)対ポナンザの対局の中盤の様子。画面上の数字はそれぞれの将棋ソフトが、どの程度有利と判断しているかを示している。差は100点前後で、ほぼ五分五分といえる状態だったが…

やねうら王はトーナメントの準決勝で、優勝した「ponanza(ポナンザ)」と当たった。ポナンザは前評判も高い強豪で、この対戦でやねうら王の本当の実力が問われることになった。R評価の平均値はポナンザがR200ほど上回るとみられていた。これはパソコン性能で比較すると2~2.5倍の差に相当し、同じ条件なら「9回対局して1回勝てるかどうか」(磯崎氏)と実力差は明らかだ。

ポナンザに対し磯崎氏が取った作戦は、通常の3倍の時間を使って将棋ソフトに思考させるという方法だった。局面を分析して次の一手を検討する思考量を増やし、R200の差を埋めようという狙いだ。これにより9回やって3回勝てるところまで勝率を引き上げようとしたのだ。

今回のトーナメントは持ち時間が2時間、それを使い切ると負けというルールだ。磯崎氏は序盤にあえて時間をつぎ込み、互角以上の争いに持ち込むことを狙った。ただ、後半になって持ち時間が足りなくなるというリスクもあるだけに「賭け」ともいえた。

実際、この作戦は功を奏した。やねうら王は序盤、優勢な状況をつくった。最強クラスの将棋ソフトと称されるポナンザも序盤は粗い展開をしがちとされる。やねうら王はそこにうまくつけ込んだのだ。

弱い将棋ソフトにも工夫の余地

しかし、対局が進むに従ってポナンザの差し手はやねうら王の読みとずれ始めた。磯崎氏は対戦中に「これ、あかんヤツや!」と叫ぶなど、焦りの色もみえ始めた。会場で観戦していた筆者も、やねうら王はこのまま一気に崩れてしまうのではと思ったほどだ。

予想を覆してやねうら王はそこから驚異的な粘りをみせ、中盤まで善戦した。終盤になると指し手を計算する時間が足りなくなり、結局、敗れはしたものの、ブランクを感じさせない磯崎氏の開発手腕が改めて注目されることになった。

磯崎氏は4位になった今回のトーナメントを「偶然の産物も大きかった」と振り返る。ただ、「弱い将棋ソフトでも、序盤の攻め方や思考時間のバランスを変えることで勝率を最大化できるという考えを実証できた」と手応えを感じたようだった。プロ棋士と対戦する来春の第3回電王戦に向け、さらなる改良に意欲をみせていた。

 次の電王戦では重要なルール変更がある。対戦相手が決まった後、その将棋ソフトを対戦相手のプロ棋士に貸し出さなければならないというルールが新たに設けられたのだ。

人間に対策機会を与える新ルール

棋士対棋士の場合、事前に対戦相手を研究したうえで対局に臨むのが普通だ。そこで将棋ソフトとの争いでも、棋士側に研究の機会を提供することで、できるだけ互角の条件にしようと考えてのことなのだろう。

優勝したポナンザを開発した山本一成氏

このルール変更について磯崎氏は、将棋ソフトの貸し出しによりプロ棋士側はかなりの対策を講じることが可能になるとみていた。棋士側が、プログラム上のミスで将棋ソフトが負けるパターンを発見する可能性が高いからだという。その場合はプロ棋士が簡単に勝ってしまう。磯崎氏は「果たしてそれでいいのだろうか」と疑問を呈していた。

磯崎氏に「コンピューターは人知を越えたのでしょうか?」と質問すると、「穴はたくさんある」との答えが返ってきた。まだまだAIが人間の頭脳を越えたとはいえないと考えているようだった。

電王戦のような機会を通して、プロ棋士は自らの技量に磨きをかける一方、将棋ソフトの開発者もプログラムの改良を繰り返す。今後しばらくはそうした応酬が続くとみられる。磯崎氏のように新しい方法論を試す開発者も出てくるだろう。

チェスがそうだったように、将棋の世界でもいずれコンピューターが人間を完全に圧倒する日が来るのかもしれない。それでも、将棋というゲームは非常に奥が深く、人間の頭脳にもまだまだ未知の可能性があるはずだ。磯崎氏は今大会の対局について、「特に終盤はコンピューターを通じ、人間が多くの新手を見つけて対抗できる余地がある」と断言していた。我々はいつまで「人間対コンピューター」の競い合いを楽しめるのだろうか。

新清士(しん・きよし)
 1970年生まれ。慶応義塾大学商学部および環境情報学部卒。ゲーム会社で営業、企画職を経験後、ゲーム産業を中心としたジャーナリストに。立命館大学映像学部非常勤講師も務める。グリーが設置した外部有識者が議論する「利用環境の向上に関するアドバイザリーボード」にもメンバーとして参加している。著書に電子書籍「ゲーム産業の興亡」 (アゴラ出版局)がある 。

春割ですべての記事が読み放題
今なら2カ月無料!

セレクション

トレンドウオッチ

新着

ビジネス

暮らし

ゆとり

新着

ビジネス

暮らし

ゆとり

新着

ビジネス

暮らし

ゆとり

フォローする
有料会員の方のみご利用になれます。気になる連載・コラム・キーワードをフォローすると、「Myニュース」でまとめよみができます。
春割で申し込むログイン
記事を保存する
有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。
春割で申し込むログイン
Think! の投稿を読む
記事と併せて、エキスパート(専門家)のひとこと解説や分析を読むことができます。会員の方のみご利用になれます。
春割で申し込むログイン