『人工知能はどのようにして「名人」を越えたのか』感想

著者は最強の将棋AIであるポナンザの作者。

将棋のポナンザと囲碁のアルファ碁を題材に、人工知能の発展の歴史と技術的本質を平易に説明してくれている。

特に技術の説明に著者なりの解釈が随所に散らばめられていて、（本人も天才である）著者の頭の中が分かるスゴい本だ。

人工知能はどのようにして「名人」を超えたのか?―――最強の将棋AIポナンザの開発者が教える機械学習・深層学習・強化学習の本質

作者: 山本一成
出版社/メーカー: ダイヤモンド社
発売日: 2017/05/11
メディア: 単行本（ソフトカバー）
この商品を含むブログ (6件) を見る

感想。

これは面白い。

最終章の人工知能の未来に関する考察は私とは意見が異なったが、大変示唆に富んだ内容だった。

もちろん筆者も、読者が自身で考えるヒントになるように自分の意見・予想を惜しみなく披露してくれているわけで、こんな風にブログに意見を書いていることが筆者の思うツボだろう（笑）

全体としては、

プログラマ→科学→天才→人間からの「卒業」を軸に（DLや強化学習を含む）機械学習の技術的進歩を説明するという構成が秀逸だった。

筆者も述べているように、人工知能について考えることは、人間の知性・知能についても深く考察することになる。

筆者なりの「人間理解」が随所で説明されている。

特に、知性と知能の筆者なりの定義がわかりやすい。

知性=目的を設計できる能力

知能=目的に向かう道を探す能力

と筆者は定義している。

（人工知能分野での、知性・知能の使い分けははっきりとしていないらしい。）

知能の点では人工知能は人間をいずれ超えるだろう。すでに越えている分野もある。

囲碁より難しい判断を求められる場面が日常にあるだろうか。

昼ごはんに何を食べようかなんてことは、私の趣向、健康状態、お財布状況などのデータがあれば、人工知能が考えてくれる未来はすぐそこだろう。

どんな女性と付き合えば幸せかというようなことでさえ、必要なデータさえあれば（そのデータを取るのが難しいのだが）、人工知能が教えてくれるだろう。

人工知能は善悪の判断もできるようになるはずだ。

ここでいう善悪とは、哲学的詳察から導かれるものではない。

世間一般の人が、どんなことをよいと思い、どんなことを悪いと思うかという通念のことだ。

Twitterを見てみれば、街で人に手助けをされてとてもうれしく思った、会社にこんなやつがいて迷惑したなどの情報で溢れている。

その学習をミスったのがMSのTayさんだろう。しかし、あのままMSが公開を停止していなければ、ヘイトスピーチへの冷たい反応や批判を受けて軌道修正していた可能性もある。

いい行動が賞賛され、悪い行動が晒し上げられる（という印象を私は持っている）SNSでは、なぜその行動が拡散されているのかという文脈さえつかめれば、人工知能は一般的な倫理観を身につけることもできるはずだ。

一方、同じ善悪でも、基準がより明確で判例が記録されている裁判での有罪・無罪を決めることはもっと簡単だろう。

このように、知能の面では、人工知能は人間よりも精度高く「目的に向かう道を探し」、人間の行動を補佐してくれる存在になるだろう。

人工知能が人間を脅かし、人間に害を加える存在になるかどうかは「知性」を持つかどうかにかかっている。

筆者は、第4章で、人工知能がいずれ知性を持つだろうと予測している。

筆者は、各々が目的を持ったディープラーニングが繋がり、相互に影響しあうモデルを作ることで知性は獲得されるだろうと考えているそうだ。

それぞれのディープラーニングが、次にどのディープラーニングを呼び出すのかまでを含めて（相互に）学習するというイメージ

だそうだ。

この場合の、各々のディープラーニングが目的を持つとは、本当にありとあらゆる目的を指す。

例えば、囲碁の勝負をさせたい場合は、

まず、いろんな行動の中から、「囲碁で勝つ」という目的のディープラーニングを呼び出し、

囲碁に勝つために、今度は、「相手を殺す」、「相手の戦意を削がせる」、「真面目に第一手を打つ」などの目的の中から、「真面目に第一手を打つ」を選び、

その次は、………

と続いていくようなことを示す。

考えてみれば、人間だって同じだろう。

囲碁をしたいという目的を持つ時には、テレビが見たい、デートがしたい、などの様々な行動の中から、囲碁をすることが魅力的ならば「囲碁で勝つ」という目的を選ぶわけだ。

同様に、囲碁を始めたら、囲碁で勝つために、「相手を殺す」という選択肢も取れなくはない（現に想像ができる）が、「真面目に第一手を打つ」という目的を選んでいる。

その後も、途中で「囲碁をやめてテレビを見る」という選択肢も取れる中で、勝負を続ける方が魅力的だと判断すれば、「囲碁で勝つ」という目的を選択し続けることになる。

筆者のいう、各々が目的を持ったディープラーニングが人間と同じレベルで、ありとあらゆる目的を持つことができれば、その人工知能はほぼ1人の人間と同じとみなせると思う。

だが、知性とは、自分で目的を設定できる能力ではなかったか。

筆者の言うようにして作られた人工知能は、人間のように、今まで全く考えたこともなかった行動を目的として自ら考え出すことができるだろうか。

結局、新しい目的を追加するときに人間がその目的を司るディープラーニング部分を追加しなければならないのなら、それは本当の知性とはいえないだろう。

人工知能が、ふとした瞬間に、自分で全く新しい目的を考え出せるかと言われれば、私は怪しいと思う。

例えば、それまで自分のことを一番に考えていた人工知能が、ある日突然、自分以外の人間や人工知能にとっての報酬（いわゆる幸せ）が最も大きくなるような行動を取る、というようなことがあるだろうか。

人間は、例えば、自分に子どもが生まれて以降、その子の幸せを自分個人の幸せよりも優先するようになったということもあるだろう。

人間は、自分の価値観が根底から覆るような経験を時としてする。

それは、理性とか感情とかいうことを凌駕して、私たちにそれまでの考えを一変させることを要求する。

私も、忘れているだけで、子どものときはそんな驚きの毎日だったんだろうと思う。

人工知能は、自分の価値観を根底から変更し、これまでとは全く違う、これまで想像もしなかった目的を持つことがあるだろうか。

私は、やはりそれはできないのではないかと考えている。

以下、余談。

ただ、評価関数を決定するアルゴリズムのイメージが少し湧きづらかった。

評価関数とは、簡単に言えば、各局面であり得る次の指し手につけられた点数だ。

評価関数 - Wikipedia

（正確に言えば、現在の局面と次の手を打った後の局面それぞれ付けられる点数。つまり、指し手自体の点数は、打った前後の評価関数の差といえる。たぶん……）

機械学習を使えば、この評価関数を自動で決められることが本の主題なのだが、もう少し具体的なアルゴリズムまで踏み込んだ説明をして欲しかった。

将棋人工知能ポナンザの技術的説明で筆者は、

（指し手の）「評価」に関する部分はすべて機械学習によってコンピュータ自身で調整されています。私はどのように学習すればいいか、つまり学習そのものではなく、メタ学習について記述するのみです。（p65）

と書いてある。アルファ碁とイ・セドル９段との世紀の対決の直後の筆者の対談を掲載した付録のp216にも

この手はいい、この手は悪いという評価をする「評価関数」を、人間が手動でプログラムを書くのではなく、棋譜から自動生成したのが2005年に登場した将棋プログラム「Bonanza」（筆者のポナンザとは別物）の画期的な部分でした。それ以降の将棋プログラムは、ほぼみんなボナンザメソッドを使っていました。

としている。（（）内は私の注釈）

目的関数や（勾配降下法などの）学習アルゴリズムの決定は、筆者のいう「メタ学習」（p65）に含まれるのだと思う……

まあそこまで気にする人はいないだろうが、私は詳しく知りたかった。

詳細な解説記事を読んでみようと思う。

最後に、

筆者も述べているように人工知能を勉強すればするほど、人間を理解する必要があるとつくづく思う。

今秋は哲学の秋ですね…笑

うえにょっき

噺はまくらが一番大事

『人工知能はどのようにして「名人」を越えたのか』感想