いなたくんへ
私には心がある。
と言って、じゃあ心の存在を証明しろと言われても「我思うゆえに…」としか答えられないけど、でも君は私の心の存在を信じるだろう。それは君が「心の理論」を持つからだ。
「心の理論」とは、「他人も自分と同じように感じ考えていること、心を持つこと」を認知できる能力を指す。他人の心の存在を推し量ることで、意図の理解や共感が可能になる。
ところで心といえば、人工知能が心を持てるのか、という問題がある。深層学習により高い認識力を獲得し大いに注目される人工知能だが、心や感情の獲得は次なる大きなハードルだ。
もっとも、人間同士であっても「心」の存在を証明するのは難しい。自分でそう信じたり、他人がそうだと推定するしかない。「人工知能が心を持つ」という状態についても、実際に人間と同じ心があるかどうかはひとまず置いて、心を持って「いるように見える」状態に至るかどうかがポイントになる(構成論)。
そこでカギとなるのが「心の理論」なわけだけど、子どもの発育に着目した研究が興味深かったので紹介したい。またこれに関連して、人工知能が次なる段階に進みつつあると予見させるニュースもいくつかあったので、最近のものをまとめてみた。人工知能が心を持つのは、どうも遠い未来の話ではなさそうだ。
Summary Note
ロボットに脳の「遠心性コピー」を実装することで、「自他認知」「ミラーニューロン」「目標指向性」「利他的行動」といった乳幼児に起こる発育がロボットにもみられた
第3次ブーム人工知能は「目が見え始めた赤ちゃん」に相当し、この発展として「運動」「記憶」「未来予測」「言葉」そして「心の理論」といった能力の開発が進んでいる
第4次ブーム人工知能のブレイクスルーは「心の理論」や「認知革命」を実現するものになるかも
脳情報通信融合研究センターの長井志江氏のグループは、ロボットへの認知機能実装を通して、人間における認知発達メカニズムの解明を目指している(「構成的アプローチ」と呼んでいる)。
同グループは脳の「遠心性コピー」に相当する機能をロボットに実装したが、その結果として「心の理論」とみられる結果が得られた。以下はその概要。
人間の脳には「遠心性コピー」と呼ばれる機能が備わっている。
例えばコップを持とうと発意して、実際に身体を動かし、つかんだとする。このとき脳は「つかむ」という結果に至る前に、身体を動かした結果をシミュレートして予測している。動作の結果が予測できるからこそ、手を伸ばし、さわり、つかむという身体の制御を連続的かつスムーズにできる。この脳の内部モデルとしての「身体の動きのシミュレーション機能」が遠心性コピーである。
遠心性コピーは、幼児期に実際に身体を動かして、脳内予測と実際に身体を動かした結果とを照合することで作られていく。子どもの動きがぎこちないのは、遠心性コピーが未発達であるからだ。
ここで長井氏は、「乳幼児の感覚・運動情報の予測学習が認知発達の基盤である」と、認知発達の観点で注目する。そして長井氏は「遠心性コピー」をロボットにもたせることを試みた。
通常のロボットであれば、人間が動作アルゴリズムを作り、実装する。一方で長井氏が実装したのは、ロボットに運動をさせ、ロボット自身が自分の中で予測アルゴリズムを創り出す、という機能だ。
遠心性コピー実装の結果は次の論文でまとめられているが、乳幼児に発育に相当する種々の能力が発現していてすごい。
ということで以下解説。
1つめが「自他認知の発達」だ。乳幼児は5ヵ月程度で、自分の感覚が自分の運動に随伴するものであって、自分が空間の中に置かれた存在であると認識する。このとき、自己の動きと他者の動きとの予測誤差から、自分と他人とが別の存在であることも認識する。
ロボットについても同様の効果が得られたという。
ちなみにジェイムズ・ホーガンのSF古典『未来の二つの顔』(1979)でも、人工知能スパルタクスは現実世界での運動を通して自他認知を獲得し、自我の完成に至っていた。
興味深いのが「ミラーニューロンの創発」だ。ミラーニューロンとは「他者の運動をまるで自己の運動であるかのように認識するニューロン」である。
「遠心性コピー」を実装したロボットは、そのアルゴリズムの抽象系(深層学習の中間層に相当)を用いることで、他者の動きをも予測できるようになった。これはミラーニューロンに当たる。
ミラーニューロンを持つことで、自己と他者の等価性を認識するとともに、他者からの随伴的応答を利用して、自己と他者の関係を認識することができる。
乳幼児は物体操作にあたり、どう達成するかの「手段」ではなく「目標」を重視するという(目標指向性)。例えば「おもちゃを箱に入れる」という動きの模倣にあたり、おもちゃを箱に入れることは真似できるが、入れる手の動きまでは真似できない。この理由は明らかにされていない。
これについて長井氏は「予測誤差の最小化」で説明を試みている。
「遠心性コピー」を実装したロボットは、予測アルゴリズムと実際の運動との誤差を最小化しようとする。このとき、物体操作の学習において「目標姿勢」の予測誤差最小化と、それに至る軌道の最小化とにかかる時間には差があり、この時間差が乳幼児における目標指向性を生んでいるということである。
ロボットの学習が人間(赤ちゃん)の成長をなぞっていて、それで人間の仕組みに仮説が立つというのはおもしろい。
そして最後の効果が「利他的行動の創発」だ。「遠心性コピー」を持つロボットは予測誤差の最小化に努める。ここでロボットはミラーニューロンを持つので、他者の行動をも予測でき、さらには他者が目標に到達しようとすることの予測誤差をも最小化しようとする。つまり他者に補助的な介入を行う。
おもちゃの例えで言えば、他者がおもちゃを箱に入れようとするとき、その意図を推定し、これを助けようとするわけだ(※実験では別の方法がとられている)。
「困っている人が何に困っているのか推定し、これを助ける」という行動は、乳幼児では14ヵ月頃から起こるという。このロボットの実験では、意図推定や利他的行動が遠心性コピーに結び付いているという仮説が成り立った。
この研究がすごいのは、特定動作に最適化されたアルゴリズムの実装や学習をさせたのでなく、「アルゴリズムを作るための汎用アルゴリズム」「学習するための汎用学習アプローチ」を実装した点にある。さらに長井氏は、この汎用アルゴリズムである「遠心性コピー」が、人間の発達段階に共通するメカニズムであることの重要性も強調している。
人間の発達を模倣することで、「自他認識」「ミラーニューロン」「他者の意図推定と利他行動」という、人工知能の課題とされてきた「心の理論」実現の糸口がつかめたわけで、すごい。
「心の理論」を備える人工知能は次の技術革新になり得そうだが、現行人工知能との関係はどう整理すればいいだろう。
現在3度目となる人工知能ブームは「深層学習」が1つのきっかけだった。この技術により実現したのが高度な「パターン認識」である。パターン認識はつい最近まで「人間ならではの能力で機械は苦手」と信じられていたのに、人類は一気に抜き去られてしまった。
東京大学の松尾豊教授は、第三次ブーム人工知能を「眼の獲得」に例えている。カメラは以前からあったが、外界の光学的情報を認知する脳の視覚野に当たる機能が、深層学習により実現したわけだ。生物史においては、眼の獲得が生存戦略を多様化させカンブリア爆発を招いた。松尾教授は機械でも同じことが起こると言う。
で、長井氏が「子どもの発育」に着目したのに倣って第3次ブーム人工知能を見直すと、「目が見え始めた赤ちゃん」と喩えれば松尾教授の説明とも矛盾がない。深層学習の基盤となるニューラルネットワークは脳の情報処理を模倣したものだが、まさに「お母さんの顔を正しく認識できる能力」を得たのが、第3次ブーム人工知能の段階である。
次世代人工知能についても「子どもの発育」の視点で見てみるとわかりやすい。次世代に続く技術は次の記事でも紹介したが、最近のニュースも併せて整理してみる。
「運動」に相当する機能。
「Deep Binary Tree」深層学習とは異なる機械学習モデルで、少量入力で軽く学習できるのが特徴。記事では、深層学習を「認識をつかさどる頭頂葉的な働き」に、Deep Binary Treeを「反射的な反応ができる小脳的な働き」に喩えている。
人間の脳が複数の機能モジュールからなるように、学習モデルも複数実装され、使い分けていくことになるかも。子どもに照らせば、目が見えるようになったあと、身体を動かし始める段階といえるかな。
「記憶」に相当する機能。
Google DeepMindによる「Deferentiable Neural Computer」なる人工知能は、獲得した知識を知識を他の状況に応用できる。例えばロンドンの地下鉄を学習して、パリの地下鉄に応用する、というように。
乳幼児が「いないいないばあ」で喜ぶのは記憶ができた証拠(前フレームと現フレームを比較できる)と言われるが、認知発達の観点で記憶が重要な要素であることは言うまでもない。
「未来予測」に相当する機能。
物理学者ミチオ・カクは『フューチャー・オブ・マインド』(2015)で意識を「目標を成し遂げるために、多数のフィードバックループを用いて世界のモデルを構築するプロセス」と定義し、霊長類の特徴として未来をシミュレートできる点を挙げた。
人工知能においても、MITやGoogleが未来を予測する技術を開発しており注目だ。
- 1.5秒先の未来を映像化するAI、MIT研究者が開発。「それっぽい動き」をぬめっと自動生成(Engadget Japanese,2016/11/29)
- Learning to Generate Long-term Future via Hierarchical Prediction(2017)
「言葉」に相当する機能。
ホモ・サピエンスの脳に起きた最大の進化の1つが「言葉の獲得」である、ということの傍証は以前紹介した通りだが、人工知能においても言葉の獲得が始まっている。
「運動」「記憶」「未来予測」そして「言葉」のいずれも、目が見え始めた赤ちゃんが獲得していく能力である。第3次ブーム人工知能は、赤ちゃんの能力の1つをようやく達成したものに過ぎない。
そして「心の理論」に関して、長井氏の研究論文は2015年のものだが、最近になり、同様の研究成果がいくつも見られている。例えば次のニュースでは、「夢」に着想を得た学習効率化の話題のほか、乳幼児の運動能力獲得を模倣した手法が触れられている。
ロボット同士の相互学習や、人間の動きを真似る技術も。これらも「心の理論」の要素である「意図推定」に関連する。
- グーグルがAIで挑む次の一歩は「新たなスキルを相互学習するロボット」(CNET Japan,2016/10/12)
- 普通の人間がロボットに教えた作業を、今度はロボットがほかのロボットに教えられる(TechCrunch,2017/5/11)
- 店員の動きを見てロボットが仕事を学ぶ「見よう見まね技術」–ATRが開発(CNET Japan,2017/6/1)
Microsoftが「AIロボットが現実世界で生物と共存するために必要な3つの要素」を公開。どれも「人間として」当たり前の内容であるけど、上述の研究開発はまさにこれら能力を人工知能に与えることになりそうだ。
胎児は発生の過程で魚や爬虫類といった過去の進化をたどるという。そして産まれた後においても、ホモ・サピエンスがたどった進化をなぞるように成長する。それは例えば自他の識別であり、「心の理論」の発現であり、あるいは言葉の獲得であったりする。
世界的ベストセラーとなった『サピエンス全史』(2016)では、言葉を「虚構を共有する能力」と定義することで認知革命の重要性を説明する。
子どもはだいたい3歳ごろに嘘をつけるようになるが、嘘は人間が地上の支配者となるための最重要能力だったわけだ。子どもは成長の過程で人類史上の革命を連発してくれていて、だから見ていておもしろい。
人工知能についても、ようやく目が見えるようになった第3次ブーム人工知能は、次の発育へと進んでいる。深層学習に続くブレイクスルーは「心の理論」獲得や「認知革命」を実現する技術になるだろう。それは文字通り次なる革命をもたらすはずだ。
さて、人工知能を人間の子どもに喩えたが、しかし人間の子どものように「まだ赤ちゃんだねー」「はやく大きくなるといいねー」と侮るわけにもいかない。例えば第3次ブーム人工知能も、その認識能力が人間をはるかに超えていることは忘れてはならない。
第3次ブーム人工知能の能力は要するに「パターン認識」であるが、パターンさえ存在すればそれを見つけ出し、あるいは応用できる。最近おもしろいニュースでは次のものとか。
- Google、手描きの絵を機械学習でプロの絵に置き換える「AutoDraw」公開(ITmedia,2017/4/12)
- 将来は「警察カラス」が誕生するかも?人工知能を使ってカラスと会話する研究(AI BIBLIO,2017/5/6)
鳥類は(少なくとも一部は)言葉を持つことが知られている。言葉を持つということはそこにパターンがあるわけで、人工知能であればこれを解読できてしまう。人間にはできない芸当だ。
ソニーコンピュータサイエンス研究所の北野所長は、人工知能による発明創出に取り組んでいる。
同研究所では人工知能を用いて創作させたビートルズ風の楽曲を公開した。ビートルズの既存の曲を学習することで、ビートルズ空間(「ビートルズっぽい音楽」の空間)の中からビートルズの未発見の曲を提示できた、というものだ。
この意義について北野氏は、「人工知能でビートルズが見過ごしたものを補完できた」ことではなく、「ビートルズ空間におけるベストの楽曲を再現性を持って発掘できること」としている。
ビートルズがリリースした楽曲は、広大なビートルズ空間におけるごく一部を「たまたま」見つけたものに過ぎない。しかし人工知能であれば、機械的に全空間を探索でき、ビートルズが発見した以上の楽曲を見つけ出せる。つまり人工知能は、人間の創作を補うのでなく、その先を行く。
北野氏はこれを「発明」に適用しようとしている。ノーベル賞では「実験を間違えたらたまたま見つけた」というセレンディピティも少なくない。しかし人工知能であれば、意図的に様々な実験を試み、再現性を持って、人類に未発見の大発明を連発できる。
第3次ブーム人工知能を「目が見え始めたばかりの赤ちゃん」と形容したが、そんな赤ちゃんでも上述の成果が期待できる。「心の理論」をもち、認知革命を経た人工知能についても、それを人間と対等の存在とみるのは間違いだろう。
第3次ブーム人工知能が社会に普及して、人間に残る仕事の1つが「ホスピタリティ」と言われている。共感を必要とする仕事は、第3次ブーム人工知能にはできないからだ。
しかし人工知能が「心の理論」を獲得したらどうなるだろう。確実に意図を汲んでくれ、100%共感してくれる存在。私は楽観主義者なので直ちにこれを脅威とは考えないが、社会の様相が大きく変わることは確かだろう。