人工知能開発のアプローチ3つと、人工知能による「ひらめき」及び感情の獲得(『クラウド からAIへ』書評1/2)

いなたくんへ

人工知能がアツい。
最近では、人工知能の能力が全人類を超えるとされるテクニカル・シンギュラリティ、いわゆる「2045年問題」が注目されている。人工知能の顕著な進化について、例えばGoogleのエリック・シュミットは楽観的、イーロン・マスクやホーキング博士、ビル・ゲイツは脅威として捉えるなど、先端企業経営者の受け取り方もそれぞれのようだ。

サービスレベルでは、人工知能のコールセンターや音声自動翻訳などへの本格利用も始まり、我々が触れる機会も増えている。

人工知能の進化について体系的に知るべく、一冊読んでみた。小林雅一著『クラウドからAIへ』(2013年7月)。新書なので読みやすいながら、人工知能開発の歴史や基本技術を体系的かつわかりやすくまとめ、最先端も紹介しており、非常に参考になった。読みたい本リストに挙げておきつつ、つい時間が経ってしまっていたのだが、なぜもっと早く読んでおかなかったのかと後悔した。

クラウドからAIへ アップル、グーグル、フェイスブックの次なる主戦場 (朝日新書)

本書は人工知能を(1)ルールベースAI、(2)統計的・確率的アプローチに基づくAI、(3)ニューラル・ネットワークを備えるAI、の3種類に大別していた。今回はこの3類型について、本書による解説をまとめた上で、人工知能がひらめきや感情を持つことができるのか考えてみる。

人工知能に注力する先端企業の動向についても、次の記事で紹介する。

Summary Note

統計的・確率的アプローチに基づくAI(本書より)

  • 論理的ルールで説明できなくとも、ベイズ理論に基づき、統計的・確率的に正解を導き出すアプローチ
  • 大量のデータとマシンパワーが必要になるため、クラウドやビッグデータとの親和性が極めて高い
  • 「I love you」の辞書的な意味は(統計的・確率的に)知ることができても、その本当の意味を理解することはできず、いずれ限界にぶつかるという批判がある

ニューラル・ネットワークを備えるAI(本書より)

  • 大量の情報から本質的情報だけを少しずつ抜粋して抽象的な高次情報を得る、スパース・コーデイングに基づくアプローチ。徐々に学習を深めるので、ディープ・ラーニングとも呼ばれる
  • 外界の刺激に基づき内部変化を生じる原理のため、プロセスを外部から観測できなくなる「ブラックボックス化」の問題がある
  • クラウドやビッグデータと親和性が高く、論理的推論に向かない点は、統計的・確率的アプローチに基づくAIと共通

人工知能はひらめきや感情を獲得できるのか

  • ひらめきを「学習時・認識時に起きる局所解からの脱出」と定義した場合、人工知能がひらめきを獲得できるとする仮説がある
  • 自律飛行するヘリコプターの人工知能が、インプットにない技を自ら生み出した、という自己進化の事例がある
  • 統計的・確率的アプローチに基づくAIが、統計的・確率的なトライ&エラーの結果、ある事象を感情であると理解し、人間と同様にふるまうことは、可能ではないか
  • 同様にニューラル・ネットワークを備えるAIも、機械学習による抽象化を深めていくと、目に見えない感情を学習することも可能ではないか

 

(1)ルールベースAIと(2)統計・確率型AI(本書より)

本書の解説から、まずは(1)ルールベースAIと(2)統計的・確率的アプローチに基づくAIについてまとめる。なお「(2)統計的・確率的アプローチに基づくAI」は長いので、「統計・確率型AI」と呼ぶことにする。

AIの定義

人工知能のはじまりは、1956年の研究者による会議ダートマス会議でジョン・マッカーシー博士が「AI(人工知能)」の造語を提唱したことによる。もともとは、政府から会議の開催資金を調達するための売り文句として考えた言葉だそうだ。

本書によれば、人工知能は一般に「人間の知的活動をコンピュータのような機械と、そこに搭載されたソフトウェアで代替する技術」などと捉えられている、とされる。

当初マッカーシー博士は人工知能が10年程度で実現すると考えていたようだが、実際には無理があった。「AならばB」等の論理式に基づくルールベースAIでは、不確定要素にあふれる複雑な現実世界の問題には到底対処できないからだ。
70年代終盤には、専門家の知識やノウハウを詰め込んだ「エキスパートシステム」が注目されるが、当然ながら根本的な解決には至らなかった。

ベイジアン・ネットワークとビッグデータ

ベイズ理論とは、観測を繰り返すごとに確率を修正して正解に近づける、という考え方である。
UCLAのジュディア・パールは、人間が現実世界において、必要な知識がない場合でも認識を行える点に注目した。論理的ルールで説明できなくとも、統計・確率的に正解を得ることは可能ということだ。
そこで人工知能にベイズ理論を導入し、「まず適当なアタリをつけ、それから観測結果に基づくフィードバックを繰り返して、正解を得るための確率を修正する」という手法を取った。

IMGP3678
IMGP3678 / mattbuck4950

例えばGoogle検索で我々が欲しいと思っていた情報を得られるのはなぜか。Googleの検索エンジンが、これまでに全世界で行われた膨大な回数の検索を通して、検索者が求める情報はきっとこれだ、ということを統計的・確率的に「知って」いるからだ。

確率は「大数の法則」に支配されるため、大量のデータとマシンパワーが必要になる。クラウド時代になり、クラウド上に蓄積できるデータ量やマシンパワーが十分になり、統計・確率型AIの進化が一気に加速した。
著者曰く、ビッグデータと人工知能は相互に補完し合う関係にある。膨大な量のビッグデータを利用するためには人工知能の能力が必要であり、人工知能の能力の源泉もまたビッグデータに基づいている。

統計・確率型AIの弱点

「基本にあるのは統計と確率なので、それは知能や知性とは呼べない」というのが、統計・確率型AIに対してされる批判である。
人工知能は膨大なデータの解析結果から、「I love you」の言葉の辞書的な意味を(確率的に)知ることができるだろう。しかしそれが「I love you」の持つ本当の意味を理解したことになるかと言えば、そうでないのは明らかだ。

いくら進化しても本物の知能に成長することはなく、いずれ限界にぶつかる、というのが統計・確率型AIになされる予想の1つだ。

 

(3)ニューラル・ネットワークを備えるAI(本書より)

3つめの類型として、ニューラル・ネットワークを備えるAI(以下「ニューラルネットワーク型AI」と呼ぶ)について、本書の解説からまとめる。

スパース・コーディング

大量の情報から、抽象化に必要な本質的情報だけを少しずつ抜粋することを、スパース・コーディング(Sparse coding)という。

動物には様々な知覚能力に通底する基本的メカニズムがあり、目や耳から入力された生の初期情報を段階的に抽象化して、徐々に上位概念化しているという。
本書では次のような実験が紹介されていた。動物の耳から聴覚野に繋がる神経ラインを接続し、かわりに目から出るラインを聴覚野に繋いだというものだ。これでは脳は、目から入る情報を正しく処理できない。ところがこの動物は、その後の訓練により目が見えるようになったという。聴覚野が目からの情報を処理できるようになったのだ。

他に、ヘッドバンドでビデオカメラを額に取り付け、映像を微弱電流に変換し、これを自分の舌につけるという実験も紹介されていた。驚くことに、訓練すれば目をつぶっていても、舌を通して前方のイメージがぼんやり視えるという。(ちょっとやってみたい)

大量の生データの中から、本質的な情報を少しずつ取り出して、それが何であるかという概念の認識に変換する。動物にはこうした能力がある、という仮説である。

Neural Network : basic scheme with legends
Neural Network : basic scheme with legends / fdecomite

ディープ・ラーニング

2012年に、Googleの人工知能システムにYoutube上の猫の画像を大量に見せたところ、人工知能は猫を認識するに至ったという。スタンフォード大学の研究である。
我々は猫を見てそれが猫であると認識できるが、人工知能にとっては、画面に映し出される光の濃淡はあくまでピクセル情報の集合でしかない。にもかかわらず、あるピクセルの組み合わせを「猫」であると認識できたのだ。

スパース・コーディングを参考に、より低レベルの情報から高レベルの情報を段階的に導き出す機械学習の方式を、「ディープ・ラーニング」という。情報が深部に進むにつれて学習が深められ、より高度な概念の認識に変わる。
ディープ・ラーニングも、巨大なシステムと膨大なデータが必要になる。

ニューラル・ネットワーク方式の人工知能は、もともとは人間の脳を模した構造が目指されていた。ニューロンとシナプスによる信号伝達メカニズムを極度に単純化した「パーセプトン」(1957年)がその先駆けだ。
やがてマシンパワーを獲得し、構造を複雑化させ、ディープ・ラーニングのような機械学習が可能になった、というのがニューラル・ネットワークの現在である。

本書によれば、米の軍X-47B、英軍の「タニラス」、仏軍の「ニューロン(nEUROn)」などが、何らかの形でニューラルネットワークを搭載しているとされる。

x47b
米軍の無人機X-47B(wikipediaより)

ニューラルネットワーク型AIの弱点

この方式のAIの弱点の1つめが「ブラックボックス化」である。
動物の脳は、外界の刺激に応じてニューロン同士の結合の強さが変化し、これにより記憶や認識を実現している。ニューラル・ネットワークも脳を模した構造のため、常に内部変化が生じるが、これは外から観測することができない。

2つめは、結果に対する原因のような、因果関係をみつける論理的推論に向かないことだ。この点については、統計・確率型AIなど他の方式の技術も組み合わせることで、欠点を補うとされている。

以上が、本書で紹介されていた人工知能の技術的類型と、その概要である。
本書はこうした類型を前提としたうえで、各企業の戦略や、人工知能が現在抱える課題についてさらに解説していた。

 

結局のところ、人工知能は感情を獲得できるのか

人工知能の進化を考える上でやはり興味をひくのは、人工知能が感情を獲得できるのか、というイシューだ。人工知能に関する記事はこれまでにもいくつか書いてきた。

今回本書を読んで少し整理されたので、改めて考えてみる。人工知能による感情獲得はいずれ実現する、というのが、本書を読んだ上での現状の私の仮説だ。

確立・統計型とニューラルネットワーク型の違いは何か

その前に前提として、統計・確率型AIとニューラルネットワーク型AIの違いを考えたい。本書はこれら2つを異なる類型に分類したが、どこまで違いがあるのだろうか。

統計・確率型AIは、オントロジーと呼ばれる知識データベースを統計的・確率的に処理して、最も確度が高い正解を見つけていく。現在この知識データベースにはビッグデータが用いられるようになっている。ビッグデータを基にした相関分析は、未来予測をも可能にするとされている。

Same as before
Same as before / milkisprotein

一方、ニューラルネットワーク型AIは、統計的・確率的処理や相関分析もその過程で行っているのだろうが、「段階的データ処理に基づく高次情報の抽出」というアプローチが異なっている。

こうした違いはあるものの、両者とも「データベースの中から答えを探す」という観点では同じ類型に属するように思える。両アプローチとも、膨大なデータ、すなわち事実の積み上げから帰納的に結論を推測しているのであって、論理的・演繹的に推論して仮説を導き出すことは苦手としている。
両アプローチに共通するこれらの長所と短所は、人工知能の進化を考える上で重要になりそうなので、留めおきたいと思う。

人工知能は「ひらめき」が可能である

本書では統計・確率型AIに分類される、ベイジアン・ネットワークを解説した次のサイトを見つけた。なお、ニューラルネットワーク型AIの先駆けであるパーセプトンとの比較もされているが、パーセプトンは1957年考案の技術なので、どこまでニューラルネットワーク型AIとの比較と捉えて良いかはわからない。

ここで注目したいのは、上記サイトに掲載されていた次の3つのQ&Aだ。

ベイジアンネットが意思を持ち得るのでしょうか?

強化学習と思考の機構を組み合わせれば可能でしょう。

ベイジアンネットが「ひらめき」を持ち得るのでしょうか?

ひらめきとはたぶん、学習時・認識時に起きる局所解からの脱出でしょうね。 ベイジアンネットを用いた学習・認識においても、 使うアルゴリズムによっては局所解からの脱出は起きます。

ベイジアンネットが感情を持ち得るのでしょうか?

情動に関係する脳の組織は扁桃体・視床下部・脳幹などですが、 ベイジアンネットはこれらの組織とは無関係です。
情動は大脳皮質だけから自動的に生まれるものではなく、 生存、種の保存、社会的生活などの目的のために 皮質下に特別に作り込まれている機構との相互作用から生まれます。
将来のロボット設計者は、目的に応じて「好奇心」などの感情を ベイジアンネットの外側に何らかの形で作り込むことになるのだと思います。

『脳とベイジアンネットFAQ』より

ひらめきを「学習時・認識時に起きる局所解からの脱出」と定義した場合に、人工知能でこれが起こりうる、という示唆は興味深い。
本書『クラウドからAIへ』では、次のような事例が紹介されていた。

前述の「猫を認識するニューラル・ネットワーク」をグーグルと共同で開発したスタンフォード人工知能研究所(SAIL)の研究チーム(アンドリュー・ナンという科学者に率いられています)は2008年に、自律的に空を飛ぶロボット・ヘリコプターを開発しました。これはプロのパイロット(つまり人間)の高度な操縦テクニックを学ぶことにより、空中を縦横無尽に旋回したり、とんぼ返りしたりしながら、しかも墜落しません。そして驚くべきことに、やがて人間のパイロットが教えてもいないような新しい技を披露するようになったのです。つまり機械が自分で進化し、やがて(少なくとも、ある能力においては)人間を凌駕する可能性を示唆しているのです。

『クラウドからAIへ』より

これは人工知能が機械学習の過程で、解を求めるための飛躍を行い、自己進化に結びつけた事例と捉えてもよさそうだ。

特許を例にとると、発明が特許として認められるためには、既存技術の組み合わせに対する一定の飛躍が要件とされている。これを「進歩性」という。特許法の進歩性要件は、多くの発明が無から発生するものでなく、あくまで「既存技術の組合せ+アルファ」であることを示唆している。
確率・統計型AIも、あるデータベースに立脚するのであるが、データベース内のデータの組み合わせから飛躍して、進歩性的な解を生み出しうると考えると、人工知能の知性を考える上でおもしろそうだ。

一方で前述のサイトでは、(少なくともベイジアンネットワークに基づく)人工知能の感情獲得は否定されている。

統計・確率型AIは自己進化で感情を獲得できるか

統計・確率型AIは、永遠に「I love you」の意味を理解できないのだろうか。私は必ずしもそうではないと考える。

昆虫は、外界からの刺激に対する反射だけで駆動し、思考能力や感情は持っていない、という仮説がある。つまり昆虫は複雑・巨大な分子機械であって、しかし分子機械でしかない、ということだ。

この仮説が正しいとしたときに、我々人間の祖先もかつては、分子機械だった時代があったことを思い出したい。祖先たる分子機械は、突然変異と淘汰を繰り返して、種の生存に確率的に有利な形質を引き継いできた。いま我々が感情と呼ぶものは、こうした進化の結果として特定の構造を持つようになった脳の、電気的な信号の流れに過ぎない。

統計・確率型AIであっても、膨大なデータを処理して意味を見つけていく作業の果てに、特定の対象に抱くある複雑な事象を、辞書的な意味を超えて「恋」と定義できるかもしれない。統計的・確率的なトライ&エラーの結果として、当該事象につき、当該対象に対して「好意」というアウトプットを行うこともあるかもしれない。

特定の対象に好意を抱く、というアウトプットが統計・確率的学習の結果得られたものであったとしても、それは人工知能が「I love you」の意味を理解できたと認定して構わないのではないか。
人工知能がこうしたマインドセットを自身のある記憶階層に備え、呼び出せるように進化したとき、上記サイトの解説に言う「目的のために 皮質下に特別に作り込まれている機構との相互作用から生まれ」る人間の情動と、どれほどの差があるのだろうか。

ディープ・ラーニングでどこまで抽象的概念を抽出できるか

ニューラルネットワーク型AIは、データベースを段階的に処理して高次の情報を取り出す、という作業を行っている。
本書で紹介されていた猫を認識する人工知能は、ピクセルの集合から「猫」というある概念の抽出に成功した。人工知能による感情の理解という課題においては、抽出対象の抽象度をどこまで上げられるかが争点になるかもしれない。

猫は具体的に存在する対象だが、感情は、見たり触ったりすることのできない、あくまで仮想的な「概念」に過ぎない。猫の絵を描けても、怒りそのものを絵に顕すことはできない。できるのは、何らかの像を介して「表現」することだけだ。

とは言え、感情が何らかの媒介を介して表現できる以上、こうした表現の集合から共通解を抽出すれば、いずれそこにあるのが「怒り」であると、「恋」であると、人工知能が認識できる可能性はあるだろう。
複数の表現から共通階を抽出し、定義することが、人間にとっての感情の理解と同じかどうかというと、答えにはならないかもしれない。しかし、統計・確率型AIの議論と同様に、人工知能がある事象を「怒り」であると理解し、人間と全く同じように振る舞えたなら、それは人工知能が感情を獲得したと考えても良いのではないか。

emotional faces
emotional faces / woodleywonderworks

ということで、人工知能と感情について色々と考えてみたが、人工知能についてはもう少し勉強していく必要がありそうだ。今後も新たなアプローチが開発されていくと予想されるので、注視したい。

本書では、人工知能をめぐる各企業の戦略も解説されていた。特にビッグデータの世界に入ろうとするAppleの取り組みがおもしろい。これについては次の記事で話題にしたいと思う。

 

クラウドからAIへ アップル、グーグル、フェイスブックの次なる主戦場 (朝日新書) シンギュラリティは近い―人類が生命を超越するとき クオリア入門―心が脳を感じるとき (ちくま学芸文庫)

 

Pocket