第3次ブーム人工知能の進化と社会実装の最近のまとめ

いなたくんへ

画像認識のエラー率で2015年に人間を超えた人工知能。その認識力は継続して進化していて、音声認識や読唇でも人間並か、人間を上回るようになった。翻訳や監視など応用先はたくさんありそう。ディープラーニングに代表される第3次ブーム人工知能がどこまで人間を超えていくのか、楽しみである。

あとすごいのが自動彩色。白黒写真のカラー化が一時話題になったけど、コミックスもいけるのね。これはちょっと嬉しい。

ディープネットワークを用いた白黒写真の自動色付けhttps://t.co/UQ6Ho9kShM
通常のモノクロマンガ原稿をカラー化したら凄くいい感じに変換された。
というかヤバイレベル。 pic.twitter.com/gVu3efFptM

— 夢乃むえ (@yumemue) 2016年11月13日

コミックのカラー化ではちょっとオトナ向けも見つけたので、それはこちらから。

一方で第3次ブーム人工知能（ディープラーニングなど統計を用いた人工知能）の限界も見えている。圧倒的な認識力を誇るものの、学習の基礎となるビッグデータの影響を受けたり、人間のように自ら意志を持ち考えらえるわけではなかったり。あくまで計算機の延長であり、人工「知能」と呼ぶにはまだまだ発展途上である（実際にこの点はよく認識されていて、IEEEなどは控えめに「計算知能（Computational Intelligence）」と呼んでいる）。

そんな人工知能であるが、2つの方向性で進化を続けている。
1つは能力を伸ばし、いまの限界を超えようとすること。より効率的な学習アプローチや、フレーム問題などの課題に挑むなど、第3次ブーム人工知能の次の能力獲得に向けて開発が進められている。
もう1つは社会への実装だ。法務、政治、監査、サイエンスなど、実際の「現場」への普及が始まり、これを変えようとしているのが現在の段階である。

恒例のテクノロジー系ニュースのまとめにあたり、この3ヶ月では人工知能に関するニュースが多かったので番外として、上記2つの観点から1つの記事にまとめてみた。人工知能やっぱりすごいよ！

Summary Note

第3次ブーム人工知能を超える人工知能（夢応用とか未来予測とか）

人工知能の社会実装9例（執筆編集とか政治腐敗とかきゅうりとか）

まとめと、今後の課題

なおテクノロジー系ニュースまとめの本編はこちらから。

未来の世界に影響を与えるテクノロジー系ニュースまとめ・第10回（2016/10-12）（希望は天上にあり，2017/1/7）

第3次ブーム人工知能を超える人工知能

超サイヤ人を超える超サイヤ人みたいな章題だけど、最新の人工知能技術について目立ったニュースを挙げてみたい。まだ第3次ブーム人工知能の次のブレイクスルーと呼べるものではなさそうだけど、限界を超えようと様々なアプローチが試されている。

1．「夢」と乳幼児にヒントを得た学習強化

AlphaGoを生み出したGoogle DeepMindは論文「Reinforcement Learning with Unsupervised Auxiliary Tasks」を発表。そこで「UNsupervised REinforcement and Auxiliary Learning」（UNREAL：教師なしの強化および補助学習）を提唱した。

グーグルDeepMind、AIの学習を高速化させる新手法を発表–動物の見る夢から着想（ZDNET Japan，2016/11/21）

これは従来の深層学習に加えて、次の2つのタスクを組み込んだものだという。

動物が夢を見ることに着想を得たタスク
乳幼児が運動神経を獲得する方法を模倣するタスク

例えば前者は、動物が起きた体験を夢で見返して再学習するように、シーケンスを再現して評価を強化するというもの。過フィードバックにならないのかな、とは思うけど、生態模倣で人工知能が強化されるのはおもしろい。

2．未来を予測する人工知能

1枚の写真に基づいて、そこから1.5秒先までの動きを予測した動画を生成できる人工知能。

1.5秒先の未来を映像化するAI、MIT研究者が開発。「それっぽい動き」をぬめっと自動生成（Engadget Japanese，2016/11/29）

例えばテレビでも、それまでのフレームから次のフレームやフレーム間の画像を予測生成してハイフレームレート化する、という技術はある。けどたった1枚の写真から1.5秒（30fpsで45フレーム分）を生成するのはすごい。これは対象とは異なる情報に基づいて未来を想像できるということ、つまり推測できるということになる。

動物の認識対象は、脳が進化するにつれて「空間」から「社会」、そして「未来」へと拡大してきたとされる。未来を意識して今の行動に繋げる能力は生物にとって重要なものであり、これを人工知能も実現できるかもしれない。

ところで日立の人工知能も未来予測ができたみたい。内容を見るとロボットが試行錯誤して鉄棒スイングがうまくできたというもの。これって学習を繰り返して上達する強化学習と何も変わらないと思うんだけど、どうなんだろう。「予言ができました！」みたいな強い言葉をつかうと、弱く見えるぞ‥。

未来の“予言”を自動で行う日立の汎用AIが初デモンストレーション（FUTURUS，2016/11/20）

3．知識を「応用」できる人工知能

こちらもDeepMindの成果。学んだことを記憶して新たなケースに応用できる「Deferentiable Neural Computer」なる新型人工知能が発表された。記事では「ロンドンの地下鉄路線図から学んだことを記憶し、その知識をほかの似たような状況（例えばパリの地下鉄）に応用できる」といった例が紹介されている。

グーグル傘下のDeepMind、「人間のように記憶する」次世代AIを発表（WIRED.jp，2016/10/18）

ある時点での学習済みモデルを保存するとともに、これを他の対象にも応用できるということかな。世界初とのこと。

東大の松尾教授は第3次ブーム人工知能の真髄を「モデル化の自動化」としている。

1つはフレーム問題、あるいはシンボルグラウンディング問題。こういう問題は、人工知能の世界で長年難問だとされてきました。
たくさん問題があるように見えますけれど、僕は根本的には問題は1つしかないと思っています。根本的な問題からいろんな問題が発生してるだけだ、と。（中略）

今までの人工知能というのは、すべて人間がモデル化した後の自動化をさせていたんですね。ところが、今回のディープラーニングというのは、「人間がモデル化する行為そのものをいかに自動化するか」ということをやっているわけなので、対象としているフェーズが違うわけです。

画像認識が人間の目を超えた　人工知能の歴史的ブレークスルーの先に（Logmi，2016/7/21）より

DeepMindのこの新型人工知能は、このような「応用」を実用的にできたと言えそうだ。やがてはフレーム問題を解く糸口につながるかもしれない。

4．ロボット同士で学び、人間からも学ぶ人工知能

過去の体験を応用したり、未来を予想できるのは素晴らしいとして、元となる体験をいかに学ぶかも研究が進められている。次の記事はGoogleのロボット学習における3つのアプローチを紹介したものだ。（またGoogleか‥）

グーグルがAIで挑む次の一歩は「新たなスキルを相互学習するロボット」（CNET Japan，2016/10/12）

3つのアプローチとは次のもの。

１．強化学習
２．学習結果のロボット同士での共有
３．人間の動きを観察しての動きの学習

未来予測の１つとして、能力の外部化が脳にまで進んでネットに溶け「ブレインネット」になる、と言うものがあった。他方、人工知能は逆にブレインネットのようなネットワークの世界から、個別の肉体を持ったロボットとして世界に生まれようとしている。

個体となり、かつ現実世界の課題に直面した時、仲間同士で情報を共有したり、現実世界では「先輩」である人間に学ぶというのは、実に理に適ったアプローチだと思う。

人工知能の社会実装9例（執筆編集とか政治腐敗とかきゅうりとか）

さて、研究室で限界を超えんと挑むかたわら、社会では人工知能の実装が進んでいる。具体的にどんなことがされているのかまとめてみた。

1．リアルタイム翻訳

音声認識で人間並に近づいている人工知能は、リアルタイム翻訳に使われている。言葉の壁が無くなればこれは人類史的な出来事になるかも。

ところで翻訳と言えばGoogle翻訳の精度向上も話題になったが、Google翻訳の人工知能が中間言語を持っている、という話は興味深い。

Google翻訳のAIは独自の「中間言語」を習得して「学習してない言語間の翻訳」すら可能な段階に突入（Gigazine，2016/12/2）

我々人間も文化によって、色や天気に着ける単語の数が違ったり、持つ感情の種類が違っている。抽象的な概念情報である「中間言語」はこれらをつなげる。

こうした「発見」は脳の仕組みを解明するヒントにもなるかも。ディープラーニング（ニューラルネット）が脳構造の模倣から始まったように、人間を知ることで人工知能は進化した。その一方で人工知能の進化が人間の仕組みをも再発見させてくれるかもしれない。
例えば、人間は脳の一次視覚野で生の視覚情報を処理したあと、高次視覚野で「意味」を抽出するとされる。人間もその過程で中間言語のようなものを持つかもしれず、脳波計測などでこれを工学利用する未来もありうるだろう。

2．与信・会計監査

与信や会計監査への応用。膨大なデータの中から不正（エラー）や傾向を見つける、というのはまさに人工知能の得意分野。このあたりの仕事は早晩置き換えられそう。

3．法律実務（弁護士と裁判官）

膨大なデータの処理と言えば、弁護士業務もこれに近い。膨大に積み重ねられた法律・判例に照らして、事件の当否を判断する。このような作業は人工知能に長けており、実際に現場に導入されている。

ただし弁護士はあくまで主張する役割だが、判断を下す側である裁判官も人工知能化しそうな予感。

人工知能で判決を下す「裁判官AI」を開発、訴訟時間の短縮化が可能（Gigazine，2016/10/24）

欧州人権裁判所の評決と比較したところ、精度は79％だったとのこと。さらにこの人工知能は「法律の判断だけではなく、道徳的な側面にも配慮しての判断が行え」るようだ。

機械に裁かれるとかSF好きにはワクワク展開だけど、現実問題として人を置き換えるには至らないだろう。何しろ人間の運命を扱う役割であるから、正答率99.9％でもまだ不十分であり、100％が求められる（もっとも人間が裁いた場合の冤罪率のが高そうではあるけど、置き換えるなら100％でないと社会は納得しない）。

現状のように、裁判官や弁護士の業務の一部を人工知能が補う、という組み合わせの深化が落としどころのように思う。

なお法律業務の１つである知財業務の未来は、当事者としてこのブログでも何度か論じた。一部業務の置き換えが進みつつ、特許制度そのものが滅びたりして‥というのが現在の予想。

4．コンテンツの執筆と編集

人工知能による新聞記事出力はすでに実現していたが、日本でもデビュー。株式会社ビットエーが米Articooloと提携し、人工知能によるWebコンテンツ制作を開始したとのこと。

ついに我々ライターは失業か？国内初のAIライティングツールの実用開始（2016/11/23）

さらに産経新聞は人工知能による自動編集を採用、「記事のバリュー（価値）をAIが瞬時に判定し、ニュース性の高い記事を24時間リアルタイムに更新」するという。

記事の価値、AIが判断――国内新聞社初、産経の新アプリは“AIが編集”（IT mediaニュース，2016/12/7）

人工知能が記事を自動生成して、人気のありそうなものだけ公開すれば、これはもう立派なメディア。ただし、新聞が大衆に迎合して社会に混乱をもたらす、という新聞登場以来の負の側面も増幅しないかどうかは懸念。人間が書くのと違って、人工知能なら事実を捻じ曲げないだけいいのかな。

Googleのファクトチェック機能はぜひ導入してもらいたい。

ネットニュースの虚実に迫れるか「Google News」に「ファクトチェック」タグ導入（WIRED.jp，2016/10/17）

5．国会答弁下書き・政治腐敗対策・謝罪会見対応

執筆つながりでは国会答弁の下書きもお任せ。「ＡＩに過去５年分の国会の議事録を全て読み込ませたうえで、与えられた質問に対し、過去の答弁内容を踏まえて回答」できるようにする。

ＡＩが国会答弁下書き　経産省が実証実験（日経新聞，2016/12/5）

「だったら政治家いらないのでは」という批判もあるけど、国会答弁も裁判官と同様に、内容そのもの以上に「誰（＝国民の代表者）」が発言することに一定の意味はあると思う。というか負担が減るのは答弁を用意する下々の方であって、政治家の仕事自体は変化なさそう。

政治関連で期待なのはこっちかな。

AIの権威ベン・ゲーツェル氏「人工知能で政治的な腐敗を正せる」（ROBOTEER，2016/10/1）

ただし課題認識は「彼ら（政治家や官僚）は、専門知識が不足していたり、私利私欲に陥って誤った判断を繰り返している」というもので、汚職対策というよりは、監査やファクトチェックに近いもののよう。それでも実現すればインパクトは大きそうだけど、大半の国は導入しないんじゃないかな。

謝罪が必要になったらこれを使おう！

「記者会見」の印象をAIで解析する産学連携プロジェクト – 謝罪会見など分析（Security NEXT，2016/12/19）

6．マーケティングとAmazon Go

ビッグデータ解析の王道の１つが需要予測やマーケティングであり、そのための人工知能も活躍している。手軽さがウリのものとか、評判分析とか。直接的に行動を促し誘導するものは、もうマーケティングの目的そのものだよね。

そんななかで世間に衝撃を与えたのが、店舗のレジをなくした「Amazon Go」。入店時にスマフォタッチで本人認証さえすれば、あとはカメラなどのセンシングに任せて、店舗の商品を取り放題で会計不要。これだけ未来なサービスだけど、サービス名が「Pockemon Go」の二番煎じに聞こえて惜しいと思うのは私だけかな‥。

どんなユーザが何を買ったか、だけでなく、買わなかったことや、店舗内での行動にも注目されており、Amazon Goもその目的と思われる。

7．監視

カメラと言えば監視も忘れてはならない応用領域だよね。おそロシアおそロシア。