いなたくんへ
画像認識のエラー率で2015年に人間を超えた人工知能。その認識力は継続して進化していて、音声認識や読唇でも人間並か、人間を上回るようになった。翻訳や監視など応用先はたくさんありそう。ディープラーニングに代表される第3次ブーム人工知能がどこまで人間を超えていくのか、楽しみである。
あとすごいのが自動彩色。白黒写真のカラー化が一時話題になったけど、コミックスもいけるのね。これはちょっと嬉しい。
ディープネットワークを用いた白黒写真の自動色付けhttps://t.co/UQ6Ho9kShM
通常のモノクロマンガ原稿をカラー化したら凄くいい感じに変換された。
というかヤバイレベル。 pic.twitter.com/gVu3efFptM— 夢乃むえ (@yumemue) 2016年11月13日
コミックのカラー化ではちょっとオトナ向けも見つけたので、それはこちらから。
一方で第3次ブーム人工知能(ディープラーニングなど統計を用いた人工知能)の限界も見えている。圧倒的な認識力を誇るものの、学習の基礎となるビッグデータの影響を受けたり、人間のように自ら意志を持ち考えらえるわけではなかったり。あくまで計算機の延長であり、人工「知能」と呼ぶにはまだまだ発展途上である(実際にこの点はよく認識されていて、IEEEなどは控えめに「計算知能(Computational Intelligence)」と呼んでいる)。
そんな人工知能であるが、2つの方向性で進化を続けている。
1つは能力を伸ばし、いまの限界を超えようとすること。より効率的な学習アプローチや、フレーム問題などの課題に挑むなど、第3次ブーム人工知能の次の能力獲得に向けて開発が進められている。
もう1つは社会への実装だ。法務、政治、監査、サイエンスなど、実際の「現場」への普及が始まり、これを変えようとしているのが現在の段階である。
恒例のテクノロジー系ニュースのまとめにあたり、この3ヶ月では人工知能に関するニュースが多かったので番外として、上記2つの観点から1つの記事にまとめてみた。人工知能やっぱりすごいよ!
なおテクノロジー系ニュースまとめの本編はこちらから。
超サイヤ人を超える超サイヤ人みたいな章題だけど、最新の人工知能技術について目立ったニュースを挙げてみたい。まだ第3次ブーム人工知能の次のブレイクスルーと呼べるものではなさそうだけど、限界を超えようと様々なアプローチが試されている。
AlphaGoを生み出したGoogle DeepMindは論文「Reinforcement Learning with Unsupervised Auxiliary Tasks」を発表。そこで「UNsupervised REinforcement and Auxiliary Learning」(UNREAL:教師なしの強化および補助学習)を提唱した。
これは従来の深層学習に加えて、次の2つのタスクを組み込んだものだという。
- 動物が夢を見ることに着想を得たタスク
- 乳幼児が運動神経を獲得する方法を模倣するタスク
例えば前者は、動物が起きた体験を夢で見返して再学習するように、シーケンスを再現して評価を強化するというもの。過フィードバックにならないのかな、とは思うけど、生態模倣で人工知能が強化されるのはおもしろい。
1枚の写真に基づいて、そこから1.5秒先までの動きを予測した動画を生成できる人工知能。
例えばテレビでも、それまでのフレームから次のフレームやフレーム間の画像を予測生成してハイフレームレート化する、という技術はある。けどたった1枚の写真から1.5秒(30fpsで45フレーム分)を生成するのはすごい。これは対象とは異なる情報に基づいて未来を想像できるということ、つまり推測できるということになる。
動物の認識対象は、脳が進化するにつれて「空間」から「社会」、そして「未来」へと拡大してきたとされる。未来を意識して今の行動に繋げる能力は生物にとって重要なものであり、これを人工知能も実現できるかもしれない。
ところで日立の人工知能も未来予測ができたみたい。内容を見るとロボットが試行錯誤して鉄棒スイングがうまくできたというもの。これって学習を繰り返して上達する強化学習と何も変わらないと思うんだけど、どうなんだろう。「予言ができました!」みたいな強い言葉をつかうと、弱く見えるぞ‥。
こちらもDeepMindの成果。学んだことを記憶して新たなケースに応用できる「Deferentiable Neural Computer」なる新型人工知能が発表された。記事では「ロンドンの地下鉄路線図から学んだことを記憶し、その知識をほかの似たような状況(例えばパリの地下鉄)に応用できる」といった例が紹介されている。
ある時点での学習済みモデルを保存するとともに、これを他の対象にも応用できるということかな。世界初とのこと。
東大の松尾教授は第3次ブーム人工知能の真髄を「モデル化の自動化」としている。
1つはフレーム問題、あるいはシンボルグラウンディング問題。こういう問題は、人工知能の世界で長年難問だとされてきました。
たくさん問題があるように見えますけれど、僕は根本的には問題は1つしかないと思っています。根本的な問題からいろんな問題が発生してるだけだ、と。(中略)
今までの人工知能というのは、すべて人間がモデル化した後の自動化をさせていたんですね。ところが、今回のディープラーニングというのは、「人間がモデル化する行為そのものをいかに自動化するか」ということをやっているわけなので、対象としているフェーズが違うわけです。
DeepMindのこの新型人工知能は、このような「応用」を実用的にできたと言えそうだ。やがてはフレーム問題を解く糸口につながるかもしれない。
過去の体験を応用したり、未来を予想できるのは素晴らしいとして、元となる体験をいかに学ぶかも研究が進められている。次の記事はGoogleのロボット学習における3つのアプローチを紹介したものだ。(またGoogleか‥)
3つのアプローチとは次のもの。
- 1.強化学習
- 2.学習結果のロボット同士での共有
- 3.人間の動きを観察しての動きの学習
未来予測の1つとして、能力の外部化が脳にまで進んでネットに溶け「ブレインネット」になる、と言うものがあった。他方、人工知能は逆にブレインネットのようなネットワークの世界から、個別の肉体を持ったロボットとして世界に生まれようとしている。
個体となり、かつ現実世界の課題に直面した時、仲間同士で情報を共有したり、現実世界では「先輩」である人間に学ぶというのは、実に理に適ったアプローチだと思う。
さて、研究室で限界を超えんと挑むかたわら、社会では人工知能の実装が進んでいる。具体的にどんなことがされているのかまとめてみた。
音声認識で人間並に近づいている人工知能は、リアルタイム翻訳に使われている。言葉の壁が無くなればこれは人類史的な出来事になるかも。
- ウェアラブル翻訳機「ili」がハワイ州観光局の公認商品に認定(Cneet Japan,2016/10/5)
- 「翻訳こんにゃく」が実現!?…MSが最大100人と対話できる「リアルタイム翻訳アプリ」発表(ROBOTEER,2016/12/16)
ところで翻訳と言えばGoogle翻訳の精度向上も話題になったが、Google翻訳の人工知能が中間言語を持っている、という話は興味深い。
我々人間も文化によって、色や天気に着ける単語の数が違ったり、持つ感情の種類が違っている。抽象的な概念情報である「中間言語」はこれらをつなげる。
こうした「発見」は脳の仕組みを解明するヒントにもなるかも。ディープラーニング(ニューラルネット)が脳構造の模倣から始まったように、人間を知ることで人工知能は進化した。その一方で人工知能の進化が人間の仕組みをも再発見させてくれるかもしれない。
例えば、人間は脳の一次視覚野で生の視覚情報を処理したあと、高次視覚野で「意味」を抽出するとされる。人間もその過程で中間言語のようなものを持つかもしれず、脳波計測などでこれを工学利用する未来もありうるだろう。
与信や会計監査への応用。膨大なデータの中から不正(エラー)や傾向を見つける、というのはまさに人工知能の得意分野。このあたりの仕事は早晩置き換えられそう。
膨大なデータの処理と言えば、弁護士業務もこれに近い。膨大に積み重ねられた法律・判例に照らして、事件の当否を判断する。このような作業は人工知能に長けており、実際に現場に導入されている。
ただし弁護士はあくまで主張する役割だが、判断を下す側である裁判官も人工知能化しそうな予感。
欧州人権裁判所の評決と比較したところ、精度は79%だったとのこと。さらにこの人工知能は「法律の判断だけではなく、道徳的な側面にも配慮しての判断が行え」るようだ。
機械に裁かれるとかSF好きにはワクワク展開だけど、現実問題として人を置き換えるには至らないだろう。何しろ人間の運命を扱う役割であるから、正答率99.9%でもまだ不十分であり、100%が求められる(もっとも人間が裁いた場合の冤罪率のが高そうではあるけど、置き換えるなら100%でないと社会は納得しない)。
現状のように、裁判官や弁護士の業務の一部を人工知能が補う、という組み合わせの深化が落としどころのように思う。
なお法律業務の1つである知財業務の未来は、当事者としてこのブログでも何度か論じた。一部業務の置き換えが進みつつ、特許制度そのものが滅びたりして‥というのが現在の予想。
- 人工知能は弁理士の仕事をどこまで奪えるか(希望は天上にあり,2016/7/1)
- 人工知能が変える知財の世界の未来年表と、発明の共有財産化という結末(希望は天上にあり,2016/11/30)
- 発明を生む人工知能は特許制度の破壊者となる(希望は天上にあり,2016/4/29)
人工知能による新聞記事出力はすでに実現していたが、日本でもデビュー。株式会社ビットエーが米Articooloと提携し、人工知能によるWebコンテンツ制作を開始したとのこと。
さらに産経新聞は人工知能による自動編集を採用、「記事のバリュー(価値)をAIが瞬時に判定し、ニュース性の高い記事を24時間リアルタイムに更新」するという。
人工知能が記事を自動生成して、人気のありそうなものだけ公開すれば、これはもう立派なメディア。ただし、新聞が大衆に迎合して社会に混乱をもたらす、という新聞登場以来の負の側面も増幅しないかどうかは懸念。人間が書くのと違って、人工知能なら事実を捻じ曲げないだけいいのかな。
Googleのファクトチェック機能はぜひ導入してもらいたい。
執筆つながりでは国会答弁の下書きもお任せ。「AIに過去5年分の国会の議事録を全て読み込ませたうえで、与えられた質問に対し、過去の答弁内容を踏まえて回答」できるようにする。
「だったら政治家いらないのでは」という批判もあるけど、国会答弁も裁判官と同様に、内容そのもの以上に「誰(=国民の代表者)」が発言することに一定の意味はあると思う。というか負担が減るのは答弁を用意する下々の方であって、政治家の仕事自体は変化なさそう。
政治関連で期待なのはこっちかな。
ただし課題認識は「彼ら(政治家や官僚)は、専門知識が不足していたり、私利私欲に陥って誤った判断を繰り返している」というもので、汚職対策というよりは、監査やファクトチェックに近いもののよう。それでも実現すればインパクトは大きそうだけど、大半の国は導入しないんじゃないかな。
謝罪が必要になったらこれを使おう!
ビッグデータ解析の王道の1つが需要予測やマーケティングであり、そのための人工知能も活躍している。手軽さがウリのものとか、評判分析とか。直接的に行動を促し誘導するものは、もうマーケティングの目的そのものだよね。
- http://www.nikkei.com/article/DGXLZO10712070V11C16A2LX0000/(日経新聞,2016/12/16)
- 人工知能で自社に関する記事の論調を分析、ビルコムが「PR Analyzer」を提供開始(ITmediaマーケティング,2016/12/21)
- 人工知能(AI)が外出プランを提案する新アプリ、行動パターンなどで好みを分析 ―ディープス・テクノロジー【動画】(トラベルボイス,2016/11/30)
- AIが買わなかった人の行動を分析、「売れない理由」をあぶり出す(Nikkei BPnet,2016/12/19)
そんななかで世間に衝撃を与えたのが、店舗のレジをなくした「Amazon Go」。入店時にスマフォタッチで本人認証さえすれば、あとはカメラなどのセンシングに任せて、店舗の商品を取り放題で会計不要。これだけ未来なサービスだけど、サービス名が「Pockemon Go」の二番煎じに聞こえて惜しいと思うのは私だけかな‥。
- 「レジで会計」もう古い? 魔法のようなコンビニ『Amazon Go』2017年にオープン(Engadget Japanse,2016/12/6)
- AI食料品店「Amazon Go」でレジ係が消える?–起こりうる変化を予測(Cnet Japan,2016/12/12)
どんなユーザが何を買ったか、だけでなく、買わなかったことや、店舗内での行動にも注目されており、Amazon Goもその目的と思われる。
カメラと言えば監視も忘れてはならない応用領域だよね。おそロシアおそロシア。
行動分析の観点では高齢者や幼児の見守りなどにも期待。
人工知能によるビッグデータ解析が変えようとする分野に、サイエンスも含まれる。例えば次のニュース。
大規模データの処理はオープン・サイエンス(同行の士が世界中で繋がって分担分析)が有望かと思ったけど、今後は人工知能の領域になるのかな。オープン・サイエンスのワクワク感は好きだったので、ちょっとさびしい。
次のニュースは、有機化学の実例を多数を学習し、与えられた原料・反応剤から生成物を予測するというもの。
人工知能は人間が試しきれない組み合わせを絨毯爆撃的に全部試して、未発見の結果を見つけ出してくれる。NECが創薬事業に参入したくなるわけである。
さらにはソニーコンピュータサイエンス研究所の北野宏明氏が、ノーベル賞級の発見ができる人工知能の2050年までの開発を目指している。
こうした人工知能による「発明」は現実世界とのインタラクションが不可欠と考えるが、人工知能の進化はこうした課題も解決していくのだろう。
さて、色々挙げたけど、最近で一番未来を感じたのはつぎのニュースかな。人工知能はここまで身近になっているわけですよ。気付かぬうちにも。
きゅうり農家さんが自作で人工知能を搭載した自動仕分けマシーンを作ったって…
むしろこの道で食えるでしょ… pic.twitter.com/WMONts8PFJ
— ゆるふわ陸士☆埼玉 (@yuruhuwa_rikusi) 2016年11月11日
他にもいろいろありそうだけど、私の目に入った範囲で、この3ヶ月を中心に人工知能の進化や社会実装に関するニュースを並べてみた。応用分野にはいくつかの傾向が見られたと思う。
まず「人間が処理しきれないビッグデータは人工知能に任せる」というもの。サイエンスも期待大としてさらに、監査や不正監視、過去に蓄積された知識(法律の判例とか)の対照など、現実世界の膨大な事象のチェックの一部は、人工知能に長けている。
倫理的な「正義」は(その判断に有意なエラーが含まれたとしても)しばらくは人間が担うかもしれない。その一方で、事実としての「正しさ」の判断、つまり矛盾の摘出は人工知能に期待できそう。人工知能と人間との協働はこのような役割分担で進んでいくだろう。
社会実装の観点ではいくつかの課題も提示されているので、最後に紹介しておきたい。
倫理的な「正義」で有名なパラドックスが「トロッコ問題」だ。人間と役割分担するようになると述べたが、自動運転車が同様の問題に直面するなど、人工知能が倫理の問題に置かれる場面は起こる。
メルセデス・ベンツの回答はズバリ「歩行者より運転者の命を守る」というもの。買ってくれたお客様を優先するのは当然ですよね。と言い切りにくいのが人の命の問題だけど、言ってくれやがりました。
IEEEは個人情報にまつわるプライバシーの取り扱い方や対処方法、自律兵器システムに対する人間の責任を定義、監査する方法など、人工知能が引き起こし得る問題に対して、3つの標準規格の策定を目指している。人工知能と倫理の問題は我々人間社会の在り方にもつながる議論なので、その結論は楽しみだ。
なおトロッコ問題で倫理観をテストするゲームもあったよ。
イーロン・マスクやGoogle DeepMindが人工知能技術をオープン化している。また、「学習済みモデル」を構築するためのデータセットの公開なんかも。
- イーロン・マスク氏のOpenAI、人工知能学習プラットフォーム「Universe」をオープンソース化(IT Mediaニュース,2016/12/6)
- DeepMind、3DゲームのようなAI開発プラットフォーム「DeepMind Lab」をオープンソース化(IT Mediaニュース,2016/12/6)
- 「バッハっぽさとは何か?」をAIに理解させることを可能にする330曲・100万音分のデータセットが公開される(Gigazine,2016/12/7)
競争戦略的には、技術をオープン化したとして、ではどこで利益を得ようとしているのか気になるところ。そして社会全体としても、人工知能の生む価値をいかに最大化するかは議論がされている。
IT革命で価値がハードウェアからソフトウェアに移り、各所でエコシステムが変わったように、人工知能もまた価値のあり方を再定義するゲームチェンジャーとなる。この辺りの行方も気にしていきたい。