ビッグデータ解析が可能にする、未来犯罪の予測と個人情報推定（『ビッグデータの正体』書評2/3）

昨今バズワードとしてニュースで見かける「ビッグデータ」について、論点を体系的にまとめたベストセラー『ビッグデータの正体』。本書では、全てのデータの相関関係を調べることで、未来予測が可能になることが述べられていました。

ビッグデータ解析による未来予測を、企業はすでに使い始めた（『ビッグデータの正体』書評1/3）（2014/1/26）

『ビッグデータの正体』では、ビッグデータの利用が普及したとき、世の中にどんな影響が現れるかも述べられています。
今回は本書の内容を参考にして、将来の社会がどう変わるかを考えてみました。

Summary Note

『ビッグデータの正体』で述べられていた未来（２）

未来犯罪の予測は可能となるが、しかし裁いてはいけない
個人情報の取扱いにあたっては、データ保有者に利用責任を問うとともに、監査機関の設立が望まれる

ビッグデータ解析が普及した社会はどのように変わるか？

それでも個人情報推定の悪用は防げない
政府機関はビッグデータを安全保障に利用する
予測できる者とできない者の間に大きな格差が生まれる

マイノリティ・リポート問題と未来を予測することの責任

本書では、ビッグデータ利用で社会に生じる問題と、解決案の提案が述べられていました。おもしろかった２つを紹介します。

ビッグデータが実現する『マイノリティ・リポート』の世界

問題の１つめが、犯人がまだ犯罪を犯していない段階でも裁いていいのか。
映画『マイノリティ・リポート』では、予知能力者が未来に起こる犯罪を予知して、事前に犯人を逮捕する社会が描かれていました。

犯罪予防関しては、本書では米国メンフィスで実際に実践された事例の紹介がありました。
メンフィスでは、あるアルゴリズムを用いて犯罪発生地域を予測することで、警備対象の地区と時間帯を大きく絞り込みました。警備にかかるコストは大幅に減ったわけですが、なおかつ犯罪の発生率を1/4に減らすことに成功したそうです。

現状のビッグデータ解析では、Amazonの「おすすめ商品提示」程度の予測しかできないでしょう。でもコンピューティング技術がさらに進んで、蓄積されるビッグデータも増えれば、未来予測の精度はどんどん高まっていくことになります。
2045年には人工知能が人間の知能を超えるという予測もありますしね。

コンピュータの知能獲得と自己進化は、人間の進化をももたらすか（2013/5/19）

そうした未来の出来事が予測できる社会で、「１時間後に殺人を犯す確率99％」の人間を逮捕すべきかどうか。

ビッグデータ解析の前では個人情報は隠しきれない

２つめの問題がプライバシーです。
ビッグデータによる相関関係の分析は、未来予測だけでなく「プライバシー保護されたその人が誰なのか」も高い精度で暴き出すことができます。現状の個人情報保護では、ビッグデータを利用した場合に起きる問題に対処できないのでは、というのが著者の問題提起でした。

著者によれば、現状の個人情報の保護態様は次の３つとなります。

１）個人情報を利用する用途を事前説明し、本人の同意を取る（告知を同位）
２）個人情報が利用されることを本人が拒否できるようにする（オプト・アウト）
３）データを匿名化して、誰の個人情報かわからないようにする（匿名化）

これに対して、ビッグデータが本格利用されると次のような問題が発生するようです。

収集された個人情報がどのようなビッグデータ解析に使われるか、どのような相関関係が取られるかは、解析段階にならないとわからない場合があり、事前に利用用途を説明することが難しいことがある
Googleストリートビューで、空き巣を恐れた富豪が建物にモザイクをかけることを要求したところ、かえって「Googleストリートビューでモザイクがある建物は金持ちの家」と思われ、リスクが増大した。このように全員のデータが利用される状況では、「データの利用を拒否」したこと自体がリスクになる可能性がある
匿名化したとしても、ビッグデータ解析を用いれば個人の特定は極めて容易

犯罪の未然防止よりも推定無罪の原則を優先

上記２つの問題に対して、著者は次のように答えています。

まず犯罪の事前逮捕ですが、これは「やってはいけない」と明言してます。
99％の確率で犯罪を犯すということは、犯罪を犯さない未来も１％あるわけです。ということは、犯行前逮捕を行うと、100人に1人は犯罪を犯さないのに逮捕をされる、つまり冤罪が発生することになっちゃいます。

推定無罪の法制下では、100％有罪の証拠がなければ裁くことは許されません。100％の精度を出せないならば、未来予測に基づく潜在的犯人の犯行前逮捕は認めないとするのが妥当です。（でも日本は証拠が微妙でも有罪になるので、どうなんだろうとは思いますけど）

「そもそもビッグデータ解析は相関関係を見つけるものなのに、犯罪摘発のような因果関係を問題とすべきものに適用するのが間違い」という著者の指摘は、ビッグデータの限界を考える上で大きなヒントになりそうでした。

個人情報の取扱いにあたっては、責任をデータ保有者に転嫁し、監査機関を設立

次にプライバシーの問題です。
著者の紹介の通り、現状では個人情報を提供する個人が、データ利用の可否を答える運用になっています。
でもそうじゃなく、データを解析する側に責任を問えばいいのでは？というのが著者の提案でした。ビッグデータ解析の結果個人に不利益が生じたら、データ保有者・解析者側が罪に問われるというものです。すると自然と、ビッグデータ取扱者は情報を慎重に扱うことになります。

監査機関を設けるという提案もありました。
会計制度における監査機関がモデルとされていて、ビッグデータ取扱者が正しく情報を扱っているかどうか、外部の公的機関が監査するというものです。
ビッグデータのもたらす影響が大きくなるのであれば、こうした社会的枠組みを設けるのも面白いアイディアです。

それでも個人情報は推定され、ビッグデータ保有者の立場は強くなる

繰り返しになりますが、ビッグデータの問題点は、未来予測や行動推定の結果が過度に信用されたり、個人にとって好ましくない使われ方をされうる点です。
これに対する著者の主張・提案が、犯罪摘発の根拠として使うべきでないことや、データ取扱者の使用責任を問うこと、監査機関の設立といったものでした。

ではそれで問題が解決するかと言うと、私はそうは思いません。
ビッグデータの普及で社会はどう変わるでしょうか。

個人情報推定の悪用は防げない

ビッグデータの保有者・解析者は、データの取扱いに責任が生じるとなれば、慎重にビッグデータを扱うでしょう。
それでも悪用や過失、事故を防げないことは、現在のカード情報漏えいや個人情報にまつわる事件を見ればよくわかるところです。
会計制度において、監査機関が不正の番人として重要な役割を担っていることは確かです。しかし、オリンパス事件のような悪質な不正が後を絶つこともありません。

将来、私たちの予定行動や個人情報はビッグデータ解析により明らかにされ、その結果は必ず漏れて、悪用されます。悪用を防ぐ社会的な仕組みは整備されると思いますが、あくまで対処療法に留まるでしょう。

政府機関はビッグデータを安全保障に利用する

ビッグデータ解析が普及したとき、ビッグデータを持つ者が最も利益を得る者になるだろうと著者は予想しました。検索履歴をもつGoogleや、商品購入情報を抱えるAmazonなどです。
そして著者が指摘する最も強力なビッグデータ保有者が「政府」でした。

人々の情報を集めるためには、一般企業はサービスを流行らせたり、人の集まるプラットフォームを作らなければなりません。一方政府であれば、公権力で半ば強制的に・組織的に国民の情報を集められます。

個人の自由と小さな政府を標榜する米国ですら、対テロ等の安全保障のために国民の監視を強めています。
「脅威」の在り方にもよりますが、他国でもこの傾向は増すでしょうし、いわんや中国みたいな管理社会ならなおさらです。

IT技術により個人の武器入手が容易になって、国家による国民管理は厳しくなる、という将来予測は以前にも紹介しました。