教養としてのデータサイエンス

発刊
2021年6月17日
ページ数
240ページ
読了目安
479分
推薦ポイント 2P
Amazonで購入する

Amazonで購入する

推薦者

わかりやすいデータサイエンスの入門書
データサイエンス教育として、大学で利用されることを目的に書かれたデータサイエンスの入門書。データサイエンスの現状や基本的な考え方、データの読み方など、数理・データサイエンス・AIの基本が学べます。データサイエンスの基礎的な知識をわかりやすく解説されているので、文系社会人にとっても使える内容になっています。

データ駆動型で産業が変わる

ビッグデータの積極的活用により、意思決定の結果が多様でそして不確実な個人をターゲットにしたビジネスが可能になってきた。従来は、多くの仮定に基づいて、標準的消費者の行動を数式で表現した消費者行動モデルを構築していた。

ところが検索エンジンやSNSの利用が進むと、膨大な数の細かいデモグラフィック情報まで、自動的かつコストをほとんどかけずに取れるようになってきた。そうすると、条件の数をもっと増やしても、その条件で購買したかどうかのデータが得られるようになる。こうなると、消費者行動モデルの汎用性を追求しなくとも、個々の事象のケースバイケースの予測性能は、データを整理しパターン分類するだけでもかなり向上する。

このようなビッグデータのパターン分類を基礎とする解決法を「データ駆動型」という。標準的なモデルを先に構築し、状況に応じてそのモデルを変化させるのではなく、まず豊富に用意された行動の変容に関係する条件とその結果のペアをビッグデータから大量に得る。次にそれらを整理することで対応関係を作成し、その対応関係から未来の行動を予測するのである。

 

このようなデータ駆動型は、特にECを代表とする小売だけに限らない。ありとあらゆるビジネスの進め方や、新しい産業の創成がデータ駆動型にシフトしている。データ駆動型の有用性は、IoTにより、さらに高まっていく。

 

AIの驚異的な発達

人工ニューラルネットワークとは、人の脳神経細胞同士のつながりを極めて単純化し、数式で表現した非線形の関数である。非線形の関数とは、比例の形になっていない関数であり、その様子は様々である。ニューラルネットワークの場合は、ある値以下ではゼロ、それより大きい値では正比例するような単純な関数を1つの部品として、それらをレゴブロックのように組み合わせた関数になっている。この技術を深層ニューラルネットワーク(DNN)と呼ぶ。

 

この30年間で、ニューラルネットワークの規模は、中間層の数が1〜2から100を超える超大規模なものになった。このような大規模化を可能にしたのは、ビッグデータと計算機の性能向上である。15年で計算機の性能は1000倍になる。そうすると、30年間では、1000×1000の100万倍になる。これは30年前は1年かかっていた計算が、今はたった32秒で計算できることを意味する。

 

2012年に画像認識の分野で成功をおさめた深層学習の技術は、それまでなかなか実用レベルに達しなかった課題に応用されていく。顕著な例は、認証技術である。大規模な国際空港では、今では審査は人が行っていない。

深層学習の登場により、人が目で見て、あるいは耳で聞いて判断していた作業がどんどんAIに置き換わっている。人の「見分ける」「聞き分ける」に依存していた職業は、今後すさまじい勢いでAIが担っていくのは間違いない。

 

人間にできてAIにできないもの

今のAIの根幹をなす仕組みは、膨大な数のペアを分類し、パターンを見つけ、そのパターンに基づいたルールを作成し、新しいデータが来た時に予測や判断を行う推論法である。このデータを起点としたものの見方に代表されるような、過去の事例に基づき意思決定のルールを作る推論法を、帰納法と呼ぶ。平たく言えば、帰納法は経験論である。

これと対極をなすのが演繹法である。演繹法の代表格は数学や物理で、仮定と原理が与えられれば、厳格な論理をもって結果が導かれる。演繹法による結果はゆらぐことはないが、一方、最初に想定した仮定と原理が成り立たない場合は、その結果は正当化できない。

帰納法の弱点もかなりある。まず、過去に一度も起きていない事象に対する予測能力が著しく乏しい点である。2つ目の弱点は、原因と結果の関係を読み解く能力が低い点である。帰納法では厳密な意味での因果関係を立証することはできない。

 

推論の仕方は、演繹法と帰納法に整理できる。人間はこの両者を上手に混ぜたり切り分けたりして使っている。これこそが、人間の知的活動の特徴と言える。演繹法では、抽象化という作業が重要である。抽象化を極端に進めると、論理の進め方を極限にまで単純化した体系に落ち着く。今のAIでは、このような思考の整理はほとんどできない。

また帰納法の利用においても、AIは予測や判別といった性能の観点は素晴らしいデータの整理の仕方ができるが、人間はその整理の仕方に必ず自分が理解できるやり方を優先する。意思決定の結果が社会応用になると、法律、規則、倫理、慣習、文化的受容度など、人が理解できる整理の仕方でないと、社会には受け入れられない。人の思考はこの点も優れている。

どれほどAIが進歩しようと、人が社会を形成し生きていく限り、このような人間の知的活動を起点とするものの見方の有用性がなくなることはない。