考える機械たち 歴史、仕組み、倫理―そして、AIは意思をもつのか?

発刊
2025年6月11日
ページ数
384ページ
読了目安
548分
推薦ポイント 2P
Amazonで購入する

Amazonで購入する

推薦者

AIの歴史と仕組み
これまでのAI開発の歴史と、それぞれの技術の仕組みがわかりやすく解説されている一冊。改めてAIの基本を理解するために役立つ内容になっています。

生成AIの仕組みと、現在生じているAIの課題、今後のAIはどのようになっていくのかなど、現時点におけるAIを総括することができます。

起こりうるすべての問題と解決策は定義できない

シンボリックAIとは、機械用のシンボルを人間が定義し、明確なルールを定めるシステムのこと。機械が正しく動くためには、ルールを理解し使用できることが肝心である。そのルールが人間の専門知識に基づいている場合には、エキスパートシステムを構築したと言う。エキスパートシステムは長い間、人工知能分野における最大の希望だった。1960〜1970年代のAI研究者は、シンボリック・アプローチを用いることにより汎用知能を備えたマシンがついには実現するのだと、かなりの程度まで信じていた。

 

問題とすべてのルールをコンピュータに説明すれば、人間と同じように問題を解決できるはず、というのがシンボリックAIの基本的なアイデアである。しかし、シンボリックAIは汎用知能をつくりだすことはできなかった。なぜなら、シンボルやルールを定義するのは人間だからである。起こりうるすべての事象を考えだし、それぞれに対して何をすべきかを正確にコンピュータに指示するのは不可能である。

 

機械が何を理解しているのかを人間は理解できない

シンボリックAIは現実世界にある不確実なことをうまく捌けない。これこそが、過去10〜20年に起こった、シンボリックAIの正反対を目指す方向転換の原動力となった。現在の新たなAI黄金時代を支えているのは、自分で学習する機械と、これまでになかった計算能力の高さとデータ量の多さである。それは機械学習と呼ばれている。機械学習は、タスクの実行や問題解決を目指して機械が自ら学習すること。人間に具体的に指示されることなく、機械は自ら試行して、最終的に新しい知識を見つけ出す。

 

機械学習には様々なモデルがあるが、直近20年間ではニューラルネットワークが優れた成果を上げている。今日の機械が顔を認識したり、アートを作成したり、テキストを書いたり、偽のデータを作成したりするのは、ニューラルネットワークのおかげである。すべての機械学習モデルと同様、ニューラルネットワークはデータを取り込み、計算を行い、予測を導き出す。ニューラルネットワークを煎じ詰めると、入力データ同士、およびデータと数値を掛け合わせることである。

ニューラルネットワークの知識表現方法を決めるのは、人間ではなく、ネットワークが最終的に実行する操作である。従って、ニューラルネットワークを使用した機械は、人間との共通言語を離れ、いわゆるサブシンボリックな知識を獲得する。学習を通じて機械が獲得した知識が不明瞭なのである。ここに落とし穴がある。私たち人間はパラメータを見ることができないため、ネットワークが何を理解しているのかを理解できないのである。

機械学習モデルは、データに基づいてモデルが最も有益だとみなすものを選択する。私たち人間が最重要だと考えていることや知っていることではないのである。

 

必要なデータをすべて集めるのは不可能

機械学習モデルは、受け取ったデータの質や量がわからず、ただデータに基づいて目標を達成しようとする。煩雑な現実世界で役立って欲しいモデルを開発する人は、みんなロングテール問題に頭を抱えている。現実社会で起こりうる事象はあまりに多いので、起こる可能性のあるすべての事象をデータとして集めて、モデルを完璧に訓練することは不可能なのである。

機械学習の研究者たちがほぼ全員同意していることは、この問題を回避するには教師あり以外の学習方法を使うしかないということである。教師なし学習とは、基本的に機械にデータの分類をしてもらうことである。教師なし学習を端的に表現すれば、自動データ分析の一種だということ。このモデルが人間に伝えることは「このデータはこの結論につながります」ではなく、「こんなパターンを見つけました。あとは自由にお使いください」だ。

 

今日、機械学習研究者の大多数は、教師あり学習と教師なし学習は機械に真の知性をもたらすことはできないが、強化学習は重要な役割を果たすだろうと結論づけている。強化学習とは、機械に様々な状況に直面させ、そこから学習させ、独自に決定させる方法である。

 

機械は創造性を持つのか

拡散モデルとは、自然言語で指示したことに基づいて、全く新しいイメージをつくり出せる生成機械学習モデルである。拡散モデルは、ノイズから統計分布への道筋を見つけるが、その分布は訓練データにより記述される。2022年時点の高性能拡散モデルの場合、訓練データは何億枚もの画像だった。

 

機械学習モデルは新たな情報を付け足すことはできない。しかし、情報を変換して別のもののように表示することはできる。モデルがスタートするランダムノイズはまさに創造性の源であり、これまでに存在しなかった新しい画像を生成する。機械学習モデルをつくる時の夢と目標は、データが表す真の基礎分布をモデルが理解することである。

 

参考文献・紹介書籍