深層学習が持つ3つの力
「AI」と言っても色々な分野があるが、今最も注目を浴びているのは「深層学習(ディープラーニング)」である。深層学習は、神経細胞のネットワーク構造に似た数理モデルに様々な工夫を施し、たくさんのデータを学習させることによって、それまでの手法をはるかに超える精度を出すことに成功した。
クルマの自動運転やロボットを動かすといったことを行おうとした時、周りの状況を認識することが非常に重要になる。認識の精度を上げることが、色々なものを自動化する上で非常に重要になる。この認識の精度を大きく向上させたのが、深層学習の大きな力の1つである。深層学習は主に3つの機能を持っている。
①認識
認識はいわば人間の目の部分に当たる。深層学習によって、この目が進化することによって、これまでは人間にしかできなかったようなタスクに、機会が柔軟に適応できるようになった。深層学習は、非常に高い「汎化(一般化する)性能」を持っている。人間は照明が明るくても暗くても物体を正確に認識できるし、光を反射しているガラス容器の中にある物体でも認識できる。こうした人間の高い柔軟性をコンピュータが持つようになった。この汎化性能が実用化においては非常に大きな影響を与えている。
認識できるものは、物体だけでなく、人の動きや3Dでの認識もできる。これは、VTuberなど、バーチャル世界にリアルの世界を投影する分野でも重要になってくる。深層学習の認識できるものの幅は日々広がり続けている。物体認識、音声認識、自然言語処理の3つは、深層学習の認識の分野において、非常に重要で急速に伸びている。物体認識、音声認識、自然言語処理を組み合わせることで、人が人に指示を出すように自然な形でロボットに指示を与えることが可能になった。
②生成
物を作ったりデザインするところでも深層学習を活用できるようになってきている。文字や絵などの2次元的表現の入力を、エンコーダーが抽象的な特徴表現に圧縮し、デコーダーが類似のデータを生成して出力する。こうして、イラストレーターが描いたようなキャラクターから、アニメの背景、さらには薬や素材などの化合物を設計することにも活用されている。
③制御
現実世界のものを制御していく上では、あらかじめルールで決められたことだけをやればいいというものではない。自動運転でも、ロボティクスでも、プラントの制御でも、必ず未知の状況に出合うため、全自動化が難しかった。今後、深層学習の持つ高い汎化能力を活用することで、「制御」」の世界にも大きな進展をもたらすと考えられる。
今後10年間にAIによって何が起きるか
①シュミレーション × AI
現在の深層学習と強化学習は、条件さえ揃えば驚くような成果を出す。しかし、これは常に成功するわけではない。成功の条件は3つあるが、それぞれ課題を抱えており、適用分野が一部の問題に限られている。
- 大量の教師データを使えること
問題はデータが手に入りにくかったり、手に入らなかったりする場合がある。 - 学習時のデータ分布と利用時のデータ分布が同じであること
今の深層学習は、見たことがあるデータの範囲の内側と似たようなデータに対しては、うまく解けるが、一度も見たことがない外の世界のデータを全く解けない。 - 多くの試行錯誤が許されること
強化学習などは、試行錯誤してデータを徐々に集めながら学習していくので、学習の初期はうまくいかない。初期にはたくさんの失敗が許されるタスクである必要がある。
これらの問題を解決するアプローチとして、シュミレーションがある。シュミレーションでAIのモデルを訓練するだけでなく、逆にAI技術を使ってシュミレーションのモデルをつくることも、近年急速に進んでいる。昔から画像を生成するのはGAN(敵対的生成ネットワーク)が有名だが、こうした技術は画像以外のデータセットでも可能になってきている。
②超大規模学習
シュミレーションは計算資源がボトルネックになる。AI技術を今後も最も速く進化させる方法は、AIシステムに必要な計算専用のハードウェアを作ることだとも言われている。
今後は大きいモデルを学習させるのは割に合わないのではという話もあり、学習の手法自体も変わってきている。今はモデルを1つずつ教師ありデータを用意して学習させているが、そういう時代はもうすぐ終わる可能性がある。今後は多くの問題について、大きな資本を投じて用意した大量のデータで事前学習させたモデルをもとに、それぞれの個別タスク向けに少量の教師ありデータを調整して利用する時代になってきている。学習データをそれほど必要としなくても、きちんと事前学習しておけば学習できるのではないかと言われている。
現実世界ではなく、シュミレーションのデータを使って事前学習する手法も出てきており、そうなるとボトルネックは計算資源だけになると考えられる。