人工知能の社会への波及効果に関する徒然なる考え

今回は、ディープラーニングを中心とした人工知能の現在と未来に関して書いてみました。技術中心の仕事に携わっているとどうしても分析手法やアルゴリズムばっかり考えています。ところで近頃、機械学習の研修を提供していく中で、営業担当・ビジネス企画担当の方々から、人工知能全般の枠組みやトレンドの解説を求められる頻度が高まってきています。そこで自ら調査した内容及び考えの整理も兼ねて、人工知能が社会にもたらすインパクトや世の中の代表的な疑問を中心に綴ってみました。最新動向を意識してディープラーニングに重みを置いた内容になります。

人工知能の枠組み

はじめに、基本に立ち返って、人工知能機械学習ディープラーニング(以下 DL)の関係性を整理しましょう。普段「データ分析」や「機械学習」の用語をよく使うけれど、曖昧性を伴う「人工知能」という用語を使用する機会が殆どないです。「人工知能」に厳密な定義はおそらくないです。専門家の間でも定義に食い違いがあり、東大の松尾豊准教授の 「人工的に作られた人間のような知能、ないしそれをつくる技術」に似た文言が多い一方、個人的に、阪大の浅田稔教授の「知能の定義が明確ではないので、人工知能を明確に定義できない」に感心しました。 広く人工知能と呼ばれるものを実現するための手法はルールベースと機械学習の2つに分類できます。前者はエキスパートシステム的な手法で、「条件Zが成立する中で情報Aが入ってきたときに、動作Bをさせる」のようなプログラムを人間が大量に予め作っておき、コンピュータは教え込まれたそれらのプログラムに従って答えを導きます。後者の機械学習はコンピュータが自ら大量のデータから知識を整理しルールを学習してモデルを作ります。この場合は「情報A入ってきたときには、正解はBだ」といったAとBのセットを大量にコンピュータに与えます。

では、DLはどこに位置するでしょうか?DLは機械学習の1種です。機械学習のうちの関数系モデルであるニューラルネットワークに属します(図1)。学習データが大量に使用可能かつ特徴量が均一な構造である条件のもとで高い精度を期待できるのが特徴です。従来の機械学習手法では、物事を分類する着眼点(=特徴量)を人間が与え、それらを軸にしてモデルを訓練させます。データサイエンティストの労力の大部分を占める特徴量の設計を依然として人間が行わなければいけないのがどこか皮肉に感じますね。DLの登場により、コンピュータは自ら特徴量をデータから見出せるようになりました。この「特徴表現の獲得」の峠を越えたことによって、これまでに積み重ねてきた人工知能の研究成果(ビッグデータ処理、ロボッティックス、言語処理など)が今までになく強いインパクトを社会に与えるようになりました。 最新の人工知能活用シーンを知る上では、とりわけDLの進歩を追うことは重要ですが、決してDLが機械学習手法のヒエラルキーの頂上にそびえ立っているわけではないです。このことをまず理解しておきましょう。例えば、同じ教師あり学習でも、決定木系モデルとDLの使い分けが明確です。決定木系モデルは、購買履歴などtabularデータを扱うのが得意です。特徴量設計の自由度が高く、予測問題・分類問題に相当幅広く使われます。また、処理過程を解釈しやすく、他人へ結果を説明がしやすいので施策に有用です。一方で、DLは画像・音声など複雑な特徴を有する非構造データを大量に扱う場合に威力を発揮します。一方で判断の根拠が不透明、つまり「ブラックボックス化」が難点です。理解は二の次でとにかく自動化と高い精度を叩き出したい場合にDLが採用されやすいです。

f:id:gri-blog:20190908191526p:plain
図1: 機械学習ディープラーニング

ディープラーニングの現在地と行先

DLの研究は数十年前から発足し、2000年に入ってから注目を浴び始め、そして近年は画像認識など特定の知的作業で人間の精度を超える地点まで到達しました。人工知能の実用レベル、適用の幅・可能性が膨らんだ背景には次のようなテクノロジーの進化があります。

  • インターネットやIoTの普及、ネットワークの低コスト化・高速化とともに、人工知能の材料となるビッグデータが生み出され、収集と蓄積がしやすくなりました。

  • ビッグデータの収納と分析するインフラが整備されてきました。例えば、GPUにより大量な並列積和演算のおかげで、ほぼ一番最初に画像認識に成功を納めた畳み込みニューラルネットワークAlexNetの学習時間は40日から6日に短縮されます。

  • アルゴリズム(計算の手法や手順)、つまり人工知能の「賢さ」が飛躍的に向上しました。

以下では人工知能の最先端を行くDLの進化を数段階で言及していきます:

  1. DLの活用例として最も広く知られているのは画像認識です。画像の特徴量は人間の直観では理解しづらく、DL以外の機械学習モデルに学習させるのも難しいです。DLの手法の1つである畳み込みニューラルネットワーク(CNN)で画像認識を行う場合、ある層で処理した結果を次の層への入力をするようにして階層的な処理を行います。浅い層では画像の小領域の明暗など具体的な特徴を、もっと中段ではエッジや形を、深い層では顔などの複雑な抽象的な特徴まで見出せるようになります。単独の層での処理は簡単な結果しか導き出せないけれど、処理を重ねるにつれて複雑な判断をできるようになります。画像認識精度の劇的な向上により、日常的に恩恵を受けている顔認識や手書き文字認識などの技術が実現され、自動運転アシスト技術、パーソナライズ広告、レントゲン・CTを元にした自動診断も期待されています。

  2. DLが次に目指すのはマルチモーダル化です。静止画像だけではなく、動画を含む時系列データ、音声、圧力などの複合的な観測データを組み合わせて処理できることです。人間の感情を認知し定型の相槌を打つペッパーが現存する一例です。もう一つの例は画像キャプションの自動生成であり、これにCNNとRNNを使い合わせたNeural Image Captionという技術が活躍します。RNNは過去の情報を記憶しその影響を次の動きに反映させる再帰的なネットワークで、自然言語処理や時系列データなど連続性のあるデータに使用されます。

  3. その次にあるのは、自分の行動とその結果を結びつけて抽象化する力、更に、連続的な試行錯誤を通じて現実世界から特徴を抽出する力です。これらを元に、プランニング、高度な状況認識、環境の変化(例外)に対するロバストさが期待されます。自動運転を例にとると、標識の認識や障害物検出などの個別のアシスト技術だけでは実用化に不十分であり、特に難しいと言われる周辺環境の認識、通行ルートを決めるpath planなど多方面のテクノロジーを組み合わせて初めて実現されます。物流におけるラストワンマイルをドローンやロボットでカバーする場合も同様です。 抽象化や因果関係を取り入れると「手を強く握ると痛いと言われる」や「コップを強くたたき付けると割れる」や「この表現を使うと相手が喜ぶ」のように人間らしい繊細な行動ができます。そうすると、医療・介護などの対人ロボットなど、「モノ」から「ヒト」へ実用化の対象が拡大されます。

  4. 次の課題は、ここまで述べてきた高度な概念に、記号とも解釈できる言語を結びつけること、およびその言語を通じて知識を自動的に吸収することです。自動翻訳が実用化されると、翻訳の資格取得や大学での外国語の勉強の重要度が下がり、他の学問に注力する余裕が現れます。旅行先ではガイドなしに安心に歩き回れます。言葉の壁が消えると企業の海外展開などグローバル化が進みます。そして、言語を通じて知識を自動的に吸収できれば、いよいよ人間への高度な補助を務めることが可能です。

社会へのインパク

人工知能の過去の潮流は、学術的な研究の進展、クイズ番組や将棋・囲碁に勝利するといった次元から、今では日常生活やビジネスシーンにも押し寄せてきています。ここまで飛躍的に発達した人工知能によって人間が征服されないのか、と脅かされているように感じる人もいます。人工知能の実用化は社会、産業、個人に顕著な変化をもたらすのはもう疑いの余地がないでしょう。ただ、人類を滅ぼすとかの次元違いの話ではなく、人工知能が人間の知能、創造性を引き立てる存在であるのが正しい考え方です。学習と判断というプロセスを初めて人間の組織から切り離した独立なものとして捉え、それを必要とするところに自由に配置可能になります。それによって人間の生き方や個性がより重視されるより生産的で効率的な社会の仕組みが実現されます。

ついでに、人間と機械学習のそれぞれの強みも整理しましょう。機械と人間の能力は全く異質であり、特定の基準で優劣を決めてはいけません。機械の強みは、作業の正確性・規則性、論理性(← チェスなどの知的作業に強い)、集中力、主観・感情・先入観に左右されない点です。人間の強みの根本にあるのは「直観」です。必ずしも推理・論理を通過することなく、積み重ねてきた学習や経験を通して物事の本質を捉え、柔軟な意思決定を行います。

残る職業・消える職業

もう一つよく聞く疑問は、色々な職業が消えるのではないか、です。人工知能の発達に伴い消えてしまう職業もあれば、依然として残る仕事もあります。消える職業に代わって新しい仕事が必ず生まれます。大昔からでも耕作は昔全て人手で行われていたのが、そのうち人間は耕作機器を活用・作る仕事に専念するようになりました。

残る職業は大きく分けて2つあると考えられています。1つは「過去事例の数が乏しく、難しい判断を伴う仕事」、例えば経営者や新規事業開発者です。この場合は、積み上げてきた少々異なる経験を転移して学習すること、多方面からの情報を加味した上で物事を判断することが必要です。もう一つは、「人間に接するインターフェースが重要視される仕事」です。人間は同じ人間と接した方が快く感じる、もしくは説得されやすいサービス、例えばセラピスト、リハビリ専門家、カウンセラーなどは当面は機械に置き換えられる確率が比較的低いでしょう。弁護士の仕事において、情報を整理し過去事例を調査する上で人工知能の効率を活かせるが、家庭裁判など情緒的な要素が強いものだと、機械に「法廷で勝つ確率は20%」と告げられるよりも、弁護士の顔を見て会話した方が納得しやすいでしょう。現在はデータの収集や分析のスキルを身につけることが重要視されているが、それらもいずれ自動化すると、長いスパンで見るとむしろ人間対人間に特化した仕事の方が最後には価値が高くなるのでしょうか?一方で、ルーティング化しやすい単純な事務作業は人工知能に置き換えられやすいです。既に部分的に人工知能が導入されているものもあります。

ちなみにOxford大学の論文”The Future of Employment: How Susceptible are Jobs to Computerisation” では、702個の職業を「手先の器用さ」「芸術的な能力」「交渉力」「説得力」など9つの軸で分解し、その中で消える職業の上位に、電話販売員、不動産登記の審査・調査、コンピュータを使ったデータの収集・加工・分析、銀行の窓口係、荷物の発想係、スポーツの審判が含まれています。一方で、残る職業の乗員には、レクリエーション療法士、危機管理責任者、ソーシャルワーカー、聴覚訓練士で、心理学者、小学校教師などが含まれます。結局社会全体で見た時に、人間が果たすべき役割と、コンピュータが果たすべき役割の区別を意識しながら両者を連携させることが理想ではないでしょうか。

最後に…

前段で議論した人工知能の技術が全て達するのは2030年頃と見込まれていますが、これはあくまでもR&Dのスピードです。社会に抵抗なく浸透させるまでには様々な障壁と不確定性を伴います。例えば、医療や防犯などは支持を得られやすい分野ではある一方、普及までにプライバシーや判断における責任などの問題を解決する必要があります。自動翻訳の精度向上によって言葉の壁がなくなれば、世界情勢に必ずしも良い影響が出るとは限りません。相手が我が国の言葉を努力して学んで片言でも話してくれるのは大変喜ばれることが、国際的な前職で実感しました。その喜びを機械学習の利便性で置き換えられません。

人工知能技術を日本の社会に浸透させる上での課題として、ビッグデータの利用に関して警戒心が非常に強いこと、ビッグデータ人工知能の活用に関する法的体制の整備が遅れていること、日本特有の「ものづくり優先の思想」、そして人材の不足です。人材不足にアプローチしたく、GRIで研修教育事業が発足していますビッグデータを活用しようとする企業を料理店に例えるならば、ビジネスの成果は料理、データは素材、企画力はメニュー、データ活用人材はシェフに例えられます。優秀なシェフと魅力的なメニューと上質な素材が揃って初めて料理店が繁盛します。国内ではデータサイエンスを社会実装できる人材が著しく不足しており、その育成も進んでいません。これはシェフのいない料理店を経営すると同じくらい無謀です。米国や中国がAI研究開発の世界的な拠点となりつつ中で、日本のデータ人材不足をこのまま放置しては危険です。したがって、今こそデータ人材の育成が急がれる時代と思われます。