ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

「AIの正体は最小二乗法」記事を読み解く

この記事は最終更新日から3年以上が経過しています


1 概要

タイトルは釣りではない. しかし人工知能 (AI) や最小二乗法の話は全体の3分の1未満である. 「AI進化の果ての時代に経済学者は何を語るか」みたいなタイトルにしたほうがリーチが良さそうだが, 私はそんな壮大な問題を語ることはできない.

2019/2/18付の日本経済新聞に掲載された小林慶一郎氏の『AIと超人類の時代 弱者がもつ強み』というコラムが twitter で大きな反響を呼んでいたが, そのコラム全体の趣旨について考察されているものが見られなかった*1. Twitter の話題は3日経てば忘れられる傾向にあるので今更感があるが自分なりに考えたことを書く.

2 はじめに

2019/2/18付の日本経済新聞に掲載された小林慶一郎氏のコラム

www.nikkei.com

ツイッターで大きな反響を呼んだ. その反響の実態は, 主に

近年、驚異的な発展を見せているAIのディープラーニング(深層学習)は、原理的には単純な最小二乗法(誤差を最小にする近似計算の一手法)にすぎない。つまり、これまで深淵な神秘と思われていた知能の働きは、単純な近似計算の寄せ集めにすぎないという発見がAIの衝撃の本質である

AIと超人類の時代 弱者がもつ強み :日本経済新聞

という箇所と, 〈ディープラーニングは「最小二乗法」〉 と題された図解に対する否定的な反応である. 昨年12月にも, 「松尾先生*2 によるとAIは最小二乗法の三次元版である」という今回の記述によく似た某社役員の投稿*3が話題になったこともこのコラムの反響が大きくなったことに寄与しているのかもしれない.

私もこういう次々と説明もなく用語が飛び出すような, センター試験の国語に出題されそうな文章は苦手である. しかし待ってほしい. 我々は普段, 厳密に定義された用語を用い, 過剰・誇大な表現を避け, 論理構造を明確にしたアカデミックライティングの作法に慣れすぎて, そうではない文章に対して非寛容になりすぎてはいないだろうか. そもそも, このコラムの主題は, ディープラーニングに関する専門的な説明などではない. すべての文章が完全に専門的で「正しい」解説をする必要はないし, 自然言語で説明してはいけないというルールも存在しない. その程度の言葉尻を捉えるだけに終始するのを「批判」というのであればそれこそ批判はすぐにでもAIで自動化できることだろう. 批判的思考とは, 単なる粗探しではなく, 自分自身が都合の良いように解釈している可能性に対しても批判的になるという態度のことで, たとえ読みづらい文章でも, 最大限好意的に趣旨を解釈した上で批判することではないか.

この手の記事を批判する上で厄介なところは, 様々な分野に広く浅く手を出しているため, 検証するための勉強コストがかなり要求され, はっきりと定義されていない用語は様々な解釈を与える予知があるので言ったもの勝ちになりやすい土壌があるが, それではしゃくなのでなんとかやってみる. わかりやすさを優先したので, この記事自体も厳密な用語の使い方をしていない. しかし, なるべく専門的な文献も挙げているので, 不満があるならば適宜参照できるようにしている. 自分が勉強不足なのは承知の上なので, この読解に対する批判ももちろん期待している.

3 コラムの主題は何か

まずは, 小林氏がコラム全体を通して何を主張したいのかを確認する. まず, 最初のセクション (ひし形を並べてあるのがセクションの区切りの合図だと思う) では, 『ホモ・デウス』なる書を引いて超人類が現生人類を淘汰するのではないか, という問題を掲げている. 超人類が具体的に何を指すのかは保留にしておく. 次のセクションの第1パラグラフでは, これは人々の経済格差の問題, 強者と弱者の問題と同型であると論じている. なので, 本文で主題としているのは, 「人間のうち, 超人類と呼ばれる人たちが経済的に絶対的強者となる時代が来るか否か」ということになる.

なお, この辺の文章も, 粗探ししようとしたらいくらでもありそうだ. 経済競争を生物学の自然淘汰の概念に結びつけるのは, 俗信としてはポピュラーで古典的な部類だ*4. しかし, 一旦はこのような枝葉末節にこだわらず, 大筋として何を言いたいのか明らかにする必要がある.

これ以降の文で, 小林氏は格差拡大に対する反論を2つ挙げている. 一つは最近 (といっても10年20年単位だが) の労働問題を絡めた経済成長理論の研究を根拠としたもの, もう1つは強者が絶対的に強者であり続けることはない, という比較的抽象的な反論である. 後者の説明に際して, 話題になったAIが最小二乗法云々という話が登場している. そこで, 以降は特に重要な「『ホモ・デウス』の主張」 「アセモグルの研究」「『AI=最小二乗法』論は何を言いたかったのか」という3点について補足説明した上で, 小林氏の主張にどのような批判を加えるべきか, 私の意見を述べる.

4 ハラリの『ホモ・デウス』は何を言っているのか

残念ながら, 私は『ホモ・デウス』を読んだことはない. しかし今から読むのも面倒なので, 読んだふりをしなければならない. 早くもかなりクリティカルな手抜きである. そこで, 人間は神になる!?『ホモ・デウス』とはや, 以下で公開されている, 内容を要約しているスライドも参考にした.

note.mu

この要約を参考にすると, ハラリはテクノロジーの未来予想だけでなく意識の哲学や宗教学などかなり雑多なテーマに言及しているようだが, やはり中心にあるのはコスミズムやトランスヒューマニズム的な思想のようだ. 生物工学やサイバネティクスによる脆弱な生身の身体の克服 (頑健さ, 機能の増強, 不死性の獲得) と, 人工知能によるより優れた思考獲得を達成した存在を超人類というらしい *5. 超人類というのはつまりヒューマンオーグメンテーションの極致のことらしい. ヒューマンオーグメンテーションによって格差が生じる未来図は, 『ニンジャスレイヤー』『ブレードランナー』『Va-11 Hall-A』などのサイバーパンクSF作品を想起させる.

小林氏は次のセクションでは資本階級と労働者階級の格差という話との関連について述べているので, 氏はハラリの主張を, 産業革命という技術革新によって熟練職人が仕事を失ったという過去の話の類推で, 将来, 技術革新で超人類となった人間がそうでない人間 (=無用者階級) の職を奪い, 挽回しようのない弱者の立場に追いやられる, と解釈して, これに対して反論しているようだ.

5 アセモグルの研究とは

ダロン・アセモグル (Daron Acemoglu, 「アシモグル」表記もよく見かける) は90年代から目新しい研究を次々発表し, 経済学者の間ではかなり有名な存在となっている. 小林氏は, 彼の研究のうち特に有名な, 労働問題と絡めた経済成長理論について言及している.

少し冗長だが, 経済成長理論についても補足しておくと, 基本的な教科書ではソロー・モデルが紹介されることが多い(例えば Romer (2012) や, G. マンキューのマクロ経済学など). ソロー・モデルでは技術進歩率*6や人口増加率を一定のものと仮定した場合, どのように経済が成長していくかを表している. ソロー・モデルはシンプルな微分方程式だけで表現され*7, わかりやすいので, 経済成長理論の導入で必ずと言っていいほど紹介される.

しかし実際の経済活動は, 「必要は発明の母」という言葉があるように, 技術進歩は完全に人間のコントロールを離れて発生するというより, 社会のニーズを汲んで主体的に進めるものだとも思える. そういったアイディアを表現したのが, 内生的経済成長理論 (endogenous growth theory) と呼ばれる経済モデルの理論である. 小林氏が紹介しているアセモグルの「方向付けられた技術変化 (directed technical change DTC) 理論 (以下, DTC理論)」も, この内政的成長理論のカテゴリーに含まれる. 具体的には, Acemoglu (2002) で述べられている話のことを指していると思われる. 小林氏の専門分野はそもそもマクロ経済学, 特に内生的成長理論であり*8, 過去にこの論文の内容を解説するコラムを公開している(小林, 2007; 小林, 2012).

www.rieti.go.jp

www.rieti.go.jp

ソロー・モデルでは技術進歩は1つの変数に集約して表現されていたが, アセモグルのDTC理論では, 80年代以降の米国での賃金格差を説明するために, 高い技能を持つ労働者と, 低い技能を持つ2種類の労働者と, それぞれの生産効率を増す機械の存在を仮定しているのが特徴である.

この理論では*9, 2種類の労働者がそれぞれ異なる中間生産物を生産し, 2種類の中間生産物から最終生産物を生産するような経済を仮定している. このとき, それぞれの中間財を生産するために機械を導入して生産効率を上げることができる. しかし, 機械の数は有限である. ここで, 企業は研究開発 (R&D) に投資することによって一定確率で機械を増やすことができる*10. R&Dの投資の見返りが確率で決まるのは, 偶然要素の強い技術革新を表している. この仮説のもとでは, 企業は2種類の労働者のリソースに応じて, どういう方向にR&D投資をするかを決めることになるため, 技術進歩がどのように発生するのかがある程度主体的に決まる. つまり, 2種類の労働者の供給量と賃金の違いに応じて, 企業がどういう分野のR&Dに傾注するのかが決まるという理論である. ある条件のもとでは, 賃金の安い労働者をより活用できるようにR&Dを進め, 結果として賃金格差は狭まり, またある条件のもとでは, 賃金の高い労働者の効率を良くする方向に投資を増やすことになる. 具体例として, 18世紀, 19世紀の技術変化, 米国での80年代からの賃金格差の拡大もこの理論で説明できるとしている.

小林 (2007) ではさらに踏み込んで, 元の論文にはない含意を引き出している. それは, 労働者の高い技能・低い技能というのが絶対的なものではなく, 相対的なものと見なした場合である. 例えば農業が産業の大半だった18世紀には農家が熟練労働者であり, もしそこにプログラマが現れたとしても彼の技能は評価されない. プログラマが熟練労働者とみなされるのは200年以上後であり, そういう長期的な経済構造の変化が賃金格差を生み出す存在の正体だと言いたいのだ. 今回の小林氏の主張も, この話を踏まえて2種類の労働者をそのまま超人類と無用者階級にあてはめることで, 一時的*11な格差はありえても, 永続的ではないとしているのだろう.

せっかくなので, 「AIの正体は最小二乗法」という文言に食いついた人達が気になるような話題にDTC理論を適用してみる. ディープラーニング機械学習の研究は以前から存在したが, 民間企業で活用されることはこれまで少なかった. しかし, コンピュータの性能向上に成功し, 大量データ処理技術が利用可能になると, データサイエンティストという技能労働者が注目された. そこで各企業はより多くのアウトプットを求めデータサイエンティストを雇うようになり, データサイエンティストの賃金は上昇した. さらに彼らのアウトプットを効率的にするため今度は統計分析や機械学習フレームワーク (R言語とか, Pythonの scikit-learn, あるいはTensorflowなりPytorchなり) の開発が成功し, データサイエンティストたちの給料は上昇する. しかし, このサイクルが際限なく続くことはない. データサイエンティストの増加に伴い, 他の労働者にデータ基盤インフラの開発や集計の作業をさせる必要がでてきたため, データサイエンティスト以外の労働者の需要も増大した. すると, 今度はデータサイエンティストよりも賃金の安い彼らをより効率的に活用できないかと企業は考えるようになる. ここで, データサイエンスの業務を定型化し, 専門家でなくても使えるソフト*12の開発に成功したため, 賃金の安い労働者をより活用することができるということで, データサイエンティストと非データサイエンティストの相対的な格差は縮小していく. こうして, 企業が合理的な行動をした結果データサイエンティストの給料上昇トレンドは終了してしまう. つまり, よく言われているように一過性のブームの終わりとともにデータサイエンスが衰退するのではなく, 企業の合理的な行動の結果として説明できる. 以上のシナリオは数値的なデータに基づかない完全なこじつけだが, DTC理論に沿った仮説である*13.

ところで, 小林氏は言及していないが, アセモグルは近年のロボットやAIの技術発展にも関心を持っており, 労働のオートメーション化がもたらす影響について Pascual Resrepo との共同研究をいくつか続けて発表している. Acemoglu and Restrepo (2016), Acemoglu and Restrepoよって (2018) は近年のこういった研究をコラムで紹介している.

voxeu.org

voxeu.org

この2つのコラムはいずれも経済学101というサイトで和訳されたものが公開されている.

econ101.jp

econ101.jp

ここで述べられている研究成果は, 小林 (2007),小林 (2012) による DTC理論の拡大解釈を結果として裏付けるものでもある.

Acemoglu and Restrepo (2016) で重要なのは,

一つ目は、殆どの時代で、それまで労働が担っていた職務が機械化およびオートメイト化されるというプロセスが絶え間なく進行しつつも、他方では時を同じくして労働の担う新たな雇用機会も創出されているのだ、という考え。二つ目は、新たな雇用機会は専ら、新しくしかもより複雑な、労働が資本に対し比較優位をもつような職務の登場に由来する、という考えである。

ダロン・アセモグル, パスカル・レストレポ 『人間と機械の競争: 成長・要素分配率・職への示唆』 (2016年7月5日) — 経済学101

という箇所である. また, ここ最近30年間, 米国では新たな職種が増えるとともに雇用成長率も上昇しているというデータを傍証として提示している.さらに Acemoglu and Restrepo (2018) では, 90~07年のより詳細なデータで, 産業ロボットの普及によって, 程度の違いこそあるものの, ブルーカラーもホワイトカラーも雇用が総じて減少しているという調査結果を提示している.

これらから, 「人間より優れた技能を持つ」ロボットの登場によって, どの分野でも人間の雇用が失われうること, しかし長期的に見れば別の職種の創出効果もあるということになる.

6 AIは最小二乗法なのか

もう1つの反論として, 小林氏は「AIは絶対に間違えることがない (無謬) か」という問題に対して, 否定的な答えを出している. これが例の「AI=最小二乗法」発言につながる. この問題は小林氏の主張の本筋とはあまり関係ないので正直なところこれ以上深入りしたくないのだが, 全く無視するわけにもいかない.

結論から言うと, 小林氏の主張の範囲では, AIを最小二乗法まで単純化しても問題ない. 日本人工知能学会 (JSAI) の人工知能のやさしい説明「What's AI」 の『人工知能研究』の項目では, 様々なトピックが挙げられ, 昔流行したというエキスパートシステムもAIの一種とされる. 本来 AI の含む範囲はかなり広く, すべてを最小二乗法と呼ぶのは無理があるが, ここでは今流行しているディープラーニングのことに限定してAIという言葉を使っていることに注意する. 例えば 岡谷 (2015) のディープラーニングの有名な教科書でも, 回帰とはネットワークの出力 (予測値) と目的変数の差の2乗和である二乗誤差を最小化する問題として定式化している. ディープラーニングは本文の図解で書かれているような線形式や三次多項式よりも遥かに複雑な関数も表現できるが, それは同時にこれら単純な式も表現できるということであり, 矛盾した記述ではない. ディープラーニング確率的勾配降下法 (SGD) を使って学習することが多いので厳密には最小化していないとか, 分類問題では交差エントロピーを最小化するので二乗誤差ではないとか, そういう粗探しはできるが, ここで小林氏が主張したいのは, 「単純な近似計算の寄せ集めにすぎないという発見がAIの衝撃の本質」である. AI (=ディープラーニング) が近似計算であるということは少し勉強した人にとっては当たり前なので, 何が衝撃かと思うかも知れないが, AIは無謬つまり誤差が全くないわけではなく, 近似計算つまり小さいものの何らかの誤差があるものだ, というのがここで小林氏の言いたいことである. 二乗誤差の代わりにロジスティック損失を最小化しようが, ヒンジ損失を最小化しようが, KLダイバージェンスを最小化しようが, 式が違うだけでデータと予測の乖離の最小化という点では最小二乗法と同じ操作である.

なお, 松尾豊氏はこの記事について以下のように言及している.

twitter.com
果たして小林氏がこのフレーズからディープラーニングのエッセンスを把握したのか, 本当に文字通りにしか受け取らなかったのか, というのは私が知る由もないが, いずれにせよこの違いがAIの力を借りても超人類が絶対的強者たりうることはない, という話の流れを破綻させることはない.

補足: もう少し形式的な説明

まあ一応もう少し詳しく書いておこう. 本筋とは外れるので興味がなければ飛ばしても構わない. 最小二乗法の考え方について, 私は過去にこういうのを書いた.

ill-identified.hatenablog.com

かいつまんで言うと最小二乗法というのは, このような一次式 (線形回帰式) の係数を, 誤差を含んだデータから決定する計算方法のことである.
 \begin{align}
y = b_0 + b_1 x + \cdots + b_K x_K
\end{align}

この式のことを最小二乗法と勘違いする人がたまにいるが, それは正確ではない. 最小二乗法というのは, 仮に係数を決めたときの回帰式の値(理論値)とデータ(観測値)の誤差である残差二乗和を最小化することである.

 \begin{align}
\min_{b_0, b_1} \sum_{i=1}^N (y_i - b_0 - b_1 x_{1, i} - \cdots - b_K x_{K, i} )^2
\end{align}

これが「最小二乗法」の由来である. 線形回帰式の係数を計算する時はほぼ最小二乗法一択なのでこの勘違いが生まれたのだろうが, より複雑なディープラーニングの場合は式と計算方法は別々に考えざるを得ない.

ディープラーニング (深層学習)」という言葉も, 本来は式ではなく計算手順を表していたはずだ. ディープニューラルネットワーク (DNN) は線形回帰式よりずっと複雑な式である. DNN はさらにいろいろなものに分類されるが, 基本的なものの1つである多層パーセプトロンを例にする. 複雑なので図にしたほうがわかりやすいだろう. 例えば scikit-learn のドキュメント を見て適当にイメージすれば良いだろう.

https://scikit-learn.org/stable/_images/multilayerperceptron_network.png

このネットワークも線形回帰式のように数式で表現できる.

一層目: 線形回帰式が  J_1 個並んでいる.それぞれはユニットと呼ばれる.

 \begin{align}
u^{(1, 1)} &= b_{1, 1 0} + b_{1, 1, 1} x_1 + \cdots + b_{1, 1, K} x_K \\
u^{(1, 2)} &= b_{1, 2 0} + b_{1, 2, 1} x_1 + \cdots + b_{1, 2, K} x_K \\
& \vdots \\
u^{(1, J_1)} &= b_{1, J_1 0} + b_{1, J_1, 1} x_1 + \cdots + b_{1, J_1, K} x_K \\
\end{align}

二層目: 一層目のユニット  u^{(1,1)}, \cdots, u^{(1, J_1)}を入力として, 同様に  J_2 個の線形回帰式を作る.

 \begin{align}
u^{(2, 1)} &= b_{1, 1, 0} + b_{1, 1, 1} u^{(1, 1)} + \cdots + b_{1, 1, J_1} u^{(1, J_1)} \\
u^{(2, 2)} &= b_{1, 2, 0} + b_{1, 2, 1} u^{(1, 1)} + \cdots + b_{1, 2, K} u^{(1, J_1)} \\
& \vdots \\
u^{(2, J_2)} &= b_{1, J_2 0} + b_{1, J_2, 1} u^{(1, 1)} + \cdots + b_{1, J_2, K} u^{(1, J_1)} \\
\end{align}

あとはコピペ同然なので省略. 層は理論上はいくらでも増やせるが, ここでは  L層まであることにする.

最後の L層は出力をする必要があるため,  L-1 層で作った  J_{L-1} 個のユニットを1つに結合する.

 y = b_{L, 0}u^{(L-1, 1)} + b_{L, 1} u^{(L-1, 2)} + \cdots + b_{L-1, J_{L-1}} u^{(L-1, J_{L-1})}

(こういう式を見せられてなんかよくわからないが「最小二乗法の三次元版?」と表現する気持ちも分からなくはない)

これだけ複雑な式であっても, 入力 ( x_1, \cdots, x_K) と出力 ( y) , そしていくつもの係数が存在するため, やはり理論値と観測値の差がなるべく小さくなるように係数を決める, 誤差を最小化する方法であるという部分は変わらない. つまりディープラーニング (ニューラルネットワーク) も最小二乗法と同じように, 残差二乗和を最小化するのが目標である. しかし, 最小二乗法の計算が難しいので, 誤差逆伝搬法と呼ばれる線形回帰式の最小二乗法とは全く異なる方法で計算するのが普通である. また, 今回はシンプルな例を書いたが, 線形回帰式とはだいぶ異なった複雑な式にすることも理論上は可能である.

しかしこれをもって同じだとか, 違うだとかいう議論はドーナツとマグカップが同じ形」という話を現実の生活に持ち込むのと同じで, 議論の本質を外した屁理屈でしかない. あえてそのような屁理屈に乗っかるのなら, 最小二乗法と一口に言ってもガウス-ザイデル法やQR法などいろいろな計算手順があるため, それぞれ別物である, ということも主張できるし, 誤差逆伝搬法の具体的な計算(SGD)にも様々なバリエーションがある. どちらにせよ同型関係であら捜しをするのはナンセンスである.


7 主張はどこまで正しくて, どこまで誤りなのか

テクノロジーの発達の末に超人類が誕生し, 残された人類を無用者として淘汰することになるか, というテーマに対し小林氏は, 経済格差の観点から, アセモグルのDTC理論を参考に, 技術革新による格差は一時的なもので, 常に平衡状態に戻る力が発生するため, 「無用者階級」は発生しないと反論する. さらに, 超人類の構成要素として重要なAIは無謬でなければならないが, 実際には「人工知能は最小二乗法と同じ」であるため必ず現実との誤差があり, 決して無謬でないためありえないと反論している.

既にアセモグルの研究から, 労働者が無用になることはないだろう, と主張しているのに, さらにAIの無謬性の話をするのは一見するとよくわからないが, その後ハイエクの思想について述べていることから, 反論のうち前者はアセモグルの研究は超人類を労働者として見た場合, 他の人間を淘汰することはないという主張, 後者は超人類が為政者, あるいは社会計画者として君臨できない, という主張だと考えて検証する.

第1の反論で検証すべきは, DTC理論とハラリ理論がどこまで前提を共有しているかである. 真面目な議論をするならば, どのような仮定のもとで, どのような経済モデルを仮説として立てるかよく議論する必要があるのだが, あまり厳密な話をするほど本件に時間をかけるつもりはないため, かいつまんで述べる.

DTC 理論から労働者の格差縮小という結論を引き出すには, 小林 (2007) でも説明しているように, 格差が縮小するのは 2種類の労働者の生産物がいずれも経済活動に必須であること, そして2種類の労働者が代替財の関係であるという前提が成り立つ場合である. 代替財とは, 一方の財の価格の上昇がもう一方の財の需要量の増加につながるような関係のことをいう. 平たく言えば, 超人類だけができる仕事を何らかの形で普通の労働者が代替できるか (おそらく普通の労働者では非効率さが発生するだろう) どうか, ということなのだが, これに関しては超人類の性質が厳密に提示されていないため断言できない (ハラリも明確に考えてないような気がする). 超人類を構成する技術のうち, 早くに実現しそうな技術としては (倫理の問題を別にして), サイバネティク義肢*14やデザイナーベイビー*15などがありそうだが, これらだけでは代替性が破られるような決定的な能力差はつかないように思える. 不死とか全知全能のAIとか, 現時点で実用化のめどの経っていない技術を根拠にするのなら, 無用者階級が存在価値を持つための技術が将来発生するだろうという主張を否定するのは不公平だろう. 近年のアセモグルらの研究を引用していないためやや説明不足にも見えるが, おかしな話ではない.

ただし, 再反論として, DTC理論は静学的なモデルであり, 動学的な変化は考慮されていないというものが考えられる. 技術進歩があまりに急激ならば, 収束しうる均衡点が他にも存在するかもしれない*16. もしかしたらそういう分析をした研究もあるかもしれないが, 成長理論は詳しくないので知らない.

第2の反論では, AI=最小二乗法を示した上で, 無謬でない AI の力だけでは超人類は支配者として君臨することはできない, としている. 無謬でなければならない根拠として, ハイエクの理論を挙げている. ハイエクの理論は市場つくらない計画経済を否定する理論であり, 例えば個人の好みなど, 消費に関する情報が完全に集まらない以上, 中央集権的に資源を分配する計画経済は不可能であり,市場に任せるほうがよいと論じた (いわゆる社会主義計算論争)*17. 事実, ソ連は経済が停滞し最終的には解体された*18. これが無謬性が要求される根拠である. ただし注意してほしいのだが, 経済学は明らかに, どのような状況であれば市場経済が適切に機能するか, 逆に市場経済が機能しない条件は何か, その場合どうすれば経済を適切にコントロールできるか, という方面へ研究が進んでいる. もちろんこれもまだ限定的であるため, 完全に経済を統制する, 実現可能な理論は存在しない.

第2の反論で言及するAIとはディープラーニングのことであり, いわゆる「弱いAI」であり, 「強いAI」ではない. 最初に引いたスライドでは, テクノロジーによる感情の制御なども挙げている. おそらくハラリのイメージとしては, 超人類は単なる最小二乗法しかできない現在の弱い AI ではなく, 一般のイメージに近い思惟能力を持つ強い AI によって補強された存在なのだろう. 具体例を挙げるなら2001年宇宙の旅の HAL 9000 やターミネータースカイネットのような. だが, 強いAIもまた未だ実用化されていないので, 論じてもあまり意味がない. 結局のところ, 技術的特異点以降に何があるかは語りようがない.

しかし, なぜここでAIが無謬でなければならないという前提で話しているのかが私には分からない. 現在のAIは最小二乗法であり, 我々の想像する範囲でも強いAIは命令の板挟みにより暴走している. かりに強いAIが誤謬する存在でなくても, スカイネットのように人間を管理する形で統制するのかは全く分からない. ハラリがそう主張してたのか, 小林氏が昔ながらのAIのイメージで語っていたのかは分からないが, 第2の反論は論点が不明瞭である.

これ以降の記述は, 超人類の可謬性を前提に, 進化生物学の話題になっていく. この分野は全く詳しくないので, すでに超人類による淘汰予想への反論がなされた以上, ここでは言及しないことにする.

8 結論

小林氏の記事は, ヒューマンオーグメンテーションによって強化された人類, 超人類がそうでない人類を淘汰しうるか, というテーマに対して, アセモグルのDTC理論を援用し, 労働者としての人類は超人類に淘汰されないこと, 現在のAI技術では経済の計画者たりえないことから, 否定的な見解を示した. ここから, 現時点で実用化の可能性が高い技術の範囲では, テーマは否定できる. しかし, これはあくまで後方帰納的な推論であり, 将来の技術的ブレークスルーがどうなるかは考慮されていないので, 断定はできない(いつ起こるかわからないからブレークスルーだから当たり前なのだが). ハラリ理論の超人類像は, 現時点では実用化していない技術を達成した先の話をも見越しているようだが, 既に述べたように, それでは都合の良い仮定から好きな結論が出せてしまう.

文章全体としては, 専門外のトピックに過剰に言及したりせず, 経済学者としてアセモグルの研究を紹介するための枕に留めておいたほうが読者のためになるのではないか, と思わなくもない. 全体として, ハイエクとか, AIとか, バズワードというか, 話題に敏感な人が食いつきそうなキーワードをわざと多くした感がある文だが, 超人類の否定論として破綻はないように見える. 反例としてAI の話をするのはやや強引な気がするが, 今回の騒動を見てわかるように, AI に対する言及は極めて食いつきがよく, 結果として多くの人の目に留まったことだろう. 我々は筆者にまんまと踊らされたのだ (ベタなオチ).

参考文献

Acemoglu, Daron (2002) Directed Technical Change", Review of Economic Studies, 69 (4), pp. 781-809
Acemoglu, Daron and Restrepo, Pascaual (2016) "The job race: Machines versus humans | VOX, CEPR Policy Portal," VoxEU.
Acemoglu, Daron and Restrepo, Pascaual (2018) "Robots and jobs: Evidence from the US | VOX, CEPR Policy Portal," VoxEU.
Romer, David (2012) Advanced Macroeconomics 4th ed., The McGraw-Hill Companies.
Advanced Macroeconomics (Mcgraw-hill Economics)

Advanced Macroeconomics (Mcgraw-hill Economics)

  • 作者:Romer, David
  • 発売日: 2018/02/19
  • メディア: ハードカバー
二神, 孝一 and 堀, 敬一 (2009) 『マクロ経済学有斐閣.
第2版:
マクロ経済学 第2版

マクロ経済学 第2版

小林, 慶一郎 (2012) 『経済教室「技術変化は格差を縮める』,産業経済研究所 (日本経済新聞, 2017/7/23付からの転載).
岡谷, 貴之 (2015) 『深層学習』, 講談社.
深層学習 (機械学習プロフェッショナルシリーズ)

深層学習 (機械学習プロフェッショナルシリーズ)

  • 作者:岡谷 貴之
  • 発売日: 2015/04/08
  • メディア: 単行本(ソフトカバー)

*1:この記事に言及しているネットメディアやブログはいくつか見つかったが, それらは本題から離れて執筆者の最小二乗法またはニューラルネットの知識を披露しているだけだったので, ここでは取り上げない.

*2:人工知能研究者の松尾豊氏のことか

*3:https://newspicks.com/news/3500835/

*4:タイトルは忘れたが, かなり昔に読んだビジネス新書で言及されていた記憶がある.

*5:スライドを見る限りでは, ファクトと未来予想とハラリの個人的な願望の区別がはっきりしないが.

*6:技術進歩を数値で表せるか, と思う人もいるかもしれないが, 数理モデルで定義されている. その定義が現実の表現として適切なのかは各自の判断次第だ.

*7:たとえば二神 and 堀 (2009)では, 差分方程式にアレンジしたものが紹介されているが, 含意に大きな違いはない.

*8:RIETI 研究員紹介ページより: https://www.rieti.go.jp/users/kobayashi-keiichiro/

*9:ただし, ここでは手短に説明するため, AI=最小二乗法論法と同様にかなり簡略化した表現を用いており, 実際の専門的な議論とは用語の使い方が異なることに注意されたい.

*10:RTSボードゲームをやったことがある人は, 似たような拡大再生産ルールを持つゲームを見たことがあるかもしれない. 内生的成長理論の経済モデルは拡大再生産的なプロセスを説明するため, こういう投資か消費かという意思決定をモデル化していると言える.

*11:たとえば数十年くらいのスケール

*12:こういう謳い文句のソフトは過去何度も登場した気がするが, 一旦はここで新登場ということにしておこう.

*13:実際にはDTC理論は単純化のため独占企業を想定しているため, 複数の企業が存在する場合はこの違いによる帰結の差に注意しなければならない.

*14:https://wired.jp/2018/05/28/restore-feeling-to-lost-limbskinda/

*15:https://www.bbc.com/japanese/46955786

*16:例えば, 成長軌道に乗れない「貧困の罠」のような現象は動学的な分析を用いる必要がある.

*17:当時の計画経済といえば社会主義国家のソ連が実施していることであり, この理論はしょっちゅう, 共産主義自由主義かというイデオロギー対立の場で引用されるため, ハイエクの名前はマルクスケインズの次くらいに一般書などで見かける気がする.

*18:ソ連の失敗した理由を「何もしなくとも配給を受けられ競争心を煽られない社会でみんな怠けたから」と説明する向きがあるが, これは迷信である.