見出し画像

研究方法論とはなにか?「因果推論:ミックステープ」を読みながら考える。

画像1

Amazon でお勧めされてScott CunninghamのCausal Inference: The Mixtapeを入手してみた。いま僕が集中的に研究をすすめている能動的推論 active inferenceの目標は人間が因果論的に考えて行動するメカニズムの解明にあるからだ。もちろんニュートン力学的あるいは機械論的な原因と結果があるわけでも、それを導く微分方程式があるわけでもない。確率論で考えていくのだ。確率論で考えるのだが、この考え方は大きく頻度論とベイズ論の二つがある。最近ではベイズ論がはやっていて僕も研究もこちらの流れである。

ベイズ論に興味をもったのは20年ちょっくらい前で、当時一緒にプロジェクトを行っていたソフトウェア会社の社長で天才といわれていたプログラマーとバーで飲んでいたときに初めてその名前を聞いた。で、いろいろ聞いていると、隣に座っていた友人のコピーライターが話をあわせてくるので、「えっ」と聴いたら、彼女の父親がこうした流れの出発点の現代の確率論が準拠する理論をつくった伊藤清さんのお弟子さんで、子供のときからこのような話を聞いていたという。で、いろいろ調べていたのだが、20年まえのことなので、ベイズ理論に関してあまり芳しい評判を聞かない。が、面白い。そこで、このプログラマーと一緒にNTTdocomoのプロジェクトとしてこの話を提案した。

電電公社時代にVIP構想というものがあった。立川敬二さんが構想した。当時はDocomoの社長だった。1985年に電電公社は民営化してNTTとなり、1999年にさらにNTT東、西と解体された。1998年に僕はNTTの中央研究所のリサーチプロフェッサーになって、横須賀と三鷹でいろいろな技術開発の現場をみてあれこれかんがえていたのだが、NTTが解体となった。が、契約が3年だったので、のこりはすきなことをやっていい、といわれて、光ファイバーによるビデオ伝送が強烈で、それをつかってみたいと言った。「そんなの2015年になっても出来ているか解らない」と研究所の人はうそぶいていたが、優秀なスタッフと1億円弱の研究予算をつけてくれた。僕はリサーチプロフェッサー(担当部長)ということで、そこまでは僕の裁量で決済していいということだった。で、2年この研究を続けたのだが、それがおわったころ、docomoやdataの幹部となって散っていったNTT中央研究所の研究仲間と会う機会が多くなった。そのときに、docomoのマルチメディア研究所の所長に転身していた中野 博隆さんから、ちょっと相談があると言うことで、お会いした。

そのときの相談はVIP構想についてであった。VIPとはvisual, intelligence, personal というビジョンで、立川さんが電電公社時代に構想したものだという。光ファイバーをつかった通信の可能性としてたしかにわかるなあ、とおもった。というのは1980年代の前半に僕はアメリカのワシントンDCの大学に留学していた。あるとき父からの手紙に光ファイバーという言葉があった。すごい技術で、これを日本中に張り巡らせば、産業界は無敵だ、といった事が書いてあった。帰国後電電公社が民営化されてNTTとなった。その後、アメリカと折衝していた現在の総務省の課長補佐とあるパーティで一緒になり、「民営化のまえに光ファイバーの敷設を終えておきたかったが、アメリカに押し切られた。NTTのコストとして光ファイバーの敷設がおこなわれることになった。残念だ」という。で、その後、NTTの投資でつくられていく光ファイバーをどう活用していくか、が戦略となっていく。電電公社時代に投資がおわっていれば、身軽にうごけたのに、ということだ。アメリカもこのあたり甘くはない。しっかりと実態を見ている。

Vは僕だけではないが、多くの人が興味をもちはじめていた映像伝送で、ビジネスの先は見えていた。Pはアナログだが個人用の携帯電話が登場して、それをつくる設備投資がさかんになり、景気を刺激していた。だがIつまりintelligenceだけどなにかで実現できるアイデアがないか、と中野さんは考えていたのだ。そこでその頃興味をもっていたエージェント型人工知能をつくって実験しませんか、と僕は提案したのだった。

画像2

30年ほど前に人工知能研究の大ブームがあった。経産省が音頭をとったシグマ計画が1990年には会社をつくるまでになり、国家予算がつぎ込まれ、しかし、何も生まれてこなくて大失敗になった。そこで研究していた研究者の何名かが1990年の慶應大学湘南藤沢キャンパスの創設に加わっていた。この本の監訳者の古川康一さんもそんな研究者だ。人工知能への逆風が強い中、研究を続けていいて、この本を1997年に翻訳出版された。

中野さんの質問に、エージェント型人工知能、あまりおりこうではないソフトウェアロボットが面白いのではないかと、僕が話すと、それ企画できる?というので、提案したのだ。当時まだデザイン思考という言葉はなかったが、IDEOと日本でワークショップを1991年におこなってから、いろいろな会社のプロジェクトをこの方法でおこなっていたので、なにが一番こまっているかなあ、と聞いてみたところ、役員が勝手にスケジュールを作るので、色々不都合が起こると秘書室が言っている、というのがあって、これが面白いなあ、ということで民族誌調査をした。その前に非常に厳密なNDAを書いたのだが、技術の問題かと思ったら、役員の行動についてのデータを一切公開してはいけない、というものだった。たしかにね。

で、エージェント型ロボットをつくり、それがあれこれといろいろな役員のスケジュールを調整しながら一つの全体スケジュールを作り出す、というものを作った。結構力作だとおもった。低迷する3Gサービスにいいなあ、とおもったのだが、このころにimodeが伸びてきて、B2B的なサービスではなくB2C的な方に注力をするということで、我々は一歩下がって、その後3年か4年、エージェント型ロボットによる検索の研究をすすめて、中野さんが退職して大阪大学の教授になり、プロジェクト全体は終了した。

エージェントアプローチの著者の一人Peter Norvigは著名なソフトウェアエンジニアで著作も多いが、なんといってもgoogleの研究所を牽引していて、アルゴリズムの開発全体を見ている。そしてこの本は二版まで翻訳されていたが、その後は翻訳はない。時代にあわせてこの本は改定された。

画像3

第3版では3分の2がベイズに費やされているのにびっくりした。そして最近第4版が出ている。

画像4

このようにベイズ理論はどんどん展開し、深層学習と組み合わせていまでは相当な所まで来ている。いま話題の能動的推論はこのベイズ理論の理解なしにはマスターすることは難しい。googleはこの領域の研究を突っ走っており、様々なサービスはここから出発している。

さて、このベイズ理論であるが、僕がこのあたりのことをやっていた頃、慶應大学の中妻照雄さん(経済学部教授)はアメリカの大学に留学していて1998年に博士号を得ている。彼は『Pythonによるベイズ統計学入門』を2019年に出している。

画像5

ここで、中妻氏は言う。「私がアメリカに留学した1990年代の前半の状況を思い出すと、ベイズ統計学は異端扱い、アメリカの主要大学でさえ統計学部は統廃合の憂き目にあい、統計学者の間で「統計学の危機」が叫ばれていた。その当時と今を比べると隔世の感がある。」と述べている。

そうなのだ。何かがかわった。ベイズ統計は異端で相手にされない。それは僕が慶應大学大学院メディアデザイン研究科の創設に参加して、教え始めた13年前でもあまり変わっていなかった。人工知能で頭脳をデザインしたロボットが惨敗におわり、刺激と反応だけで動くサブサンプション型のアーキテクチャが登場した。

画像6

だが、「頭脳」をもたないロボットは非常に簡単なことしか出来ない。自分の判断で動くロボットは確率ロボティクスの登場を待たねばならなかった。そして、これはベイズ的考え方の塊なのである。この分野は良い本が出ている。『確率ロボティクス』である。

画像7

この本の登場で、どうにか動くロボットが生まれてきた。ちなみに非常に優れた本が日本の研究者によって書かれているので紹介しておく。

画像8

というわけで、現在はベイズを研究していますと言っても眉をしかめる人は少ない。そしてカール・フリストンが能動的推論を主張することで、研究の流れが大きく変わった。能動的推論はかつてはニューラルネットワークといわれていた複数のノードをネットワークがつないでその間で情報の交換をする仕組みを何層にも積み重ねて情報のやり取りをする。そのやり取りをベイズ確率で処理をする。フリストン自身初期の深層学習でも活躍した人であり、深層学習とベイズ確率理論をつかって神経科学での大革命を起こしており、その影響力はどんどん増している。2013年の出版で、いまの能動的推論の研究動向より少し古いのだが、本質をつかまえた入門書として評判の高いヤコブ・ホーヴィの『予測する心』が翻訳で2020年に出版されているので紹介しておく。人間は脳の中に予測をする仕組みをもっていて、予測が上手くいくとそれを因果的だと感じる構造になっているという。当然上手くいかないと因果論的ではないと感じるが、多くの場合上手くいっているので、それを因果的だと認識しているとする考え方だ。因果的と考えるまでに推論が何度も行われる。それを能動的推論と呼ぶのだ。大事なポイントは世界が因果論的に出来ているのではなくて、我々の認識が世界が因果的であると思う傾向を持つ、ということと、その仕組みは経験科学的に、つまりデータをつかって証明できるとするのである。

画像9


さて、僕のこうした読書傾向を分析してAmazonはScott CunninghamのCausal Inferenceを推薦してくれたわけである。で、入手してぱらぱらとみて、索引をチェックしたが、どうも変だ。ベイズに関する話が全くない。関係する研究者にもまったく言及がない。一方で、頻度主義の泰斗R.A.Fisher の名著 Statistical Methods for Research Workers (1925)とThe Design of Experiments(1935)が輝くようにビブリオグラフィーの中で輝いている。この時代にどうしたことか?翻訳を探してみたが、あるね。

画像10

画像11

もちろんフィッシャーは偉大な統計学者であり、ベイズ理論やシャノンの情報理論とも深く関係する奥行きのある議論を展開しているのだが、それはそれとして、頻度主義の確率論といえばフィッシャーというのは通説であり、頻度主義からベイズ主義へと確率論の議論が変わってきている現在ではあまり注目されなくなってきている。

2021年に頻度主義から因果推論を主張するというのはそうとうなものだなあ、とおもって読み進めた。頻度主義の研究者が物事をどのように考えているのか、がよく分かる。我々が科学的に考えていると判断するときの枠組みを著者は非常に明確に上手に説明しているからだ。方法論の議論として非常にレベルが高い。議論もベイズ的な傾向もかなり入っている。大きく違うのは、能動的推論では知覚と行動が因果律的に結びつくのは環境と知覚と行動が関係したときの結果であって、時間軸を大きく取ったときに因果律ではないことである。このあたりは非常に込み入った難しい話になるが、丁寧に読み解いていきたいと思っている。

さて、CunninghamはIntroduction で、自分は大学時代は文学を専攻していて詩人になりたいとおもっていたが、なかなか芽がでなくて、アルバイトでマーケティングの市場調査を行っていたという。それは所詮質的調査であって、人間を観察するものであるが、そこで初めて経験主義(empiricism)を知ったという。それは"grounded theory"に基づいていた。これはグラウンデッド・セオリー・アプローチといわれるもので、観察して記述をしてそこからパターンを抽出するという方法である。民族誌調査をもとに研究を進め、人間の行動に関する理論を作ってみたが、それをfalsifyする方法が見つからなかったという。

falsifyとは英語の意味は prove (a statement or theory) to be false. つまり、その理論が間違いであると証明するという意味である。僕は大学の2年生の時に、慶應大学の文学部の社会学専攻だったのだが、アメリカの中西部の大学で社会心理学のPhDをとって帰国してきたばかりの先生が、授業で、仮説検定の話をして、この言葉をつかって、理論は間違っていることを証明できる枠組みのなかで正しいと証明できなくてはならない、ということで一生懸命この考えを授業で説明していたことを覚えている。僕らは何のことだろう、間違いであることを証明できる枠組みってなんだ?と思っていた。だが、この考え方が一部の社会科学者では非常に大切で、最初にはなした民族誌調査をして観察データを記録してそこからパターンを抽出するなんて方法をつかう学問は学問ではない、ということである。文化人類学とかフッサールの現象学を学び始めた文学部の学生にとっては「なんだ!なんだ!」という話であった。

この本の著者は、この問題について疑問をもってインターネットであらゆる記事を読んでみたという。そのなかで彼の興味をひいたのは、Gary Beckerだという。Beckerはノーベル経済学賞を1992年に取った著名な研究者だが、社会学者として研究をはじめ、経済学の理論をさまざまな社会文化現象に応用して、翻訳も何冊かある。Cunninghamはこの本を読むまで経済学は経済現象の問題だけを議論できると思っていたという。ところが、そうではなさそうだ、ということに感心したという。

そして、『銃器の数が多くなれば犯罪は減る More Guns, Less Crime: Understanding Crime and Gun Control Laws』を1998年に記したLottとMustardを知る。タイトル見るとやばい本だね。共著者のDavid Mustard はGary Beckerの弟子であった。因果関係が量的手法で証明できることに感激したCunninghamは妻と子供をつれて2002年にジョージア州のAthens アセンズ に引っ越し、ジョージア大学の博士課程に進学する。(LottとMustardの説が果たして因果的に正しいのか?は別として、この本は翻訳されていない。)

博士課程での論文提出資格試験を終えて、労働経済学を専攻して、社会問題つまり人種差別や教育差別、犯罪といった研究トッピックを勉強したという。さまざまな実証的データを調べ集めるだけではなく、その背後の理論となる計量経済学 Econometricsを学んだという。しかし、計量経済学は難しい。博士論文提出資格試験のフィールドとして計量経済学を学んだが、深い理解が出来ていたとは言えないと述べている。だが、研究を進めていくうちに、データの中に因果律をみつけていく推論が出来ることに気がついてきた。

さて、因果推論が計量経済学でみつかり、社会問題における因果律をみつけることが頻度主義統計によって可能になるとCunninghamは興奮して研究を続けることになる。

博士号をとったあと、職をえた大学でCunninghamは「因果律の理論」と題した講義を始める。そのなかでフィッシャーの研究に始まり、1970年代から1990年代にかけて経済学の研究を一変させた。そこにジューディア・パール(Judes Pearl)のようなコンピュータ科学者が加わり、因果律研究は様々な分野で研究が行われるだけではなく、いくつもの計量経済学の教科書にも取り入れられている。

さて、Cunninghamの本のタイトルは訳すと 『因果的推論 ミックステープ』となる。表紙の写真のミックステープはタイトルの一部である。「ミックステープ」という言葉を知っているだろうか。wikiを引くと「主にヒップホップ、ラップ、R&B、レゲエなどの音楽ジャンルにおいて、DJが未発又は既発の歌手の楽曲にリミックスを施し、ほとんどは製作者などの許可を得ずに路上などで発売するカセットテープ」とある。ウォークマンとダブルカセットが生み出した文化で、非常に1970年代後半から1980年的だ。iPodが普及するまで、かなり影響力のあった文化でありメディアだった。因果的推論という難しい計量経済学のコアの概念とヒップホップ文化をうみだしたミックステープとどんな関係があるのであろうか。それは以下だ。

なにがミックスされているのか。プログラミングの例題、データ、詳細な説明が一つにミックスされて、難しい計量経済学の入門となっている。この本をつかえば、それが解る。もっというと因果推論を知らないで計量経済学を行ってはいけない。計量経済学者にとってこれは不可欠の能力 conpetencyである、と述べる。データをあつめ、分析のコンピュータプログラムを書き、理論的、さらには現場のコンテキストの理解もある。こうした能力をこの本で身につけることが出来れば、計量経済学を武器として世の中を考えていくことが出来る、としている。

では、この本が想定する読者はだれか?現場で社会調査に関わっている人が自分の方法をアップデートするために、さらにDirected acyclic graph(DAG)日本語では有向非巡回グラフと呼ばれているベイズネットワークや仮想通貨を理解する能力をつけると述べる。だが、なによりも、これから博士課程に進んで計量系経済学を学ぶ学生に呼んで欲しいという。この本で博士課程のジャンプスターをして欲しい、つまり勉強を素早く強力に行うお手伝いをするぞ、というわけだ。

さて、これほど丁寧で今必要な確率論の手法をコンピュータの手ほどきまでついて学べるとなると、この本を勉強しようとなるが、いくつか問題点がある。一番の問題は使っているプログラムがRとSTATだということである。確率論をつかったデータ分析にはいいが、確率論をつかったロボット設計論にはあまり向いていない。もう一つは計量経済学のパラダイムをつかっているので、他の目的には使いにくい。それは先に紹介した中妻さんの『Pythonによおるベイズ統計学入門』も良い本で、Pythonプログラムをつかって入門にひつようなところは十分に網羅しているのだが、そして、詳しく説明されるベイズ統計に不可欠な概念、ポアソン分布、正規分布、回帰モデルのベイズ分析、モンテカルロ法、マルコフ連鎖モンテカルロ法と非常に魅力的なのだが、やはりちょっと僕の考えている入門書と違う。同じ確率モデルと行っても、どのような分野でつかっていくかで、入門の方法も異なる、という事なのだ。

さて、確率論的ロボティックスの理解と設計にむけて、若手の実務家にジャンプスタートをしてもらうためにはどうすればいいのか。この問題を次には考えてみたい。

















































この記事が気に入ったらサポートをしてみませんか?