課程博士の生態図鑑 No.10 （2023年1月）

2023年2月4日 15:02

研究の進捗

2023年になってからもう１ヶ月が過ぎてしまった。今月はひたすら国際学会の準備に追われていた。学会自体は３月末にあるので、まだ時間の猶予は残されているものの、プレゼンスライドを作るのに非常に苦戦している。

というのも、僕の研究では日本語のテキストを形態素に分解して分析しているので、そのまま英語に翻訳することが難しいのである。なので、日本語の形態素を図示しつつ英語で注釈を加えるという、少々（いや、かなり）面倒なことをしている。どうすればうまく伝わるのか、非常に難しいところだ。

また、最近実証分析とは何かを改めてちゃんと勉強し直している。実証分析とは簡単にいうと理論や仮説が正しいかどうかを、統計データを用いて検証する方法というところか。理論研究と対をなす概念と言われている。この辺りの作法については今まで深くは触れてこなかったが、デザインを学として成立させるためには当然避けては通れない道だろう。（といっても、最近デザインについての研究はまるでしておらず、創造性とその認知について研究しているのだが）

なので、以下の本を中心に取り上げつつ、実証分析について軽くまとめてみたい。

まずは相関関係と因果関係の違い。

相関関係というのは、Aという事象の生起とBという事象の生起との間に何らかの関連性が認められることであるのに対し、因果関係というのは、Aという事象「によって」Bという事象が引き起こされる、という原因・結果の関係である。因果関係があれば相関関係はあるけれども、相関関係があっても因果関係があるとは限らない。たとえば、「コンビニで傘の売上が増えること」と「雨が降っていること」との間に相関関係が観察されるけれども、だからといって、「コンビニで傘の売上が増えたから雨が降ったのだ」という因果関係は認められない（その逆の因果関係ならある）。

実証分析入門

この手の話は基本中の基本なので、わざわざ書く必要もないのだが、実証分析によって検証できる物事の多くは相関関係に過ぎないという事実が、多くの問題を引き起こしている。

この問題は人文科学や社会科学の実証分析の限界に大きく関わってくる。最も叫ばれているのが、再現性の問題だ。特に社会科学系の研究で扱われるのは、過去に起きた出来事であり、それと同じ条件を実験室でもう一度再現するのは非常に難しい。

たとえば、「離婚要件を緩和したら何が起こるか」ということを知りたいときに、特定の国の特定の過去の時点で離婚要件を緩和したときに何が起こったかを知ることはできる。しかるに、離婚要件の緩和の社会的帰結を知りたいのであれば、「離婚要件を緩和した状態」（処置群）と「緩和しない状態」（コントロール群）を比較することが必要なはずだ。ところが、後者は、現実には存在し得なかった「反事実（counterfactual）」であり、それを直接知ることはできない　一　過去にさかのぽって歴史をやり直せるのでもない限り。さらに、仮に反事実を想定できたとしても、別の国、あるいは、異なる時点で離婚要件の緩和が行われていたら何が発生するかについては、分析結果を直ちに当てはめられるとは限らない。離婚要件の緩和がもたらす社会的帰結には、離婚要件以外のさまざまな社会的経済的要因が影響しているはずであり、それらの条件を再現できるとは限らないからである。

実証分析入門

社会学のようなマスなものではなく、人間の認知を扱うようなミクロな学問であれば、処置群とコントロール群を実験室内で成立させることは容易だ。しかし、サンプルを完全にランダムに割り振るのは難しいし、人間一般に適用できるような普遍的な規則を見出すにはかなり慎重な議論が必要になってくる。つまり、上述したように因果関係を知ることができない問題とも被る。

この本を読んでいて、なるほどなと思わされた記述があった。

実証分析を学び始めた頃、次のような格言を教えられことが多い（人によって多少の表現の違いがある）： "if you torture the data long enough, it will tell anything."「データをいじり続けていれば、どんな結論でも導き出せる」という趣旨である。前述したように、社会科学における実証分析は、自然科学とは異なる障害を乗り越えるためにさまざまな工夫を編み出してきたのだけれども、それらを複雑に組み合わせていくと、分析者の望ましいと思う答えを導けてしまうことがあるのである。そのような可能性を認識し、情報操作に抵抗できる能力が、実証分析の読み手の側に必要になってくる。

実証分析入門

確かに普段日頃から論文を読んでいて、壮大で複雑な分析手法をいくつも組み合わせて、結局何が言いたかったのかよくわからない論文に出会うこともある。これは自分の理解力の無さも原因ではあるが、シンプルな分析手法を用いて明確な結果が出ている論文の方が信頼できることは確かだ。僕も今後研究を進めていく上で、「シンプルさ」を一つの指標として持っておこうと思う。一時期難解なものに憧れてた時期もあったが、全く本質的じゃない。

面白いと思った文献や事例など

The Breakfast

１日に１回、朝食を介して人と会える、リスボン発のソーシャルサービス。

リアルで会うことを重視するコミュニケーションメディアで、１日１回だけ人に会うチャンスがあるらしい。クリエイティブで多様な考えを持つ人々を支援するためのサービスらしいが、朝食を食べるという口実があるため、比較的会いやすいのかな？

個人的には、一期一会的な関係性が築ける（一期一会なのに関係性を築くというのは矛盾している気もするが）なら使ってみたい。最近DAOを中心として新たなオンラインコミュニティのあり方について議論が活発化してきているが、僕は「多様な人の考え方に触れてみたいという欲求があるくせに、人との繋がりを積極的に作るのが好きじゃない」という面倒な性格なため、The Breakfastくらいのコンセプトがちょうどいい。

もちろん、朝食を食べて気が合えば関係性を保ち続ければいいし、そうでなければ連絡をしなければいい。熱を持ったコミュニティにわざわざ入る必要はないのだ。まぁ、このサービスはまだ日本では使えないんですけど。招待制で、151以上のプロフィールデータが登録されればその街でサービスが展開される可能性があるらしい。

Helsinki Built a Library That Brings a Whole City Together

ヘルシンキにて、参加型デザインプロセスを経て建てられたOodi Libraryという図書館の話。

この図書館は、本以外にも様々な機能が備わっている。１階にはレストラン、ムービーシアター、チェスボードなど、社会的な交流を支援する施設がある。２階にはワークスペース、ゲームルームなどがあり、クリエイティブな活動ができる。さらに開放的な屋上には、ブックヘブンと言われているような美しいリーディングフロアがあるらしい。

一部の批評家たちからは、近年廃れつつある図書館を建て直すために、もっと本に投資すべきだと言われているみたいだが、デジタル技術が発展している現代でそのアプローチは意味がないと個人的には思う。図書館の価値はもはや本を読むだけに留まらない。

この図書館は、市民たちが率先して意思決定に参加し、創り上げられていったという。驚きなのが、月に市民の約半数がこの場所を利用しているらしい。こういう参加型デザインの事例はいくつか見たことがあるが、ここまで大規模でクオリティが高く、且つちゃんと市民に愛されているのは珍しいのではないか。もっと探せば色々ありそうだけど。

そもそも図書館は公共の施設であるので、文字通り市民のためのものだ。なので市民の意思が色濃く反映されたこの図書館は、ある種のダイナミックな生命っぽさも感じる。Oodi Libraryは、この街のこの時代にあるべき図書館の姿なのだろう。

クリエイティビティが文化に根付くというのは、身の回りにあるモノを愛する心が醸成されることと同義なのだろうと最近強く感じる。

How a longer walk to baggage reclaim cut complaints

「空港の手荷物引渡所の待ち時間を減らすために、到着ゲートから手荷物引渡所への移動時間を増やすの意味なくね？」という話。

この空港の話は、デザイン思考が成功したとされる最も有名な事例の一つだ。ヒューストン空港では、手荷物引渡所の待ち時間に対するクレームが日々収まらないという状況に対して、到着ゲートから手荷物引渡所に着くまでの道のりを意図的に長くして移動時間を増やし、待ち時間を相対的に減らすことでクレーム数を減少させたという。

雑に解釈するなら、「待ち時間を無くすのはコスパ的に厳しいので、そもそも待ち時間を感じさせなければいいんだ」というようなことだ。

この事例を知ったのは何年前なのか覚えてないが、当時学部生だった僕にとってはかなりの衝撃だったのを覚えている。単純に「デザイン思考すげえ！」って思ってた気がする。それからこの事例について深く考えることもなく生きてきたのだが、この記事を読んでデザイン思考がなんなのかを再考せねばならないと思った。いわゆる問題のリフレーミングであるこの事例は、一般的には成功事例として知られている。しかしこの記事では批判的な視点から解釈されている。

この事例はトリックを使っているだけであり、結局のところ本質的なボトルネックを解消してはいないという。あなたが飛行機を降りてから空港を出るまでの時間は変わっていない。確かに言われてみればそうだ。問題を問題と感じさせない努力はもちろん素晴らしいが、ベストな選択ではないのかもしれない。ただ歩く時間を伸ばすだけなら尚更意味がない。

せめて道中で旅の記録を振り返れるような仕組みを用意したり、異文化交流ができるような場を提供するなど、感情的にプラスになるようなことが起こるなら納得ができる。まぁ、旅の途中であったり、これから帰宅する人は、ただちに家に帰りたいだろうし、手荷物はいち早く自分の手元に帰ってきて欲しいという感情は無くならないだろうが。

この記事では代替案は示されていないので、めちゃくちゃいい記事だとは思わないが、自分の考えを改めさせてくれた。

Top AI conference bans use of ChatGPT and AI language tools to write academic papers

タイトル通り、AI系の学会であるICMLが、Chat GPTを用いて論文を書くことを禁止したという事例を紹介した記事。

この記事ではAI系ツールを使って論文を作成することのリスクについて述べられていたのだが、最近僕もAI系ツールを研究の壁打ち相手として利用したり、論文を探してきてもらうことをしているので、身につまされる話だなと思った。

そもそもChat GPTなどのツールは大規模言語モデルを用いて構築されており、教師学習をほとんど必要とせずに言語の認識や予測、生成ができる。そもそも言語データの学習には「教師つき学習（supervised learning）」と「教師なし学習（unsupervised learning）」というのがあり、前者は人がコーパスの一部を分類してお手本を示すことで、その分類方法を機械が後から分類する手法。スパムメールのフィルタリングとかに用いられる。後者はお手本となる正解を示さずにコーパスの中身を機械に分類させる手法で、その分類が何を示すのかは後から解釈するようなもの。クラスター分析とか主成分分析とかがこれにあたるだろう。教師ありは正解があらかじめ用意されている問題に対しての確認作業で、教師なしはどちらかというと可能性の探索に向いていると思う。

ちなみに僕はこのあたりの領域に関しては全くもってど素人なので、この説明は信用しないでほしい。

ちょっと話が逸れたが、Chat GPTは人間が作成した学習データを元に次の単語を予測する。なので「もっともらしく聞こえる文章を書く能力だけがある」ということであり、正解となる事実を必ず教えてくれるわけではない。もちろん正解となる事実を演繹的に全て人間が教えられれば話は簡単なのだが、そんなリソースを投下することは非現実的である。

つまり何が言いたいかというと、誤った情報を堂々と提示してくる可能性があるということだ。僕も最近 Perplexity という、人間の質問に対して引用文献を示しながら回答を返してくれるツールで論文を探しているのだが、実際に引用元を読んでみるとちょっと違う内容だったりしたことがある。もちろん、これからどんどん精度が上がってくると思うので、現段階で完全に否定することもできないが。

この記事では、研究者がAIを使って完全に論文を作成することは確かに可能だが、それを行うインセンティブがほとんどないから、論文を完全にAIに任せる怠惰な人間は少数派だろうと述べている。なぜなら、査読者に気づかれずにその論文が通ったとしても、間違いを孕んだ可能性のある論文はその著者と一生紐付けられ続けるからだ。

しかし、AI系のツールは新しいテキストの生成ではなく、壁打ち相手として使用したり、文章の修正をするために使用することは有意義なことだろう。この記事曰く、英語論文はより流暢な方が好まれやすいというバイアスがあり、このことはネイティブスピーカーに有利に働いてしまう。なのでAIツールをノンネイティブの推敲補助として使用することで、このあたりの問題はだいぶ解消できるのではないかと思う。

実際にICMLは、AIツールの使用を完全に否定しているわけではないようだ。AIがゼロから書いたものなのかどうかを確実に検出ことは困難であるので、他の研究者によって疑わしいとされた投稿のみを調査するらしい。こういった背景も踏まえ、AIとの上手な関わり方を模索していきたい。

その他の出来事

遂にAIお絵描きにハマってしまった。Stable Diffusion を Apple Silicon 搭載 Mac でも使用できるようにした Diffusion Bee というソフトを使ってみた。

僕は本が大量に積み重なった風景に惹かれるので、それを狙って適当に画像生成してみた結果がこれである。生成した際のキーワードも一緒に載せてみる。

pile up some books, Professional painting, 4K, Jeremy Mann, intricate details, closeup, illustration, Rutkowski, Evil, Lonely, Bitter, in a room

pile up many books on the table, Professional painting, 4K, Jeremy Mann, closeup, illustration, Lonely, Bitter, fuzzy

pile up a thousand books, Professional painting, 4K, closeup, Lonely, Detailed and Intricate, 16-bit, Photo, Electric Colors

pile up a thousand books, Professional painting, 4K, closeup, Lonely, Detailed and Intricate, by Greg Rutkowski

A man standing up on a large number of books, by Greg Rutkowski

ミスるとこんな感じになる。ミスではないかもしれないけど。
pile up many encyclopedia, Professional painting, 4K, Jeremy Mann, intricate details, closeup, illustration, Rutkowski, and other Artstation illustrators

使ってみて思ったが、自分が狙った通りの画像を生成するのは死ぬほど難しい。まだ狙い通りのものは生成できた感じがしない。適切なキーワードを選定するには、それなりの知識と研鑽が必要なようだ。これはどれだけツールの精度が向上したとしても変わらないと思う。画像をインプットして生成してもらうやり方はまだそこまで試してないので、まだなんとも言えないけど。

情報デザインの第一人者である須永剛司の言葉を借りるなら、「じゃない感」を感じるにはとてもいいツールなのかもしれない。コンピュータの方が人間よりも何かを生成するスピードは速いので、「じゃない感」を感じれる回数もそれだけ増えることになる。アイデアの種だけ大量に生み出してもらって、そこからは人間が選択し、発展させていく関係性になるんだろうな。

この記事が気に入ったらサポートをしてみませんか？