私は生成AIをどのように"勉強"しているのか

2023年12月10日 09:18

趣味として、生成AIをどのように勉強しているのか？への回答(ぽえむ)です

⚠️
(広義の)生成AIを利用し、情報収集をはじめて1年以上が経ちました。時流が速く、生成AIの全てをキャッチアップすることは不可能ですが、それでも全てをキャッチアップする気概で、かなり泥臭い「犬の道」を歩んできました。クレバーで効率的なやり方ではないことをあらかじめご了承ください。
想定読者は非エンジニア・非専門家ですので悪しからず。

📝どのように生成AIを勉強しているのか

質問を何度かいただいたので、普段の自分の行いや考えを言語化してみる。自分は勉強という意識は無いのだけれど、それも含めて。

🛜信用できる情報源の媒体としてWeb/SNSを活用する

信用できる情報源にたどり着くための媒体としてTwitterや特定のディスコ鯖を監視する。監視対象はAI開発者・提供者・利用者の三者三様。頻度はおそらく人並み以下で、気に入った情報を~~ふぁぼ~~いいねして後でまとめて見返す。頻度は低いが能動的にアクションしているつもり。

Twitterの場合、自らのおすすめTLは自分のいいね動向に影響を受けるらしいので、最初はひたすら深津さんやnpakaさんを監視・いいねすればTLがAI動向追っかけるマンになる。あとはAIの専門家もフォローしつつ。過度な驚き屋はノイズなのでミュート。エコーチェンバーには気を付ける。

媒体はインターネット（気になった新聞記事は大学図書館で読む）、情報源はAI開発者・提供者元の発言や記事やドキュメントや論文、実装プログラム、発表スライド、書籍などなど。

情報源は論文だろうと記事だろうとまず読む。先に要約する場合も多いが本文をきちんと読む場合が多い。(要約は本文を読んでいる間に考える道しるべを果たす。)読んだ内容の必要度や重要度を頭の中で重み付けて、整理する。度合いの指標は信用度、hype度、スケーラビリティ、手元で試せるかどうか、芯食っているかどうか、など。

基本はこの繰り返し。また「手元で試せる」事柄は重宝して、早速使ってみることが多い。生成AI(特にChaGPT API公開)以降、特にプロンプト/プログラムが共有される雰囲気になったので、試さない手は無い。

そもそも私は関心事について、常人の100倍はググっている、気がする。都度気になることや疑問点を調査するためと、特定の動向を定点観察するためである。特に期間の絞り込んだ定点観察は素早く情報をキャッチアップできる。ある程度は既存のbotにお任せしつつ、疲労コストと引き換えに自らググる。もう手癖になった。

🌐オープンソースの恩恵を与る

「手元で試せる」事柄を積極的に経験する。信頼できるソースがオープンであることの恩恵は極めて大きい。生成AIに関する技術の場合、Pythonの実行環境、ChaGPTアカウントさえあればたいてい試行できる。推論にGPUを要するモデルを動かす場合でもColab Proで多少はカバーできる。Colab大好き。

やってみてはじめて体得できる暗黙知はあまりにも多い。公開されているプロンプトが最適/実利用に耐えるケースは稀だ。OSSのコードが動かないことは頻繁にある。金銭的・技術的ハードルが下がったAIという代物を体験・操作できる興奮冷めやらぬ。

私は人の手を煩わせずに済むことが好きだ。自分とインターネットの間で完結する情報源は、他に遮るものが何もないので、没頭や学びに最適だと思う。

🔁何度も入門する

私は勉強が苦手だ。本を読めば頭が痛くなり2桁の引き算は遅く、知識の定着も遅い。生成AIを開発・研究する身体的環境にも置かれていない。一度見聞きした経験だけではすぐ忘れてしまう。

だから生成AIだろうとPythonだろうと何だろうと、コンテンツに入門し続けている。短期的に覚えた知識を定着させるために、忘れた頃にまた入門する。覚えている間にまた入門することもしばしば。これは勉強というよりも、こだわりである。情報源をつかんで離さず、情報源を理解するための手段や知識を執念深く追い詰め、自分の支配下に置く感じ。

ここまで私を動かすモチベーションは焦燥感である。インターネットには現実生活で絶対にお目にかかれないような、図抜けた秀才がいる。秀才の行動を見て、負けじとキャッチアップを続けないと、置いてけぼりを食らうかもしれないという仮想の焦燥感。こうして自分の信念を持ち崩さない程度に、私は自分の背中に火をつけることが多い。

その結果、秀才との距離は一向に縮まらないが、一般人より優れた知見や成果を持つに至る場合がある。そうなればもうけもんである。

📚読書案内

何も知らない！勉強したい！という方にはノータイムで岡野原本をお勧めしたい。それがちょっと取っつきにくい場合は野口本をお勧めする。学生・教職員問わず楽に読める形にまとまっている。また具体的なプロンプトについて学びたい人は山田本を。翻訳に限らず有用な情報が多い。

またちょうど良い感じのプロンプトガイドも作成中。ぼちぼち更新するつもりなので興味があればチェックしてほしい。

🧐なぜ生成AIをキャッチアップできるのか

そもそも、なぜ生成AIという新しい科学・技術(はたまた新しい社会の形)をキャッチアップするに至ったのか。なぜキャッチアップできたのか。

好きだから。でもそれでは今後リテラシーとして身につけたい人のノイズになる。そもそも生成AIのキャッチアップには精神的ハードルがある人もいる。そこで私のAIに対する見方や背景を書くことで、こんな人がAIに興味を持っているのだと参考になれば。

🔧エンジニア風味のキャリア

私は業務に関してプログラムを書くことや、その成果やコードを公表すべしとするオープンソース文化に浸ってきた。学生時代にPythonやC++、Fortranに入門していたおかげかもしれない。数年前にGitやDockerに入門して以降、先達のエンジニアが作ったプログラムや環境を倣って自ら学習できるようになった。オープンソースには感謝してもしきれない。迷宮入りしたバグが、ネットの海にぷかりと浮かぶはてなブログの備忘録のおかげで解決策に至った経験は数知れず。

OSSのLLMや拡散モデルを使ってみること、プログラムを安全に動かすためのコンテナを作ること、プログラムを動かしてみることに好奇心をそそられる。ましてやそれが業務の改善やコンテンツの生成に寄与するなら使うほかない。

「キャリア」と書いたが、就職してExcelのVBAに目覚めるAutomationつよつよマンは似た考えを持っているのではないかろうか。

もちろん私はエンジニアではないのでエンジニア風味なだけである

📖論文を読むという文化

論文を読むことは得意ではないが、好きで、その文化に理解を示すことができる。AIモデルに関する技術はもちろん、プロンプトエンジニアリングやLLMプログラムの有用な情報もたいてい論文に詳述されているため、論文を読むという発想や文化が無いと生成AIを理解するまでの道のりが険しいと思う。

この文化を理解できるかどうかは生成AIを勉強できるかどうかの一つの基準になるかもしれない。それほど重要な情報源の一つである。できないとは言わないがディスアドバンテージを抱えることになると思う。

論文が英語で読むのが億劫？ここにChaGPTがあるじゃろ。

各種リスクへの対応や組織的活用のために論文を読む必要は無いかもしれないが、それは生成AIに限った話ではないので考慮外

🔭科学技術社会論とトランスヒューマニズム

最後は私の昔話を挟みたい。

私の大学院進学の動機の一つが「学校の理科教育に足りないものは科学の本質(Nature of Science;NoS)の陶冶であるため、科学史教育を通じて、NoSの一要素である科学技術社会論(Science and Technology,and Society;STS)を授業に導入する」ことであった。無味乾燥とした形式や引っ張り出された好奇心によって成立する理科の授業ではなく、先達の汗の匂いがする生々しい理科の授業を目指した。

そのために学部4回生の私は関連書籍を読み漁っていた。その一冊が、松尾豊先生が執筆された「人工知能は人間を超えるか」である。手に取ってみた理由や動機は定かではなく、おそらくSTSっぽい(=科学・技術の枠に留まらない、科学・技術の本質)雰囲気を感じたからだろう。

この本が私に与えた影響は絶大であり、「人工知能は人間を超えない」という確信を抱き、「人間を増強するデバイス・サポーターとしてのAI像」が確立した瞬間であった。クーケルバーク先生曰くところの、トランスヒューマニストが「人間のもつ脆弱さや人間が犯す「エラー」に対する失望から、人間をエンハンス〔能力増強〕する必要があると主張する」ように。また戸田山先生の教養観に基づく「知の増強装置としての教養」がこの考えを後ろから支えるようになる。

「究極、僕はバカであり人間もバカだから、人間がバカを覆い進歩するために教養は存在し、デバイスはその具体的な実装手段の一つである」という観念が、「AIによって能力が拡張された人間」を受け入れる土壌になった。スマホが人間の能力を規定し、時には拡張する事実に、何の疑いもないのと同様に。

だから、画像を作るAIが2022年に台頭したとき、その技術仕様や倫理的課題はさておき、それが僕たち人間の能力の拡張をもたらすのだと解釈できた。これがおそらくポジティブな姿勢に基づく素早いキャッチアップにつながったのではないか、と考えている。

おわりに

なお、IR(Institutional Research)においてデータ品質を継続的に保証する取り組みの重要性を考えていたことも、AIの理解に紐づいた。AIが学習するデータセットや検索拡張用データセットの品質の高さが価値に直結するからだ。ChaGPTの利用開始時期と、研究計画策定の時期が被った。

結局、私がここまで生成AIをキャッチアップできたことは偶然や私の性癖に依るところが大きい。だからAIに対してフランケンシュタイン・コンプレックスを想起し、恐れ、規制を促すスタンスそのものを単に否定できない。職場にイキナリ現れたExcel関数やVBAやChaGPTを受け付けない人を単に否定できない。

たまたま私が思想の対岸に立っているだけだからだ。私たちは彼らと手を取り合って生きないといけない。

この記事が気に入ったらサポートをしてみませんか？