見出し画像

LLM関連ブックマークまとめ(2024.8.19-25): LongWriterって無限の可能性を感じる

LLM関連ブックマーク(週毎)をまとめる作業をLLMにやらせてみる」にあるように、毎週あつめたLLM関連ブックマークを、LLMにまとめてもらっている。今週はClaude3.5さんとgpt-4oさんにまとめてもらいました。

長いストーリラインからアニメを作るとか、自分の知らない領域の技術文書を作るとか、ちょっと斜めなLLM活用がちらほらでてきた、単なるツールとしての利用ではない、何かが始まっている(言語化できてないだけ)。

LLM最新動向(2024.8.19-25)まとめ

生成AIの世界は日々進化を続けており、その最新動向を追うのはまるでジェットコースターに乗っているような興奮を覚えます。まず、大手テック企業の動きに目を向けてみましょう。

Googleが新しい画像生成モデル「Imagen 3」を発表しました。このモデルは、指定された数の物体を正確に描画する能力や、複雑な指示にも対応できる柔軟性において、他のモデルを凌駕しているそうです。まるで、AIが私たちの想像力とピタリと同期したかのようですね。

一方、Microsoftは多言語対応の「Phi-3.5」モデルシリーズ(Phi-3.5-miniPhi-3.5-MOEPhi-3.5-vision)をリリースしました。このモデルは、様々なタスクで大幅な性能向上を見せており、まるで言語の壁を軽々と飛び越えていくかのようです。Googleも負けじと、生成AI「Gemini」が1000ページのPDFを読んで質問に答えられるように改良。AIが私たちの「頭脳」になろうとしているのでしょうか?

そして、Anthropicは興味深い一手を打ちました。Claudeに新たにLaTeXのレンダリング機能を追加したのです。数式好きの方々は、きっと心の中でガッツポーズを取ったことでしょう。

Perplexityが「FLUX.1」を画像生成機能に搭載し、実験的にではありますが、ページのサムネイル作成に利用されています。また、最新のLongWriterを使えば、通常の生成テキストの長さを大幅に上回る10,000ワードの文章を生成できるのは驚きです。LongWriterで原作を書き、Claude3.5Sonnetで脚本を練って、それに画像生成AIを組み合わせてAIマンガを作る、などの複雑なコンテンツを自動生成する能力が飛躍的に向上しました。

理論面では、AIの推論能力向上に注目が集まっています。CohereのCEOは、次のAIの進歩は推論能力の向上によってもたらされると考えているようです。そのためには、AIに推論プロセスを教えるための学習データの構築が重要だといいます。まるで、AIに「考え方」を教える教育者のような立場に私たちが立たされているようですね。

生成AIの制御や解釈性についての研究も進んでいます。例えば、IBMは9100万以上の分子を使用してエンコーダーデコーダー基盤モデルを構築し、高精度な物性予測を実現しました。また、AlphaProofのOSS版である数学の自動定理証明システム「DeepSeek-Prover-V1.5」が登場。さっそくSOTA(最先端技術)の記録を更新し、高校数学や大学数学レベルの問題にも対応可能です。さらに、物理学の知識を機械学習に組み込むアプローチが注目されており、例えば偏微分方程式の誤差を小さくするニューラルネットワークの学習方法などがあります。

また、「Speculative RAG」という新しい手法も登場しました。これは、検索と生成のタスクを分離することで、高品質な回答候補を提供し、最終的な出力生成の質と速度を大幅に改善するものです。AIが私たちの質問に対して、まるで熟練した図書館司書のように素早く的確に答えてくれる日も近いのかもしれません。

さらに、AIエージェントを自動的に生み出すためのフレームワーク「ADAS」も考案されました。これは、AIがAIを生み出すという、まるでSFの世界のような光景を想像させますね。

しかし、このような急速な発展には課題もあります。例えば、教育の分野では、ChatGPTを学生に使わせた結果、一時的に成績は上がったものの、その後使用を制限すると成績が下がってしまったという報告があります。これは、AIに頼りすぎることのリスクを示唆しているようです。

また、AIの発展に伴い、私たちの働き方や学び方も変化していくでしょう。デジタル/生成AI時代に求められる人材育成のあり方について、BCGのレポートでは、組織全体の変革の必要性や、戦略的思考やクリティカルシンキングの重要性が指摘されています。

LLMを使った学び方の変化の例として、技術Xの技術書を執筆してもらう(Claude 3.5)ってのもありました。 『Xの網羅的な技術書を書いて』 というところからスタートして、わからないところを質問しつつ、技術書ができるというまさに、共創って感じがしますね。

最後に、生成AIと人間との関係について考えてみましょう。AIは私たちの強力な助手となる一方で、その利用には慎重さも求められます。AIを使いこなすスキルを身につけつつ、同時に人間らしい創造性や批判的思考力を磨いていくことが重要になるでしょう。AIと共存する未来は、まるで新しい楽器を学ぶようなものかもしれません。最初は戸惑うかもしれませんが、徐々に上達し、やがては人間とAIが奏でる美しいハーモニーを創り出せるようになるのではないでしょうか。

LLM関連ブックマーク(オリジナル)

もととなった、ブックマーク集です。


この記事が気に入ったらサポートをしてみませんか?