大規模言語モデル(LLM)やそのツールの情報整理2024.09版
まずは個人的にお気に入りのPerplexityのビジネスモデルが見え始めたこと。サステナブルなサービスになってくれそー
と思ってたら『Genspark』という競合が出現!過去の競合であるSearchGPTとかに比べるとちゃんと結果を出してくれてるので期待大!
まだβ版だからか、今のところ無料とはいえ、イマイチ使いづらい。ただ、それはperplexityも初期は似たようなもんだったし、リサーチ特化型AIは他よりユースケースやニーズがハッキリしてて有用だと思うので、今後のモニタリング対象にしていこう
perplexityに出資してるはずのsoftbankがChatGPTのプロンプト文例集を出してた苦笑
まぁ多くの人は他のLLMなんかまで知らない、まずはChatGPTからだろうし、他のLLMでも有用なプロンプトだし、まぁ良いか。
ということでOpenAIのChatGPT、もちろんさすがというか「OpenAI o1」って、いや、まぁそこまで使いこなせるユーザがどれだけいるかというのもあるが、かなり凄くなっているのはわかる。
個人的にperplexityの次に好きなグーグルのAI、LLMのgeminiに限らず、身体性を持たせるロボットの取り組みとか、やることやってるのは相変わらず好感しかない。
使うときはnotion経由なんで、どうもイマイチに感じてしまうのだけど、Claudeも追い上げてきたと言っていいのかしら。。。
googleのgeminiでも触れた画像生成をはじめ、音声や動画を生成するAIもここにきて動きが大きく見え始めた。元Google創業の感情を読み取るで有名な「Hume AI」が新しいAI音声モデル「EVI 2」ってのも出したらしい。
なんなら2027年までに生成AIソリューションの40%がマルチモーダル化するとかどうとか。マルチモーダルLLMのベンチマークも見ないと。。。
技術の最先端というよりは実用の最前線を踏まえれば、小規模言語モデル「SLM」の動きも。
RAG技術については、ナレッジグラフで補うとか、評価のフレームワークの開発とか、まぁまぁ後で読んでみたい記事はある。今のところcoilotに要約させて一瞥した程度だけどwww
こっちは、これまでのプロンプトを統合するという論文。これもcoilotに要約させて一瞥した程度だけど実際に使えるのか…。
LLM関連の技術全般をまとめたサーベイ?
と言いつつ実務への適用はどうなんだろ
人間の創造性や生産性を高めるといったり、そうでもないと言ったり
これから更に使われるようになるねーといったそばから幻滅期になるよと言う調査会社があったり
ディープフェイクやらモデル崩壊やらの危機は煽られるし
いろんな論者が相容れない立ち位置で百花繚乱するのはビッグデータブームから繰り返す歴史ではある。当時よりマトモな論者が増えているけど、一方でポエマーとかプロ驚き屋とでもいう人も増えてるしなぁ。
表では時々それらしいことを言うべき身ではあるけど、結局のところイチユーザーとして仕事が楽になれば良いww
この記事が気に入ったらサポートをしてみませんか?