はまち
気になった論文などを読んでまとめ
LangChain関係の記事まとめ
学生時代に図書館で読んだ「プログラミング言語AWK」が、今の時代になんと、第1版から35年ぶ…
ChatGPT上の、csvファイルやグラフの扱いが改良されているようです。 ちょうど、日本全国の発…
Meta社の研究チーム(Fabian Gloeckle, Badr Youbi Idrissi, Baptiste Rozière, David Lopez-…
Transformerベースの言語モデルの内部動作を確認するためのツールを用いて各層の役割について…
Microsoft Researchが発表した以下論文がXで話題になっていました。少々出遅れた感があります…
学習可能なカラー トークン(つまり、カラー クエリ) を最適化することで、グレースケール画像…
LangGraphというLangChainの新機能が公開されていたので、google colab上でチュートリアルをざ…
わたしは最近ラジコンカーにはまっていて、近くのラジコンカーのコースで練習しています。そこ…
meta社が強化学習Agentの実用向けのフレームワーク「Pearl」を公開していました。論文も投稿さ…
jetracerを作って遊んでいたら、気が付くと自分で運転するのが楽しくなってラジコンカー沼には…
アリババクラウドが、音声入力に対応したLLMであるQwen-Audioを公開していたので早速デモを試…
バックボーンのフレームワークを、従来のTensorFlowから、デファクトスタンダードになりつつあ…
gpt4-vison API を使った作例として公開してされている、ポンチ絵をhtmlに変換するアプリdraw-…
meta社からテキストの説明や音声プロンプトに基づいて高品質の音楽サンプルを生成できるテキス…
先日OpenAIから音声テキスト変換whisperの新モデル"large-v3"が公開されました。近くAPIも公開…
gpt-4vのような画像分析機能を持つオープンソースLLM『LLaVA-1.5』が公開されていたのでローカ…