【9/23-9/29】生成AI活用事例/研究開発-Weeklyまとめ

2023年9月29日 19:38

今週のAIに関する活用事例や研究開発情報の備忘録記事です。

活用事例

・YouTubeがAIツールを多数発表

YouTubeは数々のAIツールを発表
- AIが生成する写真や動画の背景、AIによる動画トピックの提案、音楽検索などhttps://t.co/AdVE4T9sUL pic.twitter.com/xLK59nlYjb
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・Microsoft 365 Copilotが11月にローンチ

Microsoft 365 Copilotが11月にローンチ
- 365ユーザーは11月1日からCopilotに加入可能
- 1人当たり月額30ドル
- 文書要約、メール作成委託、他のファイル情報から新しいWordプロジェクト作成、Teamsミーティングのハイライトをリアルタイム表示などhttps://t.co/YnQwDAxu0C
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・Microsoftは、Bing ChatにDALL-E 3を近々追加

Microsoftは、Bing ChatにDALL-E 3を近々追加
- また、新しいショッピング機能も追加
- ユーザーに製品の使用方法に関する質問や、よりパーソナライズされた質問を投げかけることが可能https://t.co/Uzb7E5OI5K
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・中国のAIライバーの価格と料金体系について

中国のAIライバーに関して16万円で使えると思われているので正しい情報をシェアします
•分身だけなら16万円程度
•音声クローンは30万円or100万円(音声のクオリティで変動)
•年間費用4万円
•一定の動画生成の時間に達すると従量課金制に変化… pic.twitter.com/e2Mvyi9c3K
— 吉川真人🇨🇳深センスタートアップ起業🔥 (@mako_63) September 21, 2023

・LLM開発のSpiral.AI、真島なおみと音声＆チャットで擬似会話できる「Naomi.AI」ローンチへ

LLM開発のhttps://t.co/e6tkhcjLnj、真島なおみと音声＆チャットで擬似会話できる「https://t.co/rPvizFY43H」ローンチへ https://t.co/oDyzpkQLn9 @thebridge_jpより
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 22, 2023

・ドイツ銀行AI帝国への野望

ドイツ銀行AI帝国への野望🔥
- 300-400名のAIエンジニアを1年以内に2-3倍に
- 13名の業務執行役員全員で全社にまたがり推進
- 若手バンカーが2-3日かかる資料を秒で作るツールや法人顧客の相談チャットボット等が登場
- 現在25のPoC推進中で2024年に大量投入の見込みhttps://t.co/b8LBUVA3Ha
— 久保田雅也@ベンチャーキャピタル (@kubotamas) September 23, 2023

・ゲーム開発に生成AI　新興、コスト3分の1に - 日本経済新聞

ゲーム開発に生成AI　新興、コスト3分の1に - 日本経済新聞 https://t.co/puUgBMshEC
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 23, 2023

・GPT/生成AIのSaaSインパクト、業務変革を知りたいなら　Salesforceの各Keynoteをみればパクれるポイント満載！

GPT/生成AIのSaaSインパクト、業務変革を知りたいなら　Salesforceの各Keynoteをみればパクれるポイント満載！

営業(Sales), マーケ（Marketing）、コマース（Commerce）、顧客対応（Service）他、タブロー、Slack、Mulesoftなど　自社に近いところのKeynoteを見れば、生成AI,…
— 尾原@NHK Eテレ令和ネット論「中国デジタル最新事情」8/30(水) 22:00～見てちょ (@kazobara) September 24, 2023

・京丹後中学校、AIを活用した英会話学習を導入

京丹後中学校で生成ＡＩ活用した英会話学習導入へ｜NHK 京都府のニュース https://t.co/cZmlBIBGRW
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023

・AR Code Object Capture Appの最新デモ

AR Code Object Capture Appの最新デモ

綺麗にくら寿司が

アプリ: https://t.co/aY9EFzjK0e https://t.co/euYey4IfIH pic.twitter.com/QVCnK3PD45
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023

・ChatGPTが音声会話と画像の利用を可能に

ChatGPTが、見て、聞いて、話せるように
- 今後2週間でChatGPT Plusユーザーに公開
- 音声会話（iOS & Android）
- 会話に画像を含めるられる（すべてのプラットフォーム）https://t.co/j4PHWxo5Yf https://t.co/Dz9CnNTAIy pic.twitter.com/d2mdRkVsgx
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023

・SpotifyはOpenAIと提携し、ポッドキャスターが自分の声を複製し、番組を自動翻訳できるように

SpotifyはOpenAIと提携し、
ポッドキャスターが自分の声を複製し、番組を自動翻訳できるようにhttps://t.co/bpEGwtFaHH
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023

・商用利用が可能なAIアート用、画像生成AI「Emi」を無償公開

商用利用が可能なAIアート用、画像生成AI「Emi」を無償公開いたしました！
リリース内容はこちら👇https://t.co/Ve9FUpXYaz

✨特徴✨
・AIアートに特化
・商用利用可能
Emi: https://t.co/EBVTb3nHnE

また、「Manga Diffusion」の概念実証版も公開しましたので、ぜひお試しください。
Manga… pic.twitter.com/RbbyMuGUVK
— AI Picasso@AIアバター (@AIPicassoApp) September 25, 2023

・Getty ImagesとNvidiaが提携し、画像生成ツールをリリース予定

画像素材サイトのGetty ImagesがNvidiaと提携し、画像生成ツール「Generative AI by Getty Images」をリリース予定
- Getty Imagesの膨大な画像を活用
- ライセンス画像のみを対象
- 最終的に独自データでチューニングできるようにhttps://t.co/OqDa4A7H0r
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 26, 2023

・ShopifyからSDXLの背景置換

ShopifyからSDXLの背景置換ﾃﾞﾀ！
昨日のFreeUした #Fuduki_mix のバーの子をモルジブに行かせてみたｗ

SDXL Background Replacement for Product Imageshttps://t.co/gXOcSxHT2V

商品や衣装(着た人)撮ったら、呪文で背景変えられるやつや！広告に使われてくんかなhttps://t.co/V8sZVQDpyk pic.twitter.com/9qRzA0vpOs
— forasteran (@forasteran) September 26, 2023

・SAPが、AIアシスタント「Joule」を発表

SAPが、AIアシスタント「Joule」を発表

- 複数のシステムのデータに対しQ&Aしたり、インサイトを抽出など
- 例えば人事では、職務記述書の作成、適切な面接質問の生成などを支援https://t.co/LjIGC993UO pic.twitter.com/iLnQ4CD3PS
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023

・⻭学部学⽣試験⾃動⽣成アプリ「EQIO」

⻭学部学⽣試験⾃動⽣成アプリ「EQIO」／Monthly Pitch! スタートアップの扉

- ⻭科医師の作問業務をサポートする⻭学部学⽣試験⾃動⽣成アプリ
- 100問を数秒で作成https://t.co/zqlaL8qXeI
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023

・CIA、中国に対抗して独自の人工知能ツールを構築

CIA、中国に対抗して独自の人工知能ツールを構築
- ChatGPTと似た機能を展開予定
- アナリストがオープンソースの情報にアクセスしやすくhttps://t.co/tXUys5LWOj
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023

・ハーバードによる、学生のAI利用例ガイドライン

ハーバードによる、学生のAI利用例ガイドライン

以下、4つに関しての記事が記載
- フィードバック生成器としての AI
- 家庭教師としてのAI
- チームコーチとしてのAI
- 学習者としてのAIhttps://t.co/klXMbBYum0
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023

・GPT-4を使用した視覚障害者向けのサービス「Be My AI」が展開

ようやくGPT-4を用いた視覚障害者向けのサービス「Be My AI」が、世界にいる数十万人のiOSユーザーに向けて今後数週間で展開されていく

盲導犬の代わりや医療目的などの生死に関わるような使用はまだ避けるべきだが、24時間365日、いつでも視覚的な支援を得られるようになるhttps://t.co/7muzzE6iu8
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) September 27, 2023

・AIキャラクターとの会話が可能なWebサービス「EFILIA」のβ版がリリース

【本日リリース✨】
Pictoriaは、AIキャラクターと1対1でお話ができるWebサービス「EFILIA（エフィリア）」のβ版をリリースいたしました！
感情豊かなAIキャラとの会話をお楽しみください！
β版では『魔法少女アイマイン @AiMain_aicast』の2人とお話できます。
詳細はこちらhttps://t.co/wkzvq8OhVx
— Pictoria公式 (@Pictoria_Inc) September 27, 2023

・画像生成AI「ideogram v0.1」が1ヶ月で110万ユーザーを獲得し、7,500万枚以上の画像を生成

画像生成AI「ideogram v0.1」の一般公開からわずか1ヶ月で110万ユーザーを超え、7,500万枚より多くの画像を生成した。

Ideogram AIはグーグルの画像生成AI「Imagen」や動画生成AI「Imagen Video」などを開発した人たちが立ち上げた企業で、拡散モデルで世界に衝撃を与えたHo氏もいて注目を集めている https://t.co/CpA48iAtqH
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) September 27, 2023

・MetaがAI画像生成技術「Emu」をローンチ

MetaがAI画像生成技術「Emu」をローンチ。

他社と違って5秒で画像生成できるとのことで、メッセージ用に使われることを想定している。 pic.twitter.com/cN3uvJmlsC
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023

・Instagram創業者のArtifactがAIニュースアプリに投稿機能を追加し、Twitterとの競争が激化

Instagram創業者が立ち上げたAIニュースアプリのArtifactが投稿する機能を導入したので、今まで以上によりTwitterと競合するようになる。https://t.co/fgUohrNRRR pic.twitter.com/2b4TPjZsmE
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023

・Metaの次世代スマートメガネにはマルチモーダルなAIとライブ配信機能が搭載

Metaの次世代スマートメガネではマルチモーダルなAIが導入されている。

さらに音楽を聴けたり、電話をするだけではなく、ライブ配信ができる。 pic.twitter.com/BsfKKkjj8x
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023

・MetaのChatGPT的なAIチャットボット機能「Meta AI」

MetaのChatGPT的なAIチャットボット機能「Meta AI」。

Bing検索と提携してリアルタイム情報を提供できるとのことで、画像生成技術も含まれている。

全てのMetaアプリに導入されるので、普及率はどのAIサービスよりも凄そう。 pic.twitter.com/Q08leaCTnO
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023

・MetaがAIチャットボットをより簡単に開発できるプラットフォーム「AI Studio」ローンチ

MetaがAIチャットボットをより簡単に開発できるプラットフォーム「AI Studio」ろローンチ。

Off Topic AIを作ってみたい。https://t.co/AP7j3z70jW
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023

・ChatGPT x Bingブラウジングの復活

ChatGPT x Bingブラウジングの復活 https://t.co/BBDaj9Tvw3
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 28, 2023

・GPT-4Vでできること24選

GPT-4Vでできること24選

ついに、ChatGPTに視覚（目）がつきます。

私はまだGPT4V来ないので悶えています🙄🙄

代わりに厳選した24個の事例をスレッドにまとめました
↓↓↓
— Yota Ishikawa | AI (@ytiskw) September 28, 2023

・Google Colab で Preferred Networks の PLaMo-13B を試す｜npaka

Google Colab で Preferred Networks の PLaMo-13B を試す｜npaka @npaka123 #note https://t.co/pNqrewQ4Og
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 28, 2023

・Stable Diffusion Ultimate Upscale (21956 x 32000) by u/ataylorm

Stable Diffusion Ultimate Upscale (21956 x 32000) by u/ataylorm pic.twitter.com/ISkWOXTKwb
— AK (@_akhaliq) September 28, 2023

・FreeUのデモ

FreeU’s demo is now available https://t.co/9fsG6JsCkl. https://t.co/xUNzD6mTt5 pic.twitter.com/FdYeR05Iny
— scy (@scy994) September 28, 2023

・AWS提供の生成AIサービスが一般開放　新たにLlama 2も利用可能に

AWS提供の生成AIサービスが一般開放　新たにLlama 2も利用可能に

- 生成AIをAPI経由で利用できるサービス「Amazon Bedrock」の一般提供を開始
- Amazon Titan、Claude 2、Jurassic-2、Stable DiffusionなどをAPI経由で利用可能
- Llama 2も近日中に対応予定https://t.co/eI115oMdEK
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023

・DreamGaussian

DreamGaussianを試す。
無料Colabで5分ほどで完成。https://t.co/gpMg2mqgXG pic.twitter.com/G1S75btpXc
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 29, 2023

研究開発

・LLMの個別の性格（人格）特性を、プロンプトで「測定」「形成」する手法

LLMの個別の性格（人格）特性を、プロンプトで「測定」「形成」する手法https://t.co/vxC0FJIcan
DeepMindや慶應などによる研究です。
この研究に対しては、好奇心を強く刺激される方が多く、今後に期待する声が寄せられています。
性格の形成を行うプロンプトの例を掲載した記事を公開しました。
— AIDB (@ai_database) September 21, 2023

・チャットシステムを開発しているForethoughtが、自然言語でワークフローを構築するAutoflowsを発表

チャットシステムを開発しているForethoughtが、自然言語でワークフローを構築するAutoflowsを発表

- 単に質問に答えるだけでなく、一連のタスクに取り組み、システムを横断して完了させる
- 既にベータ版はリリースhttps://t.co/RXVrklGDdA
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 22, 2023

・Transformerの後継を謳ってたRetNetがViTに適用されてちゃんと結果が出ましたよ論文

Transformerの後継を謳ってたRetNetがViTに適用されてちゃんと結果が出ましたよ論文

PixelCNN系みたいに画像を左上から読み取る形式かと思ったらRetNetをちゃんと平面+双方向に拡張していて偉い（自己回帰で過去しか見れないのは画像認識とかには適してないと言ってる）https://t.co/gQs8aXwuWa
— はまなすなぎさ (@RosaRugosaBeach) September 22, 2023

・Generative Agentの内部実装を公開

MESONではAIにも力を入れています。その流れで、弊社のエンジニアが、先日公開された「Generative Agent」の内部実装を読み、概観できるように内容をまとめてくれました！ GPTをただ質問に使うだけでなく、どんどん活用していきたいですね。https://t.co/1HDAohfrJP #AI #GPT
— edom18@XR / MESON CTO (@edo_m18) September 20, 2023

・無料でGPT4越え!?ついに来たXwin-LM｜shi3z

無料でGPT4越え!?ついに来たXwin-LM｜shi3z @shi3z #note https://t.co/sr9cfqOcaJ
— shi3z (@shi3z) September 22, 2023

・経産省が基盤モデルの開発に必要な GPU を含む計算リソースの提供とその利用料の助成という形で支援。大学等は定額、営利企業は1/2助成

経産省が基盤モデルの開発に必要な GPU を含む計算リソースの提供とその利用料の助成という形で支援。大学等は定額、営利企業は1/2助成。https://t.co/IgvWcoKrfI
— Y. Kawahara (@mahimahi) September 22, 2023

・GPUを低コストで運用する方法についての発表資料

GPUをつかったインフラを低コストで運用することをテーマにした発表を行いました。

AWS/GCPのGPUと本体価格の比較、代替サービス、サーバレスGPU、自前ホスティングのオプションを比較した上で、GPUを含めた自前物理ホスティングを楽に安く行う方法を提案しています。

資料: https://t.co/cQ4cZjzms8 pic.twitter.com/8BLxTbdlkj
— Kai INUI (@_kaiinui) September 23, 2023

・新画像生成AIのDALL-E 3は何ができるのか？

✅DALL-E 3の概要
✅DALL-E 3とMIdjourneyの生成画像の比較
✅ChatGPTとの連携

新画像生成AIのDALL-E 3は何ができるのか？https://t.co/PUpMvWFw5j
— IT navi (@itnavi2022) September 22, 2023

・FreeUコードのリリース

We have released the FreeU code. https://t.co/BwVLQ1SMIZ https://t.co/xUNzD6nriD
— scy (@scy994) September 22, 2023

・Googleは、LLMを活用して「非構造化文書（例えばレシートなど）」から高精度にテキストを抽出するOCR『LMDX』を発表

Googleは、LLMを活用して「非構造化文書（例えばレシートなど）」から高精度にテキストを抽出するOCR『LMDX』を発表しました。
BardとGoogle drive等との連携をさらに強化する可能性のある技術です。

○ Fernanda De La Torre et al., "LMDX: Language Model-based Document Information Extraction… pic.twitter.com/XhWPd88l9A
— AIDB (@ai_database) September 23, 2023

・Snapchatが商品画像から価格を鑑定する技術の特許申請を行う

Snapchatが商品画像から価格の鑑定が出来る技術の特許申請を出した。

Snapカメラを使ってポケモンカードを見せるとどれぐらいレアで価格を調べられる。https://t.co/C5ay6CzdBa pic.twitter.com/fClWtsGgrT
— Tetsuro Miyatake (@tmiyatake1) September 25, 2023

・量子化が枝刈りよりも効率的で精度が高いことが実験結果で示される

NNの効率/精度において枝刈りと量子化のどちらが優れているか理論解析、実験結果で比較し、量子化が常に優れていることが示された。しかも、比較に使った枝刈りは非構造化枝刈りでありHWで性能が出せる構造化枝刈りではさらに制約があるため差が大きくなる。https://t.co/jFPP7VXj6G
— Daisuke Okanohara / 岡野原大輔 (@hillbig) September 24, 2023

・LLMを用いたAIの自動評価について

AIがAIを評価。奇妙な感覚ですね > LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog https://t.co/hFMz2AW1TP
— からあげ (@karaage0703) September 25, 2023

・Algomaticは独自LLM開発

Algomaticは独自LLM開発していきます！

LLMの利活用が進む一方で、既存のLLMでは解決できない課題も明らかになってきました。そうした技術進化と人々の生活に与える実利益のギャップを埋めるべく、独自LLMを開発していきます！

LLM開発にご興味ある方、ご連絡ください〜https://t.co/S4sRChZ7CV
— 大野峻典 | Algomatic CEO (@ono_shunsuke) September 25, 2023

・MosaicFusion

MosaicFusion
- 学習不要の拡散ベースのデータセット増強パイプライン
- テキスト画像生成モデルを用いて、複数のオブジェクトを含む画像とマスクのペアを同時に生成

論文: https://t.co/OoJIzYWHpq https://t.co/kokCvV5a18 pic.twitter.com/l5efJWFOrf
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023

・Open AIがGPT-4V(ision)のシステムカードをリリース

Open AIがGPT-4V(ision)のシステムカードをリリース
- GPT-4Vの安全特性を分析https://t.co/NtEqkzlT65 https://t.co/oL9YqjuoLq
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023

・ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説

【お知らせ】ELYZAの技術ブログ記事を公開しました。ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説、第2弾です。

モデル評価データやその妥当性、自動化の余地などを深掘りしています。内容は以下リンク先をご覧ください。https://t.co/ii42w3VMY4
— ELYZA, Inc. (@ELYZA_inc) September 26, 2023

・ファーウェイクラウド、自動車と医療分野向けの大規模言語モデルを発表

ファーウェイクラウド、自動車向け・医療向けの大規模言語モデルを発表
- 自動車: 自動車の設計や生産、マーケティング、研究開発などをカバー。
- 医療: 学術誌などのデータや、100万以上の構造化されたナレッジグラフなどで学習。4000の病院に導入され、医師をサポート予定https://t.co/NQrOkISW3N
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 26, 2023

・清華大学発スタートアップ、“創薬版ChatGPT”「ChatDD（Drug Design）」を発表

清華大学発スタートアップ、“創薬版ChatGPT”「ChatDD（Drug Design）」を発表　新薬開発の効率向上へ
- 創薬プロジェクトの立案、前臨床研究および臨床試験の全段階をカバーし、創薬専門家のアシスタントとして新薬開発の効率を向上https://t.co/gGsSlgn2Rs
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 26, 2023

・アリババクラウド、世界のLLM開発者や企業向けにAI新サービスを発表　米レッドハットとの提携も強化

アリババクラウド、世界のLLM開発者や企業向けにAI新サービスを発表　米レッドハットとの提携も強化https://t.co/2Uj0dlCHXY
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023

・VideoDirectorGPT：LLMガイド付きプランニングによる一貫したマルチシーン映像生成

VideoDirectorGPT：LLMガイド付きプランニングによる一貫したマルチシーン映像生成

- テキストプロンプトが与えられると、ビデオプランナーLLM（GPT-4）がプランを展開
- 動画ジェネレーターのLayout2Vidが、レイアウトと動きの一貫性を維持し生成

論文: https://t.co/y5bxzBvMKM https://t.co/UbH78DW2Jl pic.twitter.com/iX4eRfl0Au
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023

・LLMの推論能力向上に貢献するフレームワーク『LogiCoT』が発表

GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』が発表されました。
CoTをさらに発展させた内容で、推論能力の向上が検証されています。

○ Xufeng Zhao et al., "Enhancing Zero-Shot Chain-of-Thought Reasoning in Large Language Models through Logic"… pic.twitter.com/e5LUULq4e6
— AIDB (@ai_database) September 27, 2023

・Open Interpreter's Generatorが大幅にアップデート

●

Open Interpreter's Generator Update came out today.

it's our biggest update by far.

- You can build Open Interpreter into your apps
- 100+ new LLMs supported, including Claude
- Custom settings, custom instructions
- Set spending limits
- Resume chats

↓ pic.twitter.com/Zc0I0yOHt7
— killian (@hellokillian) September 26, 2023

・中国チームが新しい画像修復技術「DiffBIR」を発表

モザイク外し？　汚い画像をキレイな画像に修復手法、中国チームが発表　Stable Diffusionを利用 https://t.co/3hfMeh0odu 劣化画像を高品質な画像に復元するStable Diffusionを用いた修復技術「DiffBIR」。既存技術より高い性能を発揮。 pic.twitter.com/0yBqAKN3qp
— Seamless (@shiropen2) September 27, 2023

・PFNが開発した大規模言語モデル(LLM) PLaMo™︎ｰ13Bをオープンソースで公開

【発表】PFNが開発した大規模言語モデル(LLM) PLaMo™︎ｰ13Bをオープンソースで公開しました。また、PLaMoの知見をもとにマルチモーダル基盤モデルを開発・提供する新子会社Preferred Elementsを11月に設立します。10月の #CEATEC2023 ではLLMを使ったデモも出展します。 https://t.co/QfpPh2UuvO
— PFN Tech (@preferred_jp) September 28, 2023

・シードで1億1,300万ドルの資金調達をしたMistralAIがApache 2.0で7Bモデルをリリース

シードで1億1,300万ドルの資金調達をしたMistralAIがApache 2.0で7Bモデルをリリース
- 現在利用可能な13Bまでのオープンモデルを、すべての標準的な英語とコードのベンチマークで凌駕
モデル: https://t.co/MeBmgULzVV
github: https://t.co/LlWAHMhE6X
記事: https://t.co/GzNzleph3i https://t.co/S6g0UMwgLN pic.twitter.com/WiGfhHZhoZ
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 28, 2023

・医療用大規模AI (LVM-Med)

凄い！！！
広範囲かつ色々なモダリティに対応

｢医療用大規模AI (LVM-Med)｣

･ 55 の公的に利用可能なデータセットから約 130 万枚の医療画像を収集
･ CT、MRI、X 線、超音波などの多数の臓器やモダリティをカバー
･複数の既存モデルの精度を上回る
･ GitHub で公開 https://t.co/1XjXwyEfkd pic.twitter.com/KvlfnWzrkw
— 河野健一　生成AI ✕ 医療に注目！手術支援AI CEO 脳外科医 (@CeoImed) September 27, 2023

・PLaMo-13B を Colab 無料版で

弊社 PFN が今日公開した PLaMo-13B を Colab 無料版で動かしてみました。何の工夫もしないと A100 80GB クラスの GPU が必要ですが、 4 bit 量子化すると T4 15GB でも推論できます。https://t.co/czCPGAQX1j
— dhgrs (@__dhgrs__) September 28, 2023

・Deep Geometrized Cartoon Line Inbetweening

Deep Geometrized Cartoon Line Inbetweening
- 2つの白黒線画の間に中間フレームの生成

github: https://t.co/CreGbQUqU2
論文: https://t.co/xm0LXL2aTW https://t.co/gunUEZxHFi pic.twitter.com/ctoSwCWh9a
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023

・GSGEN: Gaussian Splattingを用いたテキストから3D変換

GSGEN: Gaussian Splattingを用いたテキストから3D変換
論文: https://t.co/gjxpZBWxmZ
github: https://t.co/YkYqoqDIVm https://t.co/p8CA7BfttV
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023

・基盤モデルの効果的なロングコンテキスト・スケーリング

基盤モデルの効果的なロングコンテキスト・スケーリング
- 最大32,768トークンのコンテキストウィンドウをサポートするロングコンテキストLLMシリーズを発表
- Llama 2 Long(70B)は、ロングコンテキストの一連のタスクにおいて、gpt-3.5-turbo-16kの性能を上回る

論文: https://t.co/ccqNCExCaO https://t.co/dLIBgo8TF0
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023

・MetaによるAnyMAL

MetaによるAnyMAL
- 効率的でスケーラブルなあらゆるモダリティ拡張言語モデル
- 多様な入力（テキスト、画像、ビデオ、オーディオ、IMUモーションセンサ）を推論
- テキスト応答を生成
論文: https://t.co/OIAmkK9QWf https://t.co/hDyOCYL3Cb pic.twitter.com/Xct7sPYhus
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023

この記事が気に入ったらサポートをしてみませんか？