【9/23-9/29】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発情報の備忘録記事です。
活用事例
・YouTubeがAIツールを多数発表
・Microsoft 365 Copilotが11月にローンチ
・Microsoftは、Bing ChatにDALL-E 3を近々追加
・中国のAIライバーの価格と料金体系について
・LLM開発のSpiral.AI、真島なおみと音声&チャットで擬似会話できる「Naomi.AI」ローンチへ
・ドイツ銀行AI帝国への野望
・ゲーム開発に生成AI 新興、コスト3分の1に - 日本経済新聞
・GPT/生成AIのSaaSインパクト、業務変革を知りたいなら Salesforceの各Keynoteをみればパクれるポイント満載!
・京丹後中学校、AIを活用した英会話学習を導入
・AR Code Object Capture Appの最新デモ
・ChatGPTが音声会話と画像の利用を可能に
・SpotifyはOpenAIと提携し、ポッドキャスターが自分の声を複製し、番組を自動翻訳できるように
・商用利用が可能なAIアート用、画像生成AI「Emi」を無償公開
・Getty ImagesとNvidiaが提携し、画像生成ツールをリリース予定
・ShopifyからSDXLの背景置換
・SAPが、AIアシスタント「Joule」を発表
・⻭学部学⽣試験⾃動⽣成アプリ「EQIO」
・CIA、中国に対抗して独自の人工知能ツールを構築
・ハーバードによる、学生のAI利用例ガイドライン
・GPT-4を使用した視覚障害者向けのサービス「Be My AI」が展開
・AIキャラクターとの会話が可能なWebサービス「EFILIA」のβ版がリリース
・画像生成AI「ideogram v0.1」が1ヶ月で110万ユーザーを獲得し、7,500万枚以上の画像を生成
・MetaがAI画像生成技術「Emu」をローンチ
・Instagram創業者のArtifactがAIニュースアプリに投稿機能を追加し、Twitterとの競争が激化
・Metaの次世代スマートメガネにはマルチモーダルなAIとライブ配信機能が搭載
・MetaのChatGPT的なAIチャットボット機能「Meta AI」
・MetaがAIチャットボットをより簡単に開発できるプラットフォーム「AI Studio」ローンチ
・ChatGPT x Bingブラウジングの復活
・GPT-4Vでできること24選
・Google Colab で Preferred Networks の PLaMo-13B を試す|npaka
・Stable Diffusion Ultimate Upscale (21956 x 32000) by u/ataylorm
・FreeUのデモ
・AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に
・DreamGaussian
研究開発
・LLMの個別の性格(人格)特性を、プロンプトで「測定」「形成」する手法
・チャットシステムを開発しているForethoughtが、自然言語でワークフローを構築するAutoflowsを発表
・Transformerの後継を謳ってたRetNetがViTに適用されてちゃんと結果が出ましたよ論文
・Generative Agentの内部実装を公開
・無料でGPT4越え!?ついに来たXwin-LM|shi3z
・経産省が基盤モデルの開発に必要な GPU を含む計算リソースの提供とその利用料の助成という形で支援。大学等は定額、営利企業は1/2助成
・GPUを低コストで運用する方法についての発表資料
・新画像生成AIのDALL-E 3は何ができるのか?
・FreeUコードのリリース
・Googleは、LLMを活用して「非構造化文書(例えばレシートなど)」から高精度にテキストを抽出するOCR『LMDX』を発表
・Snapchatが商品画像から価格を鑑定する技術の特許申請を行う
・量子化が枝刈りよりも効率的で精度が高いことが実験結果で示される
・LLMを用いたAIの自動評価について
・Algomaticは独自LLM開発
・MosaicFusion
・Open AIがGPT-4V(ision)のシステムカードをリリース
・ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説
・ファーウェイクラウド、自動車と医療分野向けの大規模言語モデルを発表
・清華大学発スタートアップ、“創薬版ChatGPT”「ChatDD(Drug Design)」を発表
・アリババクラウド、世界のLLM開発者や企業向けにAI新サービスを発表 米レッドハットとの提携も強化
・VideoDirectorGPT:LLMガイド付きプランニングによる一貫したマルチシーン映像生成
・LLMの推論能力向上に貢献するフレームワーク『LogiCoT』が発表
・Open Interpreter's Generatorが大幅にアップデート
・中国チームが新しい画像修復技術「DiffBIR」を発表
・PFNが開発した大規模言語モデル(LLM) PLaMo™︎ー13Bをオープンソースで公開
・シードで1億1,300万ドルの資金調達をしたMistralAIがApache 2.0で7Bモデルをリリース
・医療用大規模AI (LVM-Med)
・PLaMo-13B を Colab 無料版で
・Deep Geometrized Cartoon Line Inbetweening
・GSGEN: Gaussian Splattingを用いたテキストから3D変換
・基盤モデルの効果的なロングコンテキスト・スケーリング
・MetaによるAnyMAL
この記事が気に入ったらサポートをしてみませんか?