【9/2-9/8】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発の備忘録記事です。
活用事例
・デジタル庁がChatGPTの業務組み込み方法を公開
・ゲームアセット生成AI Scenario: スプライトアニメーションの作り方
・妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox)
・GPTを搭載し、言葉を解する驚異的な四本脚ロボット
・serial experiments lain 25周年プロジェクトにAI lainが登場!
・三重県桑名市、AI作詞・作曲の校歌を採用。iU・理研AIPの共同研究
・【こぼれ話】百度のオンラインオフィスツール「文庫」に同社の文心一言によるAI生成機能がつき、プレゼンや講演原稿など各種ファイルが作成可能に
・3Dアニメ生成AI開発のIreverent Labs、 Samsung Nextから戦略的投資を受ける——サムスン製品への導入視野に
当初はゲームやクリエイティブ産業に焦点を当てる計画だが、提携により一般大衆への展開も視野
今年後半に開発者向けのプレビュー版をリリース予定
・Automatic1111でSDXLのControlNetが対応
・AIが生成したロイヤリティ・フリーの音楽
・Open Interpreter - ローカルでコードを実行し、多機能なテキストインターフェイスを提供
LLMはコード(Python、Javascript、Shellなど)をローカルで実行
テキストインターフェイスを通してOpen Interpreterとチャット可能
写真/ビデオ/PDFなどの作成編集、ブラウザ操作/調査、データプロット、クリーニング、分析など
・好きなアーティストのAIソングカバーを生成するSingify
・DeepMindよりVisualisingAI
・半導体AI設計支援の威力、ソニーセミコン「設計工数が30分の1に」
・「Google Meet」の背景をジェネレーティブAIで生成可能に - 窓の杜
・Zoom AI Companion
・MSが10/3のOneDriveのイベントで、AIを活用した新しい検索、共有、情報クエリのプランを紹介予定https://techcommunity.microsoft.com/t5/microsoft-onedrive-blog/join-us-on-oct-3-for-an-exclusive-onedrive-event/ba-p/3915320…
・大阪市、アマゾン ウェブ サービスとPwCコンサルティングとの生成AI連携協定締結
・Apple、会話AI開発への投資強化
・「非弁行為」がクリアに、弁護士のAI利用が加速
・【こぼれ話】シャオミのスマホのUIに搭載された生成AIのチャットボットレビュー記事
・ドレイクのAIソングを制作した匿名のクリエイター、Ghostwriterが新たな楽曲を発表
・Slackが、チャンネルやスレッドを再確認できるAIツールテストを今冬開始
・AIチャットボットで機能増強、外国語Q&Aサービス「HiNative」
・[LLM 論文]自動でプログラムのバグを修正する次世代技術"Repilot"の日本語解説|すめらぎ
・弁護士ドットコムが以下のリリース出してたの知らなかった
弁護士法第72条に関するガイドライン公表に伴い、6領域21ビジネスの事業開発を開始
・第2回国際AI映画祭がこの春、ニューヨークとロサンゼルスで開催
・今年の上半期には美図(Meitu)はさらにAI作成系アプリで攻勢をかけました
・AIファイナンシャルアシスタント Intuit Assist
・Google、機械学習プラットフォーム「Vertex AI」の次なる展開を披露〜Google Cloud Next 2023から
・マーケティング・CRMプラットフォームのHubSpotがプラットフォーム全体にAIを統合する戦略を発表
・「生成AIのコミュニティからスターを誕生させたい!」 アキバで開催される「AIフェスティバル」にかける意気込みとは?
・Anthropic、AI搭載チャットボットの有料プランClaude Proを開始
・ローコードプラットフォーム「Retool」、ビジネスアプリへのAI活用を容易に
・eBay写真から商品リストの生成ツールを発表
・新Greylock GPとして任命されたSeth RosenbergがAIネイティブ・AIファーストな企業の注目領域を解説
・MSは、Copilot AIの商用ユーザーが訴えられた場合、法的責任を負う
研究開発
・AIフィードバックによる強化学習のスケーリング
・2023年度統計関連学会連合大会で大規模言語モデルに関するチュートリアル
・1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説
・Microsoft、AIスマートバックパックを実現する特許
・「Stability AI Japanにおける大規模言語モデルの研究開発」というテーマで発表
・AIがチームを組み、ゲーム攻略するシステム 中国チームが開発 マインクラフトなどで実験
専門家AIが複数待機しタスク(ゲーム開発,ゲーム攻略,DB管理等)ごとに必要なAIだけ集められそのチームで会議し処理する仕組み。汎用性高いAI協力系。添付映像:ポケモン攻略タスク中など
・テキスト指示からリアルな立体物をつくる多視点拡散モデル「MVDream」 中国バイトダンスなどの研究者らが開発
テキストプロンプトだけからキャラやメカ,アイテムなどの高精度の3Dモデルを自動生成する。ぼやけたり欠けたり等の欠損が少なく精密で高忠実度な仕上がりを出力。
・【藤本健のDigital Audio Laboratory】AI超進化で“ことり”どうなる!? 歌声処理技術の最前線を見た-AV Watch
・ハイパフォーマンスな医療特化の画像セグメンテーションモデル『SAM-Med2D』が開発https://twitter.com/ai_database/status/1698904034718240981
・AIと香りのパイオニアであるOsmoは、科学誌Scienceに画期的な論文を発表
- GNNを用いて、香りの予測において人間を凌駕
- 一般化された匂いマップであるPOMを作成 - 5,000個の分子のデータセットで訓練
- 分子構造のみに基づいて、嗅いだことのない何百もの分子の香りを予測
- 50万個の潜在的な匂い分子について、匂いの強さや知覚的類似性など、様々な匂い特性を特徴付け
・GPT4, gpt-3.5-turbo, PaLM2, ELYZA-japanese-Llama-2-7b等のLLMを使って、動画学習サービスの理解度チェックテストを解かせた精度検証
・AudioLDM2
・3D都市生成モデル
・激しすぎる日本語LLM開発状況
・Autiomatic1111 Web UI用ControlNet拡張がアップデート
・一貫したvideo2videoのTokenFlow
・中国の検索大手バイドゥは、大規模言語モデルの新バージョンをまもなくリリースすると発表
・TIIのRefinedWebデータセットを用いて3兆5000億トークンを対象に学習させた、Falcon 180Bのデモ
https://twitter.com/akinoriosamura/status/1699440941302710518
・プロンプトだけで自然言語処理モデルを作成するフレームワーク「Prompt2Model」
・prompt2modelという、プロンプトの手軽さとローカルに展開可能なモデルの利点を組み合わせた新しい研究/OSS
・明治大学、AIを活用した味の再現装置「TTTV3」を発表
・SLiMe: Segment like Me
・8種類のがんを同時検出するAI画像診断モデル、アリババの最先端研究機関が発表
・自動運転EV開発のチューリング、日英言語対応のマルチモーダル学習ライブラリ「Heron」と最大700億パラメータの大規模モデル群を公開
・3Dコンテンツ作成のための統一フレームワーク「threestudio」のデモとGitHubリポジトリ
・多様な役割のAIエージェント達に協力してソフトウェアを開発してもらう『ChatDev』登場
・複数のデータセットで評価された英語音声認識モデルを比較するOpen ASR Leaderboard
・FLM-101B: オープンLLMと10万ドルで学習する方法
・分離されたビデオセグメンテーションによるあらゆるものの追跡
・AIが「見た目に対する物理的感覚」を得ました。
・ProPainter:ビデオインペインティングのための伝搬とTransformerの改善
・OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z
この記事が気に入ったらサポートをしてみませんか?