【5/13-5/19】生成AI活用事例/研究開発-Weeklyまとめ

2023年5月19日 19:31

今週のAIに関する活用事例や研究開発情報をまとめた記事です。

活用事例

・有料版ChatGPTを使ってるひと全員に、Webブラウジング機能、プラグイン全開放

😄朗報だよー

ついに、有料版ChatGPTを使ってるひと全員に

▪️Webブラウジング機能
▪️プラグイン

全開放だって！

今週中にすべてのPlusユーザーに提供されるって。https://t.co/kEau2aLH7Y
— しょーてぃー / Experience Designer & Prompt Designer (@shoty_k2) May 13, 2023

・来週中に全てのChatGPT Plusユーザーにウェブブラウジング機能とプラグイン接続機能がリリースされるよう

来週中に全てのChatGPT Plusユーザーにウェブブラウジング機能とプラグイン接続機能がリリースされるようだ。
プラグインを潜在的に以下の画像のような数使用できるのがでかすぎる。
ハルシネーションも計算が苦手という話も実用上は過去のものになるし、日常使いし始める人が相当増えるんじゃないか。 https://t.co/XOdZprFNFa pic.twitter.com/cRPhttmdgf
— bioshok(INFJ) (@bioshok3) May 13, 2023

・生成AIによるEC・マーケの商品写真作成サービス「フォトグラファーAI」ベータ版公開に向けて鋭意開発中

生成AIによるEC・マーケの商品写真作成サービス「フォトグラファーAI」ベータ版公開に向けて鋭意開発中です...💻

待機リストに登録済みの皆さま、招待まであと数日お待ちください🙏⏳

待機リスト登録がまだの方は、下記リンクより登録可能です📝https://t.co/fDxrCnDPS5 pic.twitter.com/nzkQtQWJUI
— Suzuki Rintaro (@su_rintaro) May 15, 2023

・伸びがすごい
リリースから2ヶ月！ChatGPTをLINEで使える「AIチャットくん」登録者数150万人を突破。気になる総メッセージ数や芸能人の活用事例もご紹介 https://t.co/6Ca7TOgC6g @PRTIMES_JPから

・人間は立入禁止、スタンフォード大生らが開発したAIチャットボット専用SNS「Chirper」

こういうことを考えて実験してみる人たちがいることがおもしろい / 人間は立入禁止、スタンフォード大生らが開発したAIチャットボット専用SNS「Chirper」 https://t.co/9i7UXmb1ys @thebridge_jpより
— Toyoaki Nishida (@toyoakinishida) May 15, 2023

・台湾発MoBagel、新製品「DeLabs Design AI」を発表——企業による自社独自のジェネレーティブAIツール開発を支援
-コンセプト
1.非エンジニアがデータに接することを支援
2.対話を通じてパラメーターを調整
3.ワンクリックで AI アプリをリリース

・IBMの生成AIは、企業向け製品に注力(Think 2023)
　-Watsonx: AIモデルの構築と管理を支援
　-IBM Watsonx AI: 調整可能な基盤モデルライブラリ-Hugging Faceと提携
　し、IBMのユーザーにオープンなAIモデルへのアクセスを提供
　-AIコーディングツールも提供

・アマゾンがAIを搭載した「会話型エクスペリエンス」を検索用に構築中
-目標は、製品の質問に対する答えを見つけたり、製品比較を行ったり、パーソナライズされた製品提案を受けたりするインタラクティブな会話体験を提供すること

・大規模セット、CG、撮影、AIを駆使して作成された映像Coca-Cola® Masterpieceのメイキング映像が公開

大規模セット、CG、撮影、AIを駆使して作成された映像Coca-Cola® Masterpieceのメイキング映像が公開https://t.co/1rwz8pHhDs pic.twitter.com/8ZyZxA6IXk
— ModelingHappy (@happy_modeling) May 16, 2023

・Zapierから2 つの新しい AI ベータ機能がリリース
1. テキストからZap を作成
　-自動化したい内容を説明することで、カスタマイズできるZap の
　ドラフトを作成
2. コードを書かずにワークフローカスタマイズ
　-やりたいことの文章からカスタムコードを生成

🚀 We're launching TWO new AI beta features today! 🚀

1. Create a Zap using plain English: Describe what you want to automate, and we’ll draft a Zap you can customize.

2. Turn a sentence into code: Describe what you'd like to do, and we'll write the code for you.

The details👇
— Zapier (@zapier) May 16, 2023

・1.簡単な英語からZap を作成

1.簡単な英語からZap を作成 pic.twitter.com/5sGHZeJ0TV
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 16, 2023

・2. コードを書かずにワークフローカスタマイズ

2. コードを書かずにワークフローカスタマイズ pic.twitter.com/Fyb6s5kKQU
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 16, 2023

・Dall-E、Jasper などの生成 AI ツールを使用してフォロワーを獲得している 14 人のクリエイター

・iPhoneは、15分の学習であなたの声で話せるように
-新しいアクセシビリティ機能は、話す能力を失った方や目の見えない方、弱視の方を支援
-Personal Voice機能は、ユーザーの声で合成音声を作成
-Macには、聴覚デバイスのペアリング方法や文字の大きさの調整方法など

・ゼノデータラボ、経済特化の言語生成AI「スペクトラム」を発表. 経済文章や解説を生成
-スペクトラムは、ゼノブレインのコンテンツ生成における改善を目指して開発
-ゼノブレインは35000指標の時系列データの1年先までの月次推移の予測を提供する経済特化時系列データ予測AI

・メタ、生成AI広告の特許を取得。ターゲットごとに広告を生成・最適化…広告事業立て直しの起爆剤となるか｜BUSINESS INSIDER https://t.co/Itdnx9u0SF @BIJapanより

・パーソナルCRMアプリClayが人間関係のAIナビゲーターNexusを追加
-Clayは、友人、家族、同僚、同業者などの人間関係の管理を支援するパーソナルCRM
-Nexusは、個人のDBに問い合わせ、ネットワークについてさらに詳しく知り、人間関係維持のサポートを行う
アーリーアクセス:https://t.co/xBUgxVWV0A https://t.co/0EXScMwU6c

1/ The future of networking has arrived.

We’re thrilled to introduce Nexus by @ClayHQ, the first AI navigator for your entire network.

The only artificial intelligence that helps you be a better friend & colleague — available today.

Our stunning launch video and a quick 🧵👇🏽 pic.twitter.com/KrsV8uqdrn
— Zach Hamed (@zmh) May 16, 2023

・テンセント・ミュージック(TME)、AI音楽の成長に期待
-TMEははこの春、TME Studio Music AssistantとTone Producerという2つのAI音楽製品を発表
-作曲、編集の効率を高める
-AI音楽制作の主な課題は、限られた音楽著作権

・MicrosoftのスピンオフXiaoiceが中国と日本でAIクローンプログラムを開始、300人のテスターを募集
-性格、声、外見を組み込んだAIクローン
-最初は1か月以内に運用開始予定

・DoraAI
-プロンプトで3Dアニメーションを含んだWebサイトを生成
-デモ動画はSpaceXのWebサイト
waiting list: https://t.co/gCzrc2cXqF https://t.co/uCSmMRMZjl

Dora AI is landing! Generate powerful SpaceX websites with a single prompt, fueled by AI 3D animation.

⚡️Join the waitlist: https://t.co/lC6ldNSKCX

・Text to website
・Generative 3D interaction
・Advanced AI animation#DoraAI pic.twitter.com/yUM1LGK55Z
— Dora (@DoraTool) May 17, 2023

・Alpha
-GPT-4搭載の投資co-pilot
-テキストでリアルタイムおよび過去の市場データを取得
※まだ米国のみかな

Say hello to Alpha: your investing co-pilot powered by @OpenAI’s GPT-4. Get real-time and historical market data in a natural language interface. On demand.

Go ahead. Start a conversation about any asset you care about.https://t.co/glP1DraHmJ pic.twitter.com/G9tGcsWnTR
— Public.com (@public) May 17, 2023

・CXソリューションプラットフォーム「Simplr」、接客用ChatGPTを安全に利用できる「Cognitive Paths」をローンチ
-幻覚、すなわちブランド外のトピックに関与する可能性を排除
-一般公開されているLLMにデータが転送されず、顧客の機密データを保護可能

・ChatGPTなど生成型AIへの機密情報漏洩を未然に防ぐ「Cloudflare One for AI」発表
-AIツールの使用状況の可視化・計測、データ損失の防止、統合管理
-Cloudflare Gatewayを通じて、組織はAIサービスを試用する従業員の数を把握することが可能

・ Azure OpenAIとOpenAI API

自分の検証ではAzure OpenAIとOpenAI APIではAzureの方がgpt-3.5-turboで概ね2倍高速という結果に。
— Shinji Yamada (@santa128bit) May 18, 2023

・髪の毛のリアルタイムシミュレーション

髪の毛のリアルタイムシミュレーション。髪の毛は、大量の紐間の摩擦と重力で生み出される複雑なダイナミクスをとりシミュレーションが難しかった。局所的、並列化可能な最適化問題を導出し解決。10万本の髪のうち一割を真面目に解き、残りは補完。https://t.co/fl4DSSKuLn https://t.co/ZlwO57lurx
— Daisuke Okanohara / 岡野原大輔 (@hillbig) May 17, 2023

・13歳少女”のなりすましbotで、子供狙う大人の動向を検証　ほとんどがWebカメラへ誘導

“13歳少女”のなりすましbotで、子供狙う大人の動向を検証　ほとんどがWebカメラへ誘導 https://t.co/svhSoFitXI 13歳少女のチャットbotを複数作成,チャットルームに投入。自称大人とのやり取り953件を記録。Web会議ツールWherebyへの誘導が41%。愛や将来の関係を約束させ勧誘等。画像はやり取りの一例 pic.twitter.com/RvQBXKs65j
— Seamless (@shiropen2) May 18, 2023

・広告のクリエイティブプロセス全体の自動化だそう
12秒で1広告で出力すると謳ってる。
*流れ
簡単なテキストを入力
→GPTでプリント広告を作成(image prompt)
→GPTでプロンプトに基づく画像検索で、代表的なキーワードを3つ生成
→Stock search APIで検索

The ad industry is just going to automate the entire creative process lol pic.twitter.com/dxi28BAaim
— Alex Kantrowitz (@Kantrowitz) May 16, 2023

・ChatGPT pluginのShow Meいいなー
スライド自動生成にも組み込まれて欲しい
1枚目：AIDMAとAISASの違い
2枚目：ハンターハンター王位継承編の相関図

ChatGPT pluginのShow Meいいなー
スライド自動生成にも組み込まれて欲しい
1枚目：AIDMAとAISASの違い
2枚目：ハンターハンター王位継承編の相関図 pic.twitter.com/64UisrKLLR
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 18, 2023

・ChatGPTの大波乗るスタートアップ　身軽さこそ強み

【書いた】
クロステック公開の時に報告しそびれたので、、、、
生成系AIの盛り上がりと国内スタートアップの動向について「AIチャットくん」のpiconとLayerX、MSに取材しつつ、諸々思うことを書きました〜〜ぜひ読んでください！！！https://t.co/FnuGpZe9gQ
— Hiroko Mamoto/ 馬本寛子 (@mamomanmo) May 18, 2023

・本当に使える #ChatGPT プラグインはどれなのか？｜IT navi @itnavi2022 #note #plugin

＊先に答えを言います。WebPilotとAskYourPDFとShow Meと Wolframです。
本当に使える #ChatGPT プラグインはどれなのか？｜IT navi @itnavi2022 #note #plugin https://t.co/kntlGSYtfm
— IT navi (@itnavi2022) May 18, 2023

・AI Beatles
RunwayのGen2とGoogleのMusicLMで作られてるとのこと
Reddit: https://t.co/PO21dNZdIk
Youtube: https://t.co/i78KxIs5lB https://t.co/MiEZTaiJV4

AI Beatles: A Sonic Journey Through The Decades, Runway Gen-2 and Google MusicLM

reddit thread: https://t.co/gUybmQOjJ4 pic.twitter.com/q7To2iFGxG
— AK (@_akhaliq) May 17, 2023

・極予測AIにおいて、大規模言語モデルを活用した「広告コピー自動生成機能」を実装

極予測AIにおいて、大規模言語モデルを活用した「広告コピー自動生成機能」を実装いたしました。
自社LLM技術およびChatGPTの活用により、画像やターゲットを考慮した広告コピーの生成が可能となりました。今後も、広告効果の最大化に尽力してまいります。https://t.co/5A38nVVt2v
— サイバーエージェント　広報＆IR担当 (@CyberAgent_PR) May 18, 2023

・iOS用ChatGPTアプリがアメリカで配信開始！
-今後数週間でさらに多くの国に拡大
-無料
-デバイス間で履歴を同期
-Whisper も統合され音声入力が可能
App Store: https://t.co/pavzm2ebPk
Android: next
記事: https://t.co/oz93ygouWH https://t.co/jModSXrzh3

Introducing the ChatGPT app for iOS! We’re live in the US and will expand to additional countries in the coming weeks. Android is next! https://t.co/p3PfTtxL9i
— OpenAI (@OpenAI) May 18, 2023

・sketch-to-skybox
1,ラフなスケッチをして
2,プロンプトを書き
3, 生成ボタンを押す
だけで360度ビューが生成されてる
モバイル版も近日公開予定だとか

Draw your world! 🧙‍♂️🖌🌐

Sketch-to-skybox introduces a whole new palette of tools to let you architect your new skyboxes better than ever. Try it with Remix for maximum effect!

GET SKETCHING: https://t.co/degS4wvbpf #GenAI #aiart #gamedev #skybox #sketchtoskybox pic.twitter.com/PdRJd2xGTu
— Blockade Labs (@BlockadeLabs) May 18, 2023

・Cue：AI ブラウザアシスタント
-Adeptのようなブラウジング自動化サービス
-シンプルなテキストで Web を閲覧
-やっぱりwaiting list

Introducing Cue: your AI Browser Assistant.

Say hello to a new era of browsing the web with simple text commands!

We're building Cue to handle your daily browsing tasks fast and effortlessly. 🚀 pic.twitter.com/onC5oYsnwh
— Samip Dahal (@samipddd) May 18, 2023

・Googleの Lookout アプリ内でFlamingo を使用した機能が追加
-視覚障害者や弱視コミュニティの人々をサポート
-画像の説明を自動生成でき、ユーザーはフォローアップの質問が可能

How can we use AI to make the world around us more accessible? 💡

Today, we’re proud to help launch a new visual question and answer feature within @Google’s Lookout app, designed to support blind people and those from low vision communities. https://t.co/nfB7yroJXh #GAAD2023 pic.twitter.com/nIZ6tG6zim
— Google DeepMind (@DeepMind) May 18, 2023

・インタラクティブな検索体験のPerplexity Copilotが登場
-依頼を投げると、必要情報をヒアリングしてくれ、複数の回答と要約を提供してくれる
-ヘッドフォンを探す際の値段を設定したり、旅行計画の際の候補都道府県をヒアリングなど
-GPT-4により回答(4時間5回制限)

The next iteration of Perplexity has arrived: Copilot, your interactive AI search companion. 🚀🤖 Perplexity Copilot guides your search experience with interactive inputs, leading you to a rich, personalized answer, powered by GPT-4. Try it for free at https://t.co/ut3wdOwUEd pic.twitter.com/AGrgBELOAE
— Perplexity AI (@perplexity_ai) May 18, 2023

・スタートアップのSkyflowは、生成AIに暗号化をもたらす
-大規模言語モデルを学習する過程で、企業が機密データを非公開にできる新しいクラウドサービスを開始
-Salesforceの元幹部が設立したデータ・プライバシーのスタートアップ

・Googleが新しいAIモデルを広告に使用し、YouTubeクリエイターを支援する計画と、情報筋が語る
-また、新たなAIモデルを用いて、自社製品の接客を一部自動化する予定
-画像作成のためのStable Diffusionのような製品を社内で開発も

・Fintech Rampは、企業向け節約AIツールの提供を開始
-Ramp Intelligenceは、GPT-4を活用し、ソフトウェア価格分析、電子メールの領収書スキャン、経費報告書の監査、顧客問い合わせに対応するサービス群を備える
-MicrosoftのCEOがRampの投資家およびアドバイザーとして参加

NEW: Ramp Intelligence

Meet our newest suite of AI tools, all designed to save your business thousands of dollars.

All built directly into Ramp. Here is how it works 👇 pic.twitter.com/mImo00tHkS
— Ramp (@tryramp) May 18, 2023

研究開発

・ 100k tokensに対応したClaude ( https://t.co/F68oImvdC4 ) 使ってみた

100k tokensに対応したClaude ( https://t.co/F68oImvdC4 ) 使ってみた
使った資料：07/09/05　社会保障審議会年金部会第5回議事録https://t.co/Wa4juWJEIR
GPT-3のtokenizer換算で67,125tokens/45533字

ちゃんと資料の文章全体を見て要約できてる！ pic.twitter.com/cbtJ05nKR0
— 逆瀬川 (@gyakuse) May 12, 2023

・LLM の LoRA / RLHF によるファインチューニング用のツールキットまとめ｜npaka @npaka123 #note

LLM の LoRA / RLHF によるファインチューニング用のツールキットまとめ｜npaka @npaka123 #note https://t.co/PmklyZZAP3
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 13, 2023

・医学版基盤モデル「Generalist Medical Artificial Intelligence」の可能性を考察したPerspective論文

医学版基盤モデル「Generalist Medical Artificial Intelligence」の可能性を考察したPerspective論文。

「テキストベースの知識であれば、AIが数年以内にあらゆる医師の能力を超える」
ことはほぼ確実であり、疑いようのない未来だと考えています。https://t.co/e5QHN3LwnQ pic.twitter.com/jRxoPULDTf
— Daichi Konno / 紺野大地 (@_daichikonno) May 11, 2023

・Stability AI Japan が開発した初期バージョンの日本語モデルのデモ

Stability AI Japan が開発した初期バージョンの日本語モデルのデモ。短いテキストを入力すると、続きを生成してくれます。https://t.co/pAzln796jP
— 山本和英（言語商会広報部） (@y8o) May 13, 2023

・Bard-API

Bardくんの応答をこっそりするpython package🫢
アカと結びつくから蛮されるリスクもある奴？ちょうひこうしき
節度をもって負荷もかけず良質な学習データとして餌食となれば見逃してくれる？

Bard-API https://t.co/mPfXrkahJk
— forasteran (@forasteran) May 15, 2023

・日本初の挑戦〜食べログによるChatGPTプラグイン開発の舞台裏

・日立、生成系AIの活用を社内外で推進するCoE組織「Generative AI センター」を設立
　-兼業で数十人程度のコアメンバーを擁する
　-社外向けにはコンサルティングと環境構築・運用支援サービスを提供
　-社内向けには業務利用ガイドライン策定とともに生成系AIの
　利用環境を整備

・ XR上でAI生成技術の検証。

XR上でAI生成技術の検証。pic.twitter.com/uIbu97HkC0 https://t.co/pgsEC3ZH3t
— Tetsuro Miyatake (@tmiyatake1) May 15, 2023

・人間をサイボーグ化するJIZAI ARMS
東京大学先端科学技術研究センター身体情報学分野稲見・門内研究室の「稲見自在化身体プロジェクト」で、ユーザーが完全に制御できる6本のクモのようなロボットの手足からなるシステムを設計

・アマゾンの秘密AIロボット
コードネーム「Burnham」 Insider によって流出した内部文書によると、Amazon は AI で Astro ロボットの知能を強化することを目的とした Burnham という名前の秘密 AI プロジェクトに取り組んでいると報告

2. Amazon’s Secret AI Robot Codenamed ‘Burnham’

A leaked internal document by Insider reports that Amazon is working on a secret AI project named Burnham, aimed at enhancing the intelligence of Amazon’s Astro robot with AI. pic.twitter.com/9cl5xnxYjp
— Rowan Cheung (@rowancheung) May 15, 2023

・Epic Gamesは、Unreal Engine 5.2のMachine Learning Deformer Sampleを公開
ML技術により、完全な筋肉、肉、布のシミュレーションによって駆動するデフォルメを持つキャラクターを作成できることを実証

Epic Games released the Machine Learning Deformer Sample for Unreal Engine 5.2, which demonstrates how the engine's ML technology can help create a character with deformations driven by full muscle, flesh, and cloth simulation.https://t.co/bBO79l5DDR #ml #UnrealEngine5 pic.twitter.com/cYlhsbof47
— 80 LEVEL (@80Level) May 12, 2023

・動画を見るマウスの脳活動から映像をAIで復元

動画を見るマウスの脳活動から映像をAIで復元　スイスの研究者ら「CEBRA」開発 https://t.co/9uKXz11jqI 30秒600フレームのモノクロ映像をマウスに9回見せプローブを刺した脳から採取した信号と映像をマッピング学習。10回目の脳活動から映像を復元すると95%以上の精度で深層学習モデルが再構築に成功 pic.twitter.com/xhNzfXbFjY
— Seamless (@shiropen2) May 15, 2023

・開発者向けに Poe API を正式に開始
Poe上で AI アプリを構築するメリット
　-Poe を使用している数百万への配布
　-すべてのプラットフォームにわたるネイティブアプリ
　-永続的な履歴
　-クロスプラットフォーム同期など
収益化も可能になる予定
github: https://t.co/mulwGw7v6x https://t.co/0jEUOs5WBx

Today we are officially launching the Poe API to all developers. Details in thread below! pic.twitter.com/X8hYyc5pBT
— Adam D'Angelo (@adamdangelo) May 15, 2023

・3D版CLIPのようなULIPのver2
ULIP-2: 3D理解のためのスケーラブルなマルチモーダル事前学習に向けて
論文: https://t.co/W3tbGDV2LB
github: https://t.co/AJwksTIgiy https://t.co/BatjsErHoM

ULIP-2: Towards Scalable Multimodal Pre-training For 3D Understanding

abs: https://t.co/1VhLVj0yAB
paper page: https://t.co/7WT6hBcoUk
github: https://t.co/gfM1uckcfj pic.twitter.com/kFE1rMlFn6
— AK (@_akhaliq) May 16, 2023

・AutoRecon：自動化された3Dオブジェクトの発見と再構築
　-複数視点画像から自動的にオブジェクトを発見し再構成する
論文: https://t.co/12NfsQKLhu
プロジェクト: https://t.co/lmU0QFJi4L https://t.co/zfmAIG7kT9

AutoRecon: Automated 3D Object Discovery and Reconstruction

abs: https://t.co/YxY5IlBCQo
paper page: https://t.co/7R3Ly6bhAW
project page: https://t.co/oP0IMdTQL2 pic.twitter.com/IYY4MkkLo1
— AK (@_akhaliq) May 16, 2023

・和製生成AI開発推進、サイバーエージェントが大規模言語モデル公開
　- 日本経済新聞
　>大規模言語モデルを17日に無料で公開

・#MasaCtrl のwebui拡張

#MasaCtrl のwebui拡張来た！
一貫性の世界ｷﾀ？🫢東大+Tencent

📄MasaCtrl(4/17) https://t.co/JmCbWh9V7J
🔧https://t.co/vI1ScML8JL

つまり？同じキャラを異なるビューやポーズで一貫して生成できる奴！それも微調整学習無しでｗ

T2I-AdapterやCNに組み込むと◎だってhttps://t.co/07x209GxpI pic.twitter.com/hRNwtDVFgN
— forasteran (@forasteran) May 16, 2023

・ AI開発にかかるGPUコスト

AI開発にかかるGPUコスト、半端ないな。

・とある推計では、ChatGPTの開発から商業化まで400億円相当のGPUが必要
・生成AI RPG提供元がOpenAIとAWSに支払うコストは月額3,000万円近く
・メタが最近リリースしたLLaMAモデルはトレーニング日数21日。AWS換算で300億円近くhttps://t.co/l9N1mIuh9z
— Shiba_dog (@Shibadog15) May 16, 2023

・Optimusの最新デモ
-複数のロボットが歩き回り、現実の世界を学習してる

Multiple fully Tesla-made Bots now walking around & learning about the real world 🤖

Join the Tesla AI team → https://t.co/dBhQqg1qya pic.twitter.com/3TZ2znxkfd
— Tesla Optimus (@Tesla_Optimus) May 16, 2023

・langchainより、Poe API用テンプレート

Yesterday @poe_platform opened up their developer API

Today, we're excited to release a LangChain <> Poe template. This will make it easy for all LangChain developers to expose their applications to the Poe platform!https://t.co/QrnF2SI6uV
— langchain (@LangChainAI) May 16, 2023

・Sanctuary AI、作業用ヒューマノイド型汎用ロボット「Phoenix™」を発表
-AI 制御システムである Carbon を搭載した最初のヒューマノイド型汎用ロボット
リリース: https://t.co/p0lWUv9tZF https://t.co/A2rCfek0pD

Introducing Phoenix: a revolutionary humanoid general-purpose robot designed for work. Read the full news release: https://t.co/8YBFrInWzs

Phoenix is the first humanoid to be powered by Carbon, a pioneering AI control system, and represents a giant leap forward in our mission to… pic.twitter.com/VPBIkbyIYH
— Sanctuary AI (@TheSanctuaryAI) May 16, 2023

・@elevenlabsioが世界最先端の TTS システムのデモをリリース
-Eleven Monolingual: 英語で非常にリアルな音声を生成
-Eleven Multilingual: 英語、ドイツ語、ポーランド語、スペイン語、イタリア語、フランス語、ポルトガル語を含む複数言語をサポートする単一モデル
デモ: https://t.co/5Hca8TaVmS https://t.co/qP2SkVv5xY

.@elevenlabsio just released a demo of the world’s most advanced TTS systems

Eleven Monolingual is designed to generate highly realistic voices in English, where Eleven Multilingual is a single model supporting multiple languages including English, German, Polish, Spanish,… pic.twitter.com/ZlniCA17YE
— AK (@_akhaliq) May 16, 2023

・「最大68億パラメータの日本語LLM」を商用利用可能なライセンスで公開

当社が開発した「最大68億パラメータの日本語LLM」を商用利用可能なライセンスで公開いたしました。本モデルをベースにチューニングを行うことで、対話型AI等の開発が可能です。
今後もモデル公開や産学連携を通し、国内における自然言語処理技術の発展に貢献してまいります。https://t.co/BYbcZYFvBi
— サイバーエージェント　広報＆IR担当 (@CyberAgent_PR) May 17, 2023

・サイバーが言語モデルを公開してくれた今、改めて言語モデルをまとめてくれてるこの記事がありがたい

・rinnaも公開

サイバーが日本語モデル出してきた矢先にrinnaも公開してくるのアツい

3.6Bなので7Bにはパラメータ数は及ばないが、対話用に調整したモデルも公開された模様（サイバーの7Bモデルが補完でさえ結構厳しい感じだったのに比べてこちらはどれほどのものなのか期待感がある）https://t.co/P5JhEuJiJo
— はまなすなぎさ (@RosaRugosaBeach) May 17, 2023

・グーグルが医療分野に特化した言語モデル「Med-PaLM2」の論文を発表

ついにグーグルが医療分野に特化した言語モデル「Med-PaLM2」の論文を発表。GPT-4も含め、複数の医療関連の質問応答タスクで最高性能に近い水準か、あるいは上回る性能(MedQAで86.5%、PubMedQAで81.8%など)。多くの側面で医師の回答よりMed-PaLM 2の回答を医師が好んだhttps://t.co/hGF05WJDxY pic.twitter.com/9STVHqXhqp
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) May 17, 2023

・Guidance: MicrosoftによるLangChain 代替
OpenAI LLM だけでなく、自己ホスト型 LLM にも接続

Microsoft just launched a LangChain alternative: Guidance

It connects to self hosted LLMs as well as OpenAI LLMs. Everything is in the prompt, less opinionated on encapsulationhttps://t.co/ScUe3VOTij
— Shaun.AGI (@ShaunlyEth) May 17, 2023

・GPT4、LaMDA、LLaMaといったLLMの台頭と隆盛
ハイライト
1. 2021 年初めに GoogleのLaMDA と FLAN
2. 現在、Google、OpenAI、および中国のプレイヤーがチャートの上半分で競争
3. 下半分はオープンソースコミュニティによる。驚異的な出力速度

Proliferation of LLMs. Some highlights:
1. @Google started early in 2021 with LaMDA and FLAN
2. Now @Google, @OpenAI, and Chinese players are actively competing on the top half of chart
3. The bottom of chart is dominated by the open source community, with impressive output speed pic.twitter.com/fnSIBg5acw
— Ivan Zhou (@ivanzhouyq) May 17, 2023

・Stability AI は、DreamStudioのオープンソースバージョンであるStableStudio を発表

・GoogleのPaLM2は、PaLMに比べ約5倍のテキストデータを使用
-CNBCが閲覧した内部文書によると、PaLM 2は、3.6兆個のトークンで学習(PaLMは7800億トークン)
-PaLM 2は3400億のパラメータで学習(PaLMは5,400億のパラメータ)
真偽は不明

・AIネゴシエーション改善

LLM Agents Can Autonomously Improve in Negotiation from AI Criticism

-2 LLMs negotiate as buyer/seller bargain
-3rd LLM provides feedback to improve negotiation strategies

-Previous negotiation history + AI feedback for in-context learning improves perfhttps://t.co/VYeo0ifuYF pic.twitter.com/FyHBlTftsj
— John Nay (@johnjnay) May 18, 2023

・あら、PaLM 2のテクニカルレポートが出てた
論文: https://t.co/VZrT8JGU1K https://t.co/dx9iMxUvuc

PaLM 2 Technical Report

paper page: https://t.co/MXqCy1lPZO pic.twitter.com/8SNQyF0Djn
— AK (@_akhaliq) May 18, 2023

・ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリ

ほ！？ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリが登場したらしい！　　　https://t.co/fEsPz6w6ZZ
— うみゆき@AI研究 (@umiyuki_ai) May 18, 2023

・LangchainとMSのGuidanceを使われた方の両者比較
詳細は元投稿スレッド

I have spent hours using Guidance, so you don't have to.
tl;dr
- Guidance template code is simple & clean
- Guidance supports local LLMs
- Guidance has Agents and Tools support
- Guidance is less opinionated

🧵👇 more comparisons and learning in the thread https://t.co/I0Wnb5zRme
— Shaun.AGI (@ShaunlyEth) May 18, 2023

・Meta、Copilotに似たコード生成AIモデルCodeComposeを構築
-まだ一般には未公開
-VS CodeのようなIDEで入力すると、Pythonや他の言語のコード候補が表示
-基礎となるモデルは、Metaの公開研究の上に構築-複数のCodeComposeモデルのうち最大は67億のパラメータ

・ヒューマノイドロボット開発のFigure
製品に関してというより、本社を訪ねてみた記事

・Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了したと報告

今日、Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了したと報告。AI研究がさらに加速。フル稼働時には約5エクサフロップスの計算能力を実現とのこと(1秒あたり5 × 10^18回の計算。これは1秒あたり1回計算するなら158,443,825,000年かかる(約1580億年かかる）https://t.co/Cl85ZIEOAA
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) May 19, 2023

・Drag Your GAN
-GAN生成の画像を対話的に操作し、潜在空間を直接編集
プロジェクト：https://huggingface.co/papers/2305.10973

Drag Your GAN
-GAN生成の画像を対話的に操作し、潜在空間を直接編集

プロジェクト：https://t.co/A543irDT4f https://t.co/m5UPgMnMO6 pic.twitter.com/n9ek3XLDiU
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 19, 2023

・GETMusic
ミュージシャン向けの様々な用途の音楽copilot
1. 任意の音楽トラック (665 タスク) を生成可能
2. 音楽生成のようなミュージシャンの代替ではなく、音楽スコアでサポートをする
論文: https://huggingface.co/papers/2305.10841…
プロジェクト: https://ai-muzic.github.io/getmusic/

GETMusic
ミュージシャン向けの様々な用途の音楽copilot
1. 任意の音楽トラック (665 タスク) を生成可能
2. 音楽生成のようなミュージシャンの代替ではなく、音楽スコアでサポートをする

論文: https://t.co/4Ss0WhA8eY
プロジェクト: https://t.co/YX5tZBdZ9G https://t.co/QJ1sPAU0A5 pic.twitter.com/bdHQfucqoX
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 19, 2023

この記事が気に入ったらサポートをしてみませんか？