![見出し画像](https://assets.st-note.com/production/uploads/images/105977741/rectangle_large_type_2_48aa0165c44888fd59dc054d62083537.jpeg?width=1200)
【5/13-5/19】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発情報をまとめた記事です。
活用事例
・有料版ChatGPTを使ってるひと全員に、Webブラウジング機能、プラグイン全開放
😄朗報だよー
— しょーてぃー / Experience Designer & Prompt Designer (@shoty_k2) May 13, 2023
ついに、有料版ChatGPTを使ってるひと全員に
▪️Webブラウジング機能
▪️プラグイン
全開放だって!
今週中にすべてのPlusユーザーに提供されるって。https://t.co/kEau2aLH7Y
・ 来週中に全てのChatGPT Plusユーザーにウェブブラウジング機能とプラグイン接続機能がリリースされるよう
来週中に全てのChatGPT Plusユーザーにウェブブラウジング機能とプラグイン接続機能がリリースされるようだ。
— bioshok(INFJ) (@bioshok3) May 13, 2023
プラグインを潜在的に以下の画像のような数使用できるのがでかすぎる。
ハルシネーションも計算が苦手という話も実用上は過去のものになるし、日常使いし始める人が相当増えるんじゃないか。 https://t.co/XOdZprFNFa pic.twitter.com/cRPhttmdgf
・生成AIによるEC・マーケの商品写真作成サービス「フォトグラファーAI」ベータ版公開に向けて鋭意開発中
生成AIによるEC・マーケの商品写真作成サービス「フォトグラファーAI」ベータ版公開に向けて鋭意開発中です...💻
— Suzuki Rintaro (@su_rintaro) May 15, 2023
待機リストに登録済みの皆さま、招待まであと数日お待ちください🙏⏳
待機リスト登録がまだの方は、下記リンクより登録可能です📝https://t.co/fDxrCnDPS5 pic.twitter.com/nzkQtQWJUI
・伸びがすごい
リリースから2ヶ月!ChatGPTをLINEで使える「AIチャットくん」登録者数150万人を突破。気になる総メッセージ数や芸能人の活用事例もご紹介 https://t.co/6Ca7TOgC6g @PRTIMES_JPから
・人間は立入禁止、スタンフォード大生らが開発したAIチャットボット専用SNS「Chirper」
こういうことを考えて実験してみる人たちがいることがおもしろい / 人間は立入禁止、スタンフォード大生らが開発したAIチャットボット専用SNS「Chirper」 https://t.co/9i7UXmb1ys @thebridge_jpより
— Toyoaki Nishida (@toyoakinishida) May 15, 2023
・台湾発MoBagel、新製品「DeLabs Design AI」を発表——企業による自社独自のジェネレーティブAIツール開発を支援
-コンセプト
1.非エンジニアがデータに接することを支援
2.対話を通じてパラメーターを調整
3.ワンクリックで AI アプリをリリース
・IBMの生成AIは、企業向け製品に注力(Think 2023)
-Watsonx: AIモデルの構築と管理を支援
-IBM Watsonx AI: 調整可能な基盤モデルライブラリ-Hugging Faceと提携
し、IBMのユーザーにオープンなAIモデルへのアクセスを提供
-AIコーディングツールも提供
・アマゾンがAIを搭載した「会話型エクスペリエンス」を検索用に構築中
-目標は、製品の質問に対する答えを見つけたり、製品比較を行ったり、パーソナライズされた製品提案を受けたりするインタラクティブな会話体験を提供すること
・大規模セット、CG、撮影、AIを駆使して作成された映像Coca-Cola® Masterpieceのメイキング映像が公開
大規模セット、CG、撮影、AIを駆使して作成された映像Coca-Cola® Masterpieceのメイキング映像が公開https://t.co/1rwz8pHhDs pic.twitter.com/8ZyZxA6IXk
— ModelingHappy (@happy_modeling) May 16, 2023
・Zapierから2 つの新しい AI ベータ機能がリリース
1. テキストからZap を作成
-自動化したい内容を説明することで、カスタマイズできるZap の
ドラフトを作成
2. コードを書かずにワークフローカスタマイズ
-やりたいことの文章からカスタムコードを生成
🚀 We're launching TWO new AI beta features today! 🚀
— Zapier (@zapier) May 16, 2023
1. Create a Zap using plain English: Describe what you want to automate, and we’ll draft a Zap you can customize.
2. Turn a sentence into code: Describe what you'd like to do, and we'll write the code for you.
The details👇
・1.簡単な英語からZap を作成
1.簡単な英語からZap を作成 pic.twitter.com/5sGHZeJ0TV
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) May 16, 2023
・2. コードを書かずにワークフローカスタマイズ
2. コードを書かずにワークフローカスタマイズ pic.twitter.com/Fyb6s5kKQU
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) May 16, 2023
・Dall-E、Jasper などの生成 AI ツールを使用してフォロワーを獲得している 14 人のクリエイター
・iPhoneは、15分の学習であなたの声で話せるように
-新しいアクセシビリティ機能は、話す能力を失った方や目の見えない方、弱視の方を支援
-Personal Voice機能は、ユーザーの声で合成音声を作成
-Macには、聴覚デバイスのペアリング方法や文字の大きさの調整方法など
・ゼノデータラボ、経済特化の言語生成AI「スペクトラム」を発表. 経済文章や解説を生成
-スペクトラムは、ゼノブレインのコンテンツ生成における改善を目指して開発
-ゼノブレインは35000指標の時系列データの1年先までの月次推移の予測を提供する経済特化時系列データ予測AI
・メタ、生成AI広告の特許を取得。ターゲットごとに広告を生成・最適化…広告事業立て直しの起爆剤となるか|BUSINESS INSIDER https://t.co/Itdnx9u0SF @BIJapanより
・パーソナルCRMアプリClayが人間関係のAIナビゲーターNexusを追加
-Clayは、友人、家族、同僚、同業者などの人間関係の管理を支援するパーソナルCRM
-Nexusは、個人のDBに問い合わせ、ネットワークについてさらに詳しく知り、人間関係維持のサポートを行う
アーリーアクセス:https://t.co/xBUgxVWV0A https://t.co/0EXScMwU6c
1/ The future of networking has arrived.
— Zach Hamed (@zmh) May 16, 2023
We’re thrilled to introduce Nexus by @ClayHQ, the first AI navigator for your entire network.
The only artificial intelligence that helps you be a better friend & colleague — available today.
Our stunning launch video and a quick 🧵👇🏽 pic.twitter.com/KrsV8uqdrn
・テンセント・ミュージック(TME)、AI音楽の成長に期待
-TMEははこの春、TME Studio Music AssistantとTone Producerという2つのAI音楽製品を発表
-作曲、編集の効率を高める
-AI音楽制作の主な課題は、限られた音楽著作権
・MicrosoftのスピンオフXiaoiceが中国と日本でAIクローンプログラムを開始、300人のテスターを募集
-性格、声、外見を組み込んだAIクローン
-最初は1か月以内に運用開始予定
・DoraAI
-プロンプトで3Dアニメーションを含んだWebサイトを生成
-デモ動画はSpaceXのWebサイト
waiting list: https://t.co/gCzrc2cXqF https://t.co/uCSmMRMZjl
Dora AI is landing! Generate powerful SpaceX websites with a single prompt, fueled by AI 3D animation.
— Dora (@DoraTool) May 17, 2023
⚡️Join the waitlist: https://t.co/lC6ldNSKCX
・Text to website
・Generative 3D interaction
・Advanced AI animation#DoraAI pic.twitter.com/yUM1LGK55Z
・Alpha
-GPT-4搭載の投資co-pilot
-テキストでリアルタイムおよび過去の市場データを取得
※まだ米国のみかな
Say hello to Alpha: your investing co-pilot powered by @OpenAI’s GPT-4. Get real-time and historical market data in a natural language interface. On demand.
— Public.com (@public) May 17, 2023
Go ahead. Start a conversation about any asset you care about.https://t.co/glP1DraHmJ pic.twitter.com/G9tGcsWnTR
・CXソリューションプラットフォーム「Simplr」、接客用ChatGPTを安全に利用できる「Cognitive Paths」をローンチ
-幻覚、すなわちブランド外のトピックに関与する可能性を排除
-一般公開されているLLMにデータが転送されず、顧客の機密データを保護可能
・ChatGPTなど生成型AIへの機密情報漏洩を未然に防ぐ「Cloudflare One for AI」発表
-AIツールの使用状況の可視化・計測、データ損失の防止、統合管理
-Cloudflare Gatewayを通じて、組織はAIサービスを試用する従業員の数を把握することが可能
・ Azure OpenAIとOpenAI API
自分の検証ではAzure OpenAIとOpenAI APIではAzureの方がgpt-3.5-turboで概ね2倍高速という結果に。
— Shinji Yamada (@santa128bit) May 18, 2023
・髪の毛のリアルタイムシミュレーション
髪の毛のリアルタイムシミュレーション。髪の毛は、大量の紐間の摩擦と重力で生み出される複雑なダイナミクスをとりシミュレーションが難しかった。局所的、並列化可能な最適化問題を導出し解決。10万本の髪のうち一割を真面目に解き、残りは補完。https://t.co/fl4DSSKuLn https://t.co/ZlwO57lurx
— Daisuke Okanohara / 岡野原 大輔 (@hillbig) May 17, 2023
・13歳少女”のなりすましbotで、子供狙う大人の動向を検証 ほとんどがWebカメラへ誘導
“13歳少女”のなりすましbotで、子供狙う大人の動向を検証 ほとんどがWebカメラへ誘導 https://t.co/svhSoFitXI 13歳少女のチャットbotを複数作成,チャットルームに投入。自称大人とのやり取り953件を記録。Web会議ツールWherebyへの誘導が41%。愛や将来の関係を約束させ勧誘等。画像はやり取りの一例 pic.twitter.com/RvQBXKs65j
— Seamless (@shiropen2) May 18, 2023
・広告のクリエイティブプロセス全体の自動化だそう
12秒で1広告で出力すると謳ってる。
*流れ
簡単なテキストを入力
→GPTでプリント広告を作成(image prompt)
→GPTでプロンプトに基づく画像検索で、代表的なキーワードを3つ生成
→Stock search APIで検索
The ad industry is just going to automate the entire creative process lol pic.twitter.com/dxi28BAaim
— Alex Kantrowitz (@Kantrowitz) May 16, 2023
・ChatGPT pluginのShow Meいいなー
スライド自動生成にも組み込まれて欲しい
1枚目:AIDMAとAISASの違い
2枚目:ハンターハンター王位継承編の相関図
ChatGPT pluginのShow Meいいなー
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) May 18, 2023
スライド自動生成にも組み込まれて欲しい
1枚目:AIDMAとAISASの違い
2枚目:ハンターハンター王位継承編の相関図 pic.twitter.com/64UisrKLLR
・ChatGPTの大波乗るスタートアップ 身軽さこそ強み
【書いた】
— Hiroko Mamoto/ 馬本寛子 (@mamomanmo) May 18, 2023
クロステック公開の時に報告しそびれたので、、、、
生成系AIの盛り上がりと国内スタートアップの動向について「AIチャットくん」のpiconとLayerX、MSに取材しつつ、諸々思うことを書きました〜〜ぜひ読んでください!!!https://t.co/FnuGpZe9gQ
・本当に使える #ChatGPT プラグインはどれなのか?|IT navi @itnavi2022 #note #plugin
*先に答えを言います。WebPilotとAskYourPDFとShow Meと Wolframです。
— IT navi (@itnavi2022) May 18, 2023
本当に使える #ChatGPT プラグインはどれなのか?|IT navi @itnavi2022 #note #plugin https://t.co/kntlGSYtfm
・AI Beatles
RunwayのGen2とGoogleのMusicLMで作られてるとのこと
Reddit: https://t.co/PO21dNZdIk
Youtube: https://t.co/i78KxIs5lB https://t.co/MiEZTaiJV4
AI Beatles: A Sonic Journey Through The Decades, Runway Gen-2 and Google MusicLM
— AK (@_akhaliq) May 17, 2023
reddit thread: https://t.co/gUybmQOjJ4 pic.twitter.com/q7To2iFGxG
・極予測AIにおいて、大規模言語モデルを活用した「広告コピー自動生成機能」を実装
極予測AIにおいて、大規模言語モデルを活用した「広告コピー自動生成機能」を実装いたしました。
— サイバーエージェント 広報&IR担当 (@CyberAgent_PR) May 18, 2023
自社LLM技術およびChatGPTの活用により、画像やターゲットを考慮した広告コピーの生成が可能となりました。今後も、広告効果の最大化に尽力してまいります。https://t.co/5A38nVVt2v
・iOS用ChatGPTアプリがアメリカで配信開始!
-今後数週間でさらに多くの国に拡大
-無料
-デバイス間で履歴を同期
-Whisper も統合され音声入力が可能
App Store: https://t.co/pavzm2ebPk
Android: next
記事: https://t.co/oz93ygouWH https://t.co/jModSXrzh3
Introducing the ChatGPT app for iOS! We’re live in the US and will expand to additional countries in the coming weeks. Android is next! https://t.co/p3PfTtxL9i
— OpenAI (@OpenAI) May 18, 2023
・sketch-to-skybox
1,ラフなスケッチをして
2,プロンプトを書き
3, 生成ボタンを押す
だけで360度ビューが生成されてる
モバイル版も近日公開予定だとか
Draw your world! 🧙♂️🖌🌐
— Blockade Labs (@BlockadeLabs) May 18, 2023
Sketch-to-skybox introduces a whole new palette of tools to let you architect your new skyboxes better than ever. Try it with Remix for maximum effect!
GET SKETCHING: https://t.co/degS4wvbpf#GenAI #aiart #gamedev #skybox #sketchtoskybox pic.twitter.com/PdRJd2xGTu
・Cue:AI ブラウザアシスタント
-Adeptのようなブラウジング自動化サービス
-シンプルなテキストで Web を閲覧
-やっぱりwaiting list
Introducing Cue: your AI Browser Assistant.
— Samip Dahal (@samipddd) May 18, 2023
Say hello to a new era of browsing the web with simple text commands!
We're building Cue to handle your daily browsing tasks fast and effortlessly. 🚀 pic.twitter.com/onC5oYsnwh
・Googleの Lookout アプリ内でFlamingo を使用した機能が追加
-視覚障害者や弱視コミュニティの人々をサポート
-画像の説明を自動生成でき、ユーザーはフォローアップの質問が可能
How can we use AI to make the world around us more accessible? 💡
— Google DeepMind (@DeepMind) May 18, 2023
Today, we’re proud to help launch a new visual question and answer feature within @Google’s Lookout app, designed to support blind people and those from low vision communities. https://t.co/nfB7yroJXh #GAAD2023 pic.twitter.com/nIZ6tG6zim
・インタラクティブな検索体験のPerplexity Copilotが登場
-依頼を投げると、必要情報をヒアリングしてくれ、複数の回答と要約を提供してくれる
-ヘッドフォンを探す際の値段を設定したり、旅行計画の際の候補都道府県をヒアリングなど
-GPT-4により回答(4時間5回制限)
The next iteration of Perplexity has arrived: Copilot, your interactive AI search companion. 🚀🤖 Perplexity Copilot guides your search experience with interactive inputs, leading you to a rich, personalized answer, powered by GPT-4. Try it for free at https://t.co/ut3wdOwUEd pic.twitter.com/AGrgBELOAE
— Perplexity AI (@perplexity_ai) May 18, 2023
・スタートアップのSkyflowは、生成AIに暗号化をもたらす
-大規模言語モデルを学習する過程で、企業が機密データを非公開にできる新しいクラウドサービスを開始
-Salesforceの元幹部が設立したデータ・プライバシーのスタートアップ
・Googleが新しいAIモデルを広告に使用し、YouTubeクリエイターを支援する計画と、情報筋が語る
-また、新たなAIモデルを用いて、自社製品の接客を一部自動化する予定
-画像作成のためのStable Diffusionのような製品を社内で開発も
・Fintech Rampは、企業向け節約AIツールの提供を開始
-Ramp Intelligenceは、GPT-4を活用し、ソフトウェア価格分析、電子メールの領収書スキャン、経費報告書の監査、顧客問い合わせに対応するサービス群を備える
-MicrosoftのCEOがRampの投資家およびアドバイザーとして参加
NEW: Ramp Intelligence
— Ramp (@tryramp) May 18, 2023
Meet our newest suite of AI tools, all designed to save your business thousands of dollars.
All built directly into Ramp. Here is how it works 👇 pic.twitter.com/mImo00tHkS
研究開発
・ 100k tokensに対応したClaude ( https://t.co/F68oImvdC4 ) 使ってみた
100k tokensに対応したClaude ( https://t.co/F68oImvdC4 ) 使ってみた
— 逆瀬川 (@gyakuse) May 12, 2023
使った資料:07/09/05 社会保障審議会年金部会第5回議事録https://t.co/Wa4juWJEIR
GPT-3のtokenizer換算で67,125tokens/45533字
ちゃんと資料の文章全体を見て要約できてる! pic.twitter.com/cbtJ05nKR0
・LLM の LoRA / RLHF によるファインチューニング用のツールキットまとめ |npaka @npaka123 #note
LLM の LoRA / RLHF によるファインチューニング用のツールキットまとめ |npaka @npaka123 #note https://t.co/PmklyZZAP3
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 13, 2023
・医学版基盤モデル「Generalist Medical Artificial Intelligence」の可能性を考察したPerspective論文
医学版基盤モデル「Generalist Medical Artificial Intelligence」の可能性を考察したPerspective論文。
— Daichi Konno / 紺野 大地 (@_daichikonno) May 11, 2023
「テキストベースの知識であれば、AIが数年以内にあらゆる医師の能力を超える」
ことはほぼ確実であり、疑いようのない未来だと考えています。https://t.co/e5QHN3LwnQ pic.twitter.com/jRxoPULDTf
・Stability AI Japan が開発した初期バージョンの日本語モデルのデモ
Stability AI Japan が開発した初期バージョンの日本語モデルのデモ。短いテキストを入力すると、続きを生成してくれます。https://t.co/pAzln796jP
— 山本 和英(言語商会 広報部) (@y8o) May 13, 2023
・Bard-API
Bardくんの応答をこっそりするpython package🫢
— forasteran (@forasteran) May 15, 2023
アカと結びつくから蛮されるリスクもある奴?ちょうひこうしき
節度をもって負荷もかけず良質な学習データとして餌食となれば見逃してくれる?
Bard-API https://t.co/mPfXrkahJk
・日本初の挑戦〜食べログによるChatGPTプラグイン開発の舞台裏
・日立、生成系AIの活用を社内外で推進するCoE組織「Generative AI センター」を設立
-兼業で数十人程度のコアメンバーを擁する
-社外向けにはコンサルティングと環境構築・運用支援サービスを提供
-社内向けには業務利用ガイドライン策定とともに生成系AIの
利用環境を整備
・ XR上でAI生成技術の検証。
XR上でAI生成技術の検証。pic.twitter.com/uIbu97HkC0 https://t.co/pgsEC3ZH3t
— Tetsuro Miyatake (@tmiyatake1) May 15, 2023
・人間をサイボーグ化するJIZAI ARMS
東京大学先端科学技術研究センター身体情報学分野 稲見・門内研究室の「稲見自在化身体プロジェクト」で、ユーザーが完全に制御できる6本のクモのようなロボットの手足からなるシステムを設計
・アマゾンの秘密AIロボット
コードネーム「Burnham」 Insider によって流出した内部文書によると、Amazon は AI で Astro ロボットの知能を強化することを目的とした Burnham という名前の秘密 AI プロジェクトに取り組んでいると報告
2. Amazon’s Secret AI Robot Codenamed ‘Burnham’
— Rowan Cheung (@rowancheung) May 15, 2023
A leaked internal document by Insider reports that Amazon is working on a secret AI project named Burnham, aimed at enhancing the intelligence of Amazon’s Astro robot with AI. pic.twitter.com/9cl5xnxYjp
・Epic Gamesは、Unreal Engine 5.2のMachine Learning Deformer Sampleを公開
ML技術により、完全な筋肉、肉、布のシミュレーションによって駆動するデフォルメを持つキャラクターを作成できることを実証
Epic Games released the Machine Learning Deformer Sample for Unreal Engine 5.2, which demonstrates how the engine's ML technology can help create a character with deformations driven by full muscle, flesh, and cloth simulation.https://t.co/bBO79l5DDR#ml #UnrealEngine5 pic.twitter.com/cYlhsbof47
— 80 LEVEL (@80Level) May 12, 2023
・動画を見るマウスの脳活動から映像をAIで復元
動画を見るマウスの脳活動から映像をAIで復元 スイスの研究者ら「CEBRA」開発 https://t.co/9uKXz11jqI 30秒600フレームのモノクロ映像をマウスに9回見せプローブを刺した脳から採取した信号と映像をマッピング学習。10回目の脳活動から映像を復元すると95%以上の精度で深層学習モデルが再構築に成功 pic.twitter.com/xhNzfXbFjY
— Seamless (@shiropen2) May 15, 2023
・開発者向けに Poe API を正式に開始
Poe上で AI アプリを構築するメリット
-Poe を使用している数百万への配布
-すべてのプラットフォームにわたるネイティブアプリ
-永続的な履歴
-クロスプラットフォーム同期など
収益化も可能になる予定
github: https://t.co/mulwGw7v6x https://t.co/0jEUOs5WBx
Today we are officially launching the Poe API to all developers. Details in thread below! pic.twitter.com/X8hYyc5pBT
— Adam D'Angelo (@adamdangelo) May 15, 2023
・3D版CLIPのようなULIPのver2
ULIP-2: 3D理解のためのスケーラブルなマルチモーダル事前学習に向けて
論文: https://t.co/W3tbGDV2LB
github: https://t.co/AJwksTIgiy https://t.co/BatjsErHoM
ULIP-2: Towards Scalable Multimodal Pre-training For 3D Understanding
— AK (@_akhaliq) May 16, 2023
abs: https://t.co/1VhLVj0yAB
paper page: https://t.co/7WT6hBcoUk
github: https://t.co/gfM1uckcfj pic.twitter.com/kFE1rMlFn6
・AutoRecon:自動化された3Dオブジェクトの発見と再構築
-複数視点画像から自動的にオブジェクトを発見し再構成する
論文: https://t.co/12NfsQKLhu
プロジェクト: https://t.co/lmU0QFJi4L https://t.co/zfmAIG7kT9
AutoRecon: Automated 3D Object Discovery and Reconstruction
— AK (@_akhaliq) May 16, 2023
abs: https://t.co/YxY5IlBCQo
paper page: https://t.co/7R3Ly6bhAW
project page: https://t.co/oP0IMdTQL2 pic.twitter.com/IYY4MkkLo1
・和製生成AI開発推進、サイバーエージェントが大規模言語モデル公開
- 日本経済新聞
>大規模言語モデルを17日に無料で公開
・#MasaCtrl のwebui拡張
#MasaCtrl のwebui拡張来た!
— forasteran (@forasteran) May 16, 2023
一貫性の世界キタ?🫢東大+Tencent
📄MasaCtrl(4/17) https://t.co/JmCbWh9V7J
🔧https://t.co/vI1ScML8JL
つまり?同じキャラを異なるビューやポーズで一貫して生成できる奴!それも微調整学習無しでw
T2I-AdapterやCNに組み込むと◎だってhttps://t.co/07x209GxpI pic.twitter.com/hRNwtDVFgN
・ AI開発にかかるGPUコスト
AI開発にかかるGPUコスト、半端ないな。
— Shiba_dog (@Shibadog15) May 16, 2023
・とある推計では、ChatGPTの開発から商業化まで400億円相当のGPUが必要
・生成AI RPG提供元がOpenAIとAWSに支払うコストは月額3,000万円近く
・メタが最近リリースしたLLaMAモデルはトレーニング日数21日。AWS換算で300億円近くhttps://t.co/l9N1mIuh9z
・Optimusの最新デモ
-複数のロボットが歩き回り、現実の世界を学習してる
Multiple fully Tesla-made Bots now walking around & learning about the real world 🤖
— Tesla Optimus (@Tesla_Optimus) May 16, 2023
Join the Tesla AI team → https://t.co/dBhQqg1qya pic.twitter.com/3TZ2znxkfd
・langchainより、Poe API用テンプレート
Yesterday @poe_platform opened up their developer API
— langchain (@LangChainAI) May 16, 2023
Today, we're excited to release a LangChain <> Poe template. This will make it easy for all LangChain developers to expose their applications to the Poe platform!https://t.co/QrnF2SI6uV
・Sanctuary AI、作業用ヒューマノイド型汎用ロボット「Phoenix™」を発表
-AI 制御システムである Carbon を搭載した最初のヒューマノイド型汎用ロボット
リリース: https://t.co/p0lWUv9tZF https://t.co/A2rCfek0pD
Introducing Phoenix: a revolutionary humanoid general-purpose robot designed for work. Read the full news release: https://t.co/8YBFrInWzs
— Sanctuary AI (@TheSanctuaryAI) May 16, 2023
Phoenix is the first humanoid to be powered by Carbon, a pioneering AI control system, and represents a giant leap forward in our mission to… pic.twitter.com/VPBIkbyIYH
・@elevenlabsioが世界最先端の TTS システムのデモをリリース
-Eleven Monolingual: 英語で非常にリアルな音声を生成
-Eleven Multilingual: 英語、ドイツ語、ポーランド語、スペイン語、イタリア語、フランス語、ポルトガル語を含む複数言語をサポートする単一モデル
デモ: https://t.co/5Hca8TaVmS https://t.co/qP2SkVv5xY
.@elevenlabsio just released a demo of the world’s most advanced TTS systems
— AK (@_akhaliq) May 16, 2023
Eleven Monolingual is designed to generate highly realistic voices in English, where Eleven Multilingual is a single model supporting multiple languages including English, German, Polish, Spanish,… pic.twitter.com/ZlniCA17YE
・ 「最大68億パラメータの日本語LLM」を商用利用可能なライセンスで公開
当社が開発した「最大68億パラメータの日本語LLM」を商用利用可能なライセンスで公開いたしました。本モデルをベースにチューニングを行うことで、対話型AI等の開発が可能です。
— サイバーエージェント 広報&IR担当 (@CyberAgent_PR) May 17, 2023
今後もモデル公開や産学連携を通し、国内における自然言語処理技術の発展に貢献してまいります。https://t.co/BYbcZYFvBi
・サイバーが言語モデルを公開してくれた今、改めて言語モデルをまとめてくれてるこの記事がありがたい
・rinnaも公開
サイバーが日本語モデル出してきた矢先にrinnaも公開してくるのアツい
— はまなすなぎさ (@RosaRugosaBeach) May 17, 2023
3.6Bなので7Bにはパラメータ数は及ばないが、対話用に調整したモデルも公開された模様(サイバーの7Bモデルが補完でさえ結構厳しい感じだったのに比べてこちらはどれほどのものなのか期待感がある)https://t.co/P5JhEuJiJo
・グーグルが医療分野に特化した言語モデル「Med-PaLM2」の論文を発表
ついにグーグルが医療分野に特化した言語モデル「Med-PaLM2」の論文を発表。GPT-4も含め、複数の医療関連の質問応答タスクで最高性能に近い水準か、あるいは上回る性能(MedQAで86.5%、PubMedQAで81.8%など)。多くの側面で医師の回答よりMed-PaLM 2の回答を医師が好んだhttps://t.co/hGF05WJDxY pic.twitter.com/9STVHqXhqp
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) May 17, 2023
・Guidance: MicrosoftによるLangChain 代替
OpenAI LLM だけでなく、自己ホスト型 LLM にも接続
Microsoft just launched a LangChain alternative: Guidance
— Shaun.AGI (@ShaunlyEth) May 17, 2023
It connects to self hosted LLMs as well as OpenAI LLMs. Everything is in the prompt, less opinionated on encapsulationhttps://t.co/ScUe3VOTij
・GPT4、LaMDA、LLaMaといったLLMの台頭と隆盛
ハイライト
1. 2021 年初めに GoogleのLaMDA と FLAN
2. 現在、Google、OpenAI、および中国のプレイヤーがチャートの上半分で競争
3. 下半分はオープンソースコミュニティによる。驚異的な出力速度
Proliferation of LLMs. Some highlights:
— Ivan Zhou (@ivanzhouyq) May 17, 2023
1. @Google started early in 2021 with LaMDA and FLAN
2. Now @Google, @OpenAI, and Chinese players are actively competing on the top half of chart
3. The bottom of chart is dominated by the open source community, with impressive output speed pic.twitter.com/fnSIBg5acw
・Stability AI は、DreamStudioのオープンソースバージョンであるStableStudio を発表
・GoogleのPaLM2は、PaLMに比べ約5倍のテキストデータを使用
-CNBCが閲覧した内部文書によると、PaLM 2は、3.6兆個のトークンで学習(PaLMは7800億トークン)
-PaLM 2は3400億のパラメータで学習(PaLMは5,400億のパラメータ)
真偽は不明
・AIネゴシエーション改善
LLM Agents Can Autonomously Improve in Negotiation from AI Criticism
— John Nay (@johnjnay) May 18, 2023
-2 LLMs negotiate as buyer/seller bargain
-3rd LLM provides feedback to improve negotiation strategies
-Previous negotiation history + AI feedback for in-context learning improves perfhttps://t.co/VYeo0ifuYF pic.twitter.com/FyHBlTftsj
・あら、PaLM 2のテクニカルレポートが出てた
論文: https://t.co/VZrT8JGU1K https://t.co/dx9iMxUvuc
PaLM 2 Technical Report
— AK (@_akhaliq) May 18, 2023
paper page: https://t.co/MXqCy1lPZO pic.twitter.com/8SNQyF0Djn
・ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリ
ほ!?ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリが登場したらしい! https://t.co/fEsPz6w6ZZ
— うみゆき@AI研究 (@umiyuki_ai) May 18, 2023
・LangchainとMSのGuidanceを使われた方の両者比較
詳細は元投稿スレッド
I have spent hours using Guidance, so you don't have to.
— Shaun.AGI (@ShaunlyEth) May 18, 2023
tl;dr
- Guidance template code is simple & clean
- Guidance supports local LLMs
- Guidance has Agents and Tools support
- Guidance is less opinionated
🧵👇 more comparisons and learning in the thread https://t.co/I0Wnb5zRme
・Meta、Copilotに似たコード生成AIモデルCodeComposeを構築
-まだ一般には未公開
-VS CodeのようなIDEで入力すると、Pythonや他の言語のコード候補が表示
-基礎となるモデルは、Metaの公開研究の上に構築-複数のCodeComposeモデルのうち最大は67億のパラメータ
・ヒューマノイドロボット開発のFigure
製品に関してというより、本社を訪ねてみた記事
・Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了したと報告
今日、Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了したと報告。AI研究がさらに加速。フル稼働時には約5エクサフロップスの計算能力を実現とのこと(1秒あたり5 × 10^18回の計算。これは1秒あたり1回計算するなら158,443,825,000年かかる(約1580億年かかる)https://t.co/Cl85ZIEOAA
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) May 19, 2023
・Drag Your GAN
-GAN生成の画像を対話的に操作し、潜在空間を直接編集
プロジェクト:https://huggingface.co/papers/2305.10973
Drag Your GAN
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) May 19, 2023
-GAN生成の画像を対話的に操作し、潜在空間を直接編集
プロジェクト:https://t.co/A543irDT4f https://t.co/m5UPgMnMO6 pic.twitter.com/n9ek3XLDiU
・GETMusic
ミュージシャン向けの様々な用途の音楽copilot
1. 任意の音楽トラック (665 タスク) を生成可能
2. 音楽生成のようなミュージシャンの代替ではなく、音楽スコアでサポートをする
論文: https://huggingface.co/papers/2305.10841…
プロジェクト: https://ai-muzic.github.io/getmusic/
GETMusic
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) May 19, 2023
ミュージシャン向けの様々な用途の音楽copilot
1. 任意の音楽トラック (665 タスク) を生成可能
2. 音楽生成のようなミュージシャンの代替ではなく、音楽スコアでサポートをする
論文: https://t.co/4Ss0WhA8eY
プロジェクト: https://t.co/YX5tZBdZ9G https://t.co/QJ1sPAU0A5 pic.twitter.com/bdHQfucqoX
この記事が気に入ったらサポートをしてみませんか?