見出し画像

【5/13-5/19】生成AI活用事例/研究開発-Weeklyまとめ

今週のAIに関する活用事例や研究開発情報をまとめた記事です。

活用事例

・有料版ChatGPTを使ってるひと全員に、Webブラウジング機能、プラグイン全開放


・ 来週中に全てのChatGPT Plusユーザーにウェブブラウジング機能とプラグイン接続機能がリリースされるよう


・生成AIによるEC・マーケの商品写真作成サービス「フォトグラファーAI」ベータ版公開に向けて鋭意開発中


・伸びがすごい
リリースから2ヶ月!ChatGPTをLINEで使える「AIチャットくん」登録者数150万人を突破。気になる総メッセージ数や芸能人の活用事例もご紹介 https://t.co/6Ca7TOgC6g @PRTIMES_JPから


・人間は立入禁止、スタンフォード大生らが開発したAIチャットボット専用SNS「Chirper」


・台湾発MoBagel、新製品「DeLabs Design AI」を発表——企業による自社独自のジェネレーティブAIツール開発を支援
-コンセプト
1.非エンジニアがデータに接することを支援
2.対話を通じてパラメーターを調整
3.ワンクリックで AI アプリをリリース


・IBMの生成AIは、企業向け製品に注力(Think 2023)
 
-Watsonx: AIモデルの構築と管理を支援
 -IBM Watsonx AI: 調整可能な基盤モデルライブラリ-Hugging Faceと提携
 し、IBMのユーザーにオープンなAIモデルへのアクセスを提供
 -AIコーディングツールも提供


・アマゾンがAIを搭載した「会話型エクスペリエンス」を検索用に構築中
-目標は、製品の質問に対する答えを見つけたり、製品比較を行ったり、パーソナライズされた製品提案を受けたりするインタラクティブな会話体験を提供すること


・大規模セット、CG、撮影、AIを駆使して作成された映像Coca-Cola® Masterpieceのメイキング映像が公開


・Zapierから2 つの新しい AI ベータ機能がリリース
1. テキストからZap を作成
 -自動化したい内容を説明することで、カスタマイズできるZap の
 ドラフトを作成
2. コードを書かずにワークフローカスタマイズ
 -やりたいことの文章からカスタムコードを生成 


・1.簡単な英語からZap を作成


・2. コードを書かずにワークフローカスタマイズ


・Dall-E、Jasper などの生成 AI ツールを使用してフォロワーを獲得している 14 人のクリエイター


・iPhoneは、15分の学習であなたの声で話せるように
-新しいアクセシビリティ機能は、話す能力を失った方や目の見えない方、弱視の方を支援
-Personal Voice機能は、ユーザーの声で合成音声を作成
-Macには、聴覚デバイスのペアリング方法や文字の大きさの調整方法など


・ゼノデータラボ、経済特化の言語生成AI「スペクトラム」を発表. 経済文章や解説を生成
-スペクトラムは、ゼノブレインのコンテンツ生成における改善を目指して開発
-ゼノブレインは35000指標の時系列データの1年先までの月次推移の予測を提供する経済特化時系列データ予測AI


・メタ、生成AI広告の特許を取得。ターゲットごとに広告を生成・最適化…広告事業立て直しの起爆剤となるか|BUSINESS INSIDER https://t.co/Itdnx9u0SF @BIJapanより


・パーソナルCRMアプリClayが人間関係のAIナビゲーターNexusを追加
-Clayは、友人、家族、同僚、同業者などの人間関係の管理を支援するパーソナルCRM
-Nexusは、個人のDBに問い合わせ、ネットワークについてさらに詳しく知り、人間関係維持のサポートを行う
アーリーアクセス:https://t.co/xBUgxVWV0A https://t.co/0EXScMwU6c


・テンセント・ミュージック(TME)、AI音楽の成長に期待
-TMEははこの春、TME Studio Music AssistantとTone Producerという2つのAI音楽製品を発表
-作曲、編集の効率を高める
-AI音楽制作の主な課題は、限られた音楽著作権


・MicrosoftのスピンオフXiaoiceが中国と日本でAIクローンプログラムを開始、300人のテスターを募集
-性格、声、外見を組み込んだAIクローン
-最初は1か月以内に運用開始予定


・DoraAI
-プロンプトで3Dアニメーションを含んだWebサイトを生成
-デモ動画はSpaceXのWebサイト
waiting list: https://t.co/gCzrc2cXqF https://t.co/uCSmMRMZjl


・Alpha
-GPT-4搭載の投資co-pilot
-テキストでリアルタイムおよび過去の市場データを取得
※まだ米国のみかな


・CXソリューションプラットフォーム「Simplr」、接客用ChatGPTを安全に利用できる「Cognitive Paths」をローンチ
-幻覚、すなわちブランド外のトピックに関与する可能性を排除
-一般公開されているLLMにデータが転送されず、顧客の機密データを保護可能


・ChatGPTなど生成型AIへの機密情報漏洩を未然に防ぐ「Cloudflare One for AI」発表
-AIツールの使用状況の可視化・計測、データ損失の防止、統合管理
-Cloudflare Gatewayを通じて、組織はAIサービスを試用する従業員の数を把握することが可能


・ Azure OpenAIとOpenAI API


・髪の毛のリアルタイムシミュレーション


・13歳少女”のなりすましbotで、子供狙う大人の動向を検証 ほとんどがWebカメラへ誘導


・広告のクリエイティブプロセス全体の自動化だそう
12秒で1広告で出力すると謳ってる。
*流れ
簡単なテキストを入力
→GPTでプリント広告を作成(image prompt)
→GPTでプロンプトに基づく画像検索で、代表的なキーワードを3つ生成
→Stock search APIで検索


・ChatGPT pluginのShow Meいいなー
スライド自動生成にも組み込まれて欲しい
1枚目:AIDMAとAISASの違い
2枚目:ハンターハンター王位継承編の相関図


・ChatGPTの大波乗るスタートアップ 身軽さこそ強み


・本当に使える #ChatGPT プラグインはどれなのか?|IT navi @itnavi2022 #note #plugin  


・AI Beatles
RunwayのGen2とGoogleのMusicLMで作られてるとのこと
Reddit: https://t.co/PO21dNZdIk
Youtube: https://t.co/i78KxIs5lB https://t.co/MiEZTaiJV4


・極予測AIにおいて、大規模言語モデルを活用した「広告コピー自動生成機能」を実装


・iOS用ChatGPTアプリがアメリカで配信開始!
-今後数週間でさらに多くの国に拡大
-無料
-デバイス間で履歴を同期
-Whisper も統合され音声入力が可能
App Store: https://t.co/pavzm2ebPk
Android: next
記事: https://t.co/oz93ygouWH https://t.co/jModSXrzh3


・sketch-to-skybox
1,ラフなスケッチをして
2,プロンプトを書き
3, 生成ボタンを押す
だけで360度ビューが生成されてる
モバイル版も近日公開予定だとか


・Cue:AI ブラウザアシスタント
-Adeptのようなブラウジング自動化サービス
-シンプルなテキストで Web を閲覧
-やっぱりwaiting list


・Googleの Lookout アプリ内でFlamingo を使用した機能が追加
-視覚障害者や弱視コミュニティの人々をサポート
-画像の説明を自動生成でき、ユーザーはフォローアップの質問が可能


・インタラクティブな検索体験のPerplexity Copilotが登場
-依頼を投げると、必要情報をヒアリングしてくれ、複数の回答と要約を提供してくれる
-ヘッドフォンを探す際の値段を設定したり、旅行計画の際の候補都道府県をヒアリングなど
-GPT-4により回答(4時間5回制限)


・スタートアップのSkyflowは、生成AIに暗号化をもたらす
-大規模言語モデルを学習する過程で、企業が機密データを非公開にできる新しいクラウドサービスを開始
-Salesforceの元幹部が設立したデータ・プライバシーのスタートアップ


・Googleが新しいAIモデルを広告に使用し、YouTubeクリエイターを支援する計画と、情報筋が語る
-また、新たなAIモデルを用いて、自社製品の接客を一部自動化する予定
-画像作成のためのStable Diffusionのような製品を社内で開発も


・Fintech Rampは、企業向け節約AIツールの提供を開始
-Ramp Intelligenceは、GPT-4を活用し、ソフトウェア価格分析、電子メールの領収書スキャン、経費報告書の監査、顧客問い合わせに対応するサービス群を備える
-MicrosoftのCEOがRampの投資家およびアドバイザーとして参加


研究開発

・ 100k tokensに対応したClaude ( https://t.co/F68oImvdC4 ) 使ってみた


・LLM の LoRA / RLHF によるファインチューニング用のツールキットまとめ |npaka @npaka123 #note


・医学版基盤モデル「Generalist Medical Artificial Intelligence」の可能性を考察したPerspective論文


Stability AI Japan が開発した初期バージョンの日本語モデルのデモ


・Bard-API


・日本初の挑戦〜食べログによるChatGPTプラグイン開発の舞台裏


・日立、生成系AIの活用を社内外で推進するCoE組織「Generative AI センター」を設立
 -兼業で数十人程度のコアメンバーを擁する
 -社外向けにはコンサルティングと環境構築・運用支援サービスを提供
 -社内向けには業務利用ガイドライン策定とともに生成系AIの
 利用環境を整備


・ XR上でAI生成技術の検証。


・人間をサイボーグ化するJIZAI ARMS
東京大学先端科学技術研究センター身体情報学分野 稲見・門内研究室の「稲見自在化身体プロジェクト」で、ユーザーが完全に制御できる6本のクモのようなロボットの手足からなるシステムを設計


アマゾンの秘密AIロボット
コードネーム「Burnham」 Insider によって流出した内部文書によると、Amazon は AI で Astro ロボットの知能を強化することを目的とした Burnham という名前の秘密 AI プロジェクトに取り組んでいると報告


・Epic Gamesは、Unreal Engine 5.2のMachine Learning Deformer Sampleを公開
ML技術により、完全な筋肉、肉、布のシミュレーションによって駆動するデフォルメを持つキャラクターを作成できることを実証


・動画を見るマウスの脳活動から映像をAIで復元


・開発者向けに Poe API を正式に開始
Poe上で AI アプリを構築するメリット
 -Poe を使用している数百万への配布
 -すべてのプラットフォームにわたるネイティブアプリ
 -永続的な履歴
 -クロスプラットフォーム同期など
収益化も可能になる予定
github: https://t.co/mulwGw7v6x https://t.co/0jEUOs5WBx


・3D版CLIPのようなULIPのver2
ULIP-2: 3D理解のためのスケーラブルなマルチモーダル事前学習に向けて
論文: https://t.co/W3tbGDV2LB
github: https://t.co/AJwksTIgiy https://t.co/BatjsErHoM


・AutoRecon:自動化された3Dオブジェクトの発見と再構築
 -複数視点画像から自動的にオブジェクトを発見し再構成する
論文: https://t.co/12NfsQKLhu
プロジェクト: https://t.co/lmU0QFJi4L https://t.co/zfmAIG7kT9


和製生成AI開発推進、サイバーエージェントが大規模言語モデル公開
 - 日本経済新聞
 >大規模言語モデルを17日に無料で公開


#MasaCtrl のwebui拡張


・ AI開発にかかるGPUコスト


・Optimusの最新デモ
-複数のロボットが歩き回り、現実の世界を学習してる


・langchainより、Poe API用テンプレート


・Sanctuary AI、作業用ヒューマノイド型汎用ロボット「Phoenix™」を発表
-AI 制御システムである Carbon を搭載した最初のヒューマノイド型汎用ロボット
リリース: https://t.co/p0lWUv9tZF https://t.co/A2rCfek0pD


・@elevenlabsioが世界最先端の TTS システムのデモをリリース
-Eleven Monolingual: 英語で非常にリアルな音声を生成
-Eleven Multilingual: 英語、ドイツ語、ポーランド語、スペイン語、イタリア語、フランス語、ポルトガル語を含む複数言語をサポートする単一モデル
デモ: https://t.co/5Hca8TaVmS https://t.co/qP2SkVv5xY


・ 「最大68億パラメータの日本語LLM」を商用利用可能なライセンスで公開


・サイバーが言語モデルを公開してくれた今、改めて言語モデルをまとめてくれてるこの記事がありがたい


・rinnaも公開


・グーグルが医療分野に特化した言語モデル「Med-PaLM2」の論文を発表


・Guidance: MicrosoftによるLangChain 代替
OpenAI LLM だけでなく、自己ホスト型 LLM にも接続


・GPT4、LaMDA、LLaMaといったLLMの台頭と隆盛
ハイライト
1. 2021 年初めに GoogleのLaMDA と FLAN
2. 現在、Google、OpenAI、および中国のプレイヤーがチャートの上半分で競争
3. 下半分はオープンソースコミュニティによる。驚異的な出力速度


・Stability AI は、DreamStudioのオープンソースバージョンであるStableStudio を発表


・GoogleのPaLM2は、PaLMに比べ約5倍のテキストデータを使用
-CNBCが閲覧した内部文書によると、PaLM 2は、3.6兆個のトークンで学習(PaLMは7800億トークン)
-PaLM 2は3400億のパラメータで学習(PaLMは5,400億のパラメータ)
真偽は不明


・AIネゴシエーション改善


・あら、PaLM 2のテクニカルレポートが出てた
論文: https://t.co/VZrT8JGU1K https://t.co/dx9iMxUvuc


・ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリ


・LangchainとMSのGuidanceを使われた方の両者比較
詳細は元投稿スレッド


・Meta、Copilotに似たコード生成AIモデルCodeComposeを構築
-まだ一般には未公開
-VS CodeのようなIDEで入力すると、Pythonや他の言語のコード候補が表示
-基礎となるモデルは、Metaの公開研究の上に構築-複数のCodeComposeモデルのうち最大は67億のパラメータ


・ヒューマノイドロボット開発のFigure
製品に関してというより、本社を訪ねてみた記事


・Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了したと報告


・Drag Your GAN
-GAN生成の画像を対話的に操作し、潜在空間を直接編集
プロジェクト:https://huggingface.co/papers/2305.10973


・GETMusic
ミュージシャン向けの様々な用途の音楽copilot
1. 任意の音楽トラック (665 タスク) を生成可能
2. 音楽生成のようなミュージシャンの代替ではなく、音楽スコアでサポートをする
論文: https://huggingface.co/papers/2305.10841…
プロジェクト: https://ai-muzic.github.io/getmusic/


この記事が気に入ったらサポートをしてみませんか?