![見出し画像](https://assets.st-note.com/production/uploads/images/107410432/rectangle_large_type_2_e7ddeb8d21074e319348018089db2a3e.jpeg?width=1200)
【5/27-6/2】生成AI活用事例/研究開発-Weeklyまとめ
活用事例
・東大発の燈、建設業界でのChatGPT活用に成功
燈のリリースです!
— Yuki Noro | 燈 CEO (@yukinoro1125s) May 26, 2023
ChatGPT等で注目されているLLM(大規模言語モデル)の建設業での活用を爆速で進めております!業界初の事例をたくさん作っております!
チャットでBIMの操作も可能、ChatGPTなどを建設業に特化させた東大発・燈の野望 | 日経クロステック(xTECH) https://t.co/6VtTXAdG4m
・AIによる音楽製作で人気アーティストの声が模倣される問題が浮上
https://t.co/7zra0xjGXc
— 柿沼 太一 (@tka0120) May 27, 2023
AIを使用した音楽製作が増加し、人気アーティストの声を模倣し、新曲を歌わせる事例が非常に問題になっています。
たとえば、ドレイクとザ・ウィークエンドの声を模倣したAIが歌った楽曲「Heart On My…
・日本語GPT-NEOX 3.6bを使った会話生成におけるAPIとの違い
rinna/japanese-gpt-neox-3.6b-instruction-sftそのままでも会話になるけど、複数の応答からいいのを選ぶとかなり良くなる。 APIと違って料金増えないし、推論時はGPUに余裕があるので同時生成してもほぼ待ち時間は同じ。選択肢が見えてる方が1個生成して微妙だったら再生成するより流れを誘導しやすい pic.twitter.com/WDChph6KVl
— oshizo (@_oshizo_) May 28, 2023
・Microsoft guidanceライブラリのgenメソッドの使い方を解説
guidanceのプロンプト内で利用できるgenメソッドの使い方が多様すぎるのでまとめてみました。
— mah_lab / Masahiro Nishimi (@mah_lab) May 28, 2023
LLMアプリケーションの新定番、Microsoft guidanceライブラリのgenメソッドを詳細に追ってみる|mah_lab / 西見 公宏 @mah_lab #note https://t.co/Rr6hBYdMRs
・イヤフォンで録音&自動書き起こし可能なアプリが登場
“イヤフォン経由”で聞いて話した内容を録音&自動書き起こし
— しょーてぃー / Experience Designer & Prompt Designer (@shoty_k2) May 28, 2023
外出先で取引先と電話なんて時もへっちゃらってことか。
ZooM、TeamsなどももちろんOK
“ノイズキャンセリングとインテリジェントトランスクリプト機能で、リアルタイム録音した音声を数分でテキストに変換”
🔗https://t.co/bBWj9ZX7NZ pic.twitter.com/DFLu4Igua3
・「NVIDIA、AIでゲーム内NPCと会話可能なシステムを公表」
NVIDIAもAI使ってゲーム内の「村人A」と自由に音声で会話できるシステムを公表。AI搭載の仮想人間も普通の存在になるんだろうな。
— 佐藤航陽 🌎 著書「世界2.0 メタバースの歩き方と創り方」 (@ka2aki86) May 30, 2023
NVIDIAが生成AIでゲームのNPCと会話できる「NVIDIA Avatar Cloud Engine」のデモムービーを公開https://t.co/814msF8CHj pic.twitter.com/aecSUZPnhb
・AIを使った顧客対応サービス『Catchy』がリリースされました。
AIに色んな人格を乗せて顧客と対話できるサービスをリリースしました!可愛いキャラとかシュールなキャラをAIで作ることができてお客さんとのつながりを強化します
— 成田 修造 / Shuzo Narita (@shuzonarita) May 30, 2023
自然な会話で顧客の心を掴む!ChatGPTで24時間顧客対応を実現する『Catchyカスタマートーク』をリリース! https://t.co/64H4Hj5FFl
・未来型スタートアップの特徴
未来型スタートアップ
— 久保田 雅也@ベンチャーキャピタル (@kubotamas) May 30, 2023
- 爆速MVP (月に 1 回)
- AI による加速(10倍のオペレーション自動化)
- スーパーニッチフォーカス
- コミュニティファースト、ソフトウェアセカンド
- ノーコードファースト
- グローバルチーム、ローカルプロダクト
- チームの半分がロボット(AI)
-… https://t.co/0AlDbfubT9
・「580時間超の高品質音声データセットLibriTTS-Rが公開されました」
スタジオ品質音声データセットのLibriTTS-Rを公開しました🎙️
— Yuma Koizumi (@yuma_koizumi) May 31, 2023
ライセンスフリーの580時間超の高品質音声です。音声合成の品質が爆上がりします。最近流行りの音生成AIの学習にお役立てください🤖
Dataset: https://t.co/Fs293MBEzg
Demo: https://t.co/alvt0ihSBM
Paper: https://t.co/zL3kNIpg2L pic.twitter.com/oQlpQ9Q8Qo
・Microsoftと共催の生成AI特化プログラムが成功裏に終了
Microsoftさんと共催で、生成AI特化プログラムを実施しました!
— 鈴木雄大 / Incubate Fund (@ysuzuki5516) May 31, 2023
多くの方にお越しいただき、非常に実りあるイベントになりました。
このイベントから将来のリーディングカンパニーが生まれることを心から願っています。
今後も色々と仕掛けていきます🔥https://t.co/UPfRaOpNgG
・日本でAIのリスク評価サービスがリリースされる
日本でも正式に生成AIのリスク評価サービスをリリースしました!https://t.co/NV129afdC5
— Kojin Oshiba (@kojinoshiba) May 31, 2023
・東大の吉田塁准教授が、教員向けChatGPT講座の動画と資料を無料公開
東大の吉田塁 准教授が、「教員向けChatGPT講座~基礎から応用まで~」と題した、4時間にわたるオンライン講座の動画と資料を無料公開
・電通デジタル、全社員にAIツールAPIアカウントを付与
電通デジタルは、AIツールを使用できるAPIアカウントを全社員に付与
・NTT-AT、LLMカスタマイズサービスをリリース
NTT-ATのLLMチームから「LLMカスタマイズサービス」のリリースが出ました!https://t.co/UFd1MnfX56
— Kyosuke Nishida (@kyoun) June 1, 2023
自然言語処理・大規模言語モデル技術のハイレベルスペシャリストが企業固有の知識との最適融合を実施するサービスです!
・Microsoft TeamsにAIデザイナーツールが登場
Microsoft の AI を活用したデザイナー ツールが Teams に登場
・NvidiaとDellが「Project Helix」を始動し、オンプレ環境のAIに新たな命を吹き込む
この動きは他も出てきそう
NvidiaとDell、オンプレ環境のAIに新たな命を吹き込む「Project Helix」を始動
Project Helix は、両ベンダーのハードウェア、ソフトウェア、サービスを組み合わせて、LLMと生成AI 導入を支援
・CharacterAIモバイル、リリース1週間で170万インストール
CharacterAIモバイル、リリース1週間で170万インストール
iOS: https://t.co/jA1dyw4CMr
Android: https://t.co/kufji1w6Vm
OVER 1.7 MILLION INSTALLS in our first week of the #CharacterAI mobile launch.🤯 We could not be more grateful to our incredible community. Thank you!
— character.ai (@character_ai) May 31, 2023
𝗶𝗢𝗦: https://t.co/52kWNLHhMW
𝗔𝗻𝗱𝗿𝗼𝗶𝗱: https://t.co/NR5qP7jXXahttps://t.co/nybPMLIlgt @TechCrunch
・AIオペレーションの役職が需要急増中、プロンプトを活用してスケールアップする人材が求められる
AIオペレーションの役職は今現在需要が高い。
— Tetsuro Miyatake (@tmiyatake1) June 2, 2023
プロンプトなどを活用して社内システムを自動化してスケールさせられる人材。
結局プロンプトエンジニアよりも、そのプロンプトを活用して事業をスケールさせる方が需要が高い。pic.twitter.com/3vkI1f4xZD https://t.co/Ll5he5yY4X
研究開発
・PAKDD 2023での自然言語処理技術チュートリアルに東北大とNTTが参加
東北大・鈴木さん @drJunSuzuki NTT・西田さん @kyoun と一緒にPAKDD 2023のチュートリアル "A Gentle Introduction to Technologies Behind Language Models and Recent Achievement in ChatGPT" を担当しました。私はPart 5"Efforts for Responsible LLMs"を担当しました。 https://t.co/IOnowpB52v
— Naoaki Okazaki (@chokkanorg) May 26, 2023
・「Falcon-40B & 7BがオープンLLMリーダーボードで上位にランクイン」
オープンLLMの領域に新たな候補が登場
@huggingfaceのオープンLLMリーダーボードで上位を占めるLLM、Falcon-40B & 7Bをリリース
・大規模な指示対話形式のデータでスケールさせたUltraLLaMaが強力になる
1000件の良質なデータでFTすればいいよ!っていうLIMAが出たと思ったら、良質な指示対話形式のデータ(1.5M)でスケールさせたら強くなったぜ!っていうUltraLLaMaが出てきた LIMAは65Bだったけどこっちは13Bみたいhttps://t.co/wljhHtJVU7
— はまなすなぎさ (@RosaRugosaBeach) May 26, 2023
・Google ColabでRinna-3.6BのLoRAファインチューニングを試す
RinnのTokenizerはCALMと違うの手間取った。テンプレートは日本語の方が良いかは不明なので後で調査
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 26, 2023
Google Colab で Rinna-3.6B のLoRAファインチューニングを試す|npaka @npaka123 #note https://t.co/w5xR1lMrXY
・OpenAIのコーポレートストラクチャー公開
OpenAIのコーポレートストラクチャー。 pic.twitter.com/PmK52vifju
— Tetsuro Miyatake (@tmiyatake1) May 27, 2023
・「Google、図を読み解くオープンソースモデル「MatCha」を公開」
Google が図を読み解いて推論するモデルをオープンソースにしたらしい。なお、名前はMatChaらしい。https://t.co/ar3QVxxmnh https://t.co/otJav8DK8D
— あるふ (@alfredplpl) May 27, 2023
・GPT-4がマイクラをプレイするチームが登場
ジムファン氏のチームのVoyager、また新しいマイクラをプレイするAIか…程度に思ってたけど、こりゃあすげえな。何がスゴイって、Voyagerの中身はGPT-4だって!GPT-4がマイクラをプレイしてる!!大変な事ですよこれは。言語モデルがマイクラプレイできるんかあ!!!!さらにGPT-4って事はファインチ…
— うみゆき@AI研究 (@umiyuki_ai) May 27, 2023
・ falcon-40bの事前学習データに日本語がほとんど含まれていない
falcon-40bを少し試したところ、hallucinationを織り交ぜつつも結構いい筋の作文を出してきていて、さすが40B級でした。事前学習データのRefinedWebは例によって日本語をほとんど含んでおらず、ひらがな機能語の一部はbyte-fallbackしていますが、それでもまずまずまともな日本語を話しています。
— hiroshi matsuda (@hmtd223) May 27, 2023
・ Google、無料でGenerative AIコースを提供開始
GoogleがGenerative AIのコースを無料で提供し始めました
— gaijineers (@gaijineers) May 27, 2023
今までAIのニュースでシグナルよりノイズが多かった。ほとんどの分野はAIと離れないのでLLM、Bert modelなど基礎を学ぶ初心者コース pic.twitter.com/pIuhTSl4Ae
・「AIによるMinecraftプレイのための3つの方法」
自律型マインクラフター (Minecraft played by AI)|teftef @hanyingcl #note #AIとやってみた https://t.co/jPizg3TEl3
— teftef (@hanyingcl) May 27, 2023
AIがMinecraft をプレイするための 3 種のアプローチ
・Video PreTraining (VPT)
・MINEDOJO
・Voyage
について#GPT4 #ChatGPT
・Google PaLM2のAPIが利用可能になったが、GPT3/4とは異なるため注意が必要
Google PaLM2 のAPIが使えるようになったので(Waitlistに入れておいたらすぐに承認された)、色々と試しているけど、GPT3/4とは結構違う。GPT3/4向けに作ったプロンプトがそのまま使えるわけではないので要注意。(続く)
— Satoshi Nakajima @NounsDAO 🇺🇦 (@snakajima) May 28, 2023
・AIとWeb3の融合による新しい分散型計算システムとスマートコントラクトの実現
AI x web3の交差点🚀
— 久保田 雅也@ベンチャーキャピタル (@kubotamas) May 28, 2023
- 分散自律型LLM。オープンソースによる公共財的に計算資源や教師データの提供者に報酬を与えるDAO
- スマートコントラクトのML化。Defiプロトコルのパラメータ更新をリアルタイムでオンチェーンデータに基づき自動化など
-…
・Google Colabで無料でOpenCALM-7Bを使用可能に、8bit量子化モデルも公開
日本語オープンソースLLMの「OpenCALM-7B」をGoogle Colabの無料枠でも特別な処理なく使えるようにしましたhttps://t.co/wTqvtmDZoG
— Kyo (@kyo_takano) May 28, 2023
8bit量子化したモデルを@HuggingFaceに上げています pic.twitter.com/ekTNEdZWwK
・BiomedGPT:多様なタスクにおいて高い性能を発揮するバイオメディカル学習済みトランスフォーマー
BiomedGPT:視覚、言語、マルチモーダルタスクのための汎用的なバイオメディカル学習済みトランスフォーマー
15種類の20のデータセットを用いて、5つのタスクのSotAの大半を凌駕
・Google、人間に近い音声生成技術「SoundStorm」を開発
Googleがより人間っぽく聞こえる声を出す音声生成技術「SoundStorm」の研究をリリース。https://t.co/RXgwk1GmeC pic.twitter.com/J8PNWKj2Wt
— Tetsuro Miyatake (@tmiyatake1) May 29, 2023
・ AIのウソと著作権、国際レベルの問題に関するまとめ記事
AIのウソと著作権、国際レベルの問題に
— 新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) May 29, 2023
アスキーの「メタバース・プレゼンス」にGoogle I/O前後の動きや、OpenAIアルトマンCEOの議会公聴会、日本政府の動きをまとめた記事を書きました。オープン対クローズド、米対EUとの対立と生成AIを巡る争いは激しくなっています。https://t.co/7fBMBnv4o1
・「サイバーエージェントが和製生成AIを開発し、無償公開する理由とは?」
和製生成AIをサイバーエージェントが作る理由。“無償公開の狙い”をAI開発チームに聞く #SmartNews https://t.co/4eQxEV9au0
— shi3z (@shi3z) May 29, 2023
・「中国企業と香港大学、画像生成AI「ラファエル(RAPHAEL)」を発表」
中国企業「SenseTime」と香港大が画像生成AI「ラファエル(RAPHAEL)」を発表(画像中の一番左の列)
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) May 30, 2023
Stable Diffusion、ERNIE-ViLG2.0、DeepFloyd、DALL-E2などのモデルよりも画像品質と美的な魅力の側面で優れてると報告。1000 A100で2ヶ月間学習。30億パラメータの単一モデルhttps://t.co/5HO6Uc2vUq pic.twitter.com/6AAZAM18KV
・AIの存在論的リスクに関する声明が発表される
Center for AI Safety (https://t.co/043dGpVnmH)からAIの存在論的リスクに関する声明が出ています: 「AIによる絶滅のリスクを軽減することは、パンデミックや核戦争などの他の社会規模のリスクと並んで世界的な優先事項とされるべきだ。」… https://t.co/dGAxYs3qKJ
— 高橋恒一 (@ktakahashi74) May 30, 2023
・「Rinna社、3.6Bモデルに人間によるフィードバック学習を導入し、日本語モデルで初めてリリース」
どおおー!Rinna社が3.6Bモデルに人間によるフィードバック学習、つまりRLHFをやってリリース!日本語モデルで初めてでは?これは凄そうだぞ! →RT
— うみゆき@AI研究 (@umiyuki_ai) May 31, 2023
・Pretrained AIの時代に必要なスキルはAIを活用するアプリを作ること
OpenAIでChatGPTチームを率いるJohn Schulman氏のこの呟き、とても重要なことを語っているので連投で解説します。"Pretrained AIの時代"になった今、必要なスキルはGPUプログラミングではなく、AIを活用するアプリを素早く作れるUIスキルなのです。(続く)https://t.co/UpsK4Gs7gH
— Satoshi Nakajima @NounsDAO 🇺🇦 (@snakajima) June 1, 2023
・巨大言語モデルが競技数学タスクで人間を上回る
巨大言語モデルは多段階推論の能力を高め続けてる。現在、競技数学タスク「MATH」において約80%(best-of-N)。人間の性能は、例えば数学が特に好きじゃないコンピュータサイエンスの博士課程の学生は約40%で、IMO(国際数学オリンピック)で3度の金メダルを獲得した学生が約90%https://t.co/CIpISVr3yJ
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) June 1, 2023
・Nvidiaが動画から3Dシーン再構築技術を発表
Neuralangelo
Nvidiaより、動画から3Dシーン再構築
✨Introducing Neuralangelo✨ A new #AI model to turn 2D video from any device -- cell phone to drone capture -- into 3D structures with intricate details.
— NVIDIA AI Developer (@NVIDIAAIDev) June 1, 2023
New from #NVIDIAResearch #CVPR2023
Read more: https://t.co/e75oke56tz pic.twitter.com/E8NXoZj95F
・Wikipediaを引用することで、大規模言語モデルの信頼性を向上させる方法
ChatGPTや大規模言語モデルを使う際に「Wikipediaによると...」のような出典を特定するフレーズを追加することで、LLMが事前学習データから直接引用するように誘導し、生成される情報の信頼性を向上させることができるという手法をジョン・ホプキンス大の研究者らが発表。 pic.twitter.com/ULK5IBBmET
— KAJI | 梶谷健人 (@kajikent) May 31, 2023
・WPPとNVIDIA、AIを活用した新コンテンツエンジンの開発に着手
英大手広告グループWPPとNVIDIAは、NVIDIAのOmniverse™とAIを利用した新たなコンテンツエンジンの開発に取り組んでいることを明らかに
・NvidiaとMicrosoftが提携し、Windows PC上でAI生成を実行可能にMicrosoftともPC動作において提携
NvidiaがMicrosoftと提携、Windows PC上でも生成AIを実行可能に
Nvidia AI Enterprise のソフトウェアを Azure ML に連携し、Windows 11 PC にdeeplearningフレームワークを導入するためのパートナーシップ
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?