見出し画像

[04/20~04/26] 生成AI Weekly News

今回も社内で話題になった生成AIに関するニュースをご紹介します。
オープンソース LLM の Llama 3 が爆速で使えるようになったり、高精度な画像置換など。ビジネスでの活用の幅がどんどん広がっていますね。

それでは今週のニュースです!


プロダクト・サービス


Groq で Llama 3 が使えるように

Groq で Llama 3 が使えるようになりました。Groq は元々テキスト生成速度が爆速で有名でしたが、Llama 3 も使えるようになったため、高精度で爆速でテキスト生成ができるようになりました。

Groq で使えることもあり、生成速度がかなり早いです。

モバイルアプリでも試せる模様。

↓↓ あわせて読みたい ↓↓

Groqはどうして早いのか?

その速さの理由はGroqが使っている特別なAI半導体にあります。
AI半導体とは俗に言われるAIチップなのですが、GroqはLPU(Language Processing Unit)という独自のAIチップを使っています。
LPUはGPUとは違い、特定の計算処理に優れたAI処理専用のチップです。GPUがAIの学習に優れているのに対して、LPUは言語処理のタスクを行うことに優れています。
GPUでは少し遅くなってしまう言語処理を、LPUではスピードと効率性の高さを維持しながら処理することができるのです。
Groqは1秒間に500トークンの生成することができます。対して、ChatGPT-3.5では1秒間に40トークンの生成しかできないので、おおよそ12倍の性能があるといえるでしょう。
ちなみに1トークン = 1英単語と考えられるので、LPUは英語500字を1秒。ChatGPT-3.5は40字を1秒と考えるとわかりやすいかもしれません。
そんな圧倒的な処理速度をもっているがGrokなのです。

【世界最速のAI】Groqとは何か?ChatGPTとの違いも解説


Photoshop β版のアップデートで参照画像を選択して、生成画像に置き換えが可能に

先日、 年内に OpenAI の Sora を使えるようにすると発表した Adobe ですが、今週はまた面白いリリースが出ました。画像生成がかなり高クオリティでできる模様。

背景生成機能も公開されました。

https://helpx.adobe.com/jp/photoshop/using/photoshop-beta-desktop-app.html


テキスト入力だけでプロダクトデザインを実現


マイクロソフトが生成AI「Phi-3」を自社開発 通信なしでスマホで動作

米マイクロソフトが新型の生成AI「Phi-3」を自社開発しました。この生成AIは通信がつながらなくてもスマートフォン単体で使用可能です。マイクロソフトは提携先のオープンAIの「ChatGPT」と併せて提供し、利用者の用途に応じた選択肢を増やしていく方針です。

ポイント:
・通信不要でスマホ単体で動作可能
・オープンAIのChatGPTと併せて提供
・利用者の選択肢が拡大


数分でリアルな映像にどんな3Dモデルも追加 「Simulon」



ニュース


経産省と総務省が「AI事業者ガイドライン」を発表

経済産業省は、AI事業者がAIシステムの開発・提供を行う際の基本的な考え方や留意点をまとめた「AI事業者ガイドライン(第1.0版)」を公表しました。本ガイドラインは、AIシステムの信頼性確保と社会実装の促進を目的としており、AIガバナンスの確立に向けた指針となることが期待されます。

要点は3つ
① AIの開発者、提供者、利用者の3つに分けて、それぞれがとるべき対策・配慮事項が書かれている
② 法的拘束力のある規制はまだない(各事業者が自主的にガイドラインに沿った取り組みをしてね、というもの)
③ 官民連携、社会全体でAIリテラシー向上など、事業者だけでなくステークホルダー全体での取り組みが必要と強調

https://www.meti.go.jp/press/2024/04/20240419004/20240419004.html


政府検討会、AI学習データの対価支払いを検討

政府の「AI時代の知的財産権検討会」が、生成AIの急速な発展に伴う知的財産権保護のあり方について中間とりまとめの骨子案を了承しました。骨子案では、AI開発者・提供者に対し、学習データの適正な収集とクリエイターなどへの対価還元を求めています。また、法的ルールや契約、技術を組み合わせた対応の必要性を強調し、権利者にはAI学習用データの整備や管理を求めた模様。


全国初生成AIを活用した市長アバターによる英語での情報発信~生成AIの力で言語の壁を超える~

横須賀市が、生成AI技術を利用して市長のアバターによる、英語での市の情報発信動画を公開しました。

「HeyGen」のようなサービスを活用したのではないかなと推測しておりますが、リアルアバターによる多言語発信も生成AI活用の一つですね。

アバターの仕組み


イオン、パートも中核業務 AI導入で正社員から移管

イオンはパート従業員の働き方を見直す方針です。人工知能(AI)を活用し、これまで正社員が担ってきた商品の販売計画づくりなどの中核業務をパートに移管する。深刻化する人手不足への対応として、非正規社員の役割を拡大しながら、AIで業務の負担を軽減することで生産性を高めていく。4月末からスーパーの運営子会社で、食品や衣料品の販売部門にAIシステムを導入するようです。


日経、経済情報特化の独自 LLM を開発

日本経済新聞社は、約40年分の日経グループの新聞や雑誌の記事を学習させた、経済情報に特化した生成AIの基盤技術「NIKKEI Language Model」を開発したと発表しました。パラメーター数が130億と700億の2種類があり、記事の要約機能などでの活用を見込んでいます。日経は生成AIを記事作成や編集には用いず、一部のデジタル新媒体で要約や再構成に活用する方針です。

ポイント:
・40年分の日経グループの記事を学習
・パラメーター数130億と700億の2種類
・記事の要約などで性能を発揮

独自のデータを持っているということは、生成AIの活用において相当大きなポテンシャルを持っています。
経済情報に特化した大規模言語モデルの開発は、日経ならではの取り組みですね。


論文・技術系


NTT「tsuzumi」、LLMによる視覚読解技術を確立

NTTは、大規模言語モデル(LLM)によって文書を視覚情報も含めて理解する視覚読解技術を実現しました。文書画像を提示しながら、あらゆる質問への回答を行うAIの実現への可能性を示唆する結果が得られており、DXにおけるコア技術として期待されます。本成果はNTT版大規模言語モデル「tsuzumi」のアダプタ技術として採用・導入されており、世界初の具体的な方法論を示した論文として国際会議で発表され、国内学会でも優秀賞を受賞しました。

技術的なポイント:
・視覚情報から文書を理解する技術
・汎用的な質問応答が可能
・未学習タスクでも高い性能を実現


プロンプトに数百〜数千の例を含めて、LLMにタスクを行わせる「Many-shot」


LLM にとって「質の良い学習データ」とは



その他ニュース


バーチャル試着AI 「IDM-VTON」で社内で遊んでみた

人物画像と洋服の画像をアップロードするだけで、バーチャル試着ができるようになる「IDM-VTON」で遊んでみました。

弊社代表の高橋と、あらかじめ用意されていたTシャツを選択して、「Try On」をクリック。
すると選択したTシャツを着た状態で画像が生成されました!

少々気になる点もありますが、約30秒で生成されるにしてはクオリティが高いです。

※ 商用不可とのこと。


ハンバーガーチェーンのウェンディーズが生成AI「FreshAI」を使ってドライブスルーの自動化

応答速度は改善の余地がありますが、生成AI活用による業務効率化の良い例ですね。


LLMを活用したプロジェクトのプロダクトマネジメント



[ご案内] 生成AI活用のお悩み相談、開催中


現在弊社では、生成AI 活用をご検討されている企業様のお悩み相談を、1時間無料で受け付けております。

相談はコチラをクリック

EXPLAZA 生成AI Partner では、生成AI 活用のコンサルティングから開発までを一気通貫でご支援しております。

業務効率化のための法人向け ChatGPT 環境のサービスや、生成AI に関するリテラシー向上のための研修にご興味がある方は、コチラから


今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです!

今週もお疲れ様でした!

=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪

X でも生成 AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください!

「株式会社エクスプラザ(公式)」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase

生成AI事例集

会社HP


この記事が気に入ったらサポートをしてみませんか?