見出し画像

GPT-4o mini爆誕/Apple AI搭載の画面付きHomePod開発/Google「Pixel9」購入者にGeminiの高機能版使えるように/Adobe Express Googleスライドで利用可能に/OpenAI「Sora」使った短編ムービー公開/動画生成AI「Kaiber」使ってみた/トランプ氏、TikTok禁止に反対【週刊AIのニュース 2024年7月22日号】

こんにちは。AIのある暮らしです。

2024年7月15日〜月21日の「週刊AIのニュース」をお届けします。

【1】文章生成AIニュース

ChatGPTで出力した内容をファイルとしてダウンロードする方法

ChatGPTで生成したコンテンツを他のアプリケーションに手動で移すのは手間です。有料プランの「ChatGPT Plus」を契約すれば、指定のファイル形式でコンテンツを出力する機能を利用できます。この機能は「ChatGPT 4」に切り替えることで利用可能で、例えばExcel形式(.xlsx)で出力が可能です。手順は簡単で、ファイル形式を指定し、ダウンロードリンクをクリックするだけです。これにより作業効率が大幅に向上します。

OpenAIが「GPT-4o mini」発表、激しくなる「安くて速い」AIモデルの開発競争

OpenAIは2024年7月18日、新たなAIモデル「GPT-4o mini」を発表しました。このモデルは従来のものより小型で、利用料が安いのが特徴です。API経由での提供も開始され、利用料は大幅に低減されました。この新モデルは、コストとレイテンシーを抑え、広範なタスクを低コストで可能にします。GPT-4o miniの登場により、AIモデルの小型化競争がさらに激化することが予想されます。

ChatGPTの大学向け実証実験サポートを開始。無料で生成AIの導入検証が可能

株式会社ナレッジセンスは、企業向け/大学向けChatGPTシステム「ChatSense」を提供し、大学向け実証実験パートナーの第3次募集を開始しました。このプランでは、10万文字程度の会話を無料で試せ、予算取り前の運用検証が可能です。ChatSenseはセキュアな環境でAIを利用できる点が特徴で、多くの大学での導入実績があります。今後も大学向けの特別対応を実施し、教育機関でのAI活用を支援します。

「ChatGPT」が開発で役に立たない納得の理由 ただし、GPT-3.5版に限る

ChatGPTはコード生成が得意ですが、開発にはまだ不安が残ります。研究によると、GPT-3.5ベースのChatGPTはコード生成の成功率にばらつきがあり、特に難易度の高い問題では成功率が低いです。さらに、セキュリティ面や複雑なプログラミング問題には限界があります。開発者がChatGPTを利用するには、AIの限界を理解し、必要な知識をAIに提供することが重要です。

ChatGPTは“安全”とは言い難い? 「プラグイン」がもたらす“3大リスク”とは

ChatGPTのプラグインは便利ですが、セキュリティリスクも伴います。主なリスクは以下の3点です。1. データ流出:プラグイン利用で機密情報が第三者に漏れる可能性があります。2. コンプライアンス問題:データの第三者転送が法令順守に違反する恐れがあります。3. 欠陥や脆弱性:プラグインのセキュリティ欠陥が攻撃のリスクを高めます。これらのリスクを理解し、対策を講じることが重要です。

ChatGPTでコミュニケーションする作業ロボット、世界70カ国に展開 中国ベンチャーが資金調達

中国の「大象机器人(Elephant Robotics)」が、プレシリーズBで資金を調達しました。この資金は人型ロボット生産ラインの能力向上と研究開発に使われます。エレファントロボティクスは、人型ロボット「Mercury」シリーズを展開し、ChatGPTを活用した音声コミュニケーションが可能です。同社の製品は100%自社開発で、世界70カ国以上で販売されています。

もはや「ChatGPT」で騒いでいる場合ではない? 深みある日本語を生成するAI「Claude」の凄さ

Anthropicが開発するAI「Claude」は、自然で機械的に感じない日本語を生成する能力が高く評価されています。特に「Claude 3」はその性能が注目され、3つのモデルサイズ(Haiku、Sonnet、Opus)が用意されています。ユーザーは無料でSonnetまで利用可能で、API提供も行っています。Claudeは、OpenAIのChatGPTと並び、日本市場でもその存在感を増しています。

ChatGPTが「ディープフェイク」を見抜く、偽の顔画像と判定した根拠も説明

米ニューヨーク州立大学バッファロー校などの研究者グループは、ChatGPTを使ってディープフェイク画像を見抜けるか実験しました。ChatGPTは、マルチモーダル対応のGPT-4Vを使用し、実際の顔画像とAI生成の偽画像を区別するためにプロンプトを工夫しました。実験では、3000枚の顔画像を使用し、最適なプロンプトで正解率を求めました。この結果は2024年の国際会議で発表されました。

これは知っておきたい。GoogleのAI「Gemini」でできること

GoogleのAI「Gemini」は、テキストや画像、動画などさまざまなメディアを扱えるマルチモーダルなAIです。Geminiは、AIモデルとAIアプリの両方に使われる名称であり、現在のGeminiアプリは、以前は「Google Bard」と呼ばれていました。Geminiには、無料版と有料版の料金プランがあり、有料版は高度なモデルにアクセス可能です。Geminiの主なモデルには、Gemini Ultra、Gemini Pro、Gemini Nanoがあります。

【2】画像生成AI関連のニュース

画像生成AI実技をオンラインで。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第4回)を7月24日開催。参加者募集します

テクノエッジ編集部は、7月24日にオンラインで「生成AIグラビア実践ワークショップ」を開催します。講師は西川和久氏で、ComfyUIを使用した最新技術を学べます。受講者は高性能GPUを使ったサービス「生成AI GO」を無料で利用でき、生成した画像は保存可能です。参加費は5000円で、テクノエッジ アルファ会員は無料です。

「Adobe Express」、Googleスライドで利用可能に

アドビは「Adobe Express」で7月に追加された新機能を紹介しました。これにより、GoogleスライドでのAdobe Expressの画像編集が可能となり、背景削除や色調補正、生成AIを活用したイメージ画像の作成が行えます。他にも、商業利用可能なイラスト素材「JOY Illustrations」の提供、一括作成機能、プレゼンテーション用の発表者モードが追加され、より多機能なツールとして利用できます。

【3】動画・音声生成AI関連のニュース

OpenAI、動画生成AI「Sora」使った短編ムービー公開

OpenAIは、動画生成AI「Sora」を使用した2人のアーティストによる動画作品を公開しました。Tammy Lovin氏の作品は幻想的なネオンの光景を描写し、Benjamin Desai氏の作品はモノクロフィルム調で奇想天外なシーンを表現しています。Soraは最大1分間の高品質動画を生成でき、映画祭や広告作成にも利用されていますが、競争が激化しており、さらなる発展が期待されています。

“アーティストのためにアーティストが作った”動画生成AI「Kaiber」を試す

動画生成AI「Kaiber」は、アーティストのために作られたツールで、2023年5月にサービスを開始しました。メジャーアーティストのミュージックビデオ制作や、ライブステージのビジュアルも担当しています。登録は簡単で、無料トライアルも利用可能です。アーティスティックな作品作成に特化したKaiberは、月額5ドルから利用できます。

ゆっくり解説動画を一瞬で作れるAIアプリ「NoLang」の使い方まとめ

「NoLang」は、簡単な入力だけで解説動画を作成できるウェブアプリです。新機能として、画面端にキャラクターを配置して対話形式で物事を解説する「ゆっくり解説」形式の動画が作成可能になりました。アカウント登録後、設定を変更して対話モードをオンにし、プロンプトやアバターを指定することで、手軽に動画を作成できます。有料プランでは、クレジットが増加し、動画内にロゴを挿入しない機能が利用可能です。

NexTone、全世界のYouTube動画視聴における著作権使用料直接徴収を開始

NexToneは、YouTubeにおける著作権使用料の管理範囲を全世界に拡大し、Google LLCから直接徴収を開始しました。これにより、管理作品が利用される動画の特定精度が向上し、著作権者への使用料分配スケジュールの早期化が図られます。また、利用地域や再生回数の詳細情報も提供可能になります。今回の拡大は、国内外で培ったノウハウを活用し、より効率的な著作権管理を実現します。

【4】モバイルAI関連のニュース

グーグルPixel 9は無料で生成AI「Gemini」の高機能版を利用可能か

グーグルが8月に発売予定のPixel 9シリーズの購入者は、プレミアムAIモデル「Gemini Advanced」に1年間無料でアクセスできる可能性があります。Gemini Advancedは、アップルのApple IntelligenceやOpenAIのChatGPTと競合するプロダクトで、プレミアム機能には最新のGemini 1.5 ProモデルへのアクセスやAIを用いた書類作成機能などが含まれます。この特典は最新のAndroid用Googleアプリのベータ版コード内から発見されました。

最新AI「Claude 3.5 Sonnet」をAndroidで使える公式アプリ

Anthropicは、最新AI「Claude 3.5 Sonnet」を含むすべてのClaudeの機能をAndroidで利用できる公式アプリをリリースしました。アプリは無料で、ProやTeamなどのプランもスマートフォンから利用可能です。アプリは写真ファイルの解析、多言語処理、高度な推論などをサポートしています。これにより、AndroidユーザーもClaudeの高度なAI機能を活用できるようになりました。

AIスマホの競争とプロンプト=生成AI時代の終わり

サムスンは「Galaxy Z Fold6」と「Galaxy Z Flip6」を発表し、AI機能「Galaxy AI」を強調しました。リアルタイム翻訳や音声認識など、複数のAI機能を組み合わせ、スマホ内外で動作するシステムを提供しています。Googleとの連携で生成AI「Gemini」も活用し、AI対決が激化しています。各社のスマホはAIの活用で差別化を図り、よりパーソナルなAIアシスタントを目指しています。

Galaxy Z Fold 6のAI機能でできること

Samsungの最新折りたたみスマホ「Galaxy Z Fold 6」は、PDFオーバーレイ翻訳機能やAIキャプション作成ツール「Composer」、手描きスケッチから画像を生成する「Sketch to Image」など、多くの新しいAI機能を搭載しています。また、リアルタイム翻訳やGoogleの生成AI「Gemini」も利用可能です。これにより、ユーザーは多言語対応やクリエイティブな作業を効率的に行うことができます。

AppleはAI搭載の画面付きHomePodを開発中か

Appleが新しいHomePodを開発中であるとの噂が飛び交っています。最新の情報によると、このデバイスには画面と「Apple Intelligence」が搭載される可能性があります。新しい識別子「HomeAccessory17,1」が発見され、このデバイスがA18チップを使用し、tvOSのバリアントを使用するとされています。これにより、AIがスケジュール管理や電話の受信、家庭内サポートなどを提供する可能性があります。

【5】生成AI技術の企業活用事例

ソラテクノロジー、ドローン×AIで農業GX領域に進出

SORA Technology株式会社は、ドローンとAI技術を活用して水田の中干し期間を測定し、温室効果ガスの排出を抑制する事業を開始しました。北海道岩見沢市で実証実験を実施し、ドローンで広範囲の水田を測定しAIで水の存在を判定します。この取り組みは、稲作によるメタンガス排出の抑制を目指し、農業のGX(グリーントランスフォーメーション)に貢献します。

【6】生成AI業界関連のニュース

OpenAIが「AIの透明性を高める技術」を公表したが、それでも安全性向上には十分ではない

OpenAIはAIの透明性を高めるため、2つのAIモデルに対話させる技術を公表しました。これにより、AIの論理的思考の透明性が向上し、人間が理解しやすくなります。しかし、専門家はこれだけでは安全性向上に不十分と指摘し、AI開発企業に対する外部からの監視体制が必要だと述べています。企業利益優先の姿勢が問題視されています。

AppleのAI戦略発表はなぜ他社より大幅に遅れたのか 「Apple Intelligence」の真価を読み解く

Appleの「Apple Intelligence」は、オンデバイスとクラウドのハイブリッド戦略を採用しています。これにより、ユーザーのデバイス上でLLMを動かし、必要に応じてクラウドで処理するという方法で高いセキュリティとパフォーマンスを実現しています。この戦略は、Appleがセキュリティやユーザー体験を重視しているためであり、これが他社より発表が遅れた理由の一つです。

アップルやNVIDIAら、無許可でYouTube動画の字幕をAI訓練に利用か

AppleやNVIDIAなどのテクノロジー企業が、クリエイターの許可なくYouTube動画の字幕を使ってAIシステムを訓練している疑いがあると報じられました。Proof Newsの調査によれば、4万8000以上のYouTubeチャンネルから抜き出された17万3536本の動画の字幕が使用された可能性があります。これに対して、Googleの広報担当者は、YouTubeの利用規約違反になる可能性があると述べました。

【7】SNS×AI関連のニュース

「ギリハッピー」がTikTokでバズりまくった理由をKOMOREBI本人たちに聞いてみた!10億回再生超え、世界中のスターも続々踊る曲が生まれるまで

KOMOREBIの楽曲「Giri Giri」がTikTokで10億回再生を突破しました。草彅剛、ENHYPEN、&TEAMなど多くのスターが踊り、その人気は国境を越えています。メンバーたちは、このバズを予想外としながらも、SNSの発信努力が実を結び、嬉しいと語っています。曲の制作背景や今後の展望についても語られています。

トランプ氏、TikTok禁止に反対 「競争が必要」

トランプ前大統領は、中国系短編動画アプリ「TikTok」の米国での利用禁止に反対する考えを示しました。バイデン大統領は、TikTokの親会社バイトダンスに米資産売却を義務付ける法案に署名しましたが、トランプ氏は競争が必要だと主張しています。トランプ氏はかつてTikTokを脅威と見なしていましたが、最近になってアカウントを開設しました。

エヌビディアのCEOが台湾は半導体に加え「生成AIの中心地になる」と明言する理由

エヌビディアのジェンスン・フアンCEOは、台湾が生成AI産業の中心地になると述べました。台湾は変化対応力に優れ、AI技術を駆使するスーパーコンピューターの寄贈や高雄に研究開発センターを設置するなど、AI分野での強みを強調しています。対中制裁や価格競争の中で、台湾は西側陣営における対中国の最前線として重要な役割を果たすとされています。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内や「本当にしごとに役立つプロンプト20選」ががもらえます。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!


この記事が気に入ったらサポートをしてみませんか?