見出し画像

【無料】Claude3.5 Sonnet爆誕/TikTokの写真共有SNS「Whee」登場/iOS18Siriの名前を変えられるように/Google動画に合わせた音楽生成AI発表/ChatGPTとゴルフするデバイス/Amazon AI Alexaは月額10ドルになりそう/NotebookLMがスゴイ【週刊AIのニュース 2024年6月17日号】

こんにちは。AIのある暮らしです。

2024年6月17日〜6月23日の「週刊AIのニュース」をお届けします。


【1】文章生成AIニュース

Anthropicが「Claude 3.5 Sonnet」をリリース ~「Claude 3 Opus」の2倍高速な最新LLM

米Anthropicは6月21日、「Claude 3 Opus」の2倍の速度で動作する大規模言語モデル(LLM)「Claude 3.5 Sonnet」を発表しました。こ

の新モデルはWebサイト「claude.ai」とiOSアプリ「Claude」で無料利用可能で、さらに「Anthropic API」「Amazon Bedrock」「Google Cloud」の「Vertex AI」からもアクセスできます。料金は入力トークン100万個あたり3米ドル、出力トークン100万個あたり15米ドルです。

「Claude 3.5 Sonnet」は大学院レベルの推論力や学部レベルの知識、コーディング能力などで高い性能を示し、視覚的な推論を必要とするタスクでも優れた成果を上げています。今後は「Claude 3.5」ファミリーとして「Haiku」と「Opus」を年内にリリースする予定です。

生成AIが「Claude 3.5 Sonnet」で一歩前進も、世界は“大きな飛躍”を待ち望んでいる

Anthropicは最新のAIモデル「Claude 3.5 Sonnet」を発表しましたが、その進歩は段階的なものであり、世界は依然として次の大きな飛躍を待ち望んでいます。

「Claude 3.5 Sonnet」は数学、コーディング、論理問題で優れた性能を示し、言語のニュアンス理解やユーモアのセンスも向上しています。しかし、これらの進歩は数パーセントの向上に過ぎず、AIの飛躍的進化にはまだ時間がかかるとされています。OpenAIやGoogleなども新モデルをリリースしていますが、次の革命的な進展はまだ先のようです。

生成AIでメモアプリが進化? 自分だけのチャットAIが作れる、Google「NotebookLM」を試してみた

Googleの「NotebookLM」が日本を含む200以上の国と地域で提供開始されました。NotebookLMは、自分で入力したソースのみを使用できる生成AIサービスで、複雑な資料の理解や新しい情報の類似性を見つけるのに役立ちます。

最新のGemini 1.5 Proをベースにしたこのツールは、Googleドキュメント、PDF、テキストファイル、Googleスライド、URLをソースとして利用可能です。しかし、著作権の問題には注意が必要です。記事では、実際にNotebookLMを使用してみた結果が紹介されており、PDF形式でのソース入力が推奨されています。また、NotebookLMは各ソースを解析し、チャットによる質問ができる機能も備えています。

YouTube、「この動画を見るなら知っておくべきこと」を表示する機能をテストへ

YouTubeは、視聴者に動画の背景情報や関連情報を提供する新機能「メモ機能」をアメリカで試験運用開始しました。

この機能は視聴者が動画の正確な解釈をサポートするもので、例えば動画がパロディであることや、紹介された製品の新モデルの存在を示すメモを追加できます。初期段階では招待制で選ばれた寄稿者がメモを執筆し、その内容はフィードバックをもとに評価されます。この機能の実装により、YouTubeは動画コンテンツの質を向上させ、視聴者の理解を深めることを目指しています。

“孫正義流”ChatGPTの使い方とは? 「部下と議論するより面白い」

ソフトバンクグループの孫正義会長兼社長は、6月21日の株主総会で「ASI(人工超知能)」の活用を通じて人類の進化に貢献することを使命とし、ASIの時代が10年以内に訪れると予測しました。

孫氏はChatGPTを日常的に使用し、ディベート相手として活用することで新しいアイデアを生み出しています。また、孫氏はかつてOpenAIへの1兆円の出資を検討していたことを明かし、今後は複数のパートナーと共にASI実現に向けて集中する意向を示しました。

【ChatGPT】希望の回答形式をあらかじめ指示、ChatGPTパラメーター活用法

ChatGPTには、回答を調整するためのパラメーターがいくつか用意されています。例えば、「Max_Length」を使うと回答の文字数を制限でき、「N」で複数の回答を指定できます。

また、「Temperature」を使って回答の創造性や厳密性を調整することも可能です。Microsoft Copilotでは回答スタイルを「創造的」「厳密」「バランスよく」から選べますが、ChatGPTではパラメーターを使用して似た設定ができます。これにより、ユーザーはより具体的な回答を得ることができます。

AI検索エンジン「Perplexity」の性能はChatGPT越え? その凄さを解説

2024年5月、ウォール・ストリート・ジャーナルが行ったテストで、AI検索エンジン「Perplexity」はChatGPTや他の主要なチャットAIを抑えて総合評価で首位となりました。

Perplexityは、自然言語処理(NLP)と機械学習を駆使し、リアルタイムでウェブ情報を検索しながら回答を生成する特徴を持ちます。従来の検索エンジンとは異なり、対話型での検索が可能で、複数のソースを参照しながら具体的な回答を提供します。アカウントなしで利用可能で、履歴保存には会員登録が必要です。

【2】画像生成AIニュース

生成AI画像とLLMの熱い関係?LLMを併用するいろいろな生成AI画像環境のご紹介

2023年6月、画像生成AI「Stable Diffusion」はバージョン1.5であり、大規模言語モデル(LLM)「GPT-4」とは独立して動作していました。しかし、最近では「SDXL」や「SD3 Medium」などの新しい生成AIモデルが登場し、LLMとの関係が急速に近づいています。

例えば、LLMを使って生成AIのプロンプトを詳細に書き出す「Upscale」機能が利用されています。「Omost」や「sd3-with-LLM」などのプロダクトは、LLMを活用して生成AIの位置関係や詳細な描写を可能にし、日本語入力にも対応しています。これにより、生成AI画像とLLMの統合が進み、より高度な画像生成が実現されています。しかし、高性能なGPUが必要であるため、ローカル環境での実行には課題が残ります。

画像生成AI「Midjourney」の使い方 画風やキャラクターを固定する「スタイルリファレンス」「キャラクターリファレンス」はこう使う

2024年にMidjourneyに実装された新たなパラメーター「スタイルリファレンス」と「キャラクターリファレンス」、およびその応用である「ランダムスタイルリファレンス」について解説します。

これらのパラメーターは、アップロードした画像を参照して新たな画像を生成する手法を提供します。スタイルリファレンスは画風を、キャラクターリファレンスはキャラクターの顔、髪型、衣装を参照します。これにより、ユーザーは特定のスタイルやキャラクターの特徴を保持しつつ、新しい画像を生成できます。

1枚の画像から高品質な3Dメッシュを高速で生成できる「Unique3D」を試してみた

中国・清華大学の研究チームが、1枚の写真から高品質な3Dメッシュモデルを自動生成するフレームワーク「Unique3D」を公開しました。Unique3Dは、2Dの拡散モデルを応用して被写体の形状を予測し、比較的高速で3Dメッシュモデルを生成します。

オンラインデモはHugging Faceなどで無料で利用可能です。実際に試したところ、1枚の画像から正面、側面、背面までモデリングされた3Dメッシュが約60秒で生成されました。生成されたモデルはglTF形式でダウンロード可能です。

「生成AI」画像使用が理由…著名歌手がアニメイベント出演辞退 運営が謝罪/全文

歌手高橋洋子が、7月10日に出演予定だった「池袋アニメーションフィルハーモニー」の第一回演奏会への参加を辞退しました。理由は、イベントのチラシやホームページに生成AIで作成した画像が使用されていたためです。

高橋側は「アニメ音楽に関わる立場として好ましくない」との意見を述べ、出演辞退を決定しました。実行委員会は、生成AIを取り巻く問題についての認識不足を謝罪し、画像をイラストレーターが制作した作品に差し替えました。また、チケットのキャンセルと返金に応じるとしています。

【3】動画生成AIニュース

Google DeepMindが「動画にピッタリな音楽を生成するAI」を発表

Google DeepMindは、動画に適した音楽や音を生成するAIシステム「video-to-audio (V2A)」を発表しました。V2Aは、映像の雰囲気や動きに合わせて音楽や効果音、キャラクターのセリフを自動生成します。

映像をエンコードし、プロンプトに基づいて音を生成する仕組みで、プロンプトなしでも映像の内容に合った音声を生成できます。これは既存の映像にも応用可能で、無声映画やアーカイブ資料に新たな音声を追加するなど、創造的な機会を広げることが期待されます。Runway、超リアルなAI動画モデル「Gen-3 Alpha」を公開——10秒間の動画クリップが作成可能

【4】モバイルAIニュース

グーグルの生成AI検索「AI Overviews」 日本でも年内開始

Googleは「Google for Japan 2024」で、生成AIを活用した検索機能「AI Overviews」を年内に日本で開始することを発表しました。AI Overviewsは、検索キーワードに基づいてウェブの検索結果から自動的に概要を生成し、ユーザーに提示します。

また、AIサービス「Gemini」も紹介され、日本での利用が拡大しています。さらに、カメラを使った「Project Astra」のデモが行われ、カメラが映した物体を認識し、ユーザーとやり取りする機能が披露されました。日本独自のハッシュタグ検索や「Google ナウキャスト」も導入される予定です。

iOS18の「音声ショートカット」でSiriの名前を変更可能に

iOS18では、新機能「音声ショートカット」が導入され、Siriを起動する際の呼びかけを自由に変更できるようになりました。ただし、この機能には制限があり、変更後の名前でSiriを起動すると、少しの待ち時間が生じるため、起動とコマンドを同時に行えません。

また、Siriの新しい呼称はiPhoneのみで動作し、HomePodなど他のデバイスでは使用できません。その他、iOS18では充電速度の記録、Apple IDの名称変更、サードパーティーカメラへのロック状態からのアクセスなど多くの新機能が追加されています。特に注目されるのは、ChatGPTの有料版が無料で使用できる「Apple Intelligence」です。

Amazonの新しい”AI Alexa”、月額10ドルで提供か

TikTokは新しい写真共有アプリ「Whee」をローンチしました。現在、このアプリは一部の国でAndroid限定で導入されています。Wheeは、インスタグラムに対抗するために開発されたと考えられています。

ユーザーはWheeを通じて写真を共有し、交流することができます。TikTokは、この新アプリで写真共有市場においても存在感を高めることを目指しています。

Google AIでなにができるの? 7万円台の「Pixel 8a」で検証してみた

Googleが5月に発売した「Pixel 8a」は、最新プロセッサー「Tensor G3」とGoogle AIの機能を搭載し、価格は7万2600円(税込)です。この記事では、1か月の使用体験をもとに、Pixel 8aの実践的なAI機能が紹介されています。

Pixel 8aは片手操作が快適な6.1インチディスプレイを持ち、バッテリーは24時間以上持続します。AIによる写真と動画の編集機能が特に便利で、手ブレ補正や不要な要素の削除が簡単にできます。また、音声消しゴムマジックで動画のノイズも除去可能です。Pixel 8aはGoogle AIを手軽に体験できるスマホとして非常にお得です。

必要なのは「15秒」だけ?OpenAIの音声AI「もはや怖い」スゴすぎる実力とは

OpenAIが発表した音声生成AIモデル「Voice Engine」は、15秒の音声サンプルから話者の声を模倣する高い実力を持っています。この技術は音声コンテンツの効率化や医療分野での活用が期待される一方で、悪用の懸念もあります。

特に日本では俳優や声優の声を無断で使用する「AI声優」の問題が顕在化しており、政府は不正競争防止法の見直しを検討中です。Voice Engineの利用には厳格なポリシーがあり、OpenAIは悪用対策として音声のトレースやモニタリングを実施しています。

Microsoftの新ブランド、Copilot+ PCはみんなの仕事の副操縦士となるか?それとも...

マイクロソフトが新ブランドのWindows PC「Copilot+ PC」を発売しました。「Microsoft Copilot」は、AIアシスタントとして作業のパートナーとなることを目的としています。特に「コクリエイター」機能は、リアルタイムで手描きと文字入力により画像を生成できるため、クリエイターにとって便利なツールです。

Copilot+ PCは、AI機能を最適化したチップ「NPU」を搭載し、高性能なGPUが不要でローカルでのAI利用が可能です。これにより、生成AIを一般ユーザーが手軽に利用できる時代が到来しました。この記事では、AIがクリエイターの作業をどのように支援するか、またその可能性についても触れています。

ポケトークの次はゴルフ! ChatGPT活用の対話型デバイス「Birdie Talk」をソースネクストが発売

ソースネクストは、ChatGPTを活用したゴルフ用対話型AIデバイス「Birdie Talk」を8月末に発売すると発表しました。価格は3万9600円です。Birdie Talkは、プレー中に自然な言葉でゴルフに関する質問をすると、音声でアドバイスを返します。

このデバイスは、東京大学ゴルフ部が監修したデータベースを基にアドバイスを提供し、GPS機能も搭載しており、グリーンセンターまでの距離を音声で確認できます。また、ショットの傾向を分析するための機能も備えています。ソースネクストは、ゴルフ市場の成長とプレーヤーの上達をサポートするために、このデバイスを開発しました。

【5】生成AI業界ニュース

「最新の生成AI」はすでに人類の半数以上よりアタマが良い…落合陽一「今後、人類の働き方は大きく変わる」

筑波大学准教授の落合陽一氏は、生成AIの進化が加速している現状について述べています。特に、ChatGPTよりも正確さや速度で勝る生成AIが登場しており、現在はどれが覇者になるかが全く予測できない「戦国時代」に突入していると指摘します。

生成AIを上手に使いこなすためには「審美眼」が必要であり、生成されたデータの中から優れたものを選び出す力が重要です。今後、生成AIによる「それっぽい自然」が普及し、人々の認識や働き方が大きく変わる可能性があります。

AppleはChatGPTを利用できない中国でApple Intelligenceを提供するためにBaidu・Alibaba・Baichuan AIなどと協議中も難航か

Appleは、iOS・iPadOS・macOSにAI駆動の機能を組み込む「Apple Intelligence」を発表しましたが、ChatGPTへのアクセスが禁止されている中国市場では、現地のパートナーと協力して提供する計画です。

AppleはBaidu、Alibaba、Baichuan AIなどと協議を進めていますが、まだ提携企業は決まっていません。中国では生成AIの使用が厳しく規制されており、Apple Intelligenceの実現にはプライバシーへの懸念やクラウドサーバーの利用が課題となっています。

生成AIはIT運用にどう使えばいいのか? 現実的な「30%効率化」の方法とは

日本アイ・ビー・エムは、生成AIと自動化技術を活用してITシステムの運用効率を30%向上させるソリューションを提案しています。

このソリューションは、AI戦略策定とガバナンス、コード生成、テスト自動化、IT運用高度化、プロジェクト管理の5つの領域で構成されており、IT業務全体の最適化を目指します。特に「IT運用高度化のためのAI」では、ヘルプデスクの自動応答やインシデント対応の自動化などを実現し、2027年までにITライフサイクル全体の30%の効率化を目指します。

AI で日本のさらなる可能性を 〜 Google for Japan 2024 〜

Googleは「Google for Japan 2024」で、AIを活用した新たな取り組みを発表しました。東京大学と協力して、日本全国47都道府県の地域課題を解決するための生成AIモデルを構築し、人材育成を支援します。

具体的には、大阪府での雇用ミスマッチ解消を目指し、AIを活用したキャリアパス提案や採用支援を行います。また、Googleは日本向けの新機能として、AIを使った気象予測モデル「MetNet-3」を開発し、より正確な降水量予測を提供します。さらに、Google検索でのハッシュタグ検索や、生成AI活用の資格認定プログラム「Google AI Essentials」を開始し、AIスキルの普及と社会実装を推進します。

GoogleとAppleの異なる「AI」の見せ方。重要なのは“親しみやすさ”

2024年におけるGoogleとAppleのAIに対するアプローチの違いについての記事です。GoogleのAI発表会は、技術の大変革やAIの凄さを強調する一方、Appleの発表会はユーザーが具体的に利用できる機能に焦点を当て、親しみやすさと実用性を強調しました。

特にGoogleのAI「Gemini」は、既存のGoogle Assistantと比べて使い勝手が悪化し、ユーザーの不満が高まっています。一方、Appleは「Siri」を賢くすることでユーザーの期待に応え、使いやすさを向上させました。この違いが、消費者にとってのAI技術の受け入れやすさに影響を与えています。

時価総額のトップ争い続く エヌビディア転落、マイクロソフトが再び首位に

米国半導体大手エヌビディアが株価の下落により、時価総額で世界1位の座をマイクロソフトに明け渡しました。エヌビディアの株価はAIソフトウェアに必要な半導体市場での優位性を背景に急上昇していましたが、6月20日に3.5%以上下落し、時価総額は約3兆2200億ドルとなりました。

一方、マイクロソフトは安定した株価で3兆3000億ドル以上の時価総額を維持し、再び首位となりました。エヌビディア、マイクロソフト、アップルの3社は、時価総額3兆ドルを超え、激しいトップ争いを繰り広げています。アナリストは、今後もこの競争が続くと予測しており、特にハイテク業界における時価総額4兆ドルへの競争が展開されると見ています。

【6】その他 SNS界隈のニュース

TikTokが新写真共有アプリ「Whee」をローンチ、インスタグラムに対抗か

TikTokは新しい写真共有アプリ「Whee」をローンチしました。現在、このアプリは一部の国でAndroid限定で導入されています。Wheeは、インスタグラムに対抗するために開発されたと考えられています。

ユーザーはWheeを通じて写真を共有し、交流することができます。TikTokは、この新アプリで写真共有市場においても存在感を高めることを目指しています。

今さら聞けない「TikTok」と「TikTok Lite」は何がどう違うの?

この記事では、「TikTok」と「TikTok Lite」の違いについて解説されています。TikTok Liteは、動画の視聴やいいね、新規ユーザー招待でポイントが貯まり、ユーザーが継続的にアプリを使用するインセンティブとなっています。

ポイントを貯めるには、特定の動画を視聴する必要があり、全ての動画が対象ではありません。また、TikTok LiteのポイントシステムはEUで中毒性への懸念が示されており、日本でも今後規制の議論が行われる可能性があります。ポイント制度の目的は、ユーザーの定着と広告主への価値提供を高めることです。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内が届きます。

また「指示文」と送信して頂ければ、「本当にしごとに役立つ指示文20選」ががもらえます。


毎月AIの勉強会を開催しています

第3回 AIの勉強会 「調べる・検索する」

6月25日(火) 19時~20時

次回は仕事や暮らしに使える「AIと話す・AIで発想する」について勉強します。ぜひ公式LINEに登録いただければ無料でご参加頂けます。

お申し込みはこちらから。


今後の開催予定

第1回 「書く・要約する」 4月25日(木) 19時~20時
第2回 「調べる・検索する」 5月28日(火) 19時~20時
第1回  「書く・要約する」 補講 6月6日(木)19時~20時

第3回 「話す・発想する」6月25日(火) 19時~20時
第4回 「画像をつくる」7月24日(水) 19時〜20時
第5回 「動画をつくる」 8月28日(水) 19時~20時

AI導入研修無料相談

またAI導入研修も開催しています。30分の無料相談が可能ですのでぜひご活用下さい。


さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!

公式グッズの販売はこちらから


この記事が気に入ったらサポートをしてみませんか?