今週の生成AIの気になるニュース・記事（7/15～7/19）

2024年7月22日 18:26

こんにちは。分析屋の平野です。
社内チャット部屋にて紹介されたニュースや記事を紹介します。
あっという間に梅雨明けしましたね。これからが夏本番ですがもう既に夏バテ気味です...

生成AIモデルなど

米OpenAIは軽量で安価なマルチモーダルAIモデル「GPT-4o mini」を発表しました。
アプリ開発者向けのAPIは従来のハイエンドモデルより1桁安く、GPT-3.5 Turboよりも高性能とのことです。
既にチャットAI「ChatGPT」にて、「GPT-3.5」の代わりに利用出来るようになっております。

AI開発企業のMistral AIが、コーディング用AIモデル「Codestral Mamba」を発表しました。オープンソースライセンスでのリリースであり、商用利用が可能となっています。
Codestral Mambaはパラメーター数が70億(7B)で、同等サイズのモデルの中では最上位クラスの性能を発揮しております。220億(22B)パラメーターのCodestralモデルには全体的に性能で負けているものの、一部の指標では上回るなどMambaアーキテクチャのポテンシャルの高さを見せつけました。

富士通株式会社は、Cohereと企業向け生成AIの提供に向けた戦略的パートナーシップを締結し、Cohereの大規模言語モデルをベースとした日本語強化版LLM「Takane（高嶺）」（仮称）を共同開発すると発表しました。
プライベート環境で社内データを安心して利用できる企業向け日本語LLMとなり、富士通は2024年9月から、自社のAIサービス「Fujitsu Kozuchi」を通じて、グローバル市場向けに独占的に提供することになります。
また、富士通はCohereに出資したことも発表しました。なお、出資額については明らかにしておりません。

サービス

米Anthropicは、AIチャット「Claude」のAndroidアプリ版を公開しました。
Web版と同様、大規模言語モデル「Claude 3.5 Sonnet」とのチャットなど、基本的な機能を無料で利用できます。

AI翻訳ツール「DeepL」を提供する独DeepLは言語翻訳や文章校正の特化型大規模言語モデルを実装したと発表しました。
同社が実施したブラインドテストに参加した言語専門家からは「GPT-4よりも1.7倍、Microsoft翻訳よりも2.3倍、DeepLの翻訳出力が好ましい」と回答を得られたとのことです。

米Microsoftは2022年に発表したAI搭載デザインツール「Microsoft Designer」のiOSおよびAndroidアプリを正式版としてリリースしました。日本語対応です。
Microsoft Designerは、米OpenAIの「DALL・E」ベースのツールで、テキストプロンプトで画像やデザインを生成できるというものです。
モバイルアプリでは、ステッカーやグリーティングカード、壁紙、アバターなどを作成できます。

米Amazon Web Services（AWS）は、生成AIに自然言語で作りたい業務アプリを説明すると、自動的に業務アプリの開発が行われる新サービス「AWS App Studio」をプレビュー公開しました。
AWS App Studioはソフトウェア開発のスキルがなくとも、業務アプリケーションを数分で開発できるとしています。

Kotlin言語や統合開発ツールIntelliJ IDEAなどの開発を行っているJetBrainsは、IT系のテクニカルライティングのためのAI作文支援ツール「Grazie」（グラッツィ）を発表しました。
JetBrainsの説明によると、Grazieで利用している言語モデルはハイテク業界のテキストを学習させているため、テクニカルライティングを的確に支援できるとのことです。
現在は日本語の校正には対応しておらず、日本語への翻訳のみ対応しているとのことです。

研究

米OpenAIはLLMの出力の信頼性と透明性を向上させるための新しいトレーニング方法を紹介する論文を公開しました。
AIによる回答が本当に正しいのか、人間が理解しやすくするための取り組みです。
このトレーニング方法は、「Prover-Verifier Games（証明者ー検証者ゲーム）」と呼ばれるゲーム理論に基づいており、賢い「証明者」と証明者よりはるかに能力の低い「検証者」を用意し、証明者に問題を解決させ、その解決方法を検証者にも理解できるように説明させる方法です。
このトレーニングを繰り返すことで、証明者は説明能力が向上し、検証者は解決方法の問題点を見つける能力が向上するとのことです。

米Microsoftに所属する研究者らが表計算ソフトを理解するための効率的な大規模言語モデルを提案した研究報告「SpreadsheetLLM: Encoding Spreadsheets for Large Language Models」を発表しました。
「シートコンプレッサー」と呼ぶ手法を用いて、表計算シート内で重要な構造を持つ部分を特定して、データの表現方法を変更し、数値データの扱いを効率化することで、表計算データを平均して25倍にも圧縮することに成功。
この圧縮により、LLMが一度に処理できるデータ量が大幅に増加し、より大規模で複雑な表計算ファイルの分析が可能となりました。
同時に、データ処理にかかる計算コストも96％削減されており、実用面でも大きな進歩をもたらしております。

科学ジャーナルのScience Advancesに掲載された論文では「生成AIは個人の創造性を高める」ことが実証されましたが、一方で生成AIに頼ることで創作として問題も発生する可能性が指摘されています。
実験では、生成AIによるアイデアを含むグループは、ストーリーの新規性や出版可能性の評価が向上することがわかった一方、「この物語は面白いか」という質問に関してのみ、生成AIを用いたグループの作品より低い結果となりました。ただし、この差は小さく「統計的に有意ではありません」と論文では述べています。

ビジネス

株式会社三菱総合研究所とエム・アール・アイリサーチアソシエイツ株式会社は、最新の生成AI技術を活用し、自社向けの業界動向レポート提供へ向けた技術開発に取り組んでおり、その成果の一部を、７月18日から8月30日の間試行配信の形で一般公開しております。

以下のURLにて閲覧可能です。

公正取引委員会の藤本哲也事務総長は定例記者会見で、生成AIの関連市場についての実態調査の実施を検討していることを明らかにしました。
AI開発に必要な大量のデータや人材、半導体などが少数の巨大IT企業に集中し、それらが競争相手に渡ることを制限するなど競争上の問題が起きる可能性があるとしています。

調査

ベネッセコーポレーションは「生成AIの利用に関する調査」の結果を発表しました。
調査は2024年6月24日〜26日、小学3年生〜6年生とその保護者1,032組を対象にインターネットで行われました。
生成AIを「知っている」子どもは23%で、「知らない」は昨年の調査より9ポイントダウン、生成AIを「知っている」と答えた保護者は53%でした。
「お子さまの生成AIの利用についてどう思われますか」という質問に対し、66%の保護者が利用に肯定的であり、昨年の調査より10ポイントアップ。否定的な意見は4.1%でした。

活用事例

三重県四日市市は、市に関するデータを学習し、実情に合わせた精度の高い回答を得られる生成AIを導入し、業務での活用を始めました。
導入した生成AIは、条例や市が行った調査の結果など専用のデータを学習する独自の領域を持ち、市の実情に合わせた精度の高い回答を得ることができるほか、インターネットなどを通じて市の機密情報が漏えいしないための対策がとられているのが特徴だということです。

ファッションECサイト「ZOZOTOWN」を運営するZOZOにおける活用事例です。
ZOZOでは生成AI活用を推進する専門部署を設けており、2023年6月に「生成AI業務活用プロジェクト」を発足し、24年3月までに23個のAIツールを開発し、業務効率化を図っているとのことです。
代表的なツールとしては、情報システム部門への問い合わせを自動化するツールや、売上管理のダッシュボートから、週別のサマリーを作成するツール、自社のWebサイト用の記事作成時に利用できる「記事のタイトル＆目次ジェネレーター」、「着用画像判定ツール」などがあるとのことです。
また、短期間で開発を行うために、プロジェクトを8つのフェーズに分け、ニーズ調査に時間を費やして利用率のかなり高いツールを作成することができたとのことです。

JR東日本は、RAGを活用した生成AIシステムを全社的に導入すると発表しました。
10月から全社で試用を開始する予定で、社内規定・文書を検索する作業の効率化を目指すとのことです。

プロンプトなど

ChatGPTでマーケティングを効率化する方法と事例についての紹介記事です。
テキストコンテンツの制作やデータ分析などの方法や事例、及びプロンプトの書き方について紹介されております。

法律など

日本新聞協会は検索連動型の生成AIサービスについて「報道コンテンツを無断利用しており、著作権侵害に該当する可能性が高い」とする声明を発表しました。「知的財産権の軽視とも言えるような風潮は関係法令が十分に整備されていないことが背景にある」として、著作権法の改正を含めた法整備を政府に求めております。

アメリカ上院商務委員会の委員長であるマリア・キャントウェル上院議員ら3人の超党派議員によって、クリエイターらが自分のコンテンツがAIのトレーニングに使われたかどうかを追跡できるようにする「COPIED法」の法案を議会に提出しました。この法案が施行されれば、コンテンツの所有者が付与した来歴情報を無断で削除し、生成AIのトレーニングなどに使用することが違法となります。

その他

東急株式会社、株式会社サイバーエージェント、株式会社ディー・エヌ・エー、GMOインターネットグループ株式会社、株式会社MIXIの5社は、2024年8月に小中学生を対象としたプログラミングイベント「Kids VALLEY 未来の学びプロジェクトpresentsプログラミングサマーキャンプ2024」を開催します。
プログラムはすべて無料で、以下のurlから詳細の確認及び申し込みが可能です。

世界中で長期連載されたマンガ『ディルバート』の作者、スコット・アダムスさん。彼は漫画家でありながら、催眠術の力を強く信じる催眠術師です。そのアダムスさんが、ChatGPTに催眠術を教えたことと、その結果について自身の配信番組で語りました。
｢とんでもないものができてしまいました。AIについてみんなアレコレ言ってるけど、それがよくわかりました。
ただ、みんなが言っていることとはちょっと視点が違うかも。自分がトレーニングしたChatGPT体験、とんでもなかった！｣
とのことです。また、危険すぎるのでプロンプトは一生公開することはないとのことです。

AppleやAMD、テスラなどを渡り歩いてさまざまなプロセッサの開発に携わった、伝説とも評されるエンジニアであるジム・ケラー氏がCEOを務めるAIチップメーカーのTenstorrentは、「NVIDIAがうまく対応していない市場」を狙ったAIチップを開発しているとNikkei Asiaのインタビューで明かしました。

IT系メディアのProof Newsが、AppleやAnthrpic、NVIDIAなどがYouTubeに公開されている17万本以上の動画の字幕をAIの学習に許可なく使用していたと指摘しています。
Proof NewsはAIのトレーニングデータに関する詳細な調査を行っており、その中でも特に、非営利のAI研究団体であるEleutherAIが作成した「The Pile」と呼ばれるデータセットに注目しました。このデータセットには欧州議会や英語版Wikipedia、捜査の一環で公開されたエンロンの従業員による大量のメール、そしてYouTubeの動画字幕をまとめた「YouTube Subtitles」などのデータが含まれていたとのことです。

OpenAIはYouTubeにおいて同社の動画生成AI「Sora」で作成した2人のアーティストによる動画作品を公開しました。
Tammy StudioのクリエイティブディレクターTammy Lovin氏とイマーシブスタジオ「Radical Realities」の共同創設者Benjamin Desai氏が作品を公開しました。
Tammy Lovin氏は利用してみて「共同創作しているような感覚がある」「チームワークのようで、最も理想的な形だ」と評価し「子供の頃から想像していたモンタージュやシュールなビジュアルを、実際に動画として表現できるようになった」としています。
一方、Benjamin Desai氏は「Soraでの創作はまだ実験的なプロセスであり、多くの反復と微調整が必要だ」とし、「魔法のボタン」のような簡単なソリューションではなく人間とAIのコラボレーションであることを強調しています。

OpenAIの従業員らが、匿名でアメリカの証券取引委員会に書簡を送り、OpenAIの違法行為について調査するように求めたとThe Washington Postが報じました。
The Washington Postが入手した7ページの内部告発文書によると、OpenAIは関係者に対して「過度に制限的で違法な秘密保持契約」を締結させており、これによって従業員と投資家の両方に対して内部告発を禁止したり、通報にまつわる権利を放棄させたりしていたとのことです。

汎用人工知能の研究に画期的な進歩をもたらすかもしれないとウワサされるOpenAIのAI開発プロジェクト「Q*(キュースター)」が、社内で積極的に取り組まれていることが伝えられました。
大規模言語モデルは人間が理解できる言葉を記述することに優れていますが、計算や数学的推論については比較的精度が低く、特に設問が長文になればなるほど回答を間違える可能性が高くなることが示されています。「Q*」はこの課題を解決すべく開発が進められているプロジェクトです。

GPT-4oなどの大規模言語モデルを開発するOpenAIが、大規模言語モデルの知能が人間レベルにどれだけ追いつけているのかを示すための評価スケールを作成したことを明らかにしました。
スケールはレベル1からレベル5まで、5つの段階で構成されており、レベルが進めば進むほど人間に追いついていると評価されます。
OpenAIは記事作成時点での大規模言語モデルはレベル1であり、レベル2に近づいているとしています。OpenAIによれば、レベル2は博士レベルの教育を受けた人間と同等の基本的な問題解決能力を持つシステムと評価されるそうです。また、レベル3は「ユーザーに代わって行動できる」、レベル4は「新しいイノベーションを生み出せる」、最高段階のレベル5は「組織全体の仕事を行うことができる」レベルに設定されているそうです。

映画レビューサイト「Filmarks」を運営するつみきは、生成AIで作成したWebコマーシャル動画を巡り、謝罪文を公開しました。「映画製作に携わるクリエイターの方々への敬意に欠けた、軽率な行動であった」とし、該当の動画などを削除したと説明しています。
Filmarksの公式Xアカウントは12日、全編をAIで作ったというコマーシャル動画を公開。「クリエイターとAI技術の融合によって見たことのないCMができた」などとアピールしていましたが、ユーザーはこの投稿に対して「映画や製作者をなめているとしか思えない」「何万何千人の映画従事者によって支えられてるか分かってない」など、生成AIを使ったことに対する批判する声が相次ぎました。他にも、「単純にコマーシャルとしてもあんまり良くない」など動画内容に対して意見する声もありました。

これまでの記事はこちら！

株式会社分析屋について

弊社が作成を行いました分析レポートを、鎌倉市観光協会様HPに掲載いただきました。

ホームページはこちら。

noteでの会社紹介記事はこちら。

【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします！

【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。

【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。

【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。

【SES】
SESサービスも行っております。