![見出し画像](https://assets.st-note.com/production/uploads/images/140649591/rectangle_large_type_2_4524adad355e4d98b471e9f0b6d8d287.png?width=800)
ついに新聞が読めるようになった「GTP-4o」。「AIを携え、あえて紙媒体を探索する時代」「アナログとデジタルが本格的につながる時代」に突入した
Open-AIは5月13日、最新の「GPT-4o」のサービスを開始しました。公式サイトによると、GPT-4oの「o」は「全て」を意味するOmni(オムニ)に由来します。文字通り、テキストとオーディオ、画像を扱うことができ、それぞれを複合的に組み合わせて高度な解析や生成をすることができます。組み合わせるという意味は、公式サイトの「Explorations of capabilities」というところを見るとよく分かります。例えば、顔写真をアップロードし、「ハリウッド風のポスターに仕立てて」と頼んだり、インタビューの音声ファイルをアップロードし、「テープ起こしをして、記事にまとめて」と頼んだりできます。同じようなことができる他の生成AIもありますが、汎用チャットAIとしては精度と応答速度がかなり向上しているのが特徴です。
「新聞」を読めるとは―衝撃の日本語OCR精度
GPT-4oの出現は、なにより日本語ユーザーにとって衝撃的ではないかと思います。というのも、日本語のOCR性能が飛躍的に高まっているからです。特に個人的に、紙媒体の「新聞」が読めるようになったインパクトはかなりのものです。ChatGPTだけでなく、Claude3にしても、これまで紙媒体の新聞を正確に読むのは極めて困難でした。これができるようになったことで、「AIをパートナーに紙媒体を探索する」という紙媒体の新たな地平が開けるのではと期待しています。
静岡県知事選の記事を読ませる
試しにGTP-4oに静岡新聞を読ませてみます。1面肩にある静岡知事選の関連企画の記事を読ませたいと思います。
![](https://assets.st-note.com/img/1715707559981-abpyO9SZze.png?width=800)
このままでは、余計な情報が入ってしまうので、精度を上げるために周囲をマスクします。裏紙なんかで適当に周囲の記事を隠せば大丈夫です。
![](https://assets.st-note.com/img/1715711002577-eeX5NJr981.png?width=800)
マスクしたら、ChatGPTのアプリを入れたiPhoneで写真を撮ります。今回はプロンプトはごく簡単に「この新聞記事のポイントを箇条書きで挙げてください。」などとしました。
GPT-4oの返答はこんな感じです。
静岡県の現状:人口減少問題と若者の転出
人口減少の現状
静岡県の人口は2009年に379万人だったが、2024年には353万人に減少すると予測されている。
若者の転出が人口減少の主要な原因となっている。
労働力不足の深刻化
若者の転出により、県内の労働力不足が深刻な問題となっている。
地元企業は人材確保に苦戦している。
若者の「働きがい」を高める必要性
若者が県外へ出て行かないようにするためには、「働きがい」を提供することが重要である。
地域の魅力を高める取り組みも必要である。
具体的な取り組み
地元企業や自治体が若者の定着を目指して様々な取り組みを行っている。
働きやすい環境の整備や地域の活性化が進められている。
将来的な見通し
労働力不足の解消には長期的な取り組みが必要。
地域の持続的な発展が求められる。
一度記事を読み込めてしまえば、あとはいかようにもできますね。短い記事にまとめさせたり、ビジネスアイデアを挙げさせたり、クイズを作らせたり―。新聞のデジタル版は新聞に載っている情報全てを網羅しているわけではないので、やはり紙媒体を情報収集のプラットホームにするのは意義があると思います。これからは新聞を読むときのパートナーにAIが使えるわけです。言ったら「AI池上彰さん」が傍らにいてくれるようなもんですよ。興奮しませんか。
同じ記事を試しにGPT-4で認識させてみるとこんな感じです。
新聞記事の内容を箇条書きで以下のようにまとめました:
・2024年の年間予算案が発表された。
・総額は60兆円で、前年と比較して増加している。
・主な予算配分は、①公共事業に20兆円、②防衛費に15兆円。
・防衛費の増加は、地域の安全保障の強化のためとされている。
他に詳細な情報や特定の部分についても知りたい場合はお知らせください。
ご覧の通り、ハルシネーション(AIによる誤った回答)が甚だしいですね。これまでChatGPTに新聞を読ませようとしても、こんな感じで全く実用性がなかったわけです。
リニア中央新幹線工事の記事を読ませる
もう一つやってみます。14日付静岡新聞の1面トップ記事です。先ほど同様に裏紙で簡単にマスクし、周囲の情報をカットします。
![](https://assets.st-note.com/img/1715712107168-qRohFQ17LL.png?width=800)
iPhoneで撮影し、記事のポイントを箇条書きするよう指示を出しました。GPT-4oの回答はこちらです。
この記事のポイントを箇条書きで挙げます。
1. 県内のボーリング調査がリニア中央新幹線のトンネル工事に伴い再開されることが決定。
2. 県専門部会がリスク管理が適切であると認めた。
3. JR東海が来月中旬にもボーリング調査を再開予定。
4. 県専門部会は水源に大きな影響を与えないとの見解を示し、安全性の確保を求めた。
5. 調査結果を住民に対して適切に説明することが求められている。
6. ボーリング調査は地下水の流動や水質を調べるために行われる。
7. リニア中央新幹線のトンネル工事は県内の経済発展に大きな影響を与えるが、住民の懸念も大きい。
8. 調査の再開により、住民の不安が払拭されることが期待されている。
さらに、「この記事を中学生でも分かるように説明してください。」と指示しました。回答はこちらです。
この記事を中学生でも分かるように説明します。
---
県内で地下に穴を掘る「ボーリング調査」が再び始まることになりました。これは、新しい高速鉄道「リニア中央新幹線」のトンネル工事に伴うもので、地下水への影響を調べるためです。
県の専門家たちは、このボーリング調査が安全であり、水源に大きな影響を与えないと判断しました。また、調査結果を住民に対してしっかりと説明することを求めています。
リニア中央新幹線のトンネル工事は、地域の経済発展に大きな影響を与えると期待されていますが、住民の間には工事による地下水への影響を心配する声もあります。今回のボーリング調査が再開されることで、こうした住民の不安を少しでも和らげることが期待されています。
---
これで、記事の内容が中学生にも分かりやすくなったと思います。
ちなみに、マスクせずに全体を撮影した場合、見出しを重視して認識し、本文については全く触れない回答が返ってきました。マスクが必要なくなればより利便性が増すのですが、なかなかそこまでは行っていないようです。
アナログとデジタルの世界がつながる
求められる「AIフレンドリー」な紙面
一方でこうした"ペイン"(不便さ)が新聞社にとって新しいサービスのヒントになります。マスクをせずにどこまでが一つの記事なのかをAIが簡単に認識できるようなレイアウトをしたり、罫線を工夫したりすれば、紙の読者の利便性やUI/UXが飛躍的に高まっていくと思われます。1年後の紙面は、AIでも読みやすい「AIフレンドリー」が当たり前になっているかもしれません。そう、「AIフレンドリー」こそが、これからの紙媒体にとって重要な合言葉になるでしょう。今や当たり前に紙面に掲載されているQRコードと同じような経緯をたどることが予想されます。
デジタル化のボトルネックが解消
OCRの認識精度はこれまで日本の新聞社にとってはデジタル化の大きな障壁の一つになっていました。AWSの担当者さんともつい最近、そのあたりがボトルネックですよね、と話したばかりでした。この1~2年のAIの進歩のスピードには本当に驚かされます。
新聞社には毎日、手書きのファクスや不定形のプレスリリースが大量に届きます。これらを毎日仕分けして日々のカレンダーで管理するのは重要な仕事の一つですが、なかなか大変な仕事でもあります。①「ファクス」→②「PDF化」→③「OCR」→④「件名と日付、開始時刻、内容を抽出」→⑤「カレンダーに入力」という作業は、今後、③④をGPT-4oに投げ、出力をGAS(Google Apps Script)などでグーグルカレンダーに流し込む、なんてことが可能になるかと思います。まさにこれまでできなかったアナログからデジタルへの変換も今後はどんどん進んでいくことが予測できます。
おわりに
GPT-4oの登場で「AIのパートナーを携え、あえて紙媒体を探索する時代」「アナログとデジタルが本格的につながる時代」が到来しました。アナログの世界をバンバン撮影してAIに見せてあげ、どんどんデジタルの世界と繋げてもらいましょう。これまでにない変革が起きてくる予感がします。
この記事が気に入ったらサポートをしてみませんか?