本__2_

「超」AI整理法 無限にためて瞬時に引き出す(第1章の1)

第 1 章 新しい情報大洪水の到来

1.コンピュータが「眼や耳を持ち」 使いやすくなった


◇コンピュータが使いにくかったのは「能力が劣っていた」から

これまで、コンピュータを使うのは面倒でした。
その理由は、2つあります。第1は、キーボードから入力しないと、指示や情報を受け付けてくれなかったことです。
第2は、一定のルールに従って、正確に杓子定規に入力しなければならなかったことです。例えば、パスワードを入力する場合、1字間違えても受け付けてくれません。大文字と小文字の区別を間違えただけでもだめです。また、アプリを利用したり、表計算ソフトを用いて計算をしたり、データベースからデータを得る場合にも、決められたルールに従わなければなりません。
コンピュータが高級な機械だから使いにくいのではなく、コンピュータの理解能力が低いために使いにくかったのです。
それが簡単になりつつあります。その大きな理由は、以下で述べるように、コンピュータが眼や耳を持つようになったことです。


われわれはいまやカエサルを超えた
まず、数年前から、コンピュータを使う口述筆記が誰でも簡単にできるようになっています。第4章で詳しく説明するように、スマートフォンに向かって話せば、それを聞き取って、テキストに直してくれます。つまり、いまやコンピュータは耳を持っており、われわれが話していることを聞き、理解し、筆記してくれるのです。
その場合、厳格なルールに従って正しい発音で話す必要は、必ずしもありません。少し言い間違えても、コンピュータは正しい内容を理解してくれます。
ユリウス・カエサルは、『ガリア戦記』を、馬上から口述筆記で書いたと言われています。これは、カエサルが権力者だったからできたことです。普通の人が文章を口述筆記するのは、これまで、あまり簡単なことではありませんでした。
ところが、音声入力が可能になったので、われわれは2000年前の権力者と同じことができるようになりました。いや、同じではありません。それ以上です。なぜなら、カエサルといえども、真夜中に思いついたことを即座に口述筆記させることはできなかったろうと思われるからです。それに対してわれわれは、スマートフォンを枕元に置いて寝るだけで、真夜中であっても、簡単に口述筆記ができます。
文字通り、いつでも、どこでも思いついたことを文章にできます。ジョギングしながらでもできるし、主婦が料理をしながらでもできます。われわれが文章を書く環境は大きく変わりました。


◇眼を持った百科事典が出現
公園を歩いていたら見慣れない花を見ました。この花は何という名前でしょう? 写真を撮れば名前を教えてくれるスマートフォンがあれば便利ですが、そのようなスマートフォンは存在しません。花の名前は物識りに聞くしかありません。ついこの間まで、私はこのように考えていました。
しかし、そのようなスマートフォンのアプリがついに現れました。
グーグルが無料で提供する画像認識サービスであるグーグルレンズを用いると、撮影したものが何であるかを教えてくれます。グーグルレンズの具体的な使用方法は第5、6、7、8章で述べますが、それに先だって、まず手始めに、ミカンを撮ってみましょう。
下の写真はスマートフォンのスクリーンショットですが、上にあるのは、私がカメラで撮った画像。「Googleレンズ」というところに示されているのが、グーグルの検索結果です(時間遅れなしに、すぐさま示されます)。写真に写っている映像がミカンであることを、みごと認識しました! すごい! ついに百科事典は、眼を獲得して外界を認識し始めました!

ミカンだけではありません。
そのことを印象的に教えてくれたのが、下の写真です。
これは、私が持っているサルバドール・ダリのリトグラフの一部分なのですが、作者を「Salvador Dali」と正しく言い当てました!
写真の中に、「ダリ」という文字は一切ありません。絵の特徴だけでダリだと判断したのです! 私の家への来客で、このリトグラフの作者がダリだと分かった人は、ごくわずかしかいません。グーグルレンズの能力は、すでに多くの人たちを上回るまでになっています。


◇文字を読み取り「あっという間に検索」
グーグルレンズは、印刷された文字を読み取って、テキストに変換してくれます。これによって、検索が実に簡単にできます。
書籍などの印刷物にある言葉の意味を知りたいと思ったとき、これまでだと、PCあるいはスマートフォンを起動し、検索ウインドウを開き、その文字を入力するという作業が必要でした。
ところが、グーグルレンズを使うと、その文字をグーグルレンズで映し、検索のボタンを押せば、すぐに意味を教えてくれます。つまり、画像からシームレスで検索できるようになりました。
下の写真は、病院で渡された血液検査の結果です。たくさんの項目が並んでいますが、いちいち調べるのが面倒なので、問題を指摘されない項目は、意味を理解しないでそのままにしていたものもありました。ところが、グーグルレンズを使えば、あっという間に分かります。例えば、この写真にあるように、長年謎であった「ヘマトクリット」が何であるかを、簡単に知ることができました。薬についての詳しい説明も分かります。


これまでも、短い単語であれば、スマートフォンで音声による検索ができました。しかし、人前で声を出すのは憚られました。このため、使いにくかったのです。それに対して、グーグルレンズの検索なら、どこでもできます。
外国語の場合には、とくにロシア語や中国語や韓国語の場合には、発音が分からないので、音声入力はできません。キーボードや仮想キーボードから入力するのも簡単ではありません。しかし、いまやどんな国の言葉も簡単に翻訳や検索ができます。
私のある友人は、外国旅行中に、ホテルや街にある観光地図、パンフレットなどに印刷されている地名・人名・史跡名などを片端からグーグルレンズで読み取って、あっという間にその土地についての専門家になったそうです。
いまやわれわれは、どんな外国語も読め、森羅万象と歴史と文学とあらゆる学問に通暁した世界一の物識り博士を、いつでも引き連れているような身分になったのです。
コンピュータは、単に眼や耳から情報を取り入れているだけではありません。その情報を処理しています。そして、人間よりはるかに高速で処理しています。
グーグルレンズを使っていると、「カメラというのは眼にすぎず、重要なのはその後ろにある脳なのだ」ということがよく分かります。
日本のカメラメーカーは、優秀な眼を作ることに専念しました。しかし、ついに脳を作ることができませんでした。
また、日本のエレクトロニクスメーカーは、優秀な録音機を作り、世界を制覇しました。しかし、やはり脳を作ることができませんでした。
キヤノンやニコン、ペンタックス、ソニーなどが華々しく活躍した時代は、ついこの間のことのように思っていたのですが、実は、はるか昔のことになってしまったのです。

◇人間とコンピュータの境界面が変わった
ここで、コンピュータの使い方の変遷を、図表1-1のようにまとめてみましょう。

1と2は、従来からの利用法です。いずれも、キーボードから入力します。1では、それがテキストとしてコンピュータが処理できる形になります。ワードプロセッサなどの利用がこれに当たります。2では、入力したキーワードを含むウェブサイトが表示されます。
3と4は、ここ数年来可能になっている音声入力方式です。3では、スマートフォンなどに向かって話しかけると、テキストが出力されます。4は音声検索です。スマートフォンなどに話しかけると、ウェブサイトが表示されます。スマートスピーカーに話しかけると、答えを音声で返してくれます。
ごく最近の時点で可能になりつつある方式が、5と6で示されています。入力されるのは、画像です。
5は、写真に写っている対象が何であるかをコンピュータが理解し、それと同じ対象や概念などが含まれているウェブサイトを表示する機能です。それによって、われわれは、対象物が何かを知ったり、詳しい情報を得たりすることができます。
6は、文字イメージ(印刷された文字やURLなどの記号)をコンピュータが認識し、それらをテキストデータ(文字や数字などのデータ)に変換する機能です。印刷された文字などがテキストデータになれば、メールで送ったり、翻訳したり、編集したり、計算したり、URLによってサイトを開いたりすることが自由にできます。
人間とコンピュータの界面をインターフェイスと言います。ここで述べたのは、インターフェイスが変化し、人間とコンピュータの距離が縮まったということです。インターフェイスが改善されると、これまではコンピュータを用いていなかった人も、簡単に利用できるようになります。




・「超」AI整理法(note版)目次


ここから先は

0字
動画説明は書籍版と別のものです。写真は、書籍版にないものも掲載しています。書籍版への追加は、随時、更新する予定です。

『「超」AI整理法』(KADOKAWA、2019年6月)のnote版です。本文は基本的に書籍版と同一ですが、「超」メモ帳とアイディア製造工…

この記事が気に入ったらサポートをしてみませんか?