見出し画像

ナナロク世代とAI

理系の学生にちょっとした仕事を頼んだ。

「画像形式をどうするか聞かれたんですけど、ジェーイーピージーとかピーエヌジーとかどれを選べばいいですか」

そうか。理系といっても情報系じゃないから、JPEGをジェイペグと読むことを知らないのか。

ファイル形式の違いは、その形式フォーマットが生まれた背景を理解しないと適切なファイルを選べない。なるほど。

ひょっとすると僕はこのnoteを最近の読者が読むには少し難しく書き過ぎていたのかもしれない。最近は大学の講義が多いので、講義をきっかけに僕に興味をもってくれた学生がいたとしても、僕の記事は読み方さえわからない言葉がたくさん出てきてわけがわからない教科書みたいに見えているのかもしれない。これが老いるということか。

ほとんどの読者は、実はさりげなく置いてけぼりになっているのではないか。それでも今は少子化でナナロク世代(1976年生まれの人)以降の老人の方が多いから、別にこれでもいいのか?そこに関してはよくわからない。


念の為説明すると、JPEGジェイペグは、写真のように階調が滑らかに変化する画像を圧縮するために設計されていて、デジカメのフォーマットとしてよく使われる。PNGピングは図面のように1ピクセル1ピクセルを正確に再現するように圧縮する。

JPEGは画像が写真のように滑らかな階調変化があって自然物を主に圧縮すると言う前提で圧縮を行うので圧縮率が高いが、その代わり情報の多くは失われる。だからデジカメのプロやマニアはRAWロウというレアの形式で保存してPC上で修正レタッチする。

製図のように少しでも元の情報が変化したらまずいものや、丸いアイコンのように、画面の一部を透過させたい場合、JPEGではどうにもならない。そこでPNGという形式が生まれた。PNGは完全な情報を復元できるかわりに、圧縮率が低い。

写真のようなものを大量に扱うにはJPEGでも良くて、カッチリした情報を扱うには少なくともPNGでないといけない。

んで、吾輩がなぜこんなことを知っているかと言うと、吾輩の世代、つまりいわゆるナナロク世代は、子供の頃からコンピュータに触れてきて、JPEGもPNGもない頃、というか汎用的な画像圧縮フォーマットなんか存在してない頃からプログラムを書いてきている。

圧縮アルゴリズムも自分で書かないと簡単なゲームすら作れない。しかもゲームをちゃんとした速度で動かすには単にアルゴリズムやプログラミングを知っているだけではダメで、グラフィック描画チップを直接使ったり、アセンブリ言語で書いて高速化したり、CPUが1クロック進むたびにどの命令に何ナノ秒かかるのか、その時のパイプラインの動きはどうなっているか、など細部までの知識が必要なので、一見すると大したことのないようなゲームを作るのでも、膨大な知識を必要としたのである。

そうして自分の成長とともにコンピュータのソフトウェア基盤も成長していき、独自の圧縮形式が色々出てきたと思ったら、最終的にJPEGとPNGが出てきて、最近はまたHEICとかwebpとか高性能(と思われる)ものも出てきて現在に至るというわけだ。

要は、ナナロク以前の世代の人間はRPGのように、乏しい初期装備から少しずつ使えるスキルやアイテムが増えてきたのでコンピュータが持つ性質や昨日のほとんどのことを知っているのだが、今の20歳くらいの子達は、最初に触ったのがiPhoneみたいな世代もぜんぜんいるので、これはもうRPGでいえば、フル装備の状態でゲームが始まって、アイテムの意味も必要性もわからないところからスタートする、という状態に等しい。

これは偶然ではなく、1976年に日本で最初の個人用マイコンであるTK-80ティーケー・ハチマルが発売されたからだ。しかも、発売日は僕の誕生日と一日違いなので、僕からしたらマイコンは双子の弟のようなものだ。親父も、そう思っていたらしく、親父はTK-80の勉強会に参加し、生まれた時から僕をコンピュータの専門家に育てようと思っていたと言う。生まれてきた息子のために高卒で専門知識が乏しいにもかかわらずコンピュータの勉強を独学で始めた。

そういう親が全国あちこちにいたのが1976年以降の世界なのだ。これがナナロク世代が少し特別だった理由だと思う。

今で言えば、去年あたりから突然「AIをやる」と言い出した人が増えた。それまでAIなんか興味なさそうだった、というよりも、完璧に無視していた人までもが「AIがAIが」と言い始めた。でも彼らはChatGPTという、「完成品」のAIしか知らないので、それが実際はどんなものなのかちゃんと理解せずにただビックリしたり可能性を過大評価したり、過大評価したまま誇大広告をしていたりした。今はさすがにそういう人は減っていったが。

ナナロク世代の成長とともに成長したのが人工知能だ。僕が最初のニューラルネットワークを書いたのは小学生の頃で、人工無能を書いたのは中学の頃だ。ニューラルネットは当時でもすでに胡散臭いものだったが、僕はその胡散臭さが気に入っていた。

ニューラルネットの魅力は、「理由はよくわからないが人間や高度な知能を持つと思われる動物の脳細胞はこんな感じで情報を伝達しているので、それをプログラムで再現したら同じように学習できるのではないか」というアイデアだ。まったく、馬鹿げている。だけど、だからこそ最高なのだ。この、「よくわからないけど形から真似してみよう」という行き当たりばったり精神がニューラルネットの最大の魅力だと思う。だから人生の節々で何度もニューラルネットを作っては「どうすればこれはいつか何かの役に立つ日が来るんだろう」想像して楽しんでいた。

僕は最初の会社を2003年に作ったが、定款には「人工知能の研究開発」という目的を入れていた。でもその頃は「人工知能の研究開発」で飯を食うなんてことは寝言もいいところだった。だからちゃんと「ソフトウェアサービスの企画開発運営」も入っていた。

もちろん僕は西暦2003年時点の人工知能がぜんぜん役に立たないことをよく知っていた。何度もニューラルネットを書いては「使い道がない」という結論に至っていたからだ。

それでもいつかなんとかなるのではないかと僕は大学の研究室にも入らずに中退したくせに人工知能学会の個人正会員になって毎月送られてくる論文誌だけはせっせと目を通していた。10年経っても目覚ましい成果が出ないので半ば諦めていたのだが、2013年に人工知能技術の応用製品として手書きタブレット端末を作ってみた。手書き文字認識エンジンそのものを自作することも考えた(SVMによる試作まではした)が、そこに時間を使いたくなかったのでそれはライセンス品を使った。

いつだって僕は基礎研究がしたいのではなくて応用を考えたいのだ。

ところが手書きタプレットを作ったら、僕が人工知能に興味があるということが周囲にバレてしまったらしく、「ディープラーニングをやんなせえ」と言われた。2013年。誰もそんな言葉を知らない時期だった。

なぜなら、ヤン・ルカン(MetaのAI研究所トップ)、ジェフリー・ヒントン(当時のGoogle AI研究のトップ)、ヨシュア・ベンジオ(モントリオール大学)の三人の共著による「ディープラーニング」という論文が米Nature誌に掲載されたのは2015年なのだ。

ただ、「4層以上の深い階層を持つニューラルネットワーク」が最近どうもうまくいくようになってるらしいぞ、という噂は2011年あたりから論文になってきていて、2012年末には4層以上のニューラルネットワークが画像認識コンテストの上位を総ナメして人工知能業界に激震が走っていた。

ちょうどまさにその時、ぼくは「(ニューラルネットで手書き認識をする)手書きOSをつくる」という寝言めいたことを大々的にプレスリリースで言い出したので、人工知能業界の人に「あいつにちょっかい出したら面白そうだ」と思ってもらえたらしい。

僕は人工知能の研究がうまくいきそうな気配を見せては惨めに敗北していくのを実体験として経験していたため、「それ今までのと何が違うんですか」と聞いたら、「今までのとほとんど同じだが、性能が桁違いにいいんだ」と説明された。

そんなバカなことってあるのかよ。

それでも、予算と人を出してくれるというので半信半疑で「ディープラーニング」を研究してみることにした。すると、確かに今までのとほとんど同じやり方だが、決定的に性能が高いものに変わっていることがわかった。

そしてこの時点でようやく、「ディープラーニング」が応用可能な人工知能技術に到達したことを理解した。僕はなんでも自分でプログラミングしてみるまで信じない。全部をゼロから作るわけではないが、少なくとも自分がプログラミングして「使える」状態になっているかどうかは凄く気にする性格なのだ。

ただ、この時点でも人工知能がなんの役に立つのかさっぱりわからないとみんなが思っていた。僕の会社の社員ですら大半は「なんに使えばいいのかわからない」と思っていたのではないかと思う。というのも、まだこの時点では「なんでもできそうで、でも今はまだなんでもできるわけではない」というものでしかなかったからだ。

だから最初は「一緒に研究やりませう」というクライアントとやるしかなかった。でもこのやり方だと、ビジネスとしてスケールしない。

「AI使って一緒に儲けましょう」に到達しないとビジネスは成長しないので、新しい会社を作ってAIの社会実装をすることにした。2017年だ。そしてようやく、「AIを使ってお客さんのお客さんが喜び、そしてお客さんが儲かる」ということを実現できた。これが実現できた会社はまだ日本はもちろん世界にも少ないのではないかと思う。

僕はB2Bにおいては離脱率チャーンレートを最小化することが最も重要だと思っていて、実際、これまでに作った僕の会社はどれもチャーンレートも離職率も凄く低かった。

新規の営業先を開拓することより既存顧客の売上と利益を拡大し、パートナーとして共存共栄するほうが遥かに効果的で、簡単だからだ。

最近読んだいくつかの営業にまつわる本は、どれもお客さんに必要なさそうな商品を無理やり売りつける話で胸が痛くなった。

https://amzn.to/3JXWoLg

ビッグモーターが再出発するそうだが、ビジネスを拡大しようとするときに「誠実であること」「お客様本意であること」と言う前提を持たないとなかなか難しいところがある。

新規営業というのはとても効率が悪いのである。
まず、与信の問題がある。相手をどこまで信用していいのか。帝国データバンクを使ったところで本当の状態はわからない。想像するしかない。

仮に経営状態が良好な会社でも、テレビCMをガンガンしていても、契約書の通りにお金を払ってくれない会社なんかいっぱいある。もしくは契約書そのものにたくさん罠がしかけてあって、仕事を全うしてもぜんぜんお金が払われないような仕組みになっていたりすることもある。そういうことをしてこない会社は、規模の大小にかからず優良顧客と言える。

だから新規を伸ばすより既存顧客との信頼関係を構築して共存共栄する方がずっといい。そのためには、実は顧客を選ぶ選球眼が大切になる。顧客だけでなく、顧客を取り巻く環境、業界状況、業界における顧客の地位、将来性、経営の蓋然性などを考慮に入れて「顧客を選ぶ」のである。

さて、そういう感じになるとビジネスが回ってしまう。ビジネスが回ると、僕が本来やりたかった「AIの面白い応用法を考える」ということがやりにくくなってくる。

だからまあさっさと引退させてもらって、今は好き勝手にやっている。

実際問題、百人規模の会社を二回くらい作ってしまうと、もういい加減慎重になって、次はできるだけ少人数でやろうというところになる。これも成功体験を持つほとんどの経営者に共通していて、僕の知っている上場企業の創業者はだいたい、生きるのに困らなくなると資産運用は専門の会社に任せて、最小人数の組織で行動しようとする。組織が大きくなると、組織のことに頭を悩ませる時間が多くなって自分が本当にやりたいことに集中できなくなるからだ。

そういう意味ではナナロク世代の経営者仲間たちも、引退して自分が本来やりたいことに全ての時間を使うモードに入ってくる人が増えてきた。

はてな、mixi、スマートニュースのマネタイズに絶大な力を発揮した川崎裕一も今年の3月にスマニューの役員を引退したし、スマニューの鈴木健も引退はしてないが社長を退いた(社長なんかそんなに長くやってもいいことなんかひとつもないから僕も社長をはやく辞めた方がいいと鈴木さんに進言した一人だ)。

まあ他にも具体的な名前はあえて挙げないが、「こいつすごい経営者だったなあ」と思うような人たちがどんどん引退して毎日好き勝手に暮らしていて、50を目前にして逆に30歳の頃に戻ったような感覚でウェイウェイやってる最近の生き様が僕は結構気に入っている。

僕が前の会社を作ったのは第三次AIブームの時だったが、引退するとすぐに第四次AIブームが来た。もはやAIはブームではない。これからはブームではなく「世代」と呼ばれるようになるだろう。

もはや生成AIは、第四世代のAIと呼ぶべきだろう。その先も、きっとある。しかもけっこうすぐ。

だいたいの技術は第三世代を過ぎないと成熟しない。WindowsだってMS-DOSだって3.0までまともに動かなかった。MacOSもそうだったじゃないか。

第五世代のAIはどうなるだろうか。それを想像するだけで楽しみだ。
マイコンと一緒にうまれて、一緒に成長できて、俺は本当に幸せだなあ。