「言葉・言語には値段がある」 データサイエンティスト・原田博植さん
見出し画像

「言葉・言語には値段がある」 データサイエンティスト・原田博植さん

グルーポンやリクルートで、データサイエンス部門の主導的な役割をつとめ、2015年に「データサイエンティスト・オブ・ザ・イヤー」を受賞するなど、データ分析の草分け的存在である原田博植さんに、就活生にも役立つ”これからの社会人にとって必要なこと”を色々教えていただきます。

動画でご覧になりたい方はこちらをクリック


原田:今、「人工知能の時代」って、「人間語」「機械語」って簡単に考えてもらったらいいと思うんですけど・・・

ミイナ:「人間語」って言わないじゃないですか。きっと、「C言語」とか「Java」とかそういう機械言語を普通に扱ってきた方からすると逆に「人間語」って言いたくなっちゃうんだな・・・っていうのが面白いと思うんですけど。

原田:やはり「人間語」の方が、まだまだ多次元だと思うんですけど。本当にちょっとした空気を読んで返すとか、その瞬間に得た情報でこういう風に返すっていうのって、特に日本語だけでもすごいじゃないですか。よく言うんですけど、うちの会社とかビジネスマンって、新卒一年目だとまだエンジニアになって「機械語」学ぶ前に「日本語」出来てない状態だから・・・ってよく言うんですよ。メールの文面とか出来てないとか、上司への会話が出来てないとか、「てにをは」がおかしいとかって・・・(笑)これはまだ社会、社会っていうか企業行動の中で生産性・パフォーマンス性上げるために必要な日本語がまだ出来てないっていう状態だと思うんですよ。

ミイナ:うんうんうん。

原田:だから、こいつはもう「日本語良いから、機械語やらせとこう」っていうのが最近までの開発者っていうかエンジニアの部門だと思うんですけど、もちろんそれ両方できる人がどんどん、日本語できる、英語できる、中国語できる、で「Python」出来る、「R」できる、「SK」できるとかで、どんどん全部できる人が全部のハブになっていくじゃないですか。

ミイナ:私も会社で働いて、いかにデータがわかるかっていうのがすごい大事で、パワポ、Excel、Wordが出来るっていうのが今までの社会人の当たり前だとしたら、それプラス、データの読み方とか、そのデータを作る・分析するっていう方と、分析されてあがってきたデータのどこを見るかっていうのと、どっちもリテラシー必要なんですよね、実は・・・。(視聴者に)就活中の大学生の方とかもいると思うんですけど、その辺はどうですかね。

原田:実質、履歴書とかでそういう風に見られてると思うんですよね。履歴書に例えば日本語、英語、中国語って書いてあれば、明らかに「じゃあ中国語案件を任せられるのかな」とか「じゃあ海外事業、この子はポテンシャルあるのかもしれない」ってもちろん思われますし、かつその横に「Python」、「R」とか、機械語書いてたら「あ、これも出来るんだったら・・・」っていうところで、結局「言語としてどれだけの幅があるか」っていうことが見られてる。

ミイナ:そうですよね、数字とかそういう論理的な思考とかが出来るのかどうかっていう指標にもなってきますしね。

原田:本当にデータ分析、読み書きになると思うんですけど、Excelで数字だけ使うっていうのはたぶん限定的な分析しか出来ないと思うんですけど、例えばデータが大量、数字も大量になるとExcelじゃ処理出来なかったりしますし、言語レベルになると相当、大量のデータとかいろんな種類のデータっていう。さっき一番最初にお伝えしたみたいなビッグデータの本当に根幹である種類、量みたいなところが、分析のための言語とか、データを扱うためのプログラミング言語で扱うとどんどんいっぱい処理できるようになりますし。プログラミング言語もやったら無駄にならないんで。結構、分析ツールとかでツールによると、トレンドがあるんで、データ分析ツールにやたら詳しくなっても、流行が終わったときにダメになっちゃう可能性が非常にあると思ってて・・・。

やっぱり「データ分析」ってそのデータをどう扱うかとか、さっきも「受け取るほうが大事」って言いましたよね・・・。まさしくそうで、データ分析して出す人と、受け取って咀嚼して実行するっていう、そこのひと繋ぎで、ずっとしっかり考えて基本的には一般性のあるやり方で扱ったほうがいいんで、やっぱりプログラミング言語でデータ分析するっていうのがいい気がしますね。

*****Dooo*****

原田:自分の考えとして「言葉・言語には値段がある」と思ってまして。

ミイナ:ありますね。

原田:ちょっと前だと日本が曲がりなりにもジャパン・アズ・ナンバーワンで、アメリカ・ニューヨークでビルを買っている時とかは、日本がまぁ世界一の経済大国だから日本語の価値が滅茶苦茶上がったと思うんですよ。で、こんな難しい言語なのにアジアの人たちがみんなマスターしたりとかっていうのも、その時経済大国であり、そこの言葉の値段が上がってるんですよね・・・。

で、それで言うと、データ・言葉・通貨って結構似てると思ってまして、 「金兌換制度」から、「ドル基軸通貨」になるってことは「ドルが安定している」っていことなんですよ・・・。で、ドルに紐ついて「英語が安定してる」とか、意外と繋げて考えられまして・・・。

今、中国がワァー!って上がってきてるのは、やっぱり「中国語の値段」が上がっていってるんですよね。で、そういう中でやっぱり「言語の値段」っていうのが、価値っていうかね。すごくドライに見た言い方ですけど、あるな・・・と思ってまして。

ミイナ:ちょっと悲しいですけど、日本語の価値は下がってきちゃってますかね・・・

原田:はい、ただでさえ難しいのにね・・・というところがありまして。

ミイナ:私も「言語の値段」は、すごく実感していて、「経済圏に自分を組み込める」っていうことなんですよね・・・。「コスパ」が良い言語とかもあって、例えばインドネシア語って世界で一番勉強するのが簡単なんですけど、ローマ字ですし、ピジン(英語と中国語の混成語)って言って、多言語を話す人たちが共通言語として定着させた言葉なので難しくないんですよ。覚えやすくて、人口もあって、これから経済成長もするって考えると、実は滅茶苦茶コスパいいんですよね。中国語は難しいと思うんで。ただ日本人にとっては漢字が読んで書ける分、すごいほかの国の人に比べたら中国語学ぶ上で下駄はいてるんですよ。

原田:そうですね。中国語って簡体字繁体字があるじゃないですか。簡体字って信じられないくらい省略してるんですよね。

ミイナ:びっくりしますよね。

原田:で、あれ省略してるって何かって言うと、書くのが早くなるじゃないですか。で、ものすごいコストカットというか効率をぐーって上げてて、看板一つ書くにも、繁体字のぎっちぎちに詰まった看板を作るのと、簡体字で・・・画数がそれこそ20画から3画。そうすると看板のコストも下がってるし、看板の物理的な鉄のコストが下がるとかの比較にならないくらい、意思伝達が早くなりますよね・・・。今、本当にインドネシア語が「学ぶコスパが良い」っていうのとまったく一緒で、子供も早いうちから経済に入れますし、ほかの国も入りやすいし、中国の中の意思伝達も早くなるんで、国総じて文字を簡単にするっていうのをバッてやるってすごいなと思いまして・・・

*****Dooo*****

ミイナ:人生を変えた本とか映画ってありますか?

原田:映画がちょうど「AI映画」みたいなのが、最近パタパタ出てて・・・スパイク・ジョーンズが監督でスカーレット・ヨハンソンがAIの役の「her(her/世界でひとつの彼女)」っていうやつとか。

ミイナ:あー、ありましたね。

原田:それがちょうど最近の「AI映画」みたいな感じの中で、よかったんですけど。ちょっと見る人がみたら不気味なのかもしれないんで。

ミイナ:herは結構見終わった後に何度も思い出したりとかしましたね。自分の中でやっぱりAlexaとかSiriが身近じゃないですか。日々使うし。あれが今後どうやばくなっていくのか、みたいなのが、ちょっと垣間見えたので。

原田:うちもコーポレートムービーを作ったんですけど・・・まぁ、男女逆転herみたいな、「his」にしてるんですけど。hisアルゴリズムという風に。1分半の動画なので、是非見て頂いてご感想をいただければと。

*****Dooo*****

ミイナ:最近気になったニュースはありますか?

原田:最近気になったニュースなんですけども、AIが描いた絵、肖像画っていうのがありまして。どういうことかっていうとAIのプログラミングで機械学習っていうのがあるんですけど、その機械学習にいろんな肖像画をどんどん勉強させる。機械学習ってアルゴリズムが学習するから機械学習って言うんですけど。で、その勉強させることで、また新しい肖像画を作るんですね。それを作って、クリスティーズのほうで4900万円くらいの値段が付いたっていう絵がありまして、これが本当に「AIが描いた肖像画」っていう初めての物だったんで、初めての物っていう価値もあってぐーんと値段がついているんですけども。

ミイナ:たぶん言われなかったら普通に人間が描いた肖像画に見えますよね。

原田:そうなんですよ。

ミイナ:これをAIが描いたんだっていうのがやっぱり画期的というか。

原田:その描くためのAIのソースコードって言って、さっきからプログラミング言語の話してるんですけど、そのコードは公開されてオープンソースって言って誰でも使えるようにしているコードなんですね。その誰でも使えるようにしているAIのコードを使ってフランスのObvious(アビヤス)っていうアーティスト集団がそのコードを使って肖像画を描かせて、それっぽく右下に数式(下部参照)をさらって書いたりして、仕上がりとてもおしゃれな感じにしたらクリスティーズでどかっと売れたっていうところで。やっぱりアートもマーケティングの側面が非常にあるし、ただそのために最初に準エンジニアがコードを作っているっていういろんな連なりでこういうことが起きてるんだなって一つ象徴的なニュースだなと思いました。

AIが描いた肖像画の右下には数式が・・・


ミイナ:そうですねぇ。でも、なんかそのオープンソースを作った側のエンジニアは「誰でも使って良いよ」っていうことで公開してるんだけど、それがこんな価値生んじゃうとちょっとこう・・・

原田:「そこまで!?」みたいな。まぁ、ちょっと小揉めは・・・小揉めか大揉めかは分からないですけど。その続報でニュースとして、いろいろと問題、議論には非常になってましたね。

*****Dooo*****

ミイナ:10代、20代の若い世代に伝えたいことはありますか。

原田:データサイエンティストとして日々コードを書いていて、本当にいいと思うんですよね・・・「言葉・言語の幅」を広げるのが。本当に人間語のいろんな国の言葉もそうだし、機械語の、どんどんエンジニアリングで今後も出てくるでしょうし、長いこと生き残ってる言語もありますし、そういうのをどんどん学んで行くと、人間語のほうが喋れるようになった途端、その地域の人と喋れるんで楽しいとは思うんですけど、今後、人工知能とかどんどん発達していったりとかで、機械語を学ぶことで自分のカタルシスを得られる機会も増えていくと思うんで。どんどん色んな言語、いろんな国の言葉、いろんなデータベースの言葉、プログラミングの言葉とかを学んで行っていただけると、ずっと退屈しない!と思いますね。

ミイナ:いろんな言語を学びましょうと。

原田:はい。で・・・かつ絶対採用に無茶苦茶・・・履歴書とか無茶苦茶有利になると思いますんで(笑)

ミイナ:私なんてそれ(日本語・トルコ語・英語・スペイン語・中国語を話す)で内定もらったようなものですからね・・・「よくわからないけど色々喋れる模様」みたいな感じで。

原田:そうですよね。いや本当に・・・

*****Dooo*****

ミイナ:こちらの写真は?

原田:うちはまだまだ社員が14名の零細なんですけど、同じ月に入社した新入社員2人の誕生日が1日違いだったので、急きょケーキを・・・

ミイナ:新入社員からすると入社時にお誕生日を祝ってもらえるなんてないですよね・・・

原田:それをもってやる気になってくれるとうれしいし、AIベンチャーって結構ドライに思われちゃうと思うんですけど、ほっこりした良い会社なんで是非、これをみている方もウチ(株式会社グラフ)に入社を検討してくれるとうれしいなと!

ミイナ:社長からのダイレクトメッセージ。届きましたでしょうか?(笑)原田さん、きょうは本当にありがとうございました!


前編はこちらをクリック


後編はこちらをクリック







引き続きよろしくお願い致します!
TBSテレビ報道局が運営するnoteです。http://news.tbs.co.jp 人の顔が見える「小さな物語」を中心にお届けします。SNSを活用した、ニュースの届け方を日々研究中。いらすとキャスターはこちら→ https://twitter.com/TBSNEWS4