見出し画像

デジタルデータについて(対談)

渡邉:本日はDX専門コンサルタントの前田さんからデジタルデータについてお話をお聞きしようと思います。

渡邉:前田さんですが、プロフィールを拝見すると、野村総研で金融情報分析、その後SBIホールディングスでCOO、CIOを歴任されたとありますが、面白いことに、学生時代のプログラマのことも書いていますね。

前田:はい、そこが私の原点だと思うのですね。当時『ウルフチーム』というゲームクリエイター集団がいて、その創設メンバーだったのです。
今のゲームのオープニングが映画みたいだったり、音楽聞けるモードがあったりしますが、それを初めてやったのが私です。
当時のコンピュータは低スペック。メモリを駆使する、裏レジスタまで使う、割り込み処理までやるわけなので、当然デバッガーは動きません。コンピュータの動きをすべて頭の中でトレースします。
なので、これは笑い話ですが、本当にコンピュータの気持ちがわかるまで行きました。今でもバグを見るだけでソースコードが見えるんです。要はコンピュータの隅から隅まで理解しています。だから今の技術も深いレベルで全部わかるのですね。

渡邉:それはすごいですね・・・・。でも、その後、野村総研へ?

前田:はい、プログラマだと体壊しそうなので、野村総研に行きました。大学院の専攻は機械工学なので、てっきりコンサル配属だと思っていたのですが、コンピュータができることが災い(幸い)?したのか金融数理学をやることに。

渡邉:そこではどんなことを?

前田:デリバティブが専門なのですが、そこで大きく学んだことは、データですね。金融系データを自分で取得し、管理していました。IDの取り扱い、データ分析の基礎など。ある意味データサイエンティストの走りと言えます。デジタルデータとは何か?を否が応でも肌で体験しています。

渡邉:なるほど。では、本題に入ります。
前田さんはデジタルデータについてどうお考えでしょう?
デジタルデータとは何でしょうか?

前田:そうですね。この話ですが、ほとんどの方々が理解していないような気がしています。特にベンダー。彼らは開発はできるかもしれませんが、データそのものに対する理解は正直浅いです。コンサルの方でも理解していない人多いですね。
デジタルデータの本質を一言でいうのであれば「定義」です。

渡邉:「定義?」ですか?

前田:はい、「定義」です。本来データは「活用」して意味を成します。つまり「目的」があるわけなのですね。その「目的」を達成するためには、そのデータの意味やその運用にまで目を光らせる必要があるのです。

渡邉:ちょっとイメージがわかないのですが・・・。

前田:そうですね。いきなり聞くとわからないと思います(苦笑)
例えば「当月の売上データ」という項目があったとします。どう思いますか?

渡邉:そりゃ、当月の売上データが入っているのですよね?3月末なら3月の売上データがあるという事ではないですか?

前田:では「売上」とは何ですか?

渡邉:売って代金受け取るという事では?

前田:通常、企業などでは代金受取は後だったりしますよね?そうしたらどうします?

渡邉:え?どうなんだろう?代金受取の時?支払いされた時?

前田:そうしたら、支払してくれないお客の売り上げはどう考えるべき?

渡邉:あまり考えたことなかったかもです。「売上」はあくまでも「売上=確定」と思い込んでいました。

前田:この辺は会計基準とかも関係しますが、発注書をもらった時点での売上なのか、請書を出した時点か、品物発送時か、それとも検収時か?認識するタイミング「定義」がありますよね?

渡邉:確かにそうです。

前田:ではもう一つ質問します。先ほど3月のデータは3月末に入っていると言われましたが、本当ですか?

渡邉:え?入ってないのですか?

前田:通常経理などでは最終確定データを確認するため、数営業日かかります。要は3月末の時点では数字は入っていないのですね。1円、2円のズレが問題になるから当然と言えば当然です。これは「運用の定義」ですね。どのようにデータ登録が運用されているのか?という事です。

渡邉:要はデータとしては3月のモノだが、それが確定するのは数営業日後。3月末に何か入っていたとしても、それは正しいとは限らない?ということですか?

前田:はい、その通りです。データ運用を理解していないとこういうことが起きます。
もう一つ質問します。
経営者が意思決定したい場合、このデータは適切でしょうか?

渡邉:え?会計データだから正しいわけだし、問題ないのでは?

前田:でも、確定するまで時間掛かるのですよ?経営者だったら月末着地予想で次の手を考えたくありませんか?

渡邉:確かにそうですね。でも、経理が処理できないわけだから・・・・
あ、経理に急がせればよいのでは?

前田:(笑)はい、そういう間違った指示がされるケース多いですね。

渡邉:間違いなのですか?

前田:経営者は1円、2円のズレを重要視します?即時性を考えるのであれば、無視しませんか?

渡邉:言われてみれば、そうですね・・・。数百億の取引の中で1円2円どうなのか?でも、正しい方が良さそうなんだけど・・・。

前田:要はこれはデータ活用の「目的」によるのですね。経営から見れば、多少のズレがあってもすぐに情報が欲しいはずです。それに対し、会計は決算目的だから正確性が重要なわけです。

渡邉:同じデータ項目でも意味が異なるという事ですか?

前田:はい、その通りです。データの流れる順番も違いますよね。必ず営業側が起点になるわけです。
そう考えると、会計データ基準のデータマートとかどう思いますか?

渡邉:そういう絵、よく見ますよね。でも、データの流れや性質を考えるとこれって・・・・。

前田:はい、大きく間違っているという事です。データの内容を精査しない(できていない)人が描いている幻想図です。(笑)

前田:データの入り口は営業系になると思いますが、こちらでも運用上の問題は発生します。
例えば、営業の方が日次売上データをその日に入れずに一週間まとめて入れたりしたらどうなります?

渡邉:日次でデータを見ていたら、反映していない・・・という事ですよね?

前田:その通りです。
これ、すぐわかりますが、RPAとかでは平気でやってたりしますよね?データソースのデータ運用定義をおさえずに、そこにデータがあると思い込んでデータ持ってきてしまう・・・。

渡邉:事故起こしますね。。。。

前田:これはまだ簡単な例です。

渡邉:え?これだけでも結構重要と思ったのですが、まだあるんですか?

前田:はい、氷山の一角です。正直このデジタルデータだけでも数時間話せます(苦笑)

渡邉:・・・・・

前田:例えば、会計データ。ある経費科目が不明だったので、とりあえずある科目で処理しました。ですが、その後数か月後、明確になったので、振替をしました。

渡邉:はい、いわゆる「赤黒」処理と言うやつでしょうか?

前田:はい、会計としては間違ってないです。ですが、これを時系列的に分析しようとしたらどうなるでしょうか?
例えば、前年同月比を測定してみる。。

渡邉:あ、(会計では)過去のデータは修正しないから、間違った値をはじき出しますね。

前田:はい、その通りです。つまり、会計データはあくまでも「決算」のために行っているわけです。なので、このような分析にはそぐわないという事なのです。

渡邉:「目的」に合致していないデータは使えないというのがそういう意味なのですね・・・。

前田:はい、その通りです。データの内容の定義、その運用定義。これらが明確になっていなければデジタルデータは取り扱えないのです。
もう少し違う例を挙げましょうか?

渡邉:はい・・・。だんだん恐ろしくなってきましたが(汗)

前田:営業レポートを考えてみます。これを分析したい。なので契約確度を設けた。Aランク、Bランク、Cランク と言うように。

渡邉:なんとなくわかってきました。そのAランクとは何か?という事でしょうか?

前田:はい、その通りです。確度80%とか言ったとします。でも、それって何でしょう?営業マンによってその尺度違うかもしれませんよね?

渡邉:はい、その通りですね。それを集計分析したものは・・・?

前田:ゴミかもしれません(笑)

前田:正直、自称「データサイエンティスト」とか「データアナリスト」と言っている多くの人がいますが、ここまで深く考えている人は果たしているのか?とも考えます。多くの人が私から見たら「ツール使い」「統計使い」ですね。もともとも素データに真摯に向き合うべきです。

渡邉:これってどうしたらよいのでしょうか?

前田:すべてについてきちんと「定義」を見直すべきですね。「内容の定義」、「運用の定義」、そしてその「目的」。目的に合わない内容、運用のデータは使うべきではないのです。(使っても良いが、その程度の精度と認識すべき)
まぁ、この辺ですが、まず身の回りでもできることは「用語集」をきちんと定義することでしょうか?まずは「定義」と言うものに慣れてもらうためにも。

渡邉:それくらいなら始められそうです。
でも、「定義」はそんなに大事なのですか?

前田:この「定義」「ルール(決め事)」こそがデジタル技術そのものなのですよ。
CPUの動きも決め事です。プログラミングも定義、APIも定義。インターネットプロトコル、ブロックチェーンに至るまで全部定義ですよね?その定義が正しく管理されているから、デジタル処理が可能となっているわけです。
なのでデジタルを語るには「定義」を意識しろ、と言うのがもっともお伝えしたいことなのです。

まとめ

  • デジタルデータには内容定義、運用定義が存在する。

  • 目的に合致した定義に基づくデータを利用する必要がある。

  • 定義があいまいなデータから得られたものはゴミかもしれない。

  • デジタルデータを語る際にはこれら「定義」に神経を尖らせること。



この記事が気に入ったらサポートをしてみませんか?