見出し画像

技術士(経営工学・情報工学)が教えるDX(デジタルトランスフォーメーション)講座21 デジタライゼーション③SoI―データ分析、AIによる業務の高度化―

 データ活用は経済産業省のDX認定制度において特に重視されている評価項目であり、SoI(System Of Insight/分析のためのシステム)はDXにおいて花形とも言うべき領域であるといえます。IT業界ではプログラマやシステムエンジニアが中心的存在であり、情報システムの中心もソフトウェアと考えるのが一般的ですが、DXではデータが情報システムの中心的存在となり、AIにおいても学習モデルとして保存されるデータが主役であると考えます。
 
 従来的な情報システムでもデータは重要でしたが、人に代わって入力データを自動で加工、計算、分類、集計してくれるソフトウェアがやはり主役でした。アウトプットは紙に印刷され、入力データはあくまでも材料であり、完成品である紙の帳票を作ることがシステムの目的だったのです。時代は変わって、紙の帳票からPDFやExcelファイルに変わろうとも、帳票を出すことが最終的なシステムのゴールであることに変わりはありません。
 
 DXではデータは材料にもなれば完成品にもなります。そして、その完成品としてのデータはまた別のシステムの材料としても利用されます。DXの完成形とも言うべき企業間連携では、データがAPIを通じて共有されることになります。

 そのためには、データの持ち方も特定の目的(販売管理や生産管理、財務会計など)のためだけに考えるのではなく、様々な目的のために利用できるできるように、標準化して持つことが必要になります。データベースはそのための不可欠なプラットフォームであり、GoogleではSQLと呼ばれる昔からよく使われていたデータベース問い合わせ言語を拡張してAIにも使えるようにしています。
 
 また、コンピュータやネットワークの性能向上や大量データを保存できるクラウド技術もSoIの発展に大きく貢献しています。膨大な計算が必要な統計解析やディープラーニングなどのデータ処理もあっという間に終わらせてしまうことができるほどのデジタル技術の高度化が、システムの利用目的を集計表程度の帳票出力の先-データ活用-へと我々を導いてくれているのです。
 
 高度なデータ活用である統計解析やAI利用に向けて、ぜひ取り組んでいただきたいのが、「似ていること」と「違っていること」を見つけることです。「似ていること」を見つけるために行われるのが、相関分析や因子分析(AIでは次元削減)、クラスター分析と呼ばれるものであり、「違っていること」を見つけるために行われるのが、分散分析やカイ2乗検定、マン・ホイットニーのU(ユー)検定などの独立性の検定です。AI利用で有名な合否判定などの判別分析も判定対象が合格品のグループと不合格品グループのどちらに似ているかを調べるものだと知れば、いかに「似ていること」と「違っていること」を考えることが大切なのかがわかると思います。
 
 データ分析の詳細についてはこの連載の後半で解説する予定ですが、ここではその前提条件としてデータの品質や鮮度が重要になることについて触れておきたいと思います。筆者の経験として、昔の販売管理システムや人事給与システム上に間違ったデータが登録されていたことをシステム入れ替えの際に発見されることが少なくありませんでした。
 
 正しくないデータ登録が起きてしまう原因には様々なものがありますが、その中でも多いのが、①変更があっても更新されない、②正しいタイミングで登録されない、③適切な入力項目がないというものです。

①変更があっても更新されない
 最初は必要があって登録したが、その後利用されないようになる、更新が面倒で維持できなくなって放置されるケースがよくあります。
②正しいタイミングで登録されない
 入出荷や製造入力など、仕事の事情でデータ入力が後回しにされることがあります。
③適切な入力項目がない
 コードや選択枝に該当するものがないために、「その他」が多用されたり、コードや選択枝の意味を読み替えられることがあります。
 
 こうしたデータ品質を損なうような運用が行われてしまうと、データ活用は困難になるどころか、誤った判断を引き起こしてしまう恐れすら出てきます。データ品質を確保することはDXの取り組みの中で不可欠であり、そのためにはデータが重要な資産であることを全社員に認識させ(データポリシー)、業務上の役割や責任として明確に示す(データガバナンス)ことが必要になります。
 
 最後に、データ分析において基準データをつくることの大切さに触れておきたいと思います。顧客モデル(ペルソナ)を決めておけば、新しい顧客がどの顧客モデルに属するかを判別することができます。基準となる商品を決めておけば、類似する新商品のライフサイクルを予測することができます。店舗や営業担当者の基準(ベストパフォーマー)を決めておけば、新店舗や新人営業担当者に似ている店舗や営業担当者から学ぶことができます。
 
 こうしたデータ活用やデータ分析を牽引していくのはデータサイエンティストやデータアナリストと呼ばれる人材です。最近ではデータサイエンス学部を立ち上げる大学も増えてきているようです。高度なデータサイエンティストやデータアナリストを確保することも大切ですが、社員全員が正しくデータを活用できるようになるためのデータリテラシー教育を行っていくことが非常に重要になってくると思います。

この記事が気に入ったらサポートをしてみませんか?