見出し画像

21世紀の石油:データとその価値について

「データは21世紀の石油である」という言葉が気に入ったので、以下書籍の内容を参考にしつつ、ChatGPTに言語化してもらいながらこの言葉について考察してみた。

「データは21世紀の石油である」という言葉


「データは21世紀の石油である」。これは今日ではよく聞くフレーズであり、その背後にはデータが持つ絶大な価値と可能性を指摘するものである。しかし、この比喩は、データが真に持つ特質と、それが社会に及ぼす影響を理解するための鍵となる。

20世紀における石油とは

利便性や安定性において石炭と比べてメリットがあったことから、世界のエネルギー供給は石炭から石油へとシフトしていった。それに伴い、20世紀は国内外における油田開発が盛んに行われた期間であった。

油田開発は、国内から国外へ

国内油田開発については、昭和28年(1953年)に策定された「石油資源開発5カ年計画」にもとづき調査・探鉱が行われ、新潟県や秋田県で油田・ガス田が発見されました。しかし、この時期の石油価格は国際的に安かったため、油田開発の軸足は次第に国内から海外油田に移ります。

日本による、初の本格的な海外油田開発となったのは、サウジアラビア、クウェートの両国の中立地域沖合にあるカフジ油田。電力・鉄鋼・商社など約40社が共同で設立した「アラビア石油」が昭和35年(1960年)、海上油田の試油テストを行い、翌年から操業を開始。成功を収めました。

https://www.enecho.meti.go.jp/about/special/johoteikyo/history3shouwa.html


データの産出量

世界でデータ流通量は爆発的な拡大を見せており、この傾向は今後も続くものと見られる。

ただし、石油とは違って、データは極めて低いコストで複製可能なので、産出量が持つ意味は石油のそれとはまったく異なる。

石油が生み出す価値

石油が生み出す価値についてChatGPT(GPT-4)に聞いてみたら、以下の回答があった。

  1. エネルギー生成: 石油は、その化学的な性質により燃焼すると大量のエネルギーを発生します。このエネルギーは、自動車、船舶、航空機、発電所など、様々な場所で用いられ、運動エネルギーあるいは電力として我々の生活を支えています。

  2. 原材料供給: 石油は、プラスチックや化学製品、合成繊維などの製造に必要な原材料となります。これらの製品は、日常生活から産業まで幅広い分野で使用されており、それぞれが具体的な価値を提供しています。例えば、プラスチックは包装材料、食器、電子機器の部品などとして、化学製品は医薬品や農業用肥料などとして利用されます。

  3. 雇用創出: 石油産業は、大量の労働力を必要とします。採掘から精製、輸送、販売に至るまで、様々なスキルを持つ労働者が必要であり、それにより多くの人々に雇用を提供しています。これらの雇用は、個々の労働者に収入をもたらし、経済全体を支える重要な役割を果たしています。

データが生み出す価値

石油と対比する形で、データが生み出す価値についてもChatGPTに聞いてみた。最初、「同様に、21世紀においてデータが生み出す価値についても考察してください」という風に質問したら、石油が生み出す価値との比較が得られなかったので、以下のように質問しなおした。

得られた回答は以下。

  1. エネルギー生成に相当するデータの価値:

    • 情報生成: データは、適切に分析され、解釈されることで、価値ある情報や洞察を生み出します。これは、石油がエネルギーを生成するのと同じように、データが知識や情報という形でエネルギーを生成すると考えることができます。具体的には、マーケティング戦略の策定、製品開発の方向性決定、業績予測など、意思決定を駆動するエネルギーとなります。

  2. 原材料供給に相当するデータの価値:

    • 新サービス・製品の原材料: データは、新たなサービスや製品を生み出すための原材料となります。例えば、ユーザーデータを分析してパーソナライズされた製品やサービスを開発したり、ビッグデータを活用したAI技術の開発などが可能になります。これは、石油が化学製品の製造などの原材料となるのと同じように、データが新たな価値を生む原材料となります。

  3. 雇用創出に相当するデータの価値:

    • 新たな職種・産業の創出: データの収集、分析、解釈といったスキルを持つ人々に対する需要は急速に高まっています。データサイエンティスト、データアナリスト、ビッグデータエンジニアなど、データ関連の新しい職種が生まれ、既存の業界でもデータ分析能力を持つ人材が求められています。これは、石油産業が多数の雇用を生み出すのと同じように、データ産業も新たな雇用を創出しています。

まとめると、
・意思決定を駆動するエネルギーとなる
・新たなサービスや製品を生み出す原材料である
・新たな雇用を創出する

石油との対比という文脈で「データが生み出す価値」について、非常にシンプルにまとめることができた。

石油の価値創出プロセス

原油は、地中に埋まっているままでは価値がありません。採掘、備蓄、精製・加工という プロセスを経てガソリンなどが生み出され、価値が創出されます。データも同様です。ただ 集めただけでは価値がないのです。まず、集めたデータを同一形式に統一したり、欠損値を 埋めるなど、分析できるように整理します。次に、そのデータをクラウド環境などに保存し ます。最後に、その環境の中でデータの分析を行い、データの背後にあるルールやアルゴリ ムなどを見つけ、意思決定につなげることで価値を創出することができます。

https://amzn.asia/d/4WSSsue

石油は、以下の一連のプロセスを経て価値を生み出す。

  1. 採掘: 原油は地下深くから採掘される。この段階では原油はまだ原始的な形で、使用には適さない。

  2. 備蓄: 採掘された原油は、使用前に貯蔵施設で保管される。

  3. 精製: 原油は精製工程を経て、ガソリン、ディーゼル、灯油などの製品に分離・変換される。このプロセスにより原油から様々な製品が生み出され、それぞれが特定の用途に適した形になる。

  4. 加工: 精製された製品はさらに加工され、最終的な製品として市場に出回る。これが石油の価値創出プロセスの最終ステップであり、石油製品が我々の日常生活に欠かせない存在になるところである。

データの価値創出プロセス

一方、データの価値創出プロセスは以下のようになる。

  1. 収集: データは多様なソースから収集される。これはウェブサイトのクリック数から、センサーデータ、社会メディアの投稿、販売記録など、様々な形で存在する。

  2. 加工: 収集されたデータは、人間やマシンが理解できる形に変換される。このプロセスはデータクリーニング、統合、変換などを含む。

  3. 分析: 加工されたデータは分析のための準備が整う。この段階ではデータサイエンティストが統計的な手法や機械学習の手法を用いてデータから有用な情報を引き出す。

「データは21世紀の石油である」という文脈における「油田開発」とは

「データは21世紀の石油である」という文脈における「油田開発」とはどのような意味を持つのか。油田は石油が採れる地域のことを指す。「石油→データ」なので、ここでは(価値のある)データが採れる場所のことを「情報田」と呼ぶことにする。

ここまでの文脈を踏まえ、ChatGPTに「情報田」を定義してもらった。

「情報田」とは、価値あるデータを生み出し、収集可能な源泉や領域のことを指す概念です。情報田は具体的には以下の要素を含むと定義できます:

多様なデータソース:情報田は、ユーザーのオンライン行動、センサーデータ、ソーシャルメディア投稿、ビジネストランザクション、公的統計など、さまざまな種類のデータを提供するソースを含みます。
データの生成・収集能力:情報田は、これらのデータソースから継続的にデータを生成・収集する能力を持っています。これは、自動的なデータ収集ツールやプロトコル、人間によるデータ生成活動などを通じて実現されます。
データの利用可能性:情報田から収集されたデータは、その形状、サイズ、品質に関わらず、何らかの形で利用可能でなければなりません。これには、データのクリーニング、整形、統合などの初期処理が必要となることがあります。
継続的な価値の創出:情報田は、一定期間にわたり一貫した価値を提供し続ける能力を持つべきです。これは、データが時系列に基づいて収集され、新たな洞察や予測を可能にするためのパターンやトレンドを明らかにすることを含みます。

したがって、「情報田」とは、価値あるデータを持続的に生成し、収集し、利用可能な形に加工し、新たな価値を創出するための多様なデータソースとその周辺のシステムやプロセスを指す概念と定義することができます。

さらに、この定義をもとに「油田開発」ならぬ「情報田開発」について聞いてみた。

「情報田開発」とは、次のような活動を指すと考えられます:

情報田の探索と特定:これは、どの種類のデータが利用可能で、どのデータ源がビジネスや研究目的に最も価値があるかを特定するプロセスに該当します。情報田が存在する可能性のある場所を探し、そのデータを取得できるようにすることが含まれます。
情報田の活用:これは、具体的にデータを取得するプロセスに該当します。オンライン行動データ、センサーデータ、ソーシャルメディアデータなど、さまざまな種類のデータが対象となることがあります。
情報田の維持・管理:情報田から継続的にデータを収集し、その価値を維持・増大させるためには、情報田の状態を監視し、適切に管理する必要があります。これは、データのクリーニング、整形、そして初期の分析がこの段階で行われます。

これらのプロセスは、「情報田開発」の核心をなすもので、これらを通じて、生のデータが探し出され、収集され、そして初期の利用可能な形に整理されます。そして、情報田が持続的に価値を提供し続けるためには、その状態を監視し、問題が生じたときには適切な対策を講じるといった情報田の管理も重要な活動となります。

ここから考えられることは、データは非常に多種多様な形式やソースが存在するため、「情報田の探索と特定」プロセスが複雑になる可能性が高いことである。では、どのデータに価値があるかをどのように特定すればよいのか。以下の方法が考えられる。

関連性:特定の目的や問いに対して、データがどの程度関連性を持つかを評価します。たとえば、マーケティングキャンペーンの効果を分析するためには、消費者の購買データやオンライン行動データが関連性が高いと言えます。
品質:データの精度、完全性、一貫性、信頼性を評価します。欠損値や異常値が多い、一貫性が欠けている、古すぎるなどのデータは、分析の結果に悪影響を及ぼす可能性があります。
:データの量も評価の対象となります。多くの場合、大量のデータからはより確実な洞察が得られます。しかし、データが大量であることは必ずしも良いとは限らず、データの管理や分析のコストが増大する可能性もあります。
アクセシビリティ:データにどの程度簡単にアクセスできるか、また法的な制約やプライバシーの問題がないかを評価します。
ユニーク性:データが提供する情報が他のデータソースでは得られない独自のものである場合、そのデータは非常に価値が高いと言えます。

これらの要素を考慮に入れ、特定の目的や問いに対して最も適したデータ源を選ぶことが、情報田の探索と特定プロセスを成功させるための鍵となります。

興味深いのは「関連性」という側面である。特定の目的に合ったデータでないと、価値があるとは言えない。ここで、特定の目的とは、石油であれば発電やガソリンなどある程度想像がつくのだが、データの場合、ビジネスのどういった目的でデータを利用するのか、業種や企業によってそのパターンは多岐に渡ることが想像でき、またデータサイエンスの素養が背景にないと、この「特定の目的」を定めることはできないのではないか。

このように、石油とデータの対比で考えても、データサイエンスの重要性を考えることが出来た。

データの独自性

石油とデータの大きな違いの一つは、データは使用しても枯渇しないという点である。データはほぼゼロコストで複製可能であり、その価値は使うほどに増すとも言える。
また、インターネットとパソコンさえあれば、誰もが一定規模の範囲内でデータの価値創出プロセスを実行できる。スマートフォンが個人に広く普及している現代社会では、誰でもデータから価値を生み出す環境を手にしているとも言える。

データの扱いとその重要性

データの扱い方は、これからの社会において非常に重要なテーマとなっている。データをどのように収集、保存、分析し、その結果をどのように利用するのか、これらはすべて組織の戦略的な成功、さらには社会全体の進歩に直接影響を与える要素である。データプライバシーやセキュリティの問題、個人の権利や自由の保護、そしてデータを活用した新しいビジネスモデルやイノベーションの創出など、データを中心とした議論は多岐にわたる。
データサイエンスはこれらの問題を解決するためのキーとなる。データサイエンティストは、データを理解し、それを有効に活用するためのスキルと知識を持っている。彼らはデータから洞察を引き出し、それをアクションに変換する能力を持つため、データサイエンスは現代のビジネスや社会において非常に重要な役割を果たしている。これはデータサイエンスが「何よりもセクシーな分野」であるとされる理由の一つである。

新潟県におけるデータサイエンスの重要性

新潟県におけるデータサイエンスの重要な分野として挙げられるものとして、以下のようなものが考えられる。

  1. 農業: 新潟県は米どころとして知られ、長年にわたって農業が盛んに行われている。農業分野においては、農作物の栽培や収穫、水管理など、多くの作業があるため、それら全てにおいてデータを収集し、分析することができる。たとえば、気象データを収集し、作物の生育にどのような影響があるかを分析することで、より効率的な農業を行うことができる。

  2. 観光: 新潟県は、豊かな自然や温泉、海の幸など多種多様な観光資源がある。ここでは、観光客の動向を分析することで、どのような観光地が人気があるか、どのような属性の人が訪れているかということがわかる。これは、観光地の改装や、新たな施設の建設などに役立てることができる。

  3. 医療: 新潟県には多くの病院があり、その中でも新潟大学医学附属病院は、高度な医療を提供している。データサイエンスを活用することで、病気の予防や治療、医療費の削減に役立てることができる。たとえば、患者の診断結果や治療記録をデータ化することで、医師や看護師がより迅速に正確な診断を下すことができる。また、治療効果や医療費の削減効果を分析することで、より有効な治療方法や医療費の削減策が打ち出せる。

まとめ

「データは21世紀の石油である」という言葉から、石油とデータがもつ性質を比較することでデータの特徴や扱い方について理解を深めるとともに、データやデータサイエンスの重要性について再認識することができた。

この記事が気に入ったらサポートをしてみませんか?