見出し画像

グラフ・テクノロジを考えてみないか

グラフ・テクノロジというと、国内のほとんどの人が、データ可視化の手法と考えるのではないでしょうか。
そうではなく、いま世界で注目されているデータのハンドリング技術です。
Linked dataやセマンティック技術というと聞いたことがあるという人が増えるかもしれません。

日本と世界の認識のギャップ

日本でデータベースというとRDB(リレーショナルデータベース)が基本であり、それを高速処理するためのデータレイクの話しか出てきません。グラフ技術に関連する話は、情報サービス産業協会の「情報サービス産業における技術マップ」にも出てきませんし、日経クロステックの検索にも出てきません。amazonの和書で「グラフ技術」「グラフテクノロジー」と探してもわからないし「グラフデータベース」と検索してやっと数冊出てくる感じです。

英語で検索すると様々な情報が入手できます。amazonの洋書で「graph technology」により検索すると20000件以上の書籍が結果として表示されます。米国の老舗のコンピュータ雑誌のComputer worldでも関連記事はたくさん出てきます。IEEEのSTCというソフトウェアエンジニアリングの会議でも、2023年は7つしかないテーマの大区分の中の1つが「The graph invasion」です。欧州のデジタルガバメントの会議でもグラフ技術が当たり前のように出てきます。

で、グラフ・テクノロジーって何なのよ

簡単に言うとデータ間を関連付けて管理活用する仕組みです。皆さん、Webでクリックして情報を探索していきますが、それと同じ感じだと思ってください。

Webが出てくる前の調べものというと、ある記事を読んで、気になると、図書館に行って関連の本を見て、さらにわからないとその解説する本を探して、机が本だらけになるというスタイルでした。つまり情報のブロックをつなげていくイメージです。でも今は違いますよね。クリックすると該当するところにジャンプして、さらにクリックするという方法です。

リレーショナルデータベースによる検索は、この本での探索の仕組みに似ています。データベースを検索すると関連したファイル(テーブル)に飛んでいき、そこで調べて戻ってくるというスタイルです。それが、あらかじめ予定していたテーブル間で行われます。
これを高速処理するために、よく使うファイルを手元に置くデータレイクという手法も良く導入されます。

グラフ技術を使ったグラフデータベースは、クリックしたときのように、必要な情報をダイレクトに取りに行き、そこからさらに深堀りできるデータ操作の仕組みです。

拡張性が高く、高速に、情報の原本にアクセスし、転送負荷も軽い仕組みです。

例えば、欧州では法律管理でグラフ技術が使われており。判例から、類似判例、関連法規、法令解説などにリンクするなど、様々な検索方法が検討されています。

https://smartfiles.lereto.at/#demo

グラフテクノロジの詳細はもっと複雑なのですが興味のある方は、Japan searchの解説とか、オープンソースのグラフデータベースNeo4jを中心に解説しているクリエーションライン社のnoteを見てください。

国内のグラフ・テクノロジーの事例

Japan search

ジャパンサーチは、書籍・公文書・文化財・美術・人文学・自然史/理工学・学術資産・放送番組・映画など、我が国が保有する様々な分野のコンテンツのメタデータを検索・閲覧・活用できるプラットフォームであり、2024年1月時点で223のデータベースと連携し、29,031,873件のデータを収録しています。

gBizInfo

gBizInfoは、政府の持つ法人関連情報を集約したサイトで、国内の全法人について、本店所在地等の基本情報、政府との契約情報、資格情報、特許情報などを収録しています。

eStat LoD

統計局の統計情報をLined Dataで入手するためのサイトです。

世界の動向

冒頭に書いたようにグラフ・テクノロジーは、海外で非常に注目されています。
Dataversity education社のTrends in Data Management: A 2022 DATAVERSITY Reportによると、Semantic web technologyを9.46%の企業が導入し、20.20%の企業が導入を検討しています。導入企業は、2020年に2.35%、2021年に5.00%ですので、急速に増加しています。

マーケットで見ると、KBV research社のGlobal Graph Technology Market Size, Share & Industry Trends Analysis Reportは、2022年のマーケットサイズをUSD 3.1 B、2030年のマーケットサイズをUSD 15 Bと見積もっています。
また、GMI社のGraph Technology Marketは、2022年のマーケットサイズをUSD 4.1B、2032年のマーケットサイズをUSD 23.8Bと見積もっています。

データベースソフトウェア全体のマーケットは、The business research company社のDatabase Software Global Market Report 2023が、2022年のマーケットサイズをUSD 142.03B、2027年のマーケットサイズをUSD 274.48Bとしており、Global Industry Analysts社のDatabase Management Systems (DBMS): Global Strategic Business Reportが、2022年のマーケットサイズをUSD 63.4B、2030年のマーケットサイズをUSD 154.6 Bと予測しています。
Gartner社のMarket Share: Database Management Systems, Worldwide, 2022は、2022年のマーケットサイズをUSD 91Bと予測している。

グラフ・テクノロジーのマーケットは、USD 15-20Bということは2兆円を超えるマーケットであり、マーケット全体が急伸していることを考えると、日本でも本格的に検討を進める必要があるのではないでしょうか。

今後に向けて

実態のところどうなのかということで、(以降[]内は1/8に修正する前の文です)[ソフトウェアの大規模調査にグラフ技術の導入可能性について設問を入れてみたところ、予想通り、今のところ、国内ではほとんど導入されていないし、導入する予定もないようです。]設問に答えてくれた方が、「この設問のグラフ技術って何?」ってちょっときっかけになることを期待しています。レスポンスが遅いとか技術者がいないとか課題は多いですが、今後に向けて普及を進めていきたいです。

修正(1/8)
ソフトウェアの大規模調査にグラフ技術の導入可能性について設問を入れてみたところ、実は国内でも海外並みに使っているらしいです。
調査の中間集計ですが、ユーザーで5%、試行も含めると15%、ベンダーで8%、試行も含めると22%、エンジニアで4%、試行も含めると12%がグラフ技術を導入しているとのこと。

この記事が気に入ったらサポートをしてみませんか?