[#3データベース研究]国内で主に利用されるリアルワールドデータ

こんにちは、はるです。

昨日に続き本日もリアルワールドデータ(以下、RWD)に関するお話をします。
今回から複数回に分けて、「国内で主に利用されるRWD」について、述べさせていただきます。
前回のnoteでも少し触れましたが、データベース研究を成功させる上で、適切なデータ選択というのは欠かせません。

今回は代表的なMDVデータ、JMDCデータを扱って、データベースの理解を深めていきたいと思います。

1. どんなデータベースが存在するのか?

みなさんよく耳にするデータベースとして、MDVデータやJMDCデータ、NDBデータなどがあると思いますが、日本薬剤疫学会の報告によると臨床疫学や薬剤疫学に応用可能なデータベースは約20種類以上あります(製薬企業が利用可能という意味ではそこからやや絞られると思います)。

データベースの特徴を理解する最初の切り口としては、データソースを理解することだと思います。
データには大きく以下のような種類があります。今回はこの中でもレセプトデータを用いたデータベースについて、紹介したいと思います。

1. 電子カルテデータ
2. レセプトデータ
3. PHRデータ
4. レジストリ

データベースの特徴として、検査値が含まれている、他の施設を受診した際に追跡可能である、などをよく目にすると思いますが、データソースを理解していればこの辺の特徴が生じている背景をなんとなく推測できるようになると思います。
次の章では製薬企業が利用するケースが多いMDV、JMDCのデータベースを話題にしながら、データソースの違いと特徴について述べていきます。

2. MDVとJMDCのデータベース

データベースを提供している民間企業として、真っ先に名前が上がるのがMDV、JMDCだと思います。
いわゆる競合会社であるこちらの2社ですが、MDVはもともと病院から収集したレセプトデータやDPCデータ、検査値データをデータベース化して提供しており、JMDCは保険者から収集したレセプトデータや健康診断データをデータベース化して提供しておりました。
最近はMDVが保険者データを提供したり、JMDCが病院データを提供したり、提供するデータベースの幅を広げていますが、今のところそれぞれ得意分野は譲らずといった状態ですね。

さて、前章でデータソースを理解すると述べましたが、レセプトデータと一概に言っても、データソースは3つに分かれていることをご存知でしょうか?

1. 病院由来
2. 審査支払機関由来
3. 保険者由来

このデータソースの理解を深めるために、まずはレセプトについて簡単にまとめます。

3. レセプトってなに?

日本には国民皆保険という制度があり、全ての国民が以下のいずれかの保険に加入しており、医療費が3割負担になっています。

・健康保険組合:主に大企業などの従業員とその家族が加入
・協会けんぽ:組合健保のない中小企業の従業員とその家族が加入
・共済組合:公務員とその家族が加入する医療保険
・国民健康保険(国保):自営業者とその家族など、上記の健康保険の加入者以外の人が加入
・後期高齢者医療制度:75歳以上の人が加入

病院は患者の診察を終えた時に、その場で患者さんに3割のお金を請求します。そして、残りの7割は保険者に請求します。
この保険者に請求するときに、病院が作成するのがレセプト(診療報酬明細書)です。
レセプトは病院で作成された後に、審査支払機関という場所で請求内容が適切かの審査を受け、保険者のもとに届きます。
(ここの詳細はYouTubeで「医療くん」というChannelを見ると、非常にわかりやすくまとめられているので、参考になると思います)

4. データソースの違いによるデータの特徴

少し長くなりましたが、話をデータソースの理解という話題に戻します。
レセプトが「病院→審査支払機関→保険者」と流れる工程で、
・病院で匿名加工されたデータを提供しているのがMDVデータ
・審査支払機関で匿名加工されたデータを提供しているのがNDBデータ
・保険者で匿名加工されたデータを提供しているのがJMDCデータ
というのがデータソースの違いによる分類イメージです。

個人を特定することができないのが、匿名加工されたデータです。すなわち、匿名加工する前であれば個人を特定することが可能なわけです。
データソースと匿名加工というこの2点を理解すればレセプトデータの整理は非常にシンプルです。

冒頭でMDVは病院由来のレセプトデータと検査値データを提供していると言いましたが、病院内の患者IDでそれぞれのデータを紐づけて、匿名加工処理をしたデータを提供しています。病院内で匿名加工されているため、他の病院で作成されたレセプトデータを突合することはできません(これができちゃうと匿名加工情報ではなくなってしまいますね)。

一方のJMDCデータはというと、保険組合で匿名加工されたデータです。したがって、各保険組合のIDでそれぞれのデータを紐付けられるので、患者がどこの病院を受診してもデータの連結が可能なわけです。一方で、病院で作成されるレセプト以外の検査値等のデータは連結できません。健康診断のデータは保険組合の手元に届くケースが多いと思うので、連結ができるという仕組みになっています。

以上、今回のnoteではデータソースの違いでデータを理解するというお話をさせていただきました。
また次回以降で、NDBやMID-NETなどの他のデータに関しても触れていきたいと思います。

この記事が気に入ったらサポートをしてみませんか?