見出し画像

Biomedical Conceptとは何か

はじめに

CDISC標準に登場するBiomedical Conceptに関する記事です。「Biomedical Conceptって何?」という方に向けて、ぼんやりとしたイメージを抱いてもらいつつ、理解した気分になってもらうための文章です(『理解できる』とは言っていない)。
自分の頭の中の整理する一面もあります。正確な記述ではない部分、忠実な引用ではないこともあるので注意してください。


Biomedical Conceptとは何か?

Biomedical Conceptとは

臨床試験の「専門用語」・「よく登場する概念」を"CDISCの世界観に則して"表現したもの

注:勝手なまとめです

Biomedical Conceptとは何か?という疑問に端的に答えるなら、上記のようになるのではないかと思います。…とはいえ、これでは何が何やらさっぱり分からないので、(かなり長い)補足の説明が必要だと思います。

Concept(概念)とは何を指す?

Biomedical Conceptが分かりにくい要因の一つとして「概念」という言葉の意味が多様すぎて、イメージが付きにくいことがあります。まずは、ここでいうところの「概念」の例をいくつか挙げてみます。これらすべてはBiomedical Coneptの例です。

  • カルシウムの測定(つまり、臨床検査の一項目)

  • 自由記載で収集した有害事象

  • 治験組み入れ時の同意の取得(つまり、出来事)

  • 選択・除外基準の違反

  • 胸部X線検査(つまり、手順)

どうでしょうか?上記が全て「概念」と言われてもピンとこないかもしれません。ですが、上のアイデアを拡張するなら、次のように考えられそうです。

  • "カルシウムの測定"が一つの「概念」なら、その他の臨床検査の項目(例:赤血球数・BUN)も「概念」ではないか(→その通りです)

  • 臨床検査にとどまらず、バイタルサインの検査(血圧・脈拍など)も、それぞれが「概念」になるのでは(→その通りです)

  • 自由記載で収集した併用薬剤名も一つの「概念」だろう(→その通りです)

  • 治験の完了というイベントも「概念」ではないか(→特別な概念です)

このように、Biomedical Conceptとされる「概念」には、単純なものから、それっぽいもの、それって「概念」なの?と言いたくなるものまで、様々なものが含まれます。血圧や赤血球数などは単なる一検査に過ぎず、「概念」と呼ぶまでもないと感じるかもしれません。納得感はないかもしれませんが、Biomedical Conceptにおける「概念」にはかなりの幅がある…ということを理解しておくことが重要です。

(おまけ)
2024年3月時点では、Biomedical Conceptは開発途中のCDISC標準です。公式サイトに専用ページ(https://www.cdisc.org/cdisc-biomedical-concepts)が設けられていますが、これを読んで実態を把握するのはかなり難しいと思います

なぜ「概念」をまとめるのか?

とりあえずBiomedical Conceptにおける「概念」とはそんなものだ……と仮置きしておいて、なぜこのようなものを定義するのかを考えてみましょう。

面白いことに、人間は『自分たちの世界で通じる用語』を作る傾向があります。一例として『若者言葉』がありますし、『その界隈』でのみ通じるコミュニティの言葉もあります。『IT用語』もその一つでしょう。ひょっとすると、『ブロント語』もその一つかもしれません(これで勝つる)。
こういった"界隈の用語"を使うことで、その世界では効率よく意思疎通ができるようになります。その一方で、他の世界と言葉が通じにくくなるという弊害ももたらします。専門用語は便利ではあるのですが、セマンティクスの壁(世界を超えると意味が通じなくなる現象)も発生させてしまいます。

たとえば「カルシウム」を例に考えてみましょう。

  • カルシウム(医療分野):血液検査項目の一つ。電解質。単位はmg/dL

  • カルシウム(一般人):栄養素の一つ。牛乳に入っている。丈夫な骨の原材料。え?血液検査?グラムで測るの?

医療の世界の方にとって、カルシウムという言葉には「医療」と「一般」の意味があります。文脈に応じて適切な定義を使えるでしょう。しかし、現代においては異業種の方と協力することも多々あります。そういった方々の頭の中には「医療分野」の定義は存在しません。
病院がプログラマさんを雇って「カルシウムが~」と話してみても、言いたいことが伝わらないかもしれません。普段、何気なく使っている単語は、隣の人にとっては「謎の呪文」かもしれないのです。

CDISC標準においても同じことが言えます。CDISCの世界での「X」は、世界中の全員にとって「X」であるとは限りません(「Y」かもしれませんし、そもそも存在しないかも)。自明と思われることであっても、きちんと説明する必要があります。
部外者や新規参加者に間違いなく伝えたいこと。これを「概念」と呼ぶなら、CDISC標準は「概念」をきちんとした形でまとめておく必要に迫られます。つまり、Biomedical Conceptを定義する必要性に行きつくのです。

SDTM作成における「概念」の有用性

ここで場面を変えて『SDTMデータセット作成』の現場を考えてみましょう。SDTMデータセットの作成では、この世界(SDTM標準の世界)における特有の期待があります。ですが、外部からやってきたプログラマさん、種々の業務に忙殺されているデータマネージャーさんにとって、SDTM標準の世界は未知の領域です。

この状態で「カルシウムの測定データ」をSDTM形式で表現してみましょう。それっぽくまとめるならこんな感じでしょうか…

  • USUBJID = 001-01

  • LBTEST = カルシウム

  • LBORRES = 8.5 mg/dL

残念ながら、この実装方法はSDTMとしては不適切です。

では、作成者がもう少し賢い人と仮定しましょう。ある程度の医療の知識をもった上で、ちょっとだけSDTM/SDTM IGを読んでいます。どんな変数があるか・どんなControlled Terminology (CT)が割り当てられているか、といった情報を各種資料から引き出せます。今度は「血糖値のデータ」をSDTM形式で起こしてみます。

  • USUBJID = 001-01

  • LBORRES = 100

  • LBORRESU = mg/dL

  • LBTEST = Blood Glucose ?

  • LBTESTCD = BLDGLC ?

SDTM的にはまともになりましたが、LBTEST(CD)変数の値に自信がないようです。「血糖」=Blood Glucoseですから、作成者はこれに相当するCTを探しました。残念ながら、そんなものはありません。
なぜならば、「血糖」は LBTEST=Glucose, LBSPEC=BLOOD/SERUM/PLASMA と分割して実装するのですから(そんなことはどこにも書かれていないのでは?
更に言うなら、この血糖値なるものの検体を確認するべきです。「全血」で測定した値なのか「血漿」の値なのか「血清」の値なのかを知る必要があります。検体の種類は重要な情報です。
SDTM/SDTM IGだけを読み込んだプログラマが、この点に気が付くのは難しいかもしれません。血糖=Blood Glucoseなので、自動的に"BLOOD"を選択する可能性があります。

このように医療(治験)領域の知識とSDTMの知識があったとしても、SDTMデータセットへのデータマッピングには難しい側面があります。SDTMの世界には「独自の世界観に基づく"血糖"や"カルシウム"のデータの表現方法」があります。そこでは、暗黙的にある程度の医療分野の知識が求められています。しかし、医療の世界の用語と共通する部分が多いにしても、性質は異なるものであり、時として医療の知識が邪魔をしてしまうことすらあるのです。

となると、SDTMデータセットを正しく作成するには、特殊な能力が必要となります。それなりの医療知識があるけれど、それにトラップされない。多種多様なSDTMのルールを把握していて、必要な情報をすっと取り出せる。そんな人はほとんどいないでしょう。育成も容易ではなさそうです。
では自動化すればいいのでしょうか?それも難しそうです。もし、あなたが臨床データの自動的マッピングを考えているなら、このような"SDTMの世界観のルール"を、プログラムで処理可能な形式でまとめる必要がでてきます。

これはちょっとした……いえ、かなりの問題です。

臨床試験のデータ(例:血糖値データ)は共通の形式で表現しておく必要があります。同じデータであっても、SDTMデータセットを作るたびに違う表現になっていたら、データ交換・結合・共有はできません。しかし、人間が作成するとなると、知識・経験不足・勘違い・エラーなどでバラバラのものができてしまいます。

これを解決する良い方法はあるでしょうか?一つのアイデアは「SDTMの世界における血糖値の表現方法」を一つの「概念」と捉え、その内容きちんと記録しておくことです。Biomedical Conceptですね。

ではここで、SDTMへのデータマッピングという場面を想定して、実際のBiomedical Conceptを確認してみましょう。今度は尿糖(定性)を取り上げます

CDISC Libraryより引用

この図から次のことが分かります
(1) LBTEST(CD)変数に設定するべき値
(2) LBCAT変数に値を設定した方が良さそう
(3) LBORRES変数だけでなく、LBSTRESC・LBSTRESN変数も利用する
(4) 単位のデータは存在しない
(5) LOINC変数に設定するべき値
(6) LBSPEC変数に設定するべき値
(7) 空腹フラグ変数があり、その値はYかNである

注:上記のBiomedical Conceptはかなり簡略化した状態で表示されています。本来はより多くの情報が含まれています。必須の変数かそうでないか、SUPPデータセットかドメイン本体か…などといった情報もあります

どうでしょうか?このBiomedical Conceptがあれば、尿糖(定性)のデータはSDTMにどのようにマッピングされるでしょうか?深い知識がない人でもそれなりの形になるでしょうか?医療の定義をつい参考にしてしまう人でも、正しいCTが使えるでしょうか?おそらく、Biomedical Conceptがない時よりは、揃った状態になると予想されます。

まとめ

以上のことから、Biomedical Conceptについて次のようにまとめられるでしょう

  • Biomedical Conceptとは臨床試験の「よく登場する概念」を"CDISCの世界の言葉で"説明したものである

また、Biomedical Conceptを定義する意味として、次のようなものがあります

  • 非専門家にとって、CDISC標準への参入障壁が下がる

  • 誰もがCDISCデータセットを「期待される形式で」作成できるようになる

  • 他の分野の人たちとの意思疎通が容易になる

  • 一種の教育資材・ノウハウの蓄積場所になる

おわりに

Biomedical Conceptについて、もう少しまとめておく予定です。後編に続く

この記事が気に入ったらサポートをしてみませんか?