見出し画像

BIツールによるDPCデータの可視化~その①~

BIセレクション

今更ですが、病院データの代表格であるDPCデータとデータ分析ツールのBIツールについてまとめます。DPCデータは私の場合、自分で立てた自作SQLServerに格納しています。格納した後の工程は可視化となりますが、DPCデータの可視化には、BIツールが適しています。

Excelの良いところは手で描くようにグラフの微調整が出来る事。かなりかっこいい複雑な複合グラフを作成することができると思います。
しかし、大抵、再現性が極めて低いです。
しかも毎月同じことをするとなるとかなりの時間的ロスと精神をやられます。
同じことを繰り返す忍耐力は大事ですが、その忍耐力はココで使うべきではないと思うのです。
その忍耐力は交渉の場で発揮すべきで、普段は温存しておくべきです。
毎月、毎年ひたすら同じ帳票を作り続ける。
これも大変素晴らしいことですが、帳票形式やExcelの書式を使った表は二次利用のしようもありません。
扱うデータ量が膨大になると、もはやAccessやExcelでは限界が生じます。
最近の分析環境は大体以下のようになってきました。

DPC→SQL→BIツールorR←電カルデータ


BIは以前はQlickView、WinOS64bitをゲットしてからはQlickSense。一時期、石川ベンジャミン光一先生の影響でTableauにも憧れて無償版を使ってみた時期もありますが、やはり料金がかかるので断念しておりました。
そして統計的なグラフ生成や解析にはR。と使い分けておりました。

そんな矢先にマイクロソフト社から最強のBIツールがリリースされていることを知り数年前から最近は専らこれを使っています。

Microsoft PowerBI Desktop

あらゆるデータベースに対応しており、さらにRのグラフィックスとの連動も出来るという強者です。近年はPythonも。
そして無料で使えるという敷居の低さも大変ありがたいです。
かなり難しいグラフも生成できますし、Excelでは至難の業だった箱ひげ図(BOXPlot)も拡張機能(VisualGalleryにて追加)を使えばあっさり出来てしまいます。※Excel2016では箱ひげ図対応済。
しかし、まだまだ箱ひげ図は圧倒的にRのパッケージであるggplot2の方が鮮やかで自由度が高いと思います。
しかし、とにかく、無料ではじめられて、Rと連携出来るPowerBIを私はこれからも使い続けます。

ちなみに、Qlick製品は個人単位の利用では無料(Qlick Senseは今年より有料化の予定)ですが、R連携に対応していませんでした(2017年より連携可)。SenseはかなりUIやグラフィックスもオシャレで好きですが、Rとの連携に当初は難があり、断念しておりました。
一方、Tableauは無論、R、Python連携は可なのですが、やはり、良い製品はお金がかかる。そんなに高くはないと思いますが、個人単位での購入は非常に厳しいです。

DPCデータとBIツールの相性

DPCデータをBIで可視化する最大のメリットはデータ更新の容易性です。
SQLに毎月のデータを格納していけば、BIツールにODBC接続してデータを読み込ませる設定をしておけば、更新ボタンを押すだけでデータが更新されます。
DPCデータが再提出された場合等の更新には大変重宝します。

BIツールにSQLに格納したデータをODBC接続する前にやっておくべき処理があります。
例えば、D、E、Fファイルを金額換算する処理が必要ですし、様式1や様式4を扱いやすい形に加工しておく必要があります。
また、すべてのデータをSQLで連結することも可能ですが、連結する際には連結元と連結先のいづれかが一意のデータでなければなりません。
コツはBIツールで可視化したいテーブルに応じて結合用の一意のIDを持たせるということです。

DPCデータのBIツール上でのデータ連結のコツ

一般的には一意のレコードを作成する場合は
ⅰ データ識別番号+入院年月日
これで1患者1入院のレコードが出来ます。
しかしながら診療行為の日付を持った状態
つまり実施年月日まで持つ場合には
ⅱ データ識別番号+入院年月日+実施年月日
とする必要があります。

包括出来高比を診療区分ごと、かつ、実施日別に可視化するためには、ⅱのレコード管理を行うことでうまくいきます。

また、詳細は次回に紹介したいと思います。

この記事が気に入ったらサポートをしてみませんか?