電子カルテのデータを研究用に使えるようにする

多施設の臨床研究でデータ収集の協力をさせていただいている。
診療情報部にご協力いただき、カルテのデータを出力いただいた。
複数のデータセットを結合して整理する必要がある。
この時、重複症例を削除したり、変数名を英語にしたり、外れ値をチェックしたりしてデータを整理する必要がある。
データの整理は最も骨が折れる地道な作業と言われるが、その意味がわかってきた。
大学院でデータマネジメントの重要性は口を酸っぱく教えていただいたので、今はその重要性を認識して、大変な作業にも意味を見出せるようになった。
また、STATAのデータマネジメントの本(https://www.stata.com/bookstore/data-management-using-stata/)がとても素晴らしく、結合の時に出るエラーへの対処方法、重複の見つけ方やデータ入力エラーの見つけ方、日付のデータの取り扱いなどわかりやすく解説してくれていた。
悪戦苦闘してなんとかマージに成功した時は1人ほくそ笑んだ。

もっと大規模データを扱うときもデータとよく触れ合って、データと友達のように親しくなっていくことで質を担保する必要があるのだろう。

下手なやり方でもとにかく愚直にやれば進む作業なので、アイデアを出しては没になる研究計画の最初の段階よりは絶望感は少ないかもしれない。

体を壊さない程度に1日1日できることを大切に。後ろは振り返らず前も見ない。周りと比べない。今の自分にできることを着実に。

この記事が気に入ったらサポートをしてみませんか?