見出し画像

Stata初心者 #2 変数の型って何者?

 少しずつStataでデータを触って練習をしているが、例えば

ダミーのエクセルデータ

上記のエクセルデータをStataに読み込ませると、下記のように保存される。

Stataで読み込んだ結果

 この時点で医療系出身の私は
「Storage typeってなんぞ?Display formatってなんぞ?」
となる。
 きっとStataなら適切に読み込んでくれていると信じているが、
ネットで検索すると、変数指定のミスで痛い目をみたという報告多数…

 ここはちゃんと勉強しよう。


Storage type(変数型)について

変数型のフローチャート

 文字列の型の場合は、str「数字」の数字がそのまま文字数に対応する。
 数値データについては、下記の表のとおり。

数値型の大きさ(Stataガイドブックを参考)

Display format(表示形式)について

上記のように読み込まれる

読み込んだ例で言えば、IDは「%10.0g」と表記されている。意味は以下のように分解される。

表示形式

固定長形式は数字であれば、一般に

固定長形式

のように表現されている。

 実際に見比べてみる。もとのエクセルデータは

もとのエクセルデータ

であり、Stataに読み込んだ後の表示は、

Stataへインポート後

となる。value_Xやvalue_Yを元の少数桁数に戻したいときは、
value X:%10.0g → %10.2f
value Y:%10.0g → %10.1f
などにすると、

表示形式変更後

のようになる。

注意点(日付や生年月日)

このデータでは変数「day」は文字列として読み込まれている。日数を計算するのに使用する場合、このままでは使えないため注意が必要。その方法は、後々記載予定。

この記事が気に入ったらサポートをしてみませんか?