見出し画像

【STATA Techs-003】データの加工処理

THEME:データ処理の際に有用なコマンドを紹介
GOAL:異常値や欠陥値などを加工処理し、データ分析に入ることができる

◯サンプルデータ◯

◯使用コマンド◯

replace varname = varname + x
:変数に四則演算

generate newvar =~
:新変数の作成
※「gen」だけでも可

rename varname newvar
:カテゴリ名変更
ex)rename ecosat esat

drop varname
:変数の削除

recode varname x=y
:指定の値を任意の値に置換
ex)recode inc 1=100 2=300 3=500 4=700 5=900 6=1100 7=1350 8=1750 9=3300

recode varname x=.
:欠損値処理
ex)「999」が欠損値の場合、recode varname 999=.

drop if varname ==.
:欠損を含む列を消す

drop if varname > x
:異常値の削除
例)total_incomeにおける1275より大きいデータを消す場合、
drop if total_income>1275
*等号・不等号の関係は以下
・if varname == x :xとvarnameが等しい時
・if varname ~= x :xとvarnameが等しくない時
・if varname > x :varnameがxより大きい時
・if varname < x :varnameがxより小さい時
・if varname >= x :varnameがx以上の時
・if varname <= x :varnameがx以下の時

◯数学的関数◯
・log(varname):varnameの自然対数をとる
= In(varname)
・log10(varname):varnameの常用対数をとる
・sqrt(varname):varnameの平方根をとる
・abs(varname):varnameの絶対値をとる
・exp(varname):varnameのe^xをとる
例) gen log_income = log(income)

======
本田恒平(Kohei Honda)
一橋大学大学院経済学研究科博士後期課程(政治経済学、労働政策)

▼質問やご意見等はコメントかホームページのフォームから▼

▼SNS▼

Twitter: https://mobile.twitter.com/4strings725
Facebook: https://www.facebook.com/profile.php?id=100002374515435

この記事が気に入ったらサポートをしてみませんか?