StataとSASを比較してみた

エモリー大学ロリンス公衆衛生大学院ではSASをメインで使っているのだけど、卒業後にSASを買ってくれる組織に所属しないであろう私は、MPH2年目からStataを使い始めた。Rはコードが難しそうで、すぐに習得できる自身がなかったので…。せっかくなのでSASとStataを使い勝手を比較してみた。ちなみにStata ver. 14.2とSAS ver. 9.4を比較している。

StataがSASに比べてよいと思う点

・価格が安い(学生は約US$400で永久ライセンスが取得できる)
・コードがシンプルで覚えやすい。
・ラベル(SASでいうフォーマット)もデータセットと同じファイルに保存されるので、バラバラになる心配がない。
・Complex survey dataにもある程度対応している。SASだと実質的にはSUDAANを購入する必要があり、これがまた高価である。
Statalistという掲示板があり、質問をすると誰かが答えてくれる。
・それでも疑問が解決しない場合にStataCorp社には、ユーザーの質問に答えてくれる専門の統計家に連絡できる。

StataがSASに劣る点

・図が1つしか表示されない。新しい図を出力すると、過去の図が上書きされてしまう。
・SASでいうproc univariateがない。一つのprocedureで、ある連続変数の概要が一目でわかるのは地味に便利だった。
・SASでいうall possible model selectionでICなどを一覧表示にしてくれる機能がない。Stataでは各モデルごとに手動でICを出力しなければならないので、地味にめんどくさい。
・Multiple comparisonでTukeyなどが使えない。ボンフェローニが有名だが、有意水準が厳しすぎるので。後日、UCLAのウェブサイトからプラグインがインストールできることを発見した。
・Multicolinearityの精査でConditional indicesなどのVIF以外の手法が使えない。これもUCLAのウェブサイトからプラグインをダウンロードすることで解決した。
・一般化混合効果モデル(GLMM)を回帰する-meglm-コマンドでは、なぜかRマトリックスが指定できない(つまりIndependentのみ)。線形混合効果モデルの-mixed-コマンドではできるのに、なぜ?これだとLongitudinal data analysisができない。早急に機能改善を求めたい(注:Stata ver.15では-menl-なるRマトリックスも指定できるGLMM用コマンドができたようだ。しかしupgradeには金かかるんだよなぁ…)。
・一般化推定方程式(GEE)のpost estimationで、QICを出せない。これもサードパーティのプラグインがダウンロードできるので解決した。

SASもStataも全ての機能を使ったわけではないので、上記で網羅されているわけではないと思う。もし新しい特徴を発見したら、適宜付け足したいと思う。

もし記事の内容が役に立ったと思ったら↓ボタンをポチッとお願いします!