NABI

大学院生。エクセルばかり使ってきたため大容量データに対応できず、最近やっとStataや…

NABI

大学院生。エクセルばかり使ってきたため大容量データに対応できず、最近やっとStataやEmEditorの使用を開始。 研究メモや他の方の有益な記事のアーカイブとして利用。 記事に間違いがありましたら、教えていただけると幸いです。

最近の記事

Stata初心者 #3 cond関数(Stata版 IF関数)

 エクセルの作業でIF関数を使える事は、初心者脱却の登竜門である。当然、Stataでも様々な条件分岐が必要であり、その一つに「cond関数」がある。おそらくcondition(条件)の略である。 ダミーデータの読み込み Stataでは基本的にクリックだけでエクセルデータのインポートができる。 [ファイル] →[インポート] → 読み込むデータ形式(エクセルならxlsやxlsx) と進める。 今回は、20人の年齢、身長、体重が入ったデータを使用する。 変数(BM

    • EmEditor初心者 #3 重複を削除して列を抽出

       データを扱う際に、重複したデータを削除したい時が多々ある。  医療系データでも、例えばDPCデータの処理の際にそういったことが必要になってくる。  エクセルなら関数やマクロですぐにできそうだが、DPCデータは(ファイルの種類によるが)一か月分でも数万行~数十万行と大きいため厳しい。そのため、EmEditorの操作を確認してみる。 0. ダミーデータ  3,000行あるダミーデータを準備。 1. 列内の重複を削除  IDの重複を削除したい場合、データを読み込んだ後に、

      • Stata初心者 #2 変数の型って何者?

         少しずつStataでデータを触って練習をしているが、例えば 上記のエクセルデータをStataに読み込ませると、下記のように保存される。  この時点で医療系出身の私は 「Storage typeってなんぞ?Display formatってなんぞ?」 となる。  きっとStataなら適切に読み込んでくれていると信じているが、 ネットで検索すると、変数指定のミスで痛い目をみたという報告多数…  ここはちゃんと勉強しよう。 Storage type(変数型)について 文字列

        • EmEditor初心者 #2 フィルタリング

          ツールバーに数字やアルファベットの並び替えがあり、 その右側に「高度な並び替え」というコマンドがある。 それを使うと、優先順位がある各列の並び替えが可能。  また、「高度なフィルター」を使えば、AND、ORのフィルターが設定できる。方法はデータ中のフィルターをかけたいものを選択(場合によっては複数選択)してから、右クリックして表示されるメニューから [フィルター] を選択する。この時、「全体」なのか「列」なのか、そして「フィルター」なのか「除外」なのかを選ぶ。  最後にフィ

        Stata初心者 #3 cond関数(Stata版 IF関数)

          EmEditor初心者 #1 行列の表示とヘッダー

          データを読み込んだ後すぐにエクセルような表示になるわけではない! 左上にある ・「CSV」モード ・「カンマ」モード ・「タブ」モード で適切なものを選択。 また、ヘッダーについてはタブの真ん中右側の「ヘディング」※長方形セルマーク を選び、列ヘディングを1にすると1行目が並び替えられない。

          EmEditor初心者 #1 行列の表示とヘッダー

          Stata初心者 #1 1行目が変数にならないとき

          エクセルからファイルをインポートすると、1行目のヘッダーがうまく取り込めない。こんな初歩的な事もわからず、悪戦苦闘しわかったこと(普通にマニュアルに記載あります…)。 【変数の基本的ルール】 • 変数名はアルファベットで始める。数字や記号から始めることはできない。 • 変数名は1文字だけでよいが、時間変数として予約されている「t」は使用できない。 • 変数名の長さには制限はなく、任意の文字、数字、記号を組み合わせて使用することが可能(予約語を除く)。 • 変数名にセパレー

          Stata初心者 #1 1行目が変数にならないとき