猫と人間が付属している眼鏡

締め切り駆動型ライフスタイル。ネルー値はいつも1桁。h-indexは11。人間が付属し…

猫と人間が付属している眼鏡

締め切り駆動型ライフスタイル。ネルー値はいつも1桁。h-indexは11。人間が付属している眼鏡と猫。

マガジン

最近の記事

Stata Tips: 全角英数字を半角に変換するための完全ガイド

データ分析における最初のステップはデータのクリーニングで、それはしばしば最も時間がかかり、しかし最も重要なステップとなります。 その中でも文字列変数の操作は、面倒なのであまり丁寧に行われないか、諦められるかの何れかです。 特に、外部(あまりデータ分析を行っていない)から提供を受けるデータでは、文字列変数に何故か全角英数字を半角英数字が混ざっています。おそらく全ての解析ソフトで全角と半角は異なる文字として扱われます。 このnoteでは、統計ソフトウェアStataを使用して

    • ハゲタカジャーナルは、もう少し設定を詰めてからメールを送った方が良いと思う。

      だいたいの研究者は経験したことがある、怪しいジャーナルからのお誘いメールについてです。 設定に無理があるメールがきたので紹介します。 和文誌のレター(学会員のみ読める)に対して、下記のようなメールが届きました。Global Journal of Medical Researchというジャーナルの編集長からのメールです。 このジャーナルの編集長は、和文誌を出版している学会の会員に英国の方が入っているという事でしょうか…? なんなん、暇なの?暇なのかか? しかも、日本語の

      • 5-ALAとシアン化物のあれこれ

        業務日誌的な備忘録本日、T社の5-ALAサプリメントに、0.2ppmのシアン化物が含まれているという情報を見聞きしたために、不安になったという相談がありました。 まず、食品での基準値は10ppmですので、0.2ppmは無視してよさそうです。また、シアン化カリウムのTDI(耐用1日摂取量)は、体重1kgあたり、1日0.0045mgですので、体重60kgなら0.27mgを毎日摂取しても影響ない、と言えます。 件のT社の5-ALAでは、1カプセル300mgとして、0.00006

        • 2022年8月発災の一酸化炭素中毒事故・備忘録

          一酸化炭素中毒に関する重要な労働災害ですが、書き留めておかないと忘れられてしまいます。また、同業他者への注意喚起しにくくなってしまうので、このnoteにて残しておきたいと思います。 なお、企業名は本質的な情報ではないので、記載していません。(情報元にいけば、見ることはできますが…) まとめると、防止のために必要だったことは、下記2点になるかと思います。特に新規性がない話ですが、基本に忠実なことが重要ということかと思います。 一酸化炭素ガスが発生する機器を使用するときには

        Stata Tips: 全角英数字を半角に変換するための完全ガイド

        マガジン

        • Stata一人勉強会
          7本
        • 論文の批判的吟味
          3本
        • 統計解析をしてみた結果www
          18本
        • Python一人勉強会
          1本

        記事

          オッズ比と信頼区間からp値を出す。

          論文投稿準備していたら、投稿規定に「p値を書け絶対だ」(意訳)というp値縛りがありました。 書けと言われたのだから、p値を計算して書けば良いのですが、投稿準備中の論文は「データ提供元の規約によって生データを削除済み」ということで、今からp値を計算できないという状況です。 ただし、既に作っている表には、オッズ比とその95%信頼区間のみがかかれています。 そこで、オッズ比と95%信頼区間からp値を算出することにしました。 使用する例下記がStataコードと出力です。lbw

          オッズ比と信頼区間からp値を出す。

          【Stata】 変数名から変数ラベルを呼び出したい

          Stataでわすれがちな変数名から変数ラベルを呼び出す方法をStataのヘルプファイル調べても、なかなか見つかりません。 そこで、自分の備忘録的なnoteを残しておきます。同じことでお困りの方はご参考にしてください。 変数ラベルの貼り付け方と呼び出し方 一般に変数は半角英数のみで名前を付けておく方が便利です。 しかし、中身が何だったか忘れないように、変数ラベルを貼っておく必要もあります。 label variable kaigo "要介護度" これで、「kaigo」

          【Stata】 変数名から変数ラベルを呼び出したい

          「交絡」の初出は鎌倉時代どころか5世紀まで遡れる件。

          「交絡」という語やConfoundingの訳語としての使われ方は、いつからなのか知りたくなって、調べられるだけ調べました。 もし、追加情報を持った方がいらっしゃったら、教えてくれると嬉しいです。 2021/05/25 @nutrepi先生から指摘された文献の年違いを修正。その他の誤字修正。 @2988yukikaze様から凄い情報を頂きましたので追記。 結論「交絡」の初出は鎌倉時代どころか、5世紀まで遡れました。もしかすると、もっといけるかもしれません。 Confoun

          「交絡」の初出は鎌倉時代どころか5世紀まで遡れる件。

          「『ポビドンヨードによるうがい』の新型コロナ軽症患者への活用」研究は、倫理審査手続きがまずいのでは?

          大阪府のポビドンヨードによるうがい研究の発表には、Twitterで医療系クラスタを絶句せしめたようです(個人の観測です)。科学的な側面についての指摘は多数入っていますし、私もどうかと思う点もあります。 しかし、研究内容の詳細は明らかにされていないので、もしかしたらちゃんとやっているのかもしれません。解析を担当されているのが、横浜市立大学医学部 医療統計学 山中竹春先生ですから、おそらく報道や大阪府の公開情報以上に何かされているのだと思います。 それはそれとして、倫理審査上

          「『ポビドンヨードによるうがい』の新型コロナ軽症患者への活用」研究は、倫理審査手続きがまずいのでは?

          【Stata】SIFをHRFに変換するにはどうする?

          How to translate SIF to HRF ? Stataでは、時間や日時を扱うデータをSIFというフォーマットで扱っています。これとは逆に、文字列の状態(2020/8/15等)の状態のことをHRFと呼んでいます。 SIF=Stata Internal Form HRF=Human Readable Form Stataマニュアルには、HRFをSIFに変換する方法は関数が用意されていて、直ぐに確認出来ます(コマンドウインドウに下記をタイプすれば良い)。 h

          【Stata】SIFをHRFに変換するにはどうする?

          荒唐無稽な解析結果が得られたとき、どうするか?

          解析結果によっては、荒唐無稽なのに統計学的に有意な結果が得られることがあるかも知れません。 一律に荒唐無稽だから捨ててしまうという態度で良いでしょうか。あるいは、統計学的に有意だから荒唐無稽であっても受け入れるべきでしょうか。 それについての一意見として、noteを記載しました。 発端下記のようにTwitterに頂いた、質問について回答しようと草稿を書いていたら、ちょっと文章量が貯まってしまったので、Twitterで回答するのを諦め、このnoteを作成しました。 まと

          荒唐無稽な解析結果が得られたとき、どうするか?

          宇崎ちゃん献血コラボの影響解析に関するご指摘への回答など

          元noteは下記です。いろんな派生noteを作っていて既に自分でも追えていない。 ここでは、2020/08/09までに未回答の質問に対して回答します。 この②と③について未回答です。①や1つめの質問については、その1、その2、その3にあります。基本的にパラレル仮定について色々、書きました。 有意に増加したと言えるのか?まず、nowhereman134さんから頂いた質問の最後の部分からです。 これらの事実を考慮しても、有意に増加したといえるのかどうかということです。(上

          宇崎ちゃん献血コラボの影響解析に関するご指摘への回答など

          Stataで処理に要した時間を記録したい。

          自分用のStata備忘録です。 問題意識とても時間がかかる処理を行う時に、要した時間を記録したいことがあります。 logの最初から最後までの必要時間なら、取ったlogを後から確認すれば良いのですが、途中の一部に要する時間を知りたいという場合にはlogでは時間が記録されません。 どうするのか?display " Start at: $S_TIME $S_DATE"do foobar // 時間がかかる処理display " End at: $S_TIME $S_DATE"

          Stataで処理に要した時間を記録したい。

          - rreg - Stataでロバスト回帰する

          回帰分析したいけれど、外れ値をどうにかしてやりたい。良くある事だと思います(当社比)。 Stataではいくつかの方法がありますが、そのうちの1つであるrregについて、使用方法を学んだので、備忘録的にまとめておきたいと思います。 rregコマンドについては、下記の様に説明されています。なるほど、わからん。 rreg first performs an initial screening based on Cook’s distance> 1 to eliminate g

          - rreg - Stataでロバスト回帰する

          OLS回帰係数の和の標準誤差をどうやって求めるのか?【Stata】

          なんやかんやあって、解析で、回帰係数の和とその標準誤差で作表が必要ということになりました。 回帰係数の和は足せば良いので、すぐに分かるのですが、和の標準誤差はどうするんだろう。わからん。 調べた結果を、今後おなじことで困った人(未来の自分含む)のために、日本語で記録しておこうと思います。 検索ワードは「standard error of the sum of two coefficient」でした。 Statalistに載ってた。みつけたのはStatalistという、

          OLS回帰係数の和の標準誤差をどうやって求めるのか?【Stata】

          宇崎ちゃんコラボのSCM解析の弱点を突かれたので、何かしてみる。その3

          元記事、その1、その2 パラレル仮定が成立してないけど、どうする? その1でまとめましたように、パラレル仮定は成立していないっぽいです。パラレル仮定2については、その2でまとめたとおりです。 ここでは、パラレル仮定1について検討したいと思います。 パラレル仮定1を何とかならないか、考える。 では、次の問題点です。パラレル仮定1は下記の様に定義しました。 パラレル仮定1:関東と合成対照は、宇崎ちゃんコラボ前期間(~2019年9月)の献血者数の動きについて、パラレルな動き

          宇崎ちゃんコラボのSCM解析の弱点を突かれたので、何かしてみる。その3

          宇崎ちゃんコラボのSCM解析の弱点を突かれたので、何かしてみる。その2

          元記事、その1、その3 パラレル仮定が成立してないけど、どうする?その1でまとめましたように、パラレル仮定は成立していないっぽいです。しかし、ここで解析を投げ出すわけにはいきませんが、公表データ以外は使えません(日赤に打診はしましたが、ダメでした。とても常識的な判断だと思います)。 私が平素取り扱うデータは、研究のために収集されたり、用意されたデータというのはほとんどありません。 そのため、このような事態が起きがちです。「起きてしまったら、そこで試合終了」としてしまうと

          宇崎ちゃんコラボのSCM解析の弱点を突かれたので、何かしてみる。その2