Yuro

Osaka or Kyoto

Yuro

Osaka or Kyoto

最近の記事

How to study Duolingo English Test to get 120.

1) The reasons why I took DET Doulingo English Test (DET) has become more common in recent years even though many people tend to take IELTS or TOEFL. I took IELTS three times in the year of 2023, but it was tough for me. (FYI : My score is

    • Type1 error/Type2 error

      Type1 error(第一種の誤り) 定義: 帰無仮説が真実の場合に、誤って帰無仮説を棄却する誤り。 例: ある薬が効果がない(帰無仮説)と仮定した場合、テストの結果、この薬が効果があると誤って判断すること。 P値: 第一種の誤りの確率は、通常α(アルファ)として示され、これはしばしば0.05と設定されます。つまり、5%の確率で第一種の誤りを犯すリスクがあるということ。 Type2 error(第二種の誤り) 定義: 対立仮説が真実の場合に、誤って帰無仮説を採択す

      • サンプルサイズの大きさとp値の関係

        • ”順序”ロジスティック回帰

          ①ロジスティック回帰の位置付け →多変量解析におけるデータから予測に入ると思う。重回帰分析との棲み分けは次に述べる。 ②多変量解析における重回帰分析と何が違うか? →予測値の取る範囲が定まるもの=ロジスティック回帰? →定まらないもの=重回帰分析? ③順序ロジスティック回帰とは? →目的変数が2値ではなく3値以上を取る時に活用する回帰分析 →(取る値の数ー1個)のロジスティック回帰を作ることが本質的な考え方か。例えば4値取る場合は、3つのモデルを作る。 (→オッズの考え方

        How to study Duolingo English Test to get 120.

          分布の違い

          どのような違いがあるか。確かに、t分布と正規分布、F分布とカイ二乗分布はそれぞれ似ている特性を持っています。しかし、これらの各分布は独自の特性と適用範囲を持っており、そのためには重要な役割を果たしています。特に、統計的推定と仮説検定の文脈でそれらは頻繁に使われます。 正規分布とt分布: 正規分布は、中心極限定理により、大数の法則により平均値が正規分布に従うとされています。しかし、実際のデータ分析では、母分散が既知であるという仮定はしばしば成り立たないため、母分散が未知の場合

          分布の違い

          各要因の影響や、要因の組み合わせの影響を確かめる。(手段として交互作用項を導入し重回帰分析を使う)

          Plan & Do【解答】 もちろんです。 まず、必要なライブラリをインポートします: import pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as smf 次に、DataFrameを作成します: # データの準備data = { "joint_type": [1, 2, 3, 1, 2, 3, 1, 2, 3, 2, 1, 3, 2, 1, 3]*10, "

          各要因の影響や、要因の組み合わせの影響を確かめる。(手段として交互作用項を導入し重回帰分析を使う)

          続:クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

          【解答】 1:3群に差があるか?に対する問い: 「p値を出すために、クラスカル・ワリス検定をすればできる」 → はい、その通りです。クラスカル・ワリス検定は、3つ以上の群間での中央値の差異を検証するための非パラメトリックな手法です。この検定により、p値が得られ、それにより群間に統計的に有意な差があるかどうかを判断することができます。 2:どのくらい差があるか?に対する問い: 「効果量を出すために、Mann-Whitney U検定をすればできる」 → これは半分正しく、半分間

          続:クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

          クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

          大学院で頑張る友人へタイトルの件、1〜4章(PDCA)をChatGPTと一緒に整理した。 そんなに大層な内容ではないけど、参考になれば嬉しい。 1章:やりたい分析とコード・・・Plan・Do 【解答】 まず、Pythonでクラスカル・ワリス検定を行う方法を説明しましたが、その際の信頼区間を求めるには、クラスカル・ワリス検定自体がパラメトリックなテストではなく、特定のパラメータ(例えば平均や分散)を仮定しないため、信頼区間を直接計算することは難しいです。 しかし、エフェク

          クラスカル=ウォリス検定をして、その後にマン・ホイットニーのU検定をする(W/GPT-4)

          どう単位を取ったか?【入門微分積分('22) - 放送大学】

          掲題のクエスチョンに対する意見授業期間中に、中間テスト、課題型問題、教科書の演習に注力する。 そのために、2ヶ月ほどで15回分の放送を見終える。 以降は、「単位を取りたかった理由」「授業をマスターするために大事にしていた心得」「勉強方法」「結果」「振り返り」「2023年春セメスターの目標」「ネクストアクション」を書き下した。 受講を検討している方の参考になれば嬉しい。 単位を取りたかった理由 修士課程に応募するときのアピールとして活用するため。 過去に大学レベルの微分積

          どう単位を取ったか?【入門微分積分('22) - 放送大学】

          どう単位を取ったか?【入門線型代数('19) - 放送大学】

          掲題のクエスチョンに対する意見入学前に、範囲内の演習を1周することが有効。 例えば、23年4月から受講を考えている人は、入学前の2月〜3月は予習に使えるといいかもしれない。 以降は、「単位を取りたかった理由」「授業をマスターするために大事にしていた心得」「勉強方法」「結果」「振り返り」「2023年春セメスターの目標」「ネクストアクション」を書き下した。 受講を検討している方の参考になれば嬉しい。 単位を取りたかった理由 修士課程に応募するときのアピールとして活用するため。

          どう単位を取ったか?【入門線型代数('19) - 放送大学】

          【Data analytics】片対数グラフを使う

          1. 対数を取るグラフとは軸のスケールに対数をとること(片対数グラフや両対数グラフを使うこと)で、指数関数的に増減するデータに対して可視性を高めることができ、 示唆を出しやすく(例:増加率が上下したなど)なります。 その参考となる資料(サイトやYoutube)を3つ紹介します。 ”片対数グラフ・両対数グラフとは?ー分かりやすく解説”(Youtube) そもそもデータをグラフ化する目的って何だっけからスタートし、仮想だがの売上データを使った具体例にも触れてくれています。

          【Data analytics】片対数グラフを使う

          【Data analytics】p値とどう付き合っていくべきか(part1)

          0. 本記事のスコープpart1では、p値の問題点を提起した上で、p値はどのような特徴を持っているのか確かめます。p値以外のアプローチについては、次回以降(part2)の記事で述べる予定です。 1. p値に関する問題点 ー思ったよりも簡単にp値ハッキングができるー研究やビジネスの意思決定において、p値のハッキング(p値が設定した有意水準を下回るように操作すること)が問題となっています。 その問題点に触れている記事を3つ紹介します。 まずはTJOさんの記事です。 次にエナ

          【Data analytics】p値とどう付き合っていくべきか(part1)

          【cloud入門】難しい言葉をわかりやすくするのにトライ

          So what 1 : クラウドサービスを使う Amazon / Microsoft 365 / Youtubeのような大量のユーザを支えるインフラと同等のものを使う So what 2 : 管理コンソールで操作する ブラウザで表示されるクラウドの画面から操作する So what 3 : ゾーンを分けて冗長化する 複数のサーバを他の拠点に構築して(ゾーンを分けて)、ある拠点が停電などでサーバが動かなくなっても他の拠点のサーバは稼働し続けるようにする(冗長化する)

          【cloud入門】難しい言葉をわかりやすくするのにトライ

          【Data analytics】SEMによって、満足度の要因分析にトライ

          What/Why is SEM? SEM(別名:共分散構造分析、構造方程式モデリング)は因果関係を説明する上でとても有効な分析手法です。細かな説明はアイシアさんの動画がわかりやすいです。SEMで使われている方程式の正体や具体例が丁寧に説明されています。 前提の確認(使う言語・使うデータ)【使うツール】 私は学生時代に、「消費者はなぜ000を使うのか/使い続けるのか/人に推奨するのか」を心理に着目して、このSEMを活用して、因果関係の解明を試みました。学生時代はSPSS(大学

          【Data analytics】SEMによって、満足度の要因分析にトライ

          【Data analytics】Rで因子分析(Factor Analysis)・クロンバックα算出を試みる

          なんでやるの? 因子分析はデータの裏側にある共通した因子を見つけるため。これにより、新たな軸ができるイメージ。軸出しはマーケティングなどで活かそうです(最後の方で、因子分析の応用例に触れられています→AiciaさんYoutube)。  クロンバックα算出は信頼性の確認のため。変数の調査とそれに紐づく質問を用意する際、本当にその質問でいいのか、信頼できるのか?この問いに答えるべく、統計処理を行い、信頼性を確認します!(詳しくは、Rによるやさしい統計学) 実際にやってみる前提

          【Data analytics】Rで因子分析(Factor Analysis)・クロンバックα算出を試みる

          ビルゲイツの読書ルールを4点

          1. 1年で50冊  (Read 50 books in a year) 2. ノートを取る  (Take a note) 3. 1回の読書は1時間以上  (Reading is at least one hour at a time) 4. 最後まで読む  ( Finish every book you read)

          ビルゲイツの読書ルールを4点