- 運営しているクリエイター
記事一覧
[ R ] データファイルの冒頭 n 行を読み飛ばす
Google Trendsは,Google 検索での検索クエリから,トレンドがどう変化しているかをグラフで見ることができます。
データは csv ファイルでダウンロードできます。統計やグラフの作成の勉強用のデータとしても使えて便利です。
R で Google Trends の出力する csv には注意する点が2点あります。
冒頭2行にデータの説明が書いてある
データのラベルが日本語になって
[ R ] ふたつの折れ線グラフを重ねて描く
概要 この記事は,R を使ってふたつの折れ線グラフを重ねて描く手順を説明したものです。初心者を対象にわかりやすく,説明することを心がけています。
折れ線グラフとは折れ線グラフにはx 軸とy 軸があります。
x 軸の数値が変化することによって,y 軸のデータ量がどのように変わるのかを確認するときに効果的なグラフです。
具体例
純アルコール量と死亡リスクの関係を調査した,Holman たち (
R を使って,「わかる」統計!合格!統計検定4級 データの記述(1)
統計学の目的データを記述すること,これが統計学の目的のひとつです。
次の数値は2018年5月に測定された男子中学生の体重です(1年生,43名)。数値は,青山 (2022) の論文を参考に生成しています。2018年5月の段階では,私たちはまだコロナを経験していません。
体重は体重計で測定されます。なんらかの物差しで測った値のことを測定値といいます。測定値のあつまりをデータといいます。
次のデー
Bonferroni 法 多重検定の問題を避ける方法
多重検定の問題
多重検定の問題とは,有意水準 5%のもとで,検定を繰り返すことで,第一種の誤りの危険性が 5% を大きくこえてしまうという問題を言います。有意水準5%のもとで,10回検定をした場合,第一種の誤りの危険性は40%を超えます。
$$
1 - .95 ^{10} = .40 \cdots
$$
Bonferroni 法
この問題を避けるには,有意水準を5%より小さくすればいいでし
なぜ,一つの研究で検定を何回も行ってはいけないのか?
多重検定の問題
一つの研究で工夫のないまま何度も統計的仮説検定を行なってはいけません。
私たちは,今,人生に対する満足度に影響を与えるものを調べているとしましょう。600名の社会人(男女300人)を対象に質問紙調査をしました。調査対象者には以下の5つの質問に答えてもらい,最後に,「人生に対する満足度」を測定する尺度に回答してもらいました。
性別
職業の有無
趣味の有無
病気の有無
共分散って何のための指標なの?
共分散共分散は,モデルとデータの適合度を検定するときに使いますが,それ以外ではあまりに使いません。しかし,共分散は相関係数を学ぶときに不可欠な概念です。母集団の共分散の値を算出する場合は,以下の式で表現されます。
式
$$
s_{xy} = \frac{1}{n} \displaystyle \sum_{k = 1}^n
{(x_k - \overline{x})(y_k- \overlin