有意水準5%?1%?その決め方
有意水準とは、仮説検定をするときに、仮説を棄却するかどうかを判断するための基準です。 設定した仮説が正しいとするその上で、観測データ...
統計学に入門した方と共に学ぶ、統計学入門サイトです。
有意水準とは、仮説検定をするときに、仮説を棄却するかどうかを判断するための基準です。 設定した仮説が正しいとするその上で、観測データ...
イコール「=」は、左の式と右の式が一致していることを示していますが、 同値「⇔」は、「=」でつないだ数式同士が同じ意味であると示して...
データと情報は別物なのですが、これら2つの言葉が混同されることは、しばしばありそうです。その違いを把握してつかうようにすべきでしょう。 ...
標本データの平均値を表す記号 x̄ があります。エクセルで、このx̄ を入力する方法を紹介します。 エクセルの挿入メニューで、「記号...
等しくないことをあらわあす記号「 ≠ 」について書きました。 記号「≠」の意味 「 ≠ 」は、等しくないという意味です。 ...
ほとんど等しいをあらわす記号「 ≒ 」について書きました。 記号「 ≒ 」の意味 記号の「 ≒ 」は、ほとんど等しい、という意...
他の人がつくった分析結果を見るときには、なんらかのバイアスにかかっていないかどうか注意して見る必要があります。もしバイアスのある分析結果で...
中央平均とは、データを小さい~大きい順に並べて、真ん中の50%分のデータだけをつかって計算した平均値のことです。 小さいほうの25%...
母集団から標本を取りだすときには、ランダム(無作為)に行うことが多々あります。その際には、どのようにランダム化したらいいでしょうか。 ...
An これは、Aをn乗することをあらわしています。Aの右肩に乗ったnは指数と呼ばれ、Aを何乗するかを示すものです。次のような関数があ...
i.i.d. (または iid)とは、同一の確率分布に従う確率変数\(X_1\)、\(X_2\)、\(X_3\)…\(X_n\) が、互い...
19世紀から20世紀にかけてのフランスに、ポアンカレという数学者がいて、統計学を使ってパン屋の不正を見抜いた逸話があります。 パンの...
同じ数を何回か掛けることを累乗といいます。 2乗してaになる数を、aの2乗根(あるいは平方根)3乗してaになる数を、aの3乗根n乗し...
仮説検定をするときに出てくるp値と有意水準について、ややこしいと思われる方がいるかと思います。私は、ややこしいな、と私は思ってしまいます。...
エクセルで相関係数を計算するやり方について書きました。 相関係数とは xとyの2つの変数があったときに、xとyの値に連動する傾...
「母数」の意味を、「分母」の数のことだと思い込んでいたら、それは違うよという話です。 「好きな俳優は誰ですか?」と100人に街頭アン...
ε(イプシロン)は、誤差項を示す記号です。 たとえば、回帰モデルの誤差項を示すものとして用いられます。 回帰分析とは、2つの変...
外れ値とは、他のデータからみて、極端に大きな値、または極端に小さな値のことです。 外れ値のなかで、測定をミスや、データの入力ミスなど...
外れ値とは、他のデータからみて、極端に大きな値、または極端に小さな値のことです。そのデータのイメージからかけ離れた値。 異常値とは、...
プーリングとは、いくつかのグループを1つのグループにまとめることです。プーリングして分散を求めるなどします。 たとえば、2群の母平均...
確率変数とは、確率的に変化する値のことです。その値をとる確率が与えられています。 確率変数には決まった確率規則をもとにして発生してい...
統計学を学び始めると、大文字の「N」と小文字の「n」の記号をよく目にするかと思います。同じエヌですが、これらの使い方はきっちり分けられてい...
ウェブサイトの改善にも統計学が活用されています。 ビジネスでウェブサイトを運営するときには、目的があります。それは、お客さんに興味を...
標本調査とは、母集団全体を調べるのではなく、標本を抜きとって調査をすることです。 母集団とは対象全体のことで、そのなかで調査対象とし...
平均値を表す記号には、\(μ\) と\(\bar{x}\) があります。 \(μ\) は母集団の平均値\(\bar{x}\) は標本...
「ガーベッジ・イン、ガーベッジ・アウト」 「ゴミを入れれば、ゴミが出てくる」 このようなデータ分析に関連した格言があります。英...
エクセルの関数で、正規分布NORM.DIST、二項分布BINOM.DISTなどをつかうときに、引数として、TRUEとFALSEを指定する必...
幾何平均とは、各平均のデータの値を掛け合わせて、データ個数n乗根をとったものです。 伸び率の平均を計算するときに用いられます。 ...
2つの母集団の差を検定するときのことを考えてみます。このとき、p値が小さければ小さいほど、母集団の平均値の差が大きいと言えるのでしょうか。...
パーセントは、率をあらわしています。50パーセントは半数が、という意味です。 パーセンタイルは、データを大きさ順でならべて100個に...