» www.Giftbox.Az - Bir birindən gözəl hədiyyə satışı
ウィキペディアランダム
毎日カテゴリ
共有: WhatsappFacebookTwitterVK

分散 (確率論)

数学統計学における分散(ぶんさん、: variance)とは、データ母集団標本)、確率変数確率分布)の標準偏差自乗のことである。分散も標準偏差と同様に散らばり具合を表し[1]、標準偏差より分散の方が計算が簡単なため、計算する上で分散を用いることも多い。

分散は具体的には、平均値からの偏差2乗の平均に等しい。データ x1, x2, …, xn の分散 s2

ここで x は平均値を表す。

分散が 0 であることは、データの値が全て等しいことと同値である。データの分散は二乗平均から平均の2乗を引いた値に等しくなる。

確率変数 X の分散 V[X]Var[X] と書く場合もある。)は、X期待値E[X] で表すと

V[X] = E[(XE[X])2]

となる[2]。 確率変数の分散は確率変数の2次の中心化モーメントである。

統計学では、(記述統計学)においては標本の散らばり具合を表す指標として標本分散(ひょうほんぶんさん、: sample variance)を、推計統計学においては不偏分散(ふへんぶんさん、: unbiased variance)・不偏標本分散(ふへんひょうほんぶんさん、: unbiased sample variance)を用いる。

言葉の由来

英語の variance(バリアンス)という語はロナルド・フィッシャーが1918年に導入した[3]

確率変数の分散

2乗可積分確率変数 X の分散は期待値E[·] で表すと

 

定義される。これを展開して整理すると

 

とも書ける。また確率変数 X特性関数φX(t) = E[eitX] とおくと(i虚数単位)、これは 2階連続的微分可能

 

と表示することもできる。

チェビシェフの不等式から、任意の正の数 ε に対して

 

が成り立つ。これは分散が小さくなる程期待値の近くに確率変数の値が分布することを示す大まかな評価である。

性質

X, X1, …, Xn確率変数a, b, a1, …, an定数とし、共分散Cov[ · , · ] で表すと

  •  (非負性)
  •  (位置母数)(英語版)に対する不変性)
  •  斉次性
  •  

を満たす。したがって、特に X1, …, Xn独立ならば、

 

より

 

が成り立つ。

  • 確率変数 X一様分布 U(a, b) に従うとき、V(X) = (ba)2/12
  • 確率変数 X正規分布 N(μ, σ2) に従うとき、V(X) = σ2
  • 確率変数 X二項分布 B(n, p) に従うとき、V(X) = np(1 − p)
  • 確率変数 Xポアソン分布 Po(λ) に従うとき、V(X) = λ

データの分散

推計統計学では、母集団の分散と標本の分散を区別する必要がある。

母分散

大きさが n である母集団 x1, x2, …, xn に対して、平均値μ で表すとき、偏差自乗の平均値

 

母分散(ぼぶんさん、: population variance)と言う[4]

標本分散・不偏標本分散

大きさが n である標本 x1, x2, …, xn に対して、平均値x で表すとき、偏差自乗の平均値

 

で定義される s2標本分散(ひょうほんぶんさん、: sample variance)と言う。s標準偏差と呼ばれる[4]

定義より、

 

となるから、標本分散は2乗の平均値と平均値の2乗との差に等しい。ただし、この計算では概して二乗平均が巨大になるため、浮動小数点数による近似計算を行う場合には大きな(丸め誤差)が生じる可能性がある((桁落ち))。このため、浮動小数点数を扱う場合には定義に従って偏差の二乗和を計算することが一般的である(あるいは一般の総和計算と同じくカハンの加算アルゴリズム(pairwise summation)(英語版)のような手法により、誤差を小さくする工夫がなされることもある)。

一般に、標本分散の平均値は母分散より少し小さくなる。実際には、平均と分散を持つ同一分布からの(無作為標本)に対して、標本分散の期待値 E[s2] について、

 

が成り立つ。そこで

 

を用いると、平均値が母分散に等しくなる推定量が得られる。つまり母分散の(不偏推定量)となる。これを不偏標本分散(ふへんひょうほんぶんさん、: unbiased sample variance)や不偏分散(ふへんぶんさん、: unbiased variance)と呼ぶ[4]

上記の標本分散は不偏でないことを強調する場合偏りのある標本分散: biased sample variance)と言う。

なお、不偏標本分散を単に標本分散と呼ぶ文献もある。

定義から明らかに、標本の大きさが大きくなる程につれて偏りのある標本分散は不偏標本分散に近づく。

脚注

  1. ^ 西岡 2013, 1.8 分散.
  2. ^ JIS Z 8101-1 : 1999, 1.13 分散.
  3. ^ “Earliest Known Uses of Some of the Words of Mathematics (V)”. 2016年1月24日閲覧。
  4. ^ a b c 栗原 2011, p. 47.

参考文献

  • 栗原伸一『入門統計学検定から多変量解析・実験計画法まで』オーム社、2011年。ISBN (978-4-274-06855-3)https://books.google.com/books?id=r5JIE8QbPbAC 
  • 西岡康夫『数学チュートリアル やさしく語る 確率統計』オーム社、2013年https://books.google.com/books?id=AUY2AgAAQBAJ 
  • 日本数学会『数学辞典』岩波書店、2007年。ISBN (9784000803090)。 
  • JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999), http://kikakurui.com/z8/Z8101-1-1999-01.html 
  • 伏見康治『確率論及統計論』河出書房、1942年。ISBN (9784874720127)http://ebsa.ism.ac.jp/ebooks/ebook/204 

関連項目

ウィキペディア、ウィキ、本、library、論文、読んだ、ダウンロード、自由、無料ダウンロード、mp3、video、mp4、3gp、 jpg、jpeg、gif、png、画像、音楽、歌、映画、本、ゲーム、ゲーム。