第14回 - 07年度春学期
統計学基礎
推測統計
今まで、集めたサンプル集団から得られたデータを色々とこねくり回して、集団の特徴について記述する、ということをやってきました。集団の特徴が分かってくると、複数の集団同士でも値の比較を行うことができたりと、色々と便利なことがわかったと思います。
さて、今回からは「推測統計」ということを考えます。推測って何を推測するの? と思う人もいるでしょう。推測するのは母集団の値です。
母集団? そうです。母集団です。例えば、40代の日本人、という母集団を考えてみることにしましょう。現実的に40代の日本人という集団の性質を測定することって、できるでしょうか? そうですね。ここでは調査の手段は手段は問わないとします。
「できると思う?」
「莫大なお金を費やしてもいいんでしょう? 今現在日本に在住している40代の日本人全員に対して調査を行えば、それは「全数調査」となるから、「40代の日本人」の性質が明らかになるんじゃないですか?」
「全数調査なんて言葉を知ってるなんて感心だね。でもそれでは済まないんだ。40代の日本人っていった場合には、今この瞬間だけじゃなくて、過去も未来も含めて40代の日本人って考えないといけないんだよ」
「それって実質無理ってことじゃないですか。過去も未来もって、そんなの調査できっこありませんよ」
「そうだね。直接調査をするのは無理なんだ」
このように、標本によって母集団を直接知ることは、基本的に無理なことです。では、母集団の性質は永遠に分からないのでしょうか? いえいえ、そうではありません。母集団の性質はサンプル集団から得られたデータで推測できるのです。
さて、具体的な話に進む前に、ここで実際の調査を行った集団のことを「標本」とか「サンプル」と呼ぶことにしましょう。昆虫標本の標本ですよ(全部集める訳にはいきませんからね)。
ちなみにこの学問は20世紀に入ってからはじまりました。割と新しい学問ですね。
標本抽出
関係性の記述
- 相関
- 回帰
推測統計と検定という考え方
-
- t検定
- 分散分析
- χ二乗検定