第14回 - 07年度春学期

統計学基礎

推測統計

今まで、集めたサンプル集団から得られたデータを色々とこねくり回して、集団の特徴について記述する、ということをやってきました。集団の特徴が分かってくると、複数の集団同士でも値の比較を行うことができたりと、色々と便利なことがわかったと思います。

さて、今回からは「推測統計」ということを考えます。推測って何を推測するの? と思う人もいるでしょう。推測するのは母集団の値です。

母集団? そうです。母集団です。例えば、40代の日本人、という母集団を考えてみることにしましょう。現実的に40代の日本人という集団の性質を測定することって、できるでしょうか? そうですね。ここでは調査の手段は手段は問わないとします。

「できると思う?」

「莫大なお金を費やしてもいいんでしょう? 今現在日本に在住している40代の日本人全員に対して調査を行えば、それは「全数調査」となるから、「40代の日本人」の性質が明らかになるんじゃないですか?」

「全数調査なんて言葉を知ってるなんて感心だね。でもそれでは済まないんだ。40代の日本人っていった場合には、今この瞬間だけじゃなくて過去も未来も含めて40代の日本人って考えないといけないんだよ」

「それって実質無理ってことじゃないですか。過去も未来もって、そんなの調査できっこありませんよ」

「そうだね。直接調査をするのは無理なんだ」

このように、標本によって母集団を直接知ることは、基本的に無理なことです。では、母集団の性質は永遠に分からないのでしょうか? いえいえ、そうではありません。母集団の性質はサンプル集団から得られたデータで推測できるのです。

さて、具体的な話に進む前に、ここで実際の調査を行った集団のことを「標本」とか「サンプル」と呼ぶことにしましょう。昆虫標本の標本ですよ(全部集める訳にはいきませんからね)。

ちなみにこの学問は20世紀に入ってからはじまりました。割と新しい学問ですね。

標本抽出

正規分布

関係性の記述
  • 相関
  • 回帰
推測統計と検定という考え方
    • t検定
    • 分散分析
    • χ二乗検定