| >> 記事トピックス一覧 |
独学をすスめ(MM版) 統計的研究法編 010号
発行日: 2001/12/22
卓:このメルマガ「独学をすスめ(MM版) 統計的研究法編」は自らの意思
で購読登録された方に配送されている統計学+研究法の入門無料講座
です。もしお心当たりのない方は最後にある解除用HPで解除手付きを
申し訳ありませんが,【ご自分で行って下さい★】。
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
┏━━┓ 左図がちゃんと四角形に表示されていますか?
┃ ┃ 本メルマガでは図表を多用していますので,発行者の意図
┗━━┛ 通りに表示されるように「等幅フォント」設定を,下記HP
を参考して各自で再設定をして下さい。
http://www2.osk.3web.ne.jp/~kazikeda/mua/
綾:現号までのまとまった復習をするなら今のところ「007号」を見てね。
http://www2.justnet.ne.jp/~vine-7/Stat&Metd/MM007.htm
また本メルマガ準拠の統計テンプレート&マクロ集「統計tool」を適
宜下記HPから入手しておくように。
http://www2.justnet.ne.jp/~vine-7/Stat&Metd/index.htm
□■◆◇◆■□◇□■◆◇◆◇□■☆□■◆◇◆■□◇□■◆◇◆◇□■
独学をすスめ(Mail Magazine 版) 統計的研究法編
2001年12月22日 010号
□■◆◇◆■□◇□■◆◇◆◇□■★□■◆◇◆■□◇□■◆◇◆◇□■
本号の構成
・登場人物紹介
・御挨拶
・代表値・散布度の活用例 その3
・様々な分布
・初学者の「分布」学習態度
・次回予定
=================================
▽登場人物紹介△
・雪本 卓(たく):メルマガ発行者。先生役。
・雪本 綾(あや):卓の姉。狂言回し?
・雪本 篠(しの):卓の妹。生徒役。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽御挨拶△
綾:そろそろ……終わりね。
私たち……本当に頑張ってきたと思うわ。
そう……よね?
卓:そうだな。
三ヶ月弱,か?
でもこれ以上は無理だ。
綾:そう……
卓:……
綾:……
篠:……
綾・卓:だから篠さん,突っ込めよ!
篠:楽しいですか?
皆様ご無沙汰しております。私雪本篠と,愉快な姉兄・綾と卓が発行
する「独学をすスめ(MM版) 統計的研究法編」も本号が【今年★】最
終号となります。  ̄ ̄
卓:相変わらず淡々としてますね。うちの妹様は。
綾:卓ーーーーー!
卓:まだ続けていたのか姉さんは。
綾:あなたも結構あっさりしてるわよね。
まあいいわ。ウォーミングアップも終わったことだしそろそろ本題に
移ろうかしらね?
今年最後,今回のテーマは何かしら?
卓:"distribution"
篠:ディストリビューション……「分布」ですか?
卓:英語で書くとちょっと格好いいだろ。
データにはある程度のばらつきが存在する。そのような時,どのよう
な値の測定値がどの程度あるのか,といったデータの全体的様相……
それを分布と言う。
綾:まあデータ全体がどのような様子で存在するかを示したものよ。
どんな風にデータが存在するかは勿論データ集団によって異なるわ。
その意味では分布には様々な種類があるの。
でもそのうちの一つを篠は知っているわね?
篠:「正規分布」,前回「009号」に登場した分布ですか?
卓:その通り。しかし分布はそれだけじゃなくて他にもたくさんある。
【(標準)正規分布】【t分布】【χ2分布】【F分布】というのが
統計的研究法を使う上では知っておいた方がいい分布だな。
篠:他にもあるのですか?
綾:あるわよ。
「ベルヌーイ分布」「三項分布」「多項分布」「幾何分布」「超幾何
分布」「パスカル分布」「ベータ二項分布」「対数級数分布」「二次
元正規分布」「多次元正規分布」「ジブラ分布」「ワルド分布」「コ
ーシー分布」「ロジスティック分布」「指数分布」「ワイブル分布」
「アーラン分布」「ガンマ分布」「ベータ分布」
統計学の辞典を調べるとこんな名前を見つけられるでしょうね。
篠:すごく多いです……
兄さん,今回はこんなにたくさんの話をするのですか?
卓:え? あ,ああ,いや,そんなことはないぞ。ない。
……そうか分布ってそんなに種類がたくさんあったんだ。ほとんど知
らなかったな。僕が知っている分布なんて基本的なものばかりで,
【(標準)正規分布】【t分布】【χ2分布】【F分布】,あとはせい
ぜい【二項分布】【ポアソン分布】ぐらいなものだよな。
綾:うふふふふふふふふふふふふ。
でも,まあその中で最重要な分布は何といっても,篠も知っている
【(標準)正規分布】なんだけどね。
卓:そうそう。というわけで特に【(標準)正規分布】に焦点を当てて話
を進めていきます。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽代表値・散布度の活用例 その3△
綾:「代表値・散布度の活用例」のその3ね。「1」は「008号」,「2」
は「009号」にありまーす。
少しまとめてみると……
◆【記述統計】:集団の特徴をごく僅かな指標に圧縮する
━━━┳━━━
┏━━━━━━━━━━━━━━┛
┣【代表値】:集団の中心的代表の指標……【平均値】
┗【散布度】:集団の散らばり具合の指標…【標準偏差/分散】
◆活用例1:集団を比較しやすくするために!
http://www2.justnet.ne.jp/~vine-7/Stat&Metd/MM008.htm
◆活用例2:【正規分布★】下での平均値・標準偏差の便利な関係
 ̄ ̄ ̄ ̄
・【平均値±標準偏差×1】:全データの「68.3%」が存在
・【平均値±標準偏差×2】:全データの「95.4%」が存在
・【平均値±標準偏差×3】:全データの「99.7%」が存在
http://www2.justnet.ne.jp/~vine-7/Stat&Metd/MM009.htm
そして……今回新たに説明する活用例はこれよ!
◆活用例3:【標準正規分布によるデータの「確率」位置を算出★】
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
篠:……「確率」? よくわかりません。
それから繰り返し出ている「標準正規分布」というのは前回登場した
「正規分布」と関係があるのですか? 同じものなのですか?
卓:まずは「確率」の方から簡単に説明しよう。
そうだな。篠にとって一番分かりやすい説明は……
篠。以前説明した「t検定」「相関分析」を覚えているか?
篠:はい。二つの集団に本当に「差異」があるかどうかを調べるのが「t
検定」,二つの集団に本当に「どの程度の類似性」があるかを調べる
のが「相関分析」です。
http://www2.justnet.ne.jp/~vine-7/Stat&Metd/MM007.htm
綾:「t検定」「相関分析」の結果数値にはこんなのがあったわね。
・t検定 :「t値」/「自由度」/【確率★】
 ̄ ̄
・相関分析:「r値」/「検定t値」/「自由度」/【確率★】
 ̄ ̄
この【確率★】というのが「活用例3」に挙げた「確率」に近いわ。
 ̄ ̄
卓:そして「標準正規分布」は……「確率」を求めるのに使う「正規分
布」の一種とおぼろげに考えておいてくれ。
篠:……つまり,「t検定」「相関分析」の結果の「確率」数値は「標準
正規分布」を利用して算出されている,ということでしょうか?
綾:そうねえ。もっと正確に言えば,「標準正規分布」を修正した「t分
布」を使って算出されている,なんだけど,大筋においては正しいか
らその考えで今はいいわよ。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽様々な分布△
篠:……
卓:あまり納得できてない顔だな。
それじゃあもう少しだけ説明を加えようか?
篠:お願いします。
綾:注意よ。以下の説明は結構難しいから分からなかったらさっさと飛ば
してね。現段階では無視してもいいから。
卓:「統計tool」で実行できる,つまりは雪本的必須統計手法では次の分
布の知識を使っているんだ。
【t分布】 :「t検定」「相関分析」「多重比較」「重回帰分析」
【F分布】 :「t検定」「分散分析」「重回帰分析」
【χ2分布】:「χ2検定」
ここでは深く考えずにそれぞれの検定・分析では【t分布】【F分布】
【χ2分布】という分布知識を使っている点を抑えて欲しい。
そしてこの三つの分布知識が「統計的研究法」あるいは「推測統計
学」で頻繁に使われる分布「BEST 3」だ。
それぞれの分布が具体的にどのような形をしているかも今は全く説明
しない。とにかくそのような分布があるんだ,ということで先に進む
ぞ。
篠:「正規分布」や「標準正規分布」はどうなったんですか?
卓:正規分布と標準正規分布の関係からいこうか。
仮に正規分布をしているデータであっても,やはり個々のデータによ
って微妙に形が異なる。下の図表を見て欲しい。
== 様々な正規分布 ==========================================
| | * *
| | * *
| | * *
| | * * * *
* | * * | * * * *
* | * * | * * * * * *
*** | * * * * | * * * * * *
*** | * * * * * * | * * * * * *
***** | * * * * * * | * * * * * *
***** | * * * * * * | * * * * * * * *
******* | * * * * * * * * | * * * * * * * *
******* | * * * * * * * * | * * * * * * * *
*********|* * * * * * * * * * * *|* * * * * * * * * * * *
────────────────────────────────
(a) (b) (c)
※あくまでもイメージです。こだわらないで下さい。※
=============================================================
横に広いのは「標準偏差」が大きいことを意味し,縦に長いのは同じ
ような数値がたくさん存在することを意味している。
でもやっぱり同じ正規分布でありどれも基本的に形は同じ。
例えば(a)と(b)は縦の長さは等しく,横に広がっているだけ。
(b)と(c)は横の長さは同じで,縦の長さが異なっているだけ。
そして重要なのは正規分布である以上
◆活用例2:【正規分布★】下での平均値・標準偏差の便利な関係
 ̄ ̄ ̄ ̄
・【平均値±標準偏差×1】:全データの「68.3%」が存在
・【平均値±標準偏差×2】:全データの「95.4%」が存在
・【平均値±標準偏差×3】:全データの「99.7%」が存在
という関係が成立しているということなんだ。
綾:そしてね。「確率」を求めるときには【分布表】を使うのよ。
== 標準正規分布イメージ図 ===================================
* *
* *
* *
* *
* *
* *
* *
* *
* * * *
─────────────────────
↑
※しつこいようですがイメージ図です。この説明にも飽きましたか?※
=============================================================
例えば「↑」の位置にあるデータの「確率」は「何%」かも分布表と
いうものを使えば分かるわけね。まあ具体的にいえば「平均値○○・
標準偏差△△の正規分布上でデータ□□は確率何%か?」という感じ
で調べるわけよ。
でもそうすると「平均値○○・標準偏差△△の正規【分布表】」を調
べないといけない,というよりは無限の分布表が必要になってしまう
わ。だから「確率」を調べやすいように典型的な抽象的な正規分布,
すなわち【標準正規分布】というのを統計学では用意しているわけ。
なお【標準正規分布】は「平均値0・標準偏差1」に「標準化」されて
いるの。
卓:具体的な計算方法はいわないけど,何となくイメージがわいたかな?
篠:どうでしょうか?
卓:わかないのならわかなくもいい。
とにかく「確率」を算出しやすくするために抽象的な【標準正規分
布】が作られたんだ。
さて「確率」計算で【標準正規分布】を使うのはいいんだけど,統計
学者が研究を進めた結果,この【標準正規分布】は小標本データには
不適であることが判明したんだ。
篠:小標本データ?
綾:下のデータを見て。
────────────────────
22 16 19 26 18 13 22 19 19
────────────────────
このデータは「9個」のデータから構成されているわね。これは個数
が小さい「小標本データ」なの。
でも【標準正規分布】は非常にたくさんのデータから構成されている
「大標本データ」に本来使うものなの。100個,50個……いえどんな
に少なくても30個以上のデータじゃないと駄目なの。個数が小さくな
るほどどんどん「確率」にズレが生じるのよ。
卓:というわけで小標本用に【標準正規分布】を修正する必要があり,そ
の修正版として開発されたのが【t分布】【χ2 分布】【F分布】と
いうわけだ。
== 代表的分布関係図 =========================================
「正規分布a」「正規分布b」「正規分布c」 …… 「正規分布xx」
─────────────────────────────
抽 象 化
▼▼▼▼▼▼▼
【標準正規分布】
──┬┬──
┌────────┘└────────┐
──────┴──────── ────────┴─────
平均値(代表値)の検定用修正分布 分散(散布度)の検定用修正分布
【t分布】 【χ2 分布】→【F分布】
=============================================================
ということでまとめたのが上記の表だ。
表には「平均値」「分散」という風にもう少し細かく分かれているけ
ど,本メルマガを統計学の復習として受講されている人向けだから初
学者は全く気にするなよ。
綾:初学者の人で真面目に読まれた方はお疲れさま。
細かいことは忘れてもいいから,もし頭に残しておきたかったら,
【標準正規分布】は少ないデータ集団には【そのままでは★】使えな
い分布だから修正用の【t分布】【χ2 分布】【F分布】が開発され
て「統計的研究法」ではそれらの分布を使っている
ということだけを抑えていてね。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽初学者の「分布」学習態度△
綾:みなさん。本当にお疲れさま。
今回の「分布論」超基礎編,多分人によって学習のやる気が全然違う
でしょうね。
篠:気になっていたのですが,今回姉さんは説明をあまり深く追求せずに
曖昧なままでよいとした台詞が多かったですね。
どうしてですか?
綾:私はね,初学者,特に統計学を研究の方法論として使う人はあまり分
布論にこだわらない方がいいと考えているの。
勿論分布論は,統計学の非常に重要な領域で,統計的研究法などの推
測統計学は分布論をどれだけ有効活用するかを論じたものといっても
過言でないほど,重要なのは知っているわ。
卓:でも難しいんだ,分布論は。今回はそれでも初学者向けに限定した知
識を紹介したけど正直昇華しきれてないんじゃないかな?
僕も最初統計学を勉強したときは「分布=確率計算のための道具」と
すぱっと割り切ってその他の事柄を勉強していた。
実際統計学の教科書を見てみると,統計学理論家向けの教科書と統計
学実務家向けの教科書では「分布論」の扱いが違うんだ。統計学理論
家は分布論をきっちりと勉強するけど,統計学実務家は分布論を道具
的にその一側面だけを勉強する。下手をすれば統計学実務家向けの教
科書には「分布論」の章が削除されているものもあるぐらいだ。
それぐらい分布論の扱いには差がある。
そして実務の観点で統計学を勉強するこのメルマガ講座では分布につ
いての説明を細かくしない……少なくとも今は。
綾:ただし信頼区間の算出などの「統計的推定」を行うんだったら分布の
知識は必要不可欠になるわ。
注意して欲しいのは「統計tool」で扱っている統計各手法は「統計的
研究法」に限定した,統計学全般から見れば断片的なものであるとい
うことよ。
一応,卓は最終的に断片的でない全般的統計学を説明しようと考えて
いるけど,ね。
というわけで,今回の内容を一言でまとめると……
卓:一言でまとめると?
綾:初学者は無視しましょう!
卓:まとめすぎっ! つーか無視かい!
それはいくら何でも言いすぎだろ。
綾:あらー? でもでもメルマガ準拠の「統計tool」を使う限りでは,ど
んな分布知識を使うかを考えることなく自動的に「確率」が算出され
るんでしょ?
だったらいらないんじゃないのー?
卓:……くっ,仕方ない。
読者の皆様,取り敢えず本メルマガ主体で統計学を勉強されるのであ
れば「ひとまず今のところは」今回の内容は流してもらっても,まあ
構いま……せん。
篠:それでは今回の講義は私たち初学者にとっては無駄だったということ
ですか?
卓:はうわっ! 痛い。それはあまりにも痛い言葉だ,篠。
綾:まあ卓いぢめはこれぐらいにして,と。
読者の皆様。今回講義をどう扱われるかは結局皆様次第ということで
す。篠のように全く統計学を知らず,しかも方法論的に使う人である
ならば今回の内容は不要です。
しかし統計学をより理論的・応用的に使うことを望まれる方は,いず
れ今回のような分布論を学習する必要がある,ということを覚悟して
おいて下さい。
ということで本号,今年最後のメルマガ「独学をすスめ(MM版) 統
計的研究法編」を終えたいと思います。
篠:次回号は来年です。また来月は二回発行となります。ご了承下さい。
卓:現在読者数が約750人となりました。多くの方々に購読していただき
大変嬉しく思います。未熟で拙い雪本が発行するメルマガですが,こ
れからも頑張っていきたいと思います。
これからもどうぞよろしくお願いいたします。
綾・卓・篠:それでは,皆様お疲れさまでした。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽次回予定△
次号は「分散分析」に関する話をしたいと思います。
□■◆◇◆■□◇□■◆◇◆◇□■★□■◆◇◆■□◇□■◆◇◆◇□■
●メールマガジン「独学をすスめ(MM版) 統計的研究法編」について
発行者:雪本 卓
mailto:ykmttaku@ma5.justnet.ne.jp
BBS:http://www.luckybreak.co.jp/ba04/mkru/Yukimt.html
HP:http://www2.justnet.ne.jp/~vine-7/
「独学をすスめ(MM版) 統計的研究法編」は以下の無料メールマガジ
ン発行サービスを使って発行されています。このメルマガの内容につ
いては転載・複写などは自由ですが,著作権利を「雪本 卓」は放棄
していません。
・「melma!」(マガジンID:m00049439)
http://www.melma.com/
・「まぐまぐ」(マガジンID:0000080568)
http://www.mag2.com/
このメールマガジンを解除される方は,配送されたメルマガがいずれ
の発行システムであるかを確認して(メールの「送信者名」で判断),
適切な発行システムHPで解除手続をお願いします。
「マガジンID」か「統計的研究」をキーワード検索すれば解除フォー
ムが出現しますので,そこにご自分のメールアドレスを入力して解除
を行って下さい。
あるいは雪本のHPにも「解除フォーム」がありますのご利用下さい。
http://www2.justnet.ne.jp/~vine-7/Stat&Metd/index.htm
□■◆◇◆■□◇□■◆◇◆◇□■★□■◆◇◆■□◇□■◆◇◆◇□■
このメルマガを読んでいる人はこんなメルマガも読んでいます
- 癌めーる
- 医師・医療従事者・医療ジャーナリストなどの専門家の協力のもと、西洋医学・東洋医学などの垣根を作らず癌に関する情報を公正に配信し、一般人が癌に関する正...
- Office & VBA パーフェクトマスター
- Excel・Access・Word等の今さら聞けない「疑問」、今すぐ知りたい「困った」、たちまち解決!のmoug(モーグ)がお送りする、関数初心者か...
- 和田秀樹公式HIDEKIWADA.COMマガジン
- 『大人のための勉強法』などの著者である精神科医、和田秀樹氏のエッセイ・最新情報等が掲載されるメールマガジンです。
- 知らなきゃ損する! 面白法律講座
- NPO法人リーガルセキュリティ倶楽部がお送りする、わかりやすくて役に立つ弁護士監修の法律講座。あなたの疑問もこれで解決! 誌上無料法律相談受付中! ...
- 宮崎正弘の国際ニュース・早読み
- 評論家の宮崎正弘が独自の情報網を駆使して世界のニュースの舞台裏を分析
![メルマガスタンド[メルマ!]](/img/common/melma_logo.gif)









