独学をすスめ(MM版) 統計的研究法編 |
この記事の発行者<<前の記事
|
次の記事>>
|
最新の記事
綾:このメルマガは自らの意思で購読登録された方に配送されるわ.内容は
「実務統計学+研究法」の入門無料講座,タイトル「独学をすスめ(MM
版) 統計的研究法編」よ.
お心当たりのない方は,申し訳ないけど,このメール最後にある解除用
HPで解除手続を【自分で行ってね★】.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
篠:このメールマガジンは図表を多用しておりますので,発行者の ┏━━┓
意図通りに表示されるように「等幅フォント」設定を推奨して ┃ ┃
います.右図が正しく四角形として表示されていますか? ┗━━┛
もしされていない場合は下記HPを参照して各自で再設定をお願いします.
http://www2.osk.3web.ne.jp/~kazikeda/mua/
卓:統計学,特に実際にデータ解析法を重視する実務統計学の講義の場合データ
解析を行える「統計ソフト」が学習上不可欠と僕は考えています.そこで,
統計ソフトをお持ちでない方でも簡単に統計解析が実行可能な,本メルマガ
準拠の統計テンプレート&マクロ集「統計tool」を用意しましたので,適
宜下記HPからダウンロードして下さい.
http://www006.upp.so-net.ne.jp/dokugaku-club/Study/index.htm
★□■◆◇◆■□◇□■◆◇◆◇□■☆★□■◆◇◆■□◇□■◆◇◆◇□■★
独学をすスめ(Mail Magazine 版) 統計的研究法編
2003年06月26日 024号
☆□■◆◇◆■□◇□■◆◇◆◇□■★☆□■◆◇◆■□◇□■◆◇◆◇□■☆
本号の構成
・登場人物紹介
・プレゼント
・「+分散分析tool」の紹介
・篠不在の多重比較についての会話
・因子分析の超復習
・因子とは何か?
・因子の数の考え方
・因子の関係性と共通性
・次回予告
====================================
▽登場人物紹介△
・雪本 卓(たく):メルマガ発行者.初代教師役.
・雪本 綾(あや):卓の姉.最近完全に教師役.
・雪本 篠(しの):卓の妹.生徒役.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽プレゼント△
綾:ちらり♪
篠:暑いです.
卓:本当に暑いよなぁ.典型的な日本のじめじ〜めとした暑さだ.
綾:ちら,ちら,ちら♪
篠:……
卓:…………
綾:ちゃららーん♪
篠:(卓兄さん,はやく綾姉さんを誉めて下さい.話が進みません)
卓:(えー)
……あやねえさん,そのみずぎすがた,すてきだね?(棒読み)
篠:何故疑問系ですか?
綾:あららーん,やっぱりー♪ そそっちゃう?
卓:はいはい,そそる.わーい,わーい.
綾:むっ! 気持ちがこもってないわよ.
卓:勘弁してくれ.何が悲しくて,実の姉に欲情しなければならないんだよ.
綾:実姉が駄目なら,心の目で「義理姉」に変換するのはよろしくてよ?
背徳感がスパイシーな感じ?
卓:全然,そんな気分は,バッサリ,ないから.
ほーら,篠.遠ざかって,お兄さんをそんな冷たい目で見ちゃいけないぞ.
というより,いきなりそんな格好の登場は何故だ?
綾:えっとね,最近,卓のHP「独学をすスめ」が二万ヒットいったじゃない?
更には22222,五連続2並びヒットも到達しちゃったわけよね.
そのお祝い……なんていうのは理由として,どう?
卓:……要するに,本当の理由はないわけだな?
綾:そうとも言う……篠ちゃん,そんな白い目しちゃ,いけないわ.
ちょっと待ってね…………(ごそごそ)……じゃーん!!
Θ・)人(・Θ・)人(・Θ・)ノ コニチハー
卓:また,その物体かいっ!(前号参照)
綾:篠,ぷれぜんと・ふぉー・ゆー♪
篠:……私に……くれるのですか?
綾:どぞどぞ♪ 二万ヒットプレゼントよ.
卓:微妙なプレゼントだなぁ……
しかし,普通はプレゼントといえば,利用していただいた方に渡すものだ
ろ? 身内にプレゼント渡しても意味無いだろ?
綾:そんな読者の皆様にもプレゼントが用意されてたりするのよ.
卓:ほほう.
綾:プレゼント第一弾! 綾の水着画像〜♪ 心の目を研ぎ澄まして!
卓:(冷静に)第二弾は?
綾:……さらりと流したわね…………ちくしぉう……
第二弾は「統計tool」の使用説明書よ.
この説明書は,本メルマガ準拠の統計ソフト?の「統計tool」に実装され
ている統計解析法に関する使用法のポイントが書かれているわ.
卓:実際の作者は僕だがな.一応解説させていただきます.
使用説明書とタイトルを付けていますが,それだけで終わらずに,僕が考
える統計法の入門的【教科書★】としての位置づけもしています.
 ̄ ̄ ̄ ̄
説明は簡略化されていますが,最初に統計解析法を学習する上で参考になる
ように書いたつもりなので,統計法を初めて勉強する人も読んで下さい.
しかも,まだメルマガで説明していない「χ2検定」「相関比」も扱ってい
るので,初級編を自分でさっさと終わらせたいという方は,使用説明書で独
学するのも良いと思います.
綾:説明書の最大の売りは【統計解析法を4(+1)つの視点で整理する★】という
ところよね.視点とは, ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
?記述/推測 ?量的/質的 ?差異/類似 ?基本/拡張
そして
?対応なし/対応あり
詳しくは説明書を参照することっ!
http://www006.upp.so-net.ne.jp/dokugaku-club/Study/index.htm
そして更に,更に,プレゼントの第三弾,「分散分析tool」のバージョン
アップ版よっ!!(同上サイトにあるから探してね)
篠:……みっつ?(ぽー)……
卓:って,三個全部抱きしめてるしっ!!
綾:気に入ってもらえたみたいね♪
卓:…え……それで片づけちゃって良いの? 篠のキャラクターが変わるぐらい
の大事(おおごと)だと思うんだけど……
綾:もう一つの「+分散分析tool」のバージョンアップについてだけど……篠?
篠:…(ぽー)…
卓:完全に惚けているなぁ.
それでは,放心状態の篠が回復するまで,「+分散分析tool」について,
ほんの少しだけ説明をすることにするか.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽「+分散分析tool」の紹介△
卓:では,篠が復活するまでごく簡単に「+分散分析tool」の紹介をするか.
綾:この「分散分析tool」って以前からすでにHP上で公開されていたのよね?
卓:おう.試作版が公開されていたんだけど,多くの方の意見を取り入れてバー
ジョンアップを重ねて,(限りなく)完成版を作成,公開するに至ったわけ
だな.
以前試作版をダウンロードした方も,改めて最新版をダウンロードするのを
おすすめします.
綾:今回は,卓の友人であるFUJIKIさんが協力してくださったから,完成したん
だから,ちゃんとお礼をいっとくのよ.
FUJIKIさん,卓に代わって,改めてお礼させていただきますわね.
「+分散分析tool」のメインの一つである多重比較に関するVBAマクロのプ
ログラムを組んでいただいたから,完成させることができました.
卓のVBA作成の図々しい依頼に協力して頂き本当にありがとうございます.
卓:ありがとうございますm(_ _)m ペコリ
綾:ちなみにFUJIKIさんってどーなーた?
卓:僕の友人だったりする.彼もネット上に自分のサイトを持っています.
心理学者の「卵」…ではなく「雛(ひよこ)」の日々のつぶやきや,彼の啓
蒙対象であるPalmに関する想いが語られています.
興味がある人は訪れてみて下さい.
http://home.hiroshima-u.ac.jp/fujiki76/index.html
綾:さて,そのバージョンアップ版の「+分散分析tool」で何ができるの?
卓:タイトル通り,分散分析ができるわけだが,無論それだけじゃない.
統計解析法は大雑把に「差異の統計法」と「類似の統計法」とに分類できる
わけだが,この「+分散分析tool」は「差異の統計法」をもう少し勉強した
い,という人のための学習支援ソフトだと考えてほしい.
具体的に,実行可能な統計解析法は以下の通り.
○分散分析の前提に関する手法
□正規性の検定 □等分散性の検定
○分散分析及びその類似する手法
□t検定 □マン・ホイトニー検定 □符号検定
□百分率の差の検定 □マクニマー検定
□分散分析(一要因&二要因) □共分散分析(一要因)
□クラスカル・ウォリス検定 □フリードマン検定
□χ2検定 □コクランQ検定 □逆正弦変換によるχ2分散分析
○多重比較に関する手法
□ボンフェローニ法 □ライアン法 □テューキのHSD/WSD法
□スティール・ドゥワス法 □シェッフェ法
扱えるデータが5変数(1変数50データ)という限定がかかっているが,【学習
用★】統計ソフトとしてはそれなりに満足できるものではないか,と. ̄ ̄
 ̄ ̄
綾:結構いろいろな手法が用意されてるわね.……ちょっぴり自慢?
卓:そこそこ自慢だったりする,今日の卓であった.
実際にデータ解析を実務上で行うのではなく,統計解析を学習するという意
味では,かなりお手軽なものだと自負しています(ふふり).
…………篠は?
篠:…… (・Θ・) ギュー(ぽー) ……
綾:はまっちゃってるわねー
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽篠不在の多重比較についての会話△
綾:そういえば「+分散分析tool」に装填されている多重比較,結構種類が多く
ない? 「統計tool」で実行できるのはそのうちの「ライアン法」だけだっ
たのに,いきなり種類を増やしたわね.
卓:んー.「+分散分析tool」を作成するにあたって,分散分析関連の統計手法
を少し勉強し直したわけだな.そこには当然,多重比較も勉強対象に含まれ
ているわけだが,多重比較を勉強するにあたって,自分なりのポイントらし
きものがつかめた気がして,そのポイントを「+分散分析tool」に盛り込ん
だわけだ.
綾:つまり,「+分散分析tool」に装填されている多重比較は,多重比較を学習
する上でポイントとなるもの,ということなわけね.
卓:ういうい.
綾:で,その多重比較の学習ポイントというのは,何よ?
卓:その前に,多重比較についての確認事項.
多重比較とは「複数の平均値を【同時に★】比較するための統計解析法」だ
というのは基本だな?  ̄ ̄ ̄ ̄
綾:基本よね.
じゃあ,お馴染みのt検定とは「二つの平均値を比較する統計解析法」だか
ら「複数の平均値を同時に比較する」多重比較は【t検定の修正拡張版とも
考えられる★】……これも基本よね?  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄
卓:よし,それを踏まえた上で……
多重比較の計算原理とt検定の計算原理はかなりの類似性がある.と言うよ
りは,t検定の計算原理に修正を施したものが,多重比較の計算原理になる
わけだ.
ここで押さえておかなければならないのは,多重比較はt検定に「同時に」
という厳しい条件を追加しているわけだから,t検定の計算原理に比べて
「厳しい」という修正をしなければならない…
とりあえず,そんなイメージを持ってもらえればいい.
綾:じゃあ,具体的にどんなふうにして「厳しい」修正をするか,が問題ね.
卓:その通りだ.多重比較には実にたくさんの種類があるわけだが,どのように
厳しくするかによって多くの種類が開発されているわけだな.
ただ,厳しくする方法にもパターンがあって,どうやら三つのパターンに分
類できそうだ……というのが,雪本流の学習ポイントだな.
t検定とは何かを考えてみてくれ.
t検定とは,二つの平均値の差が統計的に有意かどうかを調べるために,
?t値という統計量を使って(統計量),
?t分布という分布によってその現象の発生確率を参照して(分布),
?その確率が,予め設定した有意水準より小さいかどうか(有意水準),
によって検討を行っているわけだ.
綾:ふむふむ.すると,「厳しくする」その方法が,?統計量,?分布,?有意
水準の観点でなされているわけね……なかなか変わった多重比較の解説ね.
卓:多分に「雪本 卓オリジナル解釈」だが,整理する上では有効だと思う.
というわけで,「+分散分析tool」に装填されている多重比較を,上記の
枠組みで分類すると,以下のようになる.
?統計量の観点で「厳しく」する多重比較法
□シェッフェ法
?分布の観点で「厳しく」する多重比較法
□テューキのHSD法 □テューキのWSD法 □スティール・ドゥワス法
?有意水準の観点で「厳しく」する多重比較法
□ボンフェローニ法 □ライアン法
綾:でもさあ,この分類って知っていて,実務的に何か得することがあるわけ?
実務統計家にとっては,原理はどうであれ,「厳しくしている」という点で
は同じわけよね?
統計学専門家ならともかく,実務統計家にとっては,単なるトリビアになっ
ちゃうんじゃない?
卓:なかなか痛い質問だなぁ,それ.
確かに,【上記の枠組みだけ知っているのでは無意味かもしれない★】.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
しかし,上記の枠組みに追加知識を持っていれば有効だと思うぞ.
例えば,分布の観点で厳しくする多重比較法は,「対応なし」データに基づ
く分布によって「厳しくしている」ので,対応なしデータの分析にしか使っ
てはいけない,とか.
綾:へぇ.多重比較で最も有名なテューキ法は「対応なし」データは使ってもい
いけど,「対応あり」データには使っちゃいけないわけ?
卓:テューキ法の原理を厳密に考えるとそうなる.ただし,一定の条件が満たさ
れている場合は使用可みたいだけどな.
だからこそ,SPSSという有名な統計ソフトでは「対応あり」データを分析
する場合の多重比較では,テューキ法が使えない設定になっているわけだ.
代わりに対応なし・ありに無関係な,有意水準を厳しくする多重比較を用い
ることになる.このためSPSSではボンフェローニ法が用意されている.
綾:へぇーへぇーへぇー.
卓:この辺は,多重比較の中級編として,いずれ説明……できたらいいなぁ,の
予定なので,興味がある方は気長に待っていて下さい.
どうしても気になるようでしたら,掲示板で質問して下さい.答えられる質
問でしたら答えたいと思います.
……さて,そろそろ篠を復活させよう.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽因子分析の超復習△
篠:……申し訳ございません……
卓:大丈夫だっ! 篠も我らがきょうだいだという再確認ができたからな.
篠:……それはどういう意味ですか?
卓:気にするな.
綾:そうそう,可愛かったわよ.
篠:………………(まっか)
それで,今回の本題は何でしょうか? さっさと話を進めて下さい.
綾・卓:照れてますなぁ
篠:うるさいです.
卓:うい,それでは篠のご要望通り,今回の本題「因子分析」に移るとするか.
前回,「因子分析」の基礎編の内容を説明したわけだが,因子分析とはどん
な統計解析法だったか,覚えているか?
篠:多くの変数を,類似する変数同士をグループとしてまとめること……それが
因子分析だと前回教わりました.
卓:その通り.
―――――――――――――――――――――
X1 2 1 5 3 6 4
X2 5 7 1 8 5 4
X3 3 1 8 2 4 2
X4 1 1 2 4 5 1
―――――――――――――――――――――
上記のようなデータが与えられた場合,類似の統計法である「相関係数」
をベースにして,類似変数をグルーピングして,より少ないグループ数に
まとめる.これが因子分析の基本的考え方だな.
具体的に因子分析を実行してみるとこうなる(VARIMAX回転).
――――――――――― 因子分析の重要結果 ―――――――――――
直交回転後の因子負荷量(VARIMAX) 第1因子 第2因子 共通性
―――――――――――――――――――――――――――――――――
X1 0.64 0.68 0.87
X2 -0.99 0.14 1.00
X3 0.89 0.19 0.83
X4 -0.08 0.99 0.98
―――――――――――――――――――――――――――――――――
因子負荷量の二乗和 2.19 1.49
寄与率 54.79 37.36
累積寄与率 54.79 92.15
―――――――――――――――――――――――――――――――――
綾:この結果から
(1)グループ(因子)の数は何個か? → 「因子数」を参照
(2)グループ(因子)の内容な何か? → 「因子負荷量」を参照
を参考にして,具体的なグループを決定するわけ……以上復習おしまい.
卓:一応,前回の講義で「統計tool」を使えばひとまずの因子分析をすることが
できるようになったわけだ.
篠:そうです.しかし因子分析の結果表を見てみると,「共通性」「寄与率」な
どの単語があります.これらは一体どのような意味を持つ数値なのでしょう
か?
綾:今回の因子分析に関する話は,その辺の「因子分析もう少し」を説明したい
と思っているのよ.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽因子とは何か?△
卓:「共通性」や「寄与率」の話をする前に,そもそもの話である「因子」の話
をしよう.
篠:そういえば,前回は「因子」という言葉を使わない説明でした.
卓:因子分析とは,その名の通り,因子というものを分析するための統計解析法
なんだが……実は,この「因子」というのは【「あるだろうなぁ」という仮
定の概念★】のことなんだ.  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄
篠:仮定の概念? よくわかりません.
綾:そうねえ……篠は,因子分析は「類似した変数をグルーピングさせる手法」
と考えている訳よね?
篠:はい.
綾:じゃあ,どうやってグルーピングをしていると思う?
篠:……類似指標の相関係数を使ってグルーピングしているのでは?
綾:まあ,そんなんだけど,じゃあ,相関係数の情報を使って「具体的に」どの
ようにしてグルーピングしているか,ということよ.
但し,この場合の「具体的」とは数学的ではなく,概念的意味の質問よ.
篠:……
卓:具体例で考えてみるか.
下に,英語・数学・国語・理科・社会の五教科のテスト得点の相関係数,及
び因子分析結果を示している.
──────── 五教科の相関行列(架空) ────────
理 科 社 会 数 学 国 語 英 語
理 科 1.00 -0.34 0.98 -0.44 -0.24
社 会 -0.34 1.00 -0.34 0.53 0.63
数 学 0.98 -0.34 1.00 -0.35 -0.32
国 語 -0.44 0.53 -0.35 1.00 0.54
英 語 -0.24 0.63 -0.32 0.54 1.00
─────────────────────────────
――――――――――― 因子分析の重要結果 ―――――――――――
直交回転後の因子負荷量(VARIMAX) 第1因子 第2因子 共通性
―――――――――――――――――――――――――――――――――
理科 0.97 -0.22 0.99
社会 -0.17 0.77 0.62
数学 0.96 -0.23 0.97
国語 -0.26 0.66 0.50
英語 -0.11 0.79 0.63
―――――――――――――――――――――――――――――――――
因子負荷量の二乗和 1.97 1.74
寄与率 39.41% 34.86%
累積寄与率 39.41% 74.27%
―――――――――――――――――――――――――――――――――
綾:この結果によると,「理科」と「数学」の変数が類似した変数として,ある
いは「社会」と「国語」と「英語」の変数が類似した変数としてグルーピン
グされているわけね.
複数の項目でグルーピングを作る場合,「何かの一つの基準」を作って,そ
の基準と照らし合わせて,その基準とこの項目はどの程度類似しているか,
その基準とあの項目はどの程度類似しているか……という感じで,作ること
ができるわ.
篠:…………
卓:複数のグループを作って,個々の項目(メンバー)がどのグループに入るか
どうかを調べるには,「あなたはこのグループのメンバーになるのに適して
いるか」の基準が必要になるだろう?
例えばだなぁ……
僕たち雪本きょうだいの三人の中で,さらにグルーピングを作るとしよう.
「綾姉さんと篠」群と「卓」群を作りたいと思うんだけど,その場合,どの
ようなグループ基準を作ればいいかな?
篠:綾姉さんと私がグループとなる……それは「女性群」と「男性群」ですね?
すると「『女性かどうか』基準」を作れば良いと思われます.
綾:その通りよ.
その他にも「綾と卓」群と「篠」群を作りたい場合も,何らかの基準を作る
ことでグルーピングすることができるわよ.
そうねぇ…例えば「『先生役かどうか』基準」にしようかしら.
┌─────────────┐
│ 『女性かどうか』の基準 │
└─────────────┘
│ │ │
○ × ○ ○ … その基準に合致
↓ ↓ ↓
┌───┐ ┌───┐ ┌───┐
│ 綾 │ │ 卓 │ │ 篠 │
└───┘ └───┘ └───┘
↑ ↑ ↑
○ ○ × × … その基準に不一致
│ │ │
┌─────────────┐
│ 『先生役かどうか』基準 │
└─────────────┘
篠:……ひょっとして,この基準というものが「因子」なのですか?
卓:そう思ってもらってもいいだろう.
篠:すると五教科の因子分析は次のように図示できると思います.
┌─────────────────────┐
│ 基準1(第一因子) │
└─────────────────────┘
│ │ │ │ │
○ × ○ × ×
↓ ↓ ↓ ↓ ↓
┌───┐┌───┐┌───┐┌───┐┌───┐
│理 科││社 会││数 学││国 語││英 語│
└───┘└───┘└───┘└───┘└───┘
↑ ↑ ↑ ↑ ↑
× ○ × ○ ○
│ │ │ │ │
┌─────────────────────┐
│ 基準2(第二因子) │
└─────────────────────┘
○ … その基準に合致 / × … その基準に不一致
因子分析が「グルーピングを作るための基準である『因子』を調べる」統計
解析法であることは,わかりました.
しかし,この基準が具体的にどのような内容なのか,どのような基準の名前
を付ければよいのでしょうか?
卓:んー,それは統計学の観点からでは回答できない.それは対象の知識から,
分析する者が付けなければならない.
上記の五教科の場合,基準1(第一因子)は,「理科&数学」には影響を与え
て【いる★】が,「社会&国語&英語」には影響を与えて【いない★】.
 ̄ ̄ ̄  ̄ ̄ ̄ ̄
これを手掛かりにして判断するしかないんだ.
篠:……もしかして「第一因子」は「理系能力」でしょうか?
卓:その命名でもかまわないと思う.
同様に,「第二因子」は「文系能力」と命名できるだろう.
なお,命名する時には【因子負荷量の正負に注意しろよ★】.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
篠:でも,【命名作業は随分と頼りないです★】.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
綾:なかなか鋭いわね.【その辺も因子分析の弱点と言われてるわ★】.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
でも,逆に言えば,分析者のオリジナリティを入れることができるわけ.
卓:篠,とりあえず因子についての説明を済ませるわけだが,どうよ?
篠:おぼろげには分かった気がします.
卓:はっはっは.実は因子という概念は元々曖昧な概念なんだ.
改めて,因子とは何か,をまとめてみよう.
・因子とはグルーピングをするために考え出された,仮定の概念である.
・因子とは,グルーピングのための基準の概念である.
・仮定の概念であり,分析者によってその内容が異なる可能性がある.
・基準となる因子は,背後から影響を与えているかどうかによって,グルー
ピングを判断される.
綾:因子が「仮定の概念」ということは,因子分析をしたからと言って,その概
念が【本当にあるかどうかを証明したとは言えないの★】.注意事項よ.
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
まあ,「手掛かり」を調べる,程度に使うのが吉と思われ.
卓:因子については,潜在変数の要素とかあるんだが,その辺は独学をして理解
を深めてもらうしかないだろう.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽因子の数の考え方△
綾:それじゃあ,今説明した「因子」の話を踏まえつつ,因子分析結果について
の,もう少し詳しい解読法を説明するわね.
卓:それじゃあ,因子分析結果にはどのような数値が登場するかを改めて確認し
てみよう.先ほどの「五教科の因子分析」結果を例にしよう.
――――――― 因子分析の重要結果(2因子モデル) ―――――――
直交回転後の因子負荷量(VARIMAX) 第1因子 第2因子 共通性
―――――――――――――――――――――――――――――――――
理科 0.97 -0.22 0.99
社会 -0.17 0.77 0.62
数学 0.96 -0.23 0.97
国語 -0.26 0.66 0.50
英語 -0.11 0.79 0.63
―――――――――――――――――――――――――――――――――
因子負荷量の二乗和 1.97 1.74
寄与率 39.41% 34.86%
累積寄与率 39.41% 74.27%
―――――――――――――――――――――――――――――――――
結果に登場する数値は,「因子の数」「因子負荷量」「共通性」「因子負荷
量の二乗和」「寄与率」「累積寄与率」の五つだな.
「因子負荷量」については前回で説明しているので,ここでは既習事項とす
るからな.一応念のために言うと次の意味だ.
□因子負荷量:【各】項目変数と【各】因子の関連度
なお「因子の数」については,前回で説明をしているわけだが,改めて説明
をすることにしよう.
綾:いい,篠?
因子分析とは「複数の項目変数を,類似性をもとにして,なるべく少なく,
かつ効率の良いグルーピングをすることができる基準『因子』を調べる」
……これをしっかりと押さえおくのが大事なのよ.
篠:はい,わかりました.
卓:ただし,同じ多変量解析に分類される重回帰分析とは異なり,因子分析その
ものは【本質的な★】選択オプションはない.
 ̄ ̄ ̄ ̄ ̄
確かに,因子分析を実際に統計ソフトなどで実行する場合には,いろいろな
選択オプションはあるんだが,その中で非常に重要な選択肢は意外と数が少
ないんだ.
篠:そうなのですか?
卓:ああ.それは何かというと次の二つだ.
1)因子の数
2)因子の関係
綾:因子とは「グルーピングのための基準」だということは良いわね?
これはデータには,似ている「共通」部分と似ていない「非共通」部分とが
あって,共通部分のデータを取り出す,ということを意味するの.
別の言い方をすれば,似ている部分の情報を優先して,似ていない部分をあ
まり重要でない情報としてを捨てちゃおう,ということなのよ.
でも,重要であろうとなかろうと,情報は情報でしょ?
だから,グルーピングをしすぎちゃうと,不必要に情報を捨ててしまう可能
性があるわけ.
じゃあ逆に,基準,すなわち因子をたくさん設定しちゃと,情報をたくさん
持つことはできちゃうんだけど,「グルーピング」という観点ではあまり意
味がないわけよね.
篠:なるべく効率よく少ない情報要約をしたいけれど,要約しすぎてしまうと情
報量が過剰に減ってしまう……
すると,基準である「因子」の数は「効率のよいなかで,少なく」が原則な
わけですか?
卓:そういうことになる.だからこそ,それぞれの因子が,あるいは採用した因
子モデル全体での説明力がどのようなものか,を知ることが重要になるわけ
だ.
そこで,因子の説明力に関する数値が以下のもの.
□寄与率:【各】因子の説明力
それぞれの因子がどの程度の説明力を持っているかを示す数値.
例では,第1因子は39.41%の説明力を持つ.つまり,データ全体の39.41
%を第1因子によって説明できることを意味する.
※「固有値(因子負荷量の二乗和)」も同様の意味を持つ.
□累積寄与率:モデル【全体】の説明力
採用した因子数による因子モデル全体がどの程度の説明力を示す数値.
例では,一番最後の因子である第2因子の累積寄与率である74.27%となっ
ており,このデータでは2因子モデルを採用した場合,データの74.27%を
説明できることを意味する.
綾:試しに,同じデータに対して1因子モデル,3因子モデルで因子分析をしてみ
て,その結果を比較してみるわね.
――――――― 因子分析の重要結果(1因子モデル) ―――――――
因子負荷量 第1因子 共通性
―――――――――――――――――――――――――――――――――
理科 0.87 0.77
社会 -0.64 0.40
数学 0.87 0.76
国語 -0.63 0.40
英語 -0.60 0.36
―――――――――――――――――――――――――――――――――
因子負荷量の二乗和 2.68
寄与率 53.68%
累積寄与率 53.68%
―――――――――――――――――――――――――――――――――
――――――― 因子分析の重要結果(3因子モデル) ―――――――
因子負荷量(VARIMAX) 第1因子 第2因子 第3因子 共通性
―――――――――――――――――――――――――――――――――
理科 0.96 -0.20 -0.20 1.00
社会 -0.18 0.77 0.02 0.62
数学 0.97 -0.23 0.08 0.99
国語 -0.25 0.64 0.29 0.55
英語 -0.12 0.79 -0.04 0.65
―――――――――――――――――――――――――――――――――
因子負荷量の二乗和 1.97 1.72 0.13
寄与率 39.40% 34.31% 2.66%
累積寄与率 39.40% 73.71% 76.37%
―――――――――――――――――――――――――――――――――
卓:上記の1因子モデル,2因子モデル,3因子モデルを比較してみてくれ.
基本的には,因子分析には【どのモデルが正解というものはないっ!★】
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
分析者が最終的には自分の仮説に一番相応しいものを選択すればいい.
篠:仮に全く仮説を持っていない場合はどうすればよいのですか?
綾:その場合にはさっきの「効率のよいなかで,少なく」原則を使うのよ.
1因子モデルでは累積寄与率が53.68%と低いわね.ここから因子数をもう少
し増やした方がよいと考えられるわ.次に2因子モデルだけど,特別悪いと
ころはなさそうなので,保留.3因子モデルと比べてみましょう.
2因子モデル:累積寄与率=74.27%
│
│ 3因子追加分は「76.37%−74.27%」=「2.1%」※
↓
3因子モデル:累積寄与率=76.37%
※3因子モデルの「第3因子の寄与率」ではないことに注意※
どう? 「効率よく」という意味では,因子を一つ増やしても寄与率がほと
んど増加していないでしょ? これだったら,3因子モデルにするメリット
が,寄与率の観点からはあまりないの.
卓:それからもう一つの「因子の数」の決定基準がある.それは「因子構造が単
純かどうか」というものだ.
これは,因子負荷量を参考にして,因子の内容を明確にすることができるか
どうかを意味している.
3因子モデルの場合,特に第3因子の命名が難しいだろう? 対して,2因子
モデルの場合は命名が第1因子と第2因子,両方ともすっきりできる.
綾:つまり「因子の数」を決める場合には
・「効率のよいなかで,少なく」
・「因子の命名がすっきりできる(因子構造が単純)」
この二つの観点で絞り込んでいけばいいわけよ.
篠:わかりました.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽因子の関係性と共通性△
綾:今回の勉強会もいつも通りに長くなってしまったけど,そろそろ終わりそう
な気分ね.
篠:? まだ「因子の関係」と「共通性」に関するお話を伺っていませんが?
もう終わるのですか?
綾:ええ.その辺の話はさらりと流してそろそろ終わるわ.
だって――――
篠:だって?
綾:さすがに水着姿じゃ寒いものっ!
篠:……………………………えっと…………
卓:情景が分からない読者の皆様へ.
今回の綾姉さんは,水着姿で勉強会を受けているという奇妙なことをしてお
ります.冷房がそろそろ効きだしたこの部屋で,長時間の水着姿はきついよ
うです.
綾:ちなみに篠が復活したあたりから,冷房をつけてたりして.
まあ,ともあれ,そんな感じでラストスパート,みんな一気にごー!
卓:それでは続けましょう.
因子分析では本質的な選択オプションは「1)因子の数」と「2)因子の関係」
だと言いました.そして「1)因子の数」については既に説明しているので,
今度は「2)因子の関係」について,ごくごく簡単に述べます.
綾:因子とは「グルーピングの基準」なわけだけど,その基準の間に「相関があ
る」という立場と,「相関がない」という立場を考えることができるの.
今までの説明は全て「相関がない」というものだったの.試しに「因子に相
関がある」場合にどのような結果が出るか見てみましょう(なお使用する回
転法は「クアーティミン回転」よ).
―――――――――――――――――――――
X1 2 1 5 3 6 4
X2 5 7 1 8 5 4
X3 3 1 8 2 4 2
X4 1 1 2 4 5 1
―――――――――――――――――――――
―――――――――― 因子分析の重要結果 ――――――――――
斜交回転後の因子負荷量(QUARTIMIN) 第1因子 第2因子
―――――――――――――――――――――――――――――――
X1 0.74 0.78
X2 -1.00 0.02
X3 0.94 0.31
X4 -0.05 1.00
―――――――――――――――――――――――――――――――
――――――――――――――――――
因子間の相関係数行列
――――――――――――――――――
第1因子 第2因子
第1因子 1.00 -0.24
第2因子 -0.24 1.00
――――――――――――――――――
篠:あの,綾姉さん.因子分析で重要な「寄与率」「累積寄与率」などの情報が
表示されていません.間違いですか?
卓:残念ながら篠君.その表示は正しいのだよ.
「因子間に相関がない」は【直交回転★】,「因子間に相関がある」は【斜
交回転★】と呼ぶ.  ̄ ̄ ̄ ̄ ̄  ̄
 ̄ ̄ ̄ ̄
今まで説明してきた直交回転と異なり,斜交回転の計算法ではその性質上,
直交回転とは異なる結果が表示されるのだ.【単純に「固有値」「寄与率」
「共通性」を求めることができない★】のだ. ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
篠:だとすると,今回習った解読法がほとんど使えないのでは?
卓:…………
そうだな.正直なところ,「因子間に相関がある」とする斜交回転は,今回
説明した以上の因子分析の知識を持っていないと本当は使いこなすことがで
きない.初学者にとっては使いこなすのが難しいわけだ.
綾:だから,初学者向けの入門者では,斜交回転の説明がすぱっと切り捨てられ
てたりするのよ.なので,【初学者は★】斜交回転よりも,解読が簡単な直
交回転を使うことをおすすめするわ.
ただし,本格的な研究論文レベルになると,直交回転よりも斜交回転の方が
おすすめとされているんだけどね.
篠:とりあえず初学者は直交回転で因子分析に慣れろ,ということですか?
卓:そういうことだ.
さて残った因子分析の結果数値である「共通性」を説明しよう.
□共通性:【各】項目ごとの全因子の説明力
採用した因子全てを使って,各項目を説明できる程度の数値.
――――――― 因子分析の重要結果(3因子モデル) ―――――――
因子負荷量(VARIMAX) 第1因子 第2因子 第3因子 共通性
―――――――――――――――――――――――――――――――――
理科 0.96 -0.20 -0.20 1.00
社会 -0.18 0.77 0.02 0.62
数学 0.97 -0.23 0.08 0.99
国語 -0.25 0.64 0.29 0.55
英語 -0.12 0.79 -0.04 0.65
―――――――――――――――――――――――――――――――――
因子負荷量の二乗和 1.97 1.72 0.13
寄与率 39.40% 34.31% 2.66%
累積寄与率 39.40% 73.71% 76.37%
―――――――――――――――――――――――――――――――――
例えば,この結果の場合.
理科という項目は三つの基準(因子)を使って100%説明することができるこ
とを意味する.
対して,国語は三つの因子を使って55%説明することができる,逆に言え
ば三つの因子で説明できない割合が45%ある,ということだ.
まあ,共通性は因子分析を使って質問紙を作る場合など,少し限定された使
用法以外ではそれほど重要ではないから,この辺でさらりと終わろう.
これで,因子分析の初級レベルの解読法の説明はおしまいです.とりあえず
前回と今回の内容をおさえておけば,それほど的はずれな使い方をすること
はないと思います.
綾:というわけで,今回はおわりー♪
卓:あい,お疲れさん.
久々に長いメルマガ講義を読んでへとへとだと思いますので,さっさと終わ
りましょう.
それでは皆様,また半年後にお会いしましょう(あれ?
綾:もう少し早めに発行しなさいよ……
卓:うるさいやい.さっさと服を着やがれ.
篠:お疲れ様でした.またお会いしましょう.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
▽次回予定△
χ2分析の説明をする予定です.
★□■◆◇◆■□◇□■◆◇◆◇□■☆★□■◆◇◆■□◇□■◆◇◆◇□■★
●メールマガジン「独学をすスめ(MM版) 統計的研究法編」について
発行者:雪本 卓
mailto:ykmttaku@jn5.so-net.ne.jp
BBS:http://www.luckybreak.co.jp/ba04/mkru/Yukimt.html
HP:http://www006.upp.so-net.ne.jp/dokugaku-club/
「独学をすスめ(MM版) 統計的研究法編」は以下の無料メールマガジン発行
サービスを使って発行されています.このメルマガの内容については転載・
複写などは自由ですが,著作権利を「雪本 卓」は放棄していません.
・「melma!」 (マガジンID:m00049439)http://www.melma.com/
・「まぐまぐ」(マガジンID:0000080568)http://www.mag2.com/
このメールマガジンを解除される方は,配送されたメルマガがいずれの発行
システムであるかを確認して(メールの「送信者名」で判断),適切な発行シ
ステムHPで解除手続をお願いします.「マガジンID」か「統計的研究」を
キーワード検索すれば解除フォームが出現しますので,そこにご自分のメー
ルアドレスを入力して解除を行って下さい.
あるいは雪本のHPにも「解除フォーム」がありますのご利用下さい.
http://www006.upp.so-net.ne.jp/dokugaku-club/Study/index.htm
★□■◆◇◆■□◇□■◆◇◆◇□■☆★□■◆◇◆■□◇□■◆◇◆◇□■★
この記事の発行者<<前の記事
|
次の記事>>
|
最新の記事
