この本のTOPへ
Mulcelとは…
目次
クラスター分析(PDF)
全例題
多変量解析(Multivariate Analysis)について
多変量解析は互いに関係があると考えられる多種類のデータを目的に応じて分析する手法です。目的によりたくさんの手法があり、これからもいろいろな手法が生まれると思われます。理論的な理解をするためには微分積分学と線形代数学の知識が必要ですが,本書では多変量解析法でまず何ができるか知り、使って慣れていただきたいと考えました。基本的な7つの手法から21の例題をあげましたので、多変量解析の手法を見ていただきたいと思います。これらの例題は添付CD のExampleのフォルダに入れてあります。例題の解析手順は各章で詳しく解説します。
【本書で扱う7つの基本的手法】
-
- 重回帰分析(Multiple Regression Analysis)
多くの変数から特定の変数を予測する手法。 - 主成分分析(Principal Component Analysis)
多くの変量から新たに少数の合成変量を求め、情報を集約する手法。 - 因子分析(Factor Analysis)
データが持つ潜在的な要因を見つけ出して、単純化した構造で分析する手法。 - 判別分析(Discriminant Analysis)
データ間の関係から所属するグループを見つける手法。 - 正準相関分析(Canonical Correlation Analysis)
変量群の間の関係を解明する手法。 - クラスター分析(Cluster Analysis)
データの間の距離を定義して似たもの同士をグループにまとめる手法。
[1]最短距離法
[2]最長距離法
[3]群平均法
[4]重心法
[5]メディアン法
[6]ウォード法 - 数量化理論 (Quantification Theory)
質的なデータに数値を与えて解析を行う手法。
[1]数量化I類
[2]数量化Ⅱ類
[3]数量化Ⅲ類 数量化Ⅳ類
- 重回帰分析(Multiple Regression Analysis)
多変量解析は多くの変量を解析するというテーマで、変量とはいろいろな現象の起こるもとになる要因のことです。いろいろな要因が原因で結果が現れると考え、それを解明するために上記の手法が生まれました。
原因と考えるものを説明変数といい、結果としてあつかうものを目的変数といいます。結果として現れたデータは長さ、物の個数のように数値であらわされるものを量的データ、 数値であらわせないデータ、たとえば好き嫌い、病名などを質的データといいます。
多変量解析はこれらにより分類すると次のようになります。 本書では、これらについて21個の例題をあげ、解説しています。
【分析における注意】
-
- データに分析をほどこせば必ず期待した結論が得られるわけでないことを理解したうえで辛抱強く分析を試みます。
- データを処理して得た式について、何が何でも無理やり解釈を行うことについては十分注意します。解釈が無理かどうか判断するには専門的知識が必要です。
- 「有効な結論が出ない」ことも重要な結論と考え大切な情報として保存します。
- 分析の選択に注意します。
- 数学的理論付けも必要です。