多変量解析
多変量解析とは、多数の変数間の相互の関係性を捉えるために使われる統計的手法の総称で、分析手法は、重回帰
分析、数量化分析、判別分析、因子分析、クラスター分析などがあります。多変量解析は、品質改善の他、マーケ
ティングや社会情勢、医療分野など活用範囲は多岐に渡ります。
(1)重回帰分析
単回帰分析(散布図)が、1つの目的変数を1つの説明変数で予測したのに対し、重回帰分析は1つの目的変数を
複数の量的説明変数で予測しようというものです。
例えば、単回帰分析が身長×体重の関係を評価するのに対し、体重を身長の他、胸囲、腹囲、体脂肪など複数
の量的説明変数で評価します。体重を落とすにはどこを減らせば効果的かを予測することが可能となります。
(2)数量化分析
1)数量化T類
層別が、一つの質的変数で説明するのに対し、数量化T類は、1つ目的変数を複数の質的変数で、説明や
予測するための方法です。
例として、販売量を性別や家族構成、居住地などに分類し、どの層をターゲットにすべきかの判断材料に
使われます。
2)数量化U類
数量化T類の目的変数が量的変数であるのに対して、数量化U類の目的変数は質的変数になります。1つの
目的変数を複数の質的説明変数により、複数のカテゴリーとして判別することが出来ます。
例として、アンケート調査により、客層のカテゴリーを分類することが出来ます。
(3)判別分析
数量化T類の説明変数が質的変数であるのに対して、判別分析は、量的変数となります。一つの目的変数を
複数の量的説明変数により、複数のカテゴリーとして判別することが出来ます。
例として、目、口、鼻やあごの大きさ・長さから性別を判別する方法が考えられています。
(4)因子分析
複数の変数の背後にある、かくれた因子を明らかにて分類することが出来ます。よって、因子分析には、
目的変数が不明で、全てが説明変数になります。
例えば 理科系や文科系という隠れた因子により、説明変数である成績などを説明することになります。
(5)主成分分析
主成分分析とは、複数の変数から新たな指標を作り出すための手法となります。因子分析は、説明変数が
それぞれ独立しているのに対し、主成分分析は、複数の変数から少数の合成変数を作ることになります。合成
変数を作る時に明確さを表す統計量として寄与率を算出します。寄与率が一番大きなものを第一主成分と
言い、以下、第二、第三となります。累積寄与率が80%程度まで主成分を出します。
例として、算出された主成分から理系科目や文系科目が導き出されます。
(6)クラスター分析
クラスター分析とは、異なる性質のものが混ざり合っている集団の中から、互いに似たものを集めて、集落
(クラスター)をつくり、集団を分類しようとする方法を総称したものです。クラスター分析には、大きく
分けると階層クラスター分析、非階層クラスター分析の2種類の方法があります。
1)階層的クラスター分析
単に対象をいくつかのクラスターに分類するだけでなく、どのようにクラスターが結合されていくかの
過程までが見られる非常に直感的なアウトプットが得られます。その反面、分類する対象が非常に多い
場合に、計算量が非常に多くなり実行不可能となったり、結果が不安定となってしまうという欠点もあり
ます。その場合は、非階層クラスター分析を行います。
2)非階層クラスター分析
非階層クラスター分析とは、全体をあらかじめ決めておいたクラスター数に分割していく方法で、自動で
グルーピングを行うアルゴリズムで、最初に、指定したクラスターの数に分類していきます。階層
クラスター分析とは違い、大量の項目の分類に用いても結果が安定していることが特長です。