March ― 53 ― 2014 〈研究ノート〉 多因子分析による探索的多変量データ分析 中 * 山 慶 一 郎** 1.はじめに 多因子分析(Multiple Factor Analysis)、MFA とは、主成分分析 PCA Principal Component Analysis にお ける変数を幾つかのグループに分け、グループ間の関係を分析する手法であり、PCA をさらに一般化し た分析である。MFA は、Escofier and Pages(1988)にその考えが見られるが、その解説は文献[1]に詳 しい説明が見られる。また、最近、R の Package である FactoMineR では、比較的簡単に計算ができる。 MFA は幾つかの変数のグループから構成されるデータの分析に利用される幅広い適用性を有する分析 手法であり、本稿では、その理論と計算方法を概観し基本的な応用例として、主成分分析への適用と、複 数の分割表の結合について、幾つかの応用部門に適用した利用例を示すことにする。 MFA はグループに分割したデータ表を併置した複数の表をまとめて処理するもので、個別の表が全体 の表に対する影響の大きさのバランスをとるために、個別の表に weight を掛けて調整し、global table を 作成して分析を実施する。また、MFA では、変数が量的 quantitative であるか、質的 categorical であるか によって、PCA Principal Component Analysis, CA Correspondence Analysis, MFA Multiple Factor Analysis が 適用され、分析が行われる。本稿では、これらの分析の考えかたを説明し、分析のやり方と FactoMineR の package の適用について解説し、その分析例の一例を示すことにする。2 では、MFA のデータ構造を 説明し、3 では、解析の手順を R を用いて、4 で FactoMineR を用いた分析を展開する。5 で分析モデル に従った計算例を呈示する。 2.データ構造について 今まで取り上げてきた多変量データ解析では、n×p のデータ構造において、変数 p は numerical variables か、categorical variables に分けられる。分析においても、主成分分析 PCA は前者になるし、対応分 析 MCA は後者になる。ここで取り上げる MFA においても、同様にそれらに対応して、2 種類のモデル がある。まず、数値変数の場合を取り扱う。 a.MFA は PCA における変数が幾つかのグループから構成されるデータを問題にする。 図に表せば、通常のデータは 1 つの枠でデータが表示されるが MFA では複数の枠で表され処理され る。この図は、J 個のデータセットからできている。 ───────────────────────────────────────────────────── * キーワード:Multiple factor analysis, R, FactoMineR ** 関西学院大学名誉教授 ― 54 ― 社 会 学 部 紀 要 第118号 set 1 variables 1 individuals i K 1 j J Kj Xij I J 個のデータが連結されて 1 つのデータを構成し、1 つの枠は 1 つのグループからの変数を表す。MFA の分析目的はすべてのグループ間の変数の特徴を見出すことである。分析の設計にさいしては、各グルー プ毎の影響のバランスをとり全体のデータ構造を作る点に、その分析の特質が示されているように思う。 そのために、MFA では、各グループのデータに、その各グループ毎のデータの特異値分解 Singular value decomposition の第 1 特異値 α 1 をウエート1)にして、データを再構成している。ウエート付けしたデータ は、次のようになる。 ! │ X1 │ λ 11 ; !Xλ 2 2 1 ; ・・・ ; !Xλ ││=[Z , Z , ・・・, Z ] J J 1 1 2 J このように MFA はウエート付けした PCA(weighted PCA)であり、主成分の再スケーリングと見な される。変数は一般には標準化されたデータで、個体間の距離を計算するようにウエート付けされてい る。このウエートは 1 つのグループの変数には、同じウエート付けされているので、グループの構造は保 持されている。各グループの第 1 固有値は 1(svd(Zj)=1)である。 次に、この MFA 分析の理論的根拠として、一般化特異値分解 Generalized singular value decomposition 2)について簡単に触れておく。 (GSVD) GSVD について b.特異値分解 Singular value decomposition(SVD)では、データ行列は、 X=UΛVT UTU=VTV=I と分解する。 −1/2 ここで、P=M U X=PΔQT ∼ 1/2 Q=W−1/2V と変換すると、 PTMP=QTWQ=I に分解される。 1/2 X=M XW ∼ ∼ X=M−1/2XW1/2 の関係がある。M と W は、行と列に対する制約を示している ので、GSVD は SVD の一般化したものと考えられる。 GSVD では、 P=M−1/2U および Q=W−1/2V の変換を行う。 ここで、M はデータ行列 X の row に関する制約で、row(行数)を m とすると、 M=diag(1/m,・・・,1/m)であり、W は列、変数に対する制約で、 W=diag( α )=diag( α 1、 α 2、・・・、 α J) この変換が GSVD であることは、 PT=UTM−1/2 かつ、QT=VTW−1/2 であるから、PTMP=UTM−1/2MM−1/2U=UTU=I QTWQ=VTW−1/2WW−1/2V=VTV=I となることから、分かる。 さらに、SVD では、X=PΔQT において、F=PΔ とすると、X=FQT である。P=M−1/2U であるので、F =M−1/2UΔ である。F は主成分得点 Score という。又、Q=W−1/2V であるから、G=W−1/2VΔ とすると、G は主成分負荷量 loadings と言われている。F と G をグラフ表示 Biplot して、分析結果が解釈されること が多い。 ───────────────────────────────────────────────────── 1)このウエートは、一般にはデータ X の第 1 固有値 λ 1 を用いる。 λ 1= α 12 という関係がある。 2)SVD と GSVD については、文献[5]が詳しい。 March ― 55 ― 2014 c.次に、categorical data につてのモデルをのべる。この場合はデータは比率で表されるので、グループ 化されたデータは、全体として次の形で示される。 1 ! J ! i pijt pi. p.jt 1 j row weight を pi. . と し 、 col weight を p.jt と す る と 、 対 応 分 析 correspondence analysis で は 、 φ = pijt−pi..p.jt を用いて、各点 n 座標の距離をもとめるが、 pi..p.jt ! グループ化されたモデルの場合では、 ! i j pijt pi.t row weight= p.jt pi.. col weight= pi.t p.t p.jt p..t Internal correspondence analysis3)では、次のように定義された距離を用いる。 pi.t pijt p.jt 1 ┌ pijt pi.t ┐ p..t ICA= │ − │= pi.. p.it pi.. └ p.jt p..t ┘ ( ) この ICA は分割表 contingency table を結合したデータの分析に用いられる MFA の適用の一つのモデ ルを提供する。 3.簡単な例による MFA の R によるプログラム a.ここで、以下の例について MFA の programming を試みることにする。この例は wine の taste を 3 人 の専門家による評価のデータ4)である。 wines wine1 wine2 wine3 wine4 wine5 wine6 Expert1 Expert2 Expert3 fruity woody coffe redfruit roasted vanillin woody fruity buttery woody 1 5 6 7 2 3 6 3 1 1 5 4 7 2 1 2 4 4 2 4 5 7 3 3 5 4 2 2 5 5 7 4 1 1 6 4 6 2 1 2 5 5 3 4 7 2 2 1 6 4 1 2 6 7 7 3 1 2 6 5 ───────────────────────────────────────────────────── 3)文献[1] 、[3] 4)この例のデータは、資料 1 参照。また、以下の program は文献[1]のアルゴリズムにしたがって programing し た。 ― 56 ― 社 会 学 部 紀 要 第118号 まず Excel のシート上のデータを読み込む。 >Y1<−read.table (”clipboard”,header=TRUE,row.names=1) #Excel から Expert1 をコピーする。 >Y2<−read.table (”clipboard”,header=TRUE,row.names=1) #Expert2 をコピーする。 >Y3<−read.table (”clipboard”,header=TRUE,row.names=1) #Expert3 をコピーする。 >n<−nrow (Y1) #n はデータの列の数 >sd<−apply (Y1,2,sd) >sdp<−sqrt ((n−1)/n)*sd #sdp は母標準偏差 >XX1<−scale (Y1,apply (Y1,2,mean),sdp) >X1<−(1/sqrt(n))*XX1 #Y1 のデータを標準化する。 >n<−nrow (Y2) >sd<−apply (Y2,2,sd) /n)*sd >sdp<−sqrt ((n−1) >XX2<−scale (Y2,apply (Y2,2,mean),sdp) >X2<−(1/sqrt(n))*XX2 #Y2 のデータを標準化する。 >n<−nrow (Y3) >sd<−apply (Y3,2,sd) /n)*sd >sdp<−sqrt ((n−1) >XX3<−scale (Y3,apply (Y3,2,mean),sdp) >X3<−(1/sqrt(n))*XX3 #Y3 のデータを標準化する。 >Z1<−X1/svd (X1)$d[1] #X1 のデータのウエイトを付ける。 >Z2<−X2/svd (X2) $d[1] #X2 のデータにウエイトを付ける。 >Z3<−X3/svd (X3)$d[1] #X3 のデータにウエイトを付ける。 >Z<−cbind (Z1,Z2,Z3) #ウエイト付けしたデータを作る。 >Z #グループの変動を調整したデータである。標準化したデータに、各デ ! ータ X に α =1/ λ のウエイトを付けたもの。 fruity woody coffe redfruit roasted vanillin wine1 wine2 wine3 wine4 wine5 wine6 −0.3350906 0.1116969 0.2233938 0.3350906 −0.2233938 −0.1116969 0.34123959 −0.04265495 −0.29858464 −0.29858464 0.21327474 0.08530990 0.44864525 −0.16314373 −0.28550153 −0.16314373 0.08157186 0.08157186 −0.2616731 0.0000000 0.1308366 0.3925097 −0.1308366 −0.1308366 0.18550466 0.02650067 −0.29150733 −0.29150733 0.18550466 0.18550466 0.29845661 0.01570824 −0.26704013 −0.26704013 0.20420715 0.01570824 woody fruity buttery woody wine1 wine2 wine3 wine4 wine5 wine6 0.2821694 −0.1693016 −0.2821694 −0.1693016 0.1693016 0.1693016 −0.02214601 0.11073004 0.50935818 −0.15502206 −0.15502206 −0.28789810 0.19538868 −0.03907774 −0.39077736 −0.27354415 0.19538868 0.31262189 0.359976 −0.119992 −0.359976 −0.239984 0.239984 0.119992 いま、Z=[Z1, Z2, Z3]=UΔVT なる Singular Value Decomposition を行うと、UTU=VTV=I となり、更 に、GSVD を、同じ Z に用いると、Z=PΔQT と分解する。ここで、P=M−1/2U と、Q=W−1/2V なる変換を 行う。PTMP=QTWQ=I なる関係がある。 ここで、問題となるのが、M と W の設定である。M と W は row と column の制約を示している。列 March ― 57 ― 2014 の制約として、一様な周辺分布 1/n を想定する。 >n<−nrow (Z) #列の数(n=6) >M<−c (rep (1/n,n)) >M [1]0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 Z=PΔQT において、F=PΔ とすると、Z=FQT で、P=M−1/2U であるので、F=M−1/2UΔ である。したが って、 >P<−diag(1/sqrt(M))%*% svd (Z)$u >F<−diag(1/sqrt(M))%*% svd (Z)$u %*% diag (svd(Z)$d) >F #主成分得点 score wine1 wine2 wine3 wine4 wine5 wine6 [,1] dim.1 [,2] dim.2 [,3] dim.3 2.1721551 −0.5570173 −2.3176633 −1.8325573 1.4037873 1.1312955 −0.50859564 −0.19740840 −0.83025948 0.90504558 0.05497671 0.57624123 −0.484354015 0.410158063 0.006244002 −0.398982615 0.130753278 0.336181286 次に、individual の位置を表す。loadings を求める。これは、データの対称性を利用して、W を以下の ように定義する。これは、個々のデータの分散 inertia を情報として、利用することにしよう。 col.w<−apply(Zˆ2,2,sum) W<−col.w >W fruity woody coffe redfruit 0.3493334 0.3493334 0.3493334 0.2738913 roasted vanillin woody 0.273891 0.2738913 0.273891 いま、ZT=QΔPT として、G=QΔ である。 Q<−diag(1/sqrt(W))%*% svd (Z)$v Q [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] Dim.1 Dim.2 Dim.3 −0.57549 0.5848 0.544055 −0.52906 0.569142 0.564734 0.578049 −0.35146 0.562751 0.588693 0.366843 −0.245 −0.10664 0.649466 −0.00937 −0.33792 0.170123 −1.34811 0.317298 0.008324 0.05422 −0.05355 −1.09463 −0.60951 0.825803 −0.0085 −0.41431 0.022959 0.706054 −0.32523 fruity buttery woody 0.4031463 0.4031463 0.4031463 ― 58 ― 社 会 学 部 紀 要 第118号 G<−diag(1/sqrt (W))%*%svd (Z)$v%*%diag(svd(Z)$d) G #individuals の loading [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] Dim.1 Dim.2 Dim.3 −0.96894 0.98462 0.916019 −0.89077 0.958257 0.950835 0.973254 −0.59174 0.947497 0.991174 0.219143 −0.14636 −0.0637 0.387976 −0.0056 −0.20186 0.101627 −0.80533 0.189546 0.004973 0.018416 −0.01819 −0.37179 −0.20702 0.280483 −0.00289 −0.14072 0.007798 0.239811 −0.11046 ここで、Z=[Z1, Z2, Z3]=PΔQT、Q=[Q1, Q2, Q3]とすると、Z=[PΔQ1T, PΔQ2T, PΔQ3T]となる。 Z=PΔQT であるので、Z=WQ=PΔQWQ=PΔ=F 従って、F=ZWQ=[Z1, Z2, Z3]WQ QT=[Q1, Q2, Q3]T とすると、 Fk=ΣZkWkQk=Σ α kZkQk これらから、G(k=1、・・・、10) 、F(k=1,・・・、6)が得られる。 K k b.次に contingency tables の場合は、 ここでは、具体的な計算例として、文献[1]p.337 のデータを利用した計算例を示す。 データには、以下のような 2 つの data table A, B を用いる。 table A A1 A2 A3 計 table B B1 B2 B3 計 R1 R2 R3 10 0 0 0 42 3 0 3 42 10 45 45 R1 R2 R3 58 6 6 6 7 2 6 2 7 70 15 15 計 10 45 45 100 計 70 15 15 100 Table A, B を比率に変換して、合併した table C を作成する。 table C A1 A2 A3 小計 B1 B2 B3 小計 計 R1 R2 R3 0.05 0 0 0 0.21 0.015 0 0.015 0.21 0.05 0.225 0.225 0.29 0.03 0.03 0.03 0.035 0.01 0.03 0.01 0.035 0.35 0.075 0.075 0.4 0.3 0.3 計 0.05 0.225 0.225 0.5 0.35 0.075 0.075 0.5 1 (2)を用いて、ICA を計算すると、 C A1 A2 A3 B1 B2 B3 R1 R2 R3 2.25 −1.50 −1.50 −0.25 1.61 −1.28 −0.25 −1.28 1.61 0.32 −0.21 −0.21 −0.75 1.06 −0.06 −0.75 −0.06 1.06 この結果を利用して、MFA の計算を行う。 Table C の周辺度数を、row.m<−apply (C,1,sum)= (0.4,0.3,0.3)とし、col.m<−apply (C,2,sum)= (0.05,0.225,0.225,0.35,0.075,0.075)とする。ここで、ICA の周辺度数を定義して、 March ― 59 ― 2014 row.w<−0.4,0.3,0.3(=row.m)とし、 col.w<−col.m*rep (svd(A)$d[1] (1/2) ˆ ,3),svd(B)$d[1] (1/2) ˆ ,3)とすれば、 row.w,col.w を用いて、 >svd.triplet 5)(C,row.w,col.w) から分析結果が得られる。 4.R の Package について 実際のデータ解析は、R の Package を用いるが、ここで、利用するのは、FactoMineR の MFA 関数で、 前節の例を、FactoMineR を用いて計算する。 MFA の使用方法の詳細は package の manual を参照されたい。ここでは、3 で利用した、wine のデー タから、MFA の解説を試みる。wine のデータでは、 >res.mfa<−MFA (wine,group=c (3,4,3),type=c (rep(“s”,3)), 6) name.group=c (“Exp1”,”Exp2”,”Exp3”),graph=FALSE) >res.mfa この program を実行すれば、結果が表示される wine データでは、グループは、Exp1, Exp2, Exp3 の名前をもち、3, 4, 3 個の変数からなる。変数の型 type は“s”で指定する。変数の指定により、計算手順が決まる。MFA の計算手順は、変数の type 指定によ り、グループ変数毎に実行される。これを separate analysis という。“c”は平均からの偏差に変換し、“s” では、標準化したデータを、PCA を行う、separate analysis では、“n”の時は、MCA を、“f”では、CA を選択する。次に、グループを結合したデータには、PCA を、global analysis として実施する。global.pca で分解するデータは、すべての group を含む結合したデータで、その形は global.pca$call$X である。この データは、データ全体としてバランスのとれた値に調整されたもので、このデータを GSVD で分解して、 解が得られ、適切な次元に還元されてグラフ化される。 FacoMineR では、関数 svd.triplet(data,row.w,col.w)によって、GSVD が実行される。wine のデータで は、変数の値が、分散が 1 になるように調整された表 Z から計算できる。 >col.w<−apply (Zˆ2,2,sum)=res.mfa$global.pca$call$col.w col.w fruity woody coffe redfruit roasted vanillin woody fruity buttery woody 0.349 0.3493 0.349 0.2739 0.2739 0.2739 0.274 0.4031 0.403 0.4031 >row.w=rep(1/6,10)であるので、 $call$row.w [1]0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 >svd.triplet(X,row.w,col.w) $vs [1]0.40119363 0.14987622 0.08042432 0.04115212 0.02665631 ───────────────────────────────────────────────────── 5)svd.trplet( )は FactoMineR の関数である。 6)MFA の関数を利用する際に、graph=FALSE を挿入しなければ、自動的に例示したグラフが出力される。 ― 60 ― 社 会 学 部 紀 要 第118号 $U [1,] [2,] [3,] [4,] [5,] [6,] [,1] [,2] [,3] [,4] [,5] 1.2711212 −0.3474389 −1.4140072 −1.0405481 0.8346984 0.6961746 0.92660892 0.27016560 1.35740149 −1.51086811 −0.07505598 −0.96825192 1.39800724 −1.16988274 −0.08173772 1.23474813 −0.38081000 −1.00032490 −0.1796929 1.1939568 −0.8336602 0.3231376 1.0927284 −1.5964696 0.73412066 1.41849863 −0.67555479 0.07427285 −1.72005048 0.16871312 $V [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [,1] [,2] −0.5789116 0.5894411 0.5505659 −0.4679126 0.5093536 0.5029860 0.5200434 −0.3968883 0.6147770 0.6405205 −0.39860258 0.28010393 0.16178546 −0.57981005 0.03363665 0.32386906 −0.09801115 1.36269052 −0.29360121 0.04547837 [,3] −0.014164039 0.033428395 1.092748677 0.598571670 −0.754298673 −0.005201197 0.357952471 −0.096411175 −0.775211483 0.342579147 [,4] [,5] 0.2018224 0.5550319 −0.5313725 0.5292962 0.2174109 1.2130589 −0.6382870 −0.1956772 −0.5263743 0.3453576 0.94925706 0.10684259 0.95130635 −0.30238278 0.38309721 0.33359998 −0.73531895 0.02046325 0.30228485 −0.45720154 以下、このモデルで MFA を実行して、group の比較がグラフ化される >res.mfa<−MFA (wine.data,group=c (3,4,3),type=rep(“s”,3), +name.group=c (”Exp1”,”Exp2”,”Exp3”)) >res.mfa.group ,L(ν )を持つ。νi は次元 i dimension を表し、その大 この結果では、Group j は座標(L(ν g 1 , Kj ) g 2 , Kj ) きさを K で示している7)。 = 0<=L(ν g 1, Kj) 1 λ 1j ! k∈Kj 2 cov(x. ≦1 k, ν1) ここで、2 つの group の類似性を説明する幾つかの測度が考えられている。 Group Kk と KJ 間の類似性の測度は、 !(λ ) Kj i 2 k !(λ ) Kj j 2 k L(K = k=1 j 2 =1+ k=2 j 2 g k, KJ) (λ i ) ( λ 1) >res.mfa$group$Lg EXp1 EXp1 Exp2 Exp3 MFA 1.0017902 0.9517525 0.7822593 0.9650774 Exp2 0.9517525 1.0037355 0.8359190 0.9846926 Exp3 0.7822593 0.8359190 1.0326333 0.9350963 MFA 0.9650774 0.9846926 0.9350963 1.017661 ───────────────────────────────────────────────────── 7)文献[3]を参照。 ・Lg 係数 s:グループ間の関係性の Lg 係数は、2 個ずつの表がどの程度関係しているのかを測定できる。1 番 目の表の変数がより多く 2 番目の表の変数に関係するほど、Lg 係数が高くなる。 ・RV 係数:グループ間の関係性の RV 係数は、Lg 係数から派生するもう 1 つの測度である。RV 係数の値は、 0 から 1 の間の値をとる。 March ― 61 ― 2014 第 1 図 グループの表示 >plot (res.mfa,choix=” group” ) >res.mfa$group$coord[,1 : 2] EXp1 Exp2 Exp3 Dim.1 Dim.2 0.9597660 0.9758837 0.8991509 0.02567692 0.05522578 0.27595635 グループ間の関連はグラフで直観的に理解できる。グループ間にはほぼ差のないことが知られる。 グループ間の相関関係は RV で示される。また、MFA の主成分に対する貢献度 contribution によって与 えられている。 res.mfa$group$RV, res.mfa$group$contrib 第 2 図 部分次元の表示 >plot (res.mfa,choix=” var” , hab=” group” ) 各グループの次元への射影の様子が作図されている。次元 1 は各グループを十分に説明している。Exp 3 は dim2 の説明力があることが分かる。 ― 62 ― 社 会 学 部 紀 要 第118号 第 3 図 個体の配置図 >plot (res.mfa,choix=” ind” , habillage=” group) >plot (res.mfa,choix=” ind” ) MFA の計算による wine の配置を示す。 >res.mfa$ind$coord[,1 : 2] wine1 wine2 wine3 wine4 wine5 wine6 Dim.1 Dim.2 2.1721551 −0.5570173 −2.3176633 −1.8325573 1.4037873 1.1312955 0.50859564 0.19740840 0.83025948 −0.90504558 −0.05497671 −0.57624123 第 4 図 Group 別変数の次元に対する相関 >plot (res.mfa,choix=” var” , hab=” group” ) March ― 63 ― 2014 >res.mfa$global.pca$var$cor[,1 : 2] fruity woody coffe red.fruit roasted vanillin woody.1 fruity.1 butter woody.2 Dim.1 Dim.2 −0.9689447 0.9846203 0.9160188 −0.8907682 0.9582567 0.9508348 0.9732536 −0.5917422 0.9474965 0.9911738 −0.219143241 0.146357563 0.063704928 −0.387975758 0.005595672 0.201864717 −0.101627307 0.805328580 −0.189546290 −0.004972744 第 5 図 グループ毎の個体の配置図 >plot (res.mfa,choix=” ind” , partial=” all” , habillage=” group” ) >res.mfa$ind$coord.partiel[,1 : 2] wine1.EXp1 wine1.Exp2 wine1.Exp3 wine2.EXp1 wine2.Exp2 wine2.Exp3 wine3.EXp1 wine3.Exp2 wine3.Exp3 Dim.1 Dim.2 2.7644318 2.2139276 1.5381060 −0.7730339 −0.2842466 −0.6137713 −1.9913978 −2.1115082 −2.8500839 1.1048125 0.8635191 −0.4425446 −0.2989190 0.1321352 0.7590090 −0.8058935 −0.4997180 3.7963899 wine4.EXp1 wine4.Exp2 wine4.Exp3 wine5.EXp1 wine5.Exp2 wine5.Exp3 wine6.EXp1 wine6.Exp2 wine6.Exp3 Dim.1 Dim.2 −1.9814561 −2.3930095 −1.1232063 1.2928336 1.4921140 1.4264142 0.6886225 1.0827227 1.6225413 −0.9271871 −1.2271463 −0.5608033 0.6206606 0.4880883 −1.2736790 0.3065265 0.2431217 −2.2783719 5.統計分析 a.まず、主成分分析による MFA の分析例を示す。取り上げたデータは、平成 24 年、25 年に公表され た都道府県の学力調査の結果である。出題に対する平均正答率を分析データとした。MFA 分析では、平 成 24 年度と 25 年度との間に学力差が見られるかどうか、又、小学 6 年生と中学 3 年生との間に成績の差 があるかないかが分析の目的となる。又、県別順位がどのように、固定化の傾向にあるか、などが関心が ある。 ― 64 ― 社 会 学 部 紀 要 第118号 今、データをファイル名 seiseki とし、group 名を“24”、”25”とすると >res.mfa<−MFA (seiseki,group−c (8,8),type=c (“s”, ”s”), name.group=c (“24”,”25”)) データは以下の構造を持っている。 24 年 小学 6 年生 北海道 青 森 国語 B 算数 A 算数 B 国語 A.1 国語 B.1 算数 A.1 算数 B.1 79.0 84.7 53.5 58.7 69.6 77.4 55.8 61.4 74.2 76.0 63.1 65.5 60.8 62.4 48.1 48.9 …… …… …… …… …… …… …… 縄 国語 A …… …… 沖 77.0 51.7 66.5 52.9 67.6 56.9 50.8 38.4 25 年 小学 6 年生 北海道 青 森 国語 A.2 国語 B.2 算数 A.2 算数 B.2 国語 A.3 国語 B.3 算数 A.3 算数 B.3 60.4 68.7 46.4 52.9 74.9 80.7 54.0 60.5 76.0 78.8 66.2 67.7 62.3 65.0 39.1 42.4 …… …… …… …… …… …… …… 縄 中学 3 年生 …… …… 沖 中学 3 年生 58.3 45.5 73.3 54.4 69.2 62.4 53.2 29.8 図から、24 年度と 25 年度の成績は殆ど差がない。 >plot (res.mfa,choix=”group”) >res.mfa$group #グループの差の計算 $coord $Lg 24 25 MFA 24 25 MFA 1.0424332 0.9635577 1.0227615 0.9635577 1.0592228 1.0313217 1.022761 1.031322 1.047281 Dim.2 0.9808249 0.9805229 0.1747955 0.2108039 $contrib $RV 24 25 MFA 24 25 Dim.1 24 25 MFA 1.0000000 0.9169802 0.9788554 0.9169802 1.0000000 0.9791941 0.9788554 0.9791941 1.0000000 24 25 Dim.1 Dim.2 50.0077 49.9923 45.33086 54.66914 March ― 65 ― 2014 次元 1、2 で、ほゞ説明可能である。1 次元は成績を表すが、2 次元は説明が必要であろう。 ここで、データを 4 つのグループに分割して計算した。ただし、a=24、b=25 である。 >res.mfa<−MFA (SEISEKI,group=c (4,4,4,4),type=rep(”s”,4), + name.group=c (”小 6 a”、”中 3 a”、”小 6 b”、”中 3 b”)) 分析結果は、前と同じである。 ― 66 ― 社 会 学 部 紀 要 第118号 参考のために、階層モデルを用いて計算を行った。結果は同じである。 March 2014 ― 67 ― >res.hmfa<−HMFA8) (seiseki,H=hierar,type=rep(”s”,4),graph=FALSE) >plot (res.hmfa,choix=”group”) 更に、成績の府県別の差の要因を調べるためにクラス定員を説明変数として導入して計算したが、特に明 白な要因とは考えられない。 >res.pca<−PCA (seiseki 29),quali.sup=6) >plot.PCA (res.pca,choix=”ind”,habillage=6) >plot.PCA (res.pca,choix=”ind”,habillage=6,label=” none”) b.次に質的データの分析例として、分割表に対する MFA の分析を呈示する。データは従来から分析し てきた社会調査を利用し今回は「生活信条について、日本とドイツの調査の比較を行う。Q 5 a∼j(日本) と、Q 4 A∼J(ドイツ)を用い、その回答の反応を MFA による分析で行った。 ───────────────────────────────────────────────────── 8)HMFA は階層モデルの関数である。これについては、FactoMineR の manual を参照された。 9)seiseki 2 このファイルは、24 年小学 6 年データにクラス学生数を加えたものである。 ― 68 ― 社 会 学 部 紀 要 第118号 >data<−cbind (JD,DD) #JD,DD は資料参照。 >res.mfa<−MFA (data,group=c (50,48),type=c (”f” ,”f”), + name.group=c (”日本” 、”ドイツ”)) > Q 5(日本)と Q 4(ドイツ)の回答には殆ど差がない。ここでは、結果を呈示するのにとどめる。 March ― 69 ― 2014 又、変数 variables と個体 individuals についても、あまり差がない。 >res.mfa$group $Lg 日本 ドイツ MFA 日本 ドイツ MFA 1.204412 0.568264 1.073208 0.5682640 1.0322875 0.9690011 1.0732082 0.9690011 1.2363882 日本 ドイツ MFA 1.0000000 0.5096386 0.8794659 0.5096386 1.0000000 0.8577219 0.8794659 0.8577219 1.0000000 Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 0.8255228 0.8262313 0.3145915 0.2669454 0.2742699 0.0978557 0.24337270 0.07749977 0.15181191 0.05595547 $RV 日本 ドイツ MFA $coord 日本 ドイツ $contrib 日本 ドイツ Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 49.97855 50.02145 54.09657 45.90343 73.70358 26.29642 75.84717 24.15283 73.06821 26.93179 階層 MFA を利用すると、 >data<−cbind (JD,DD) >hierar<−list (c (15,25,5,5,14,25,4,5), ( c 4,4)) >res.hmfa<−HMFA (data,H=hierar,type=c (rep(”s”,8))) ― 70 ― 社 会 学 部 紀 要 第118号 HMFA を用いても、大体同じである。L1G5(成功ドイツ)が、Dim 1,2 やや離れているのが観察され る。 最後に全ての変数を 1 グループにして MFA を適用してみた。 >res.mfa<−MFA (data,group=c (15,25,5,5,14,25,4,5), + + type=c (rep(”f”,8)),name.group=c (”成功 J”、”自己 J”、”家族 J”、”競争 J”、 ”成功 G”、”自己 G”、”家族 G”、”競争 G”)) March 2014 ― 71 ― 面白い結果が示される。 6.まとめ 本稿で取り上げた主因子分析(Multiple Factor Analysis)は、2 のデータ構造 a.で説明した主成分分析 (Principal Component Analysis)を複数の変数をもつ場合に拡張したものと、b.で解説したクロスデータ (Contingency Table Analysis)にも、同様の手法を適用したものである。 本稿では、これらの分析手法の考え方と計算方法について、説明し、更に、R の package、FactoMineR の関数 MFA を適用して、簡単な分析方法とデータ解析を示したものである。この分析手法は拡張され て、対応分析(Correspondence Anaysis)、多重対応分析(Multiple Correspondence Analysis)にも応用さ れ、MFA として、簡単にデータ解析が可能であり、R の FactoMineR, package で容易に利用可能となって いる。 MFA は複数の表を処理するが、それらは、quantitative か categorical な変数の組から構成されており、 その解析手法は同じではないが、package では、parameter を指定することによって、計算することができ る。 MFA は変数群の分析であるので。分析対象の変数間の構造の有無、時間的変化の差異など興味ある結 果を表示する。データ解析の一手法としては、分析対象の概観をえるのに優れた手法である。 本稿ではデータ構造 a で取り上げた PCA を一般化した分析手法と、その解析例と、b での、contingency table を結合した分析例を呈示した。これ以外にも、MCA を一般化したものが考えられるし、更に、contingency table を用いるものでは、別のアルゴリズムが考えられている。 データ解析で MFA を利用することは、分析対象の構造を把握する上で、簡便であり、探索的分析手法 として、更に多くの分析を導入するのに役立つものであるう。 文献 [ 1 ]Pages and Becue-Bertaut, Multiple Factor Analysis for Contingency Tables, from, Multiple Correspondence Analysis and Related Methods(2006) , Chapman & Hall/CRC pp 199−326. [ 2 ]Abdi & Williams & Valentin, Multiple Factor Analysis : Principal Component Analysis for Multi-Table and Multi-Block Data Sets Computational Statistics vol 5/2(20133/4)Wiely Interdisciplinary Reviews [ 3 ]J. Pages, Multiple Factor Analysis : Main Features and Application to Sensory Data, Revista Colombiana de Estadistica, ― 72 ― 社 会 学 部 紀 要 第118号 vol 27/1 2004/6 [ 4 ]Abdi & Valentin. Multiple Factor Analysis, in Encyclopedia of Measurement Statistcs. Thousand Oaks(CA):Sage (2007) [ 5 ]H. Abdi, Singular Value Deconposition(SVD)and Generalized Singular Value Dcomposition(GSVD) (2007) , Encyclopedia of Mesurement and Statistics, Thousand Oarks(CA) ;Sage [ 6 ]H. Abdi, L. I. Williams and D. Valentin, Multiple factor analysis : principal component analysis for multitable and multiblock data sets, Wiley Periodicals, inc(2013) [ 7 ]A. Zarraga and B. Goitisolo, Simultaneous Analysis : A Joint Study of Several Contingency Tables with Different Margins. from Multiple Correspondence Analysis and Related Methods(2006) , Chapman & Hall/CRC pp 327−350. [ 8 ]E. Abascal, I. G. Lautre, and M. I. Landaluce, Multiple Factor Analysis of Mixed Tables of Metric and Categorical Data. From Multiple Correspondence Analysis and elated Methods(2006) , Chapman & Hall/CRC pp 351−367. [ 9 ]H. Abdi, RV Coefficient and Congruence Coefficient(2007 Encyclopedia of Mesurement and Statistics, Thousand Oarks (CA) ;Sage [10]B. Kostov, M. Bercue-Bertaut and F. Husson, Multiple Factor Analytsis for Contingency Tables in the FactoMineR Package, The R Journal vol 5/1(2013) [11]C. E. Pardo, M Becue-Bertaut, J. E. Ortiz. Correspondence Analysis of Contingency Tables with Subpartitions on Rows and Columns. Revista Colombiaana de Estadistica(2013. vol 36/1) [12]A. Zarrage B. Goitisolo, Simultaneous Analysis in S-PLUS : The SimultAn Package. Journal of Statistical Software. (2011/4)vol 40, Issue 11. [13]B. Everitt, T. Hthorn, An Introduction to Applied Multivariate Analysis with R, Springer,(2011) 資料 1. wines wine1 wine2 wine3 wine4 wine5 wine6 Expert1 Expert2 Expert3 fruity woody coffe redfruit roasted vanillin woody fruity buttery woody 1 5 6 7 2 3 6 3 1 1 5 4 7 2 1 2 4 4 2 4 5 7 3 3 5 4 2 2 5 5 7 4 1 1 6 4 6 2 1 2 5 5 3 4 7 2 2 1 6 4 1 2 6 7 7 3 1 2 6 5 March ― 73 ― 2014 資料 2.全国学力調査データ 都道府県の公立校の平均正答率(%) (平成 24 年 8 月 9 日,平成 25 年 8 月 28 日 24 年 北海道 青森 岩手 宮城 秋田 山形 福島 茨城 栃木 群馬 埼玉 千葉 東京 神奈川 新潟 富山 石川 福井 山梨 長野 岐阜 静岡 愛知 三重 滋賀 京都 大阪 兵庫 奈良 和歌山 鳥取 島根 岡山 広島 山口 徳島 香川 愛媛 高知 福岡 佐賀 長崎 熊本 大分 宮崎 鹿児島 沖縄 朝日新聞による10)) 小学 6 年生 国語 A 国語 B 算数 A 算数 B 理科 クラス学生数 分類 79 84.7 82.7 81.7 86.9 82.4 81.7 82.5 80.4 80.6 81.3 81.6 83.4 81.1 81.9 83.5 84.8 85.7 80.8 82.4 80.5 80.4 80.6 79.6 80.3 83.3 80.5 82.4 82.6 79.9 83.2 81.4 80.3 83.6 82.3 82.7 83.8 80.7 82.1 81.6 81.6 80.9 81.5 80.7 82.1 81.2 77 53.5 58.7 56.3 55.9 63 55 55.1 57.1 54.2 53.5 55.4 57.5 57.8 55.8 55.7 60.4 60.3 60.2 54.8 55.8 54.8 54.1 55 52.7 53.7 58.2 53.5 55.5 56.9 51.9 56.2 56.3 53.4 58.1 56.3 55.7 59.8 55.4 53.4 54.4 53.9 54.7 55 53.9 54.5 54.8 51.7 69.6 77.4 74.2 72.7 79.5 73.5 72.9 74.7 72.6 73.3 72.1 73.6 74.8 72.4 74.2 76.5 78.3 78.3 71.6 73.2 72 72.1 72 72.2 71.2 76.5 74.2 73.9 75.5 72.9 72.8 70.9 70.1 75.4 73.5 73.5 74.8 73.3 74.7 72.9 73.3 71.8 73.9 74.9 74.3 74 66.5 55.8 61.4 57.7 58.1 64 56 56.3 60.2 56.6 56.8 58.7 60.3 62.6 60.2 58.8 61.3 63.6 62.8 57.3 58.6 57.5 57.6 59.3 56.8 56.3 61.8 58.4 59.4 60 56.7 57.3 56.3 55.6 60.5 58 57.5 61.4 59.5 58.1 57.9 57.7 57.1 59.2 57.3 56.6 58.3 52.9 58.8 65.9 63.1 62.1 68.4 63.2 61.7 63.1 59.5 61.2 60.4 62.6 62.9 60.8 61.7 65.6 66.6 67.1 61.3 61.1 61.7 58.1 60.1 58 58.5 62.4 57.8 59.7 61.7 58 59.6 61.1 59.8 62.9 61.2 59.4 64.3 60.2 59.6 59.9 60.8 60.6 63.5 59.7 60.4 63.4 55.5 21.7 21.7 21.3 23.3 21.2 20.8 21.6 23.9 24.8 24.4 29.0 26.3 30.0 28.0 22.1 24.3 23.4 23.0 22.5 23.1 25.1 27.6 27.2 22.7 24.4 24.2 26.5 25.7 22.5 21.7 20.0 18.5 23.2 23.8 21.6 19.8 23.6 20.9 17.8 26.3 24.7 22.2 22.2 21.7 23.0 20.2 26.2 a a a b a a a b b b c c c c b b b b b b b c c b b b c b b a a a b b a a b a a c b b b a b a c ───────────────────────────────────────────────────── 10)但し、クラス学生数のデータは別のソースである。 ― 74 ― 社 会 学 部 紀 要 第118号 中学 3 年生 北海道 青森 岩手 宮城 秋田 山形 福島 茨城 栃木 群馬 埼玉 千葉 東京 神奈川 新潟 富山 石川 福井 山梨 長野 岐阜 静岡 愛知 三重 滋賀 京都 大阪 兵庫 奈良 和歌山 鳥取 島根 岡山 広島 山口 徳島 香川 愛媛 高知 福岡 佐賀 長崎 熊本 大分 宮崎 鹿児島 沖縄 国語 A 国語 B 算数 A 算数 B 理科 クラス学生数 分類 74.2 76 75.9 76.2 79.7 77.4 76.6 74.8 75.4 77.3 74.7 74.9 76.1 75 75 78.1 77 78.9 76.2 76.3 75.6 76.1 75.3 74 74.7 74.8 73.1 76 76.7 74.6 76 74.6 74.1 75.3 75.2 74.6 75.3 76.5 72.5 74.1 73.7 75.2 75 74.2 74.8 74 67.6 63.1 65.5 64.2 65.5 70.3 66.9 64.4 65.3 63.7 65.5 63.1 63.5 64 63.6 62.7 67 66.4 67.5 64.8 63.8 65.9 64 63.6 61.1 62 62.2 59.1 62.2 62.9 61.7 65.2 65.6 61.6 63.6 64.1 61.4 62.3 63.4 61.6 62.4 63 63.8 64.4 63.6 65 62.3 56.9 60.8 62.4 59.1 60.8 67.4 62.3 60.9 61.9 61.6 63.7 60.2 61.4 63.8 61.2 61.1 66.5 66.3 68.1 60.6 62.3 65.1 65.3 65 61.6 63 62.5 60.2 63.8 63.5 62.9 64 61 61.4 62.4 63.6 63.1 63.2 64.1 58.3 59.4 61.2 62.5 61.9 61.5 64.5 60.4 50.8 48.1 48.9 47.4 50.5 56.7 50.1 49.1 50.7 49.6 53 48.1 48.8 51.3 49.8 47.4 54.6 54.7 56.2 51.4 48.8 53 52.7 50.9 48 48.4 48.4 45.9 49.7 50.4 48.5 49.5 47.8 47.5 49.8 50.9 47.1 49.4 51.1 45.4 47.1 47.4 51.3 50.1 47.9 50 46.6 38.4 50.5 52.1 51.1 52.7 56.1 54.9 52.2 52.4 51.5 55.2 48.8 50.1 50.1 49.6 50.4 56.8 56.3 57.8 52.1 51 54.5 53.2 53.7 50.6 51.1 49.5 47.8 51.9 51.1 49.8 52.4 50.7 51.2 50.2 52.6 51 51.5 52 47.3 49.7 49.2 50.7 52.7 51.5 52.7 49.6 41.4 25.0 26.3 26.0 27.1 26.3 25.2 25.5 28.9 27.0 29.4 32.4 30.5 33.0 31.6 28.2 29.6 29.4 25.4 27.9 27.8 28.7 29.2 31.3 27.6 29.1 28.7 31.0 31.3 27.7 25.5 24.8 24.0 28.0 29.1 24.7 24.8 28.7 27.8 22.7 30.7 28.8 27.3 27.9 26.8 27.0 27.0 30.6 a b b b b a a b b b c c c c b b b a b b b b c b b b c c b a a a b b a a b b a c b b b b b b c March ― 75 ― 2014 25 年 北海道 青森 岩手 宮城 秋田 山形 福島 茨城 栃木 群馬 埼玉 千葉 東京 神奈川 新潟 富山 石川 福井 山梨 長野 岐阜 静岡 愛知 三重 滋賀 京都 大阪 兵庫 奈良 和歌山 鳥取 島根 岡山 広島 山口 徳島 香川 愛媛 高知 福岡 佐賀 長崎 熊本 大分 宮崎 鹿児島 沖縄 小学 6 年生 中学 3 年生 国語 A.2 国語 B.2 算数 A.2 算数 B.2 国語 A.3 国語 B.3 算数 A.3 算数 B.3 60.4 68.7 65.5 60.8 71.7 63.9 63.9 63.7 61.1 61.3 62.6 61.9 64.8 61.5 66.3 63.8 67.6 68.6 60.1 63.7 61.3 57.7 61.2 60.3 58.8 65.8 61.2 63.3 62.6 62.4 63.9 59.2 61.4 65.8 64.3 63.3 66.8 63.1 65.3 63.2 63.3 60.3 64 62.3 64.5 64.7 58.3 46.4 52.9 50.8 47.6 59.1 48.5 48.5 49.7 47.9 47.5 49.7 50.1 52.1 49.7 50.4 50.7 54.3 54.3 47.5 50.3 49.1 47.3 48.6 46.7 46.4 52.1 47.9 49.9 50.1 47.5 50.4 46.8 47.7 52.7 50.2 49 52.9 50.7 49.8 49.1 46.8 46.9 48.1 48.7 48.1 47.9 45.5 74.9 80.7 78.3 76.3 82.8 77.3 76.4 77.2 76.8 76.4 76.2 77.1 78.4 76.5 79.5 79.7 80.2 81.6 75.6 77.8 76.2 76.2 76.2 75.8 74.7 79.2 77.1 77.4 78.6 76.4 78.1 74.3 74.6 79.2 77.9 75.8 78.1 77.6 78.8 77.2 77.1 76.4 78.5 78.7 77 78.8 73.3 54 60.5 57.9 56.5 67.1 57.1 55.3 58.9 56.3 55 57.7 59.4 60.8 58.7 59.3 60.4 64.3 65.1 55.8 59.5 56 56.6 59.5 55.3 55.1 61.1 57.3 59.2 58.5 56.9 60.2 55.8 57.2 61.3 59.9 58.4 62.3 61 57.9 58.7 57.4 57.1 58.6 57.8 56.8 56.7 54.4 76 78.8 78.2 77.6 81.9 78.9 77.3 77.2 77.2 78.1 76.5 76.2 77.3 76.3 76.5 78.9 78.3 80 76.9 76.8 77.1 77.1 76.5 75 75.5 76.3 73.3 76.8 77.1 74.4 77.6 77.2 76.4 76.7 77.3 76.5 76.6 76.5 74.3 75.4 75.3 76.1 76.6 76 76.1 75.4 69.2 66.2 67.7 68.1 68.6 74.6 69.1 66.4 69.5 68 68.8 68.8 68.1 69.3 68.9 68.6 70.4 70.7 71.7 67.4 65.9 70.2 68.7 67.1 65.8 65.6 68.2 63 67 67.5 64.3 68.6 69.1 66.4 69.2 68.3 64.9 67 67.2 64.8 66.5 65.8 66.6 67.1 66.7 66.4 64.8 62.4 62.3 65 59.9 62.2 68.9 63.1 61 62.9 63.8 64.9 62.8 63.2 65.2 63.8 62.7 65.8 66.6 69.9 62.1 61.9 66.6 65 66.3 63.2 64.4 64.2 61.7 65.9 65.5 63.4 64.8 62.9 62.8 64.8 65.5 65.4 66.3 64.5 59.3 62 61.7 63.2 63.4 62 64 61.5 53.2 39.1 42.4 37.4 39.7 47.5 40.7 38.1 42.1 41.1 42.8 40.6 41.5 43.2 41.9 39.2 43.9 45 49.2 40 40.2 45.7 44.6 44.5 39.3 40.4 42.9 38.8 43.8 42.9 40.3 43 40.8 40.3 43.5 44.2 42.6 44.6 44 35.4 39.8 39.5 41.3 43 39.2 41.4 39.2 29.8 ― 76 ― 社 会 学 部 紀 要 第118号 資料 3.生活の信条について 日本 ドイツ 記号(日) 記号(独) Q5a Q5b Q5c Q5d Q5e Q5f Q5g Q5h Q5i Q5j Q4A Q4B Q4C Q4D Q4E Q4F Q4G Q4H Q4I Q4J a b c d e f g h i j A B C D E F G H I J 内容 学歴 収入 地位 社会活動 ライフワーク、趣味 人間関係 友人、知人との交流 仕事 家族 競争 世俗的成功 世俗的成功 世俗的成功 自己充実感 自己充実感 自己充実感 自己充実感 自己充実感 家庭 競争 Demographic Variables 日本 ドイツ 記号(日) 記号(独) 性別 年齢 性別 年齢 Q1 Q2 D1 q1, D2 生活の信条について、年齢階級に対する日本とドイツの質問(Q5a∼Q5j, Q4A∼Q4J)の回答のクロス分布データ >JD ∼20 30 40 50 60 70 80∼ ∼20 30 40 50 60 70 80∼ Q3a1 Q3a2 Q3a3 34 42 59 86 109 80 23 40 57 43 55 51 29 8 15 23 25 35 21 4 2 Q3c5 Q5d1 Q5d2 Q5d3 Q5d4 11 7 13 22 30 35 8 36 55 59 72 83 44 12 36 46 41 72 56 28 11 12 11 14 14 10 9 1 Q5f5 Q5g1 Q5g2 Q5g3 48 58 60 64 59 43 12 36 50 43 84 84 50 9 9 12 23 31 32 18 9 3 0 3 3 1 3 1 Q5f4 ∼20 30 40 50 60 70 80∼ 3 6 5 11 7 5 2 1 0 4 0 0 1 0 Q3a4 5 2 7 8 2 4 1 Q3a5 3 1 0 2 0 2 0 Q3b1 Q3b2 Q3b3 20 35 53 85 94 79 20 49 55 53 71 66 34 12 20 29 23 24 18 5 2 Q5d5 Q5e1 Q5e2 Q5e3 47 67 59 80 75 44 11 37 47 56 74 78 49 13 12 6 10 26 23 16 6 Q5g5 Q5h1 Q5h2 Q5h3 39 41 49 71 77 49 13 38 52 58 78 77 44 7 16 25 21 29 19 18 10 2 5 7 2 1 1 0 Q5g4 3 2 3 6 6 5 1 1 1 4 0 1 1 0 Q3b4 5 4 5 4 4 2 0 Q3b5 3 2 0 2 1 0 0 Q5e4 0 4 5 3 5 6 2 Q3c1 Q3c2 Q3c3 Q3c4 16 14 23 32 42 36 11 31 53 43 58 62 37 10 36 50 52 70 66 36 9 11 8 11 21 12 7 3 Q5e5 Q5f1 Q5f2 Q5f3 39 39 52 59 73 47 11 38 56 52 80 74 48 11 16 23 20 33 28 15 7 Q5h5 Q5i1 Q5i2 59 87 86 116 113 71 20 19 22 39 59 57 39 7 1 0 4 1 1 2 0 Q5h4 2 6 2 5 5 5 1 2 0 3 2 1 0 0 March ― 77 ― 2014 Q5i3 ∼20 30 40 50 60 70 80∼ 14 14 7 8 12 4 3 Q5i4 3 1 0 1 0 1 1 Q5i5 2 0 1 0 0 1 0 Q5j1 8 5 4 4 5 7 1 Q5j2 Q5j3 Q5j4 Q5j5 20 22 30 24 28 14 5 37 47 41 70 89 44 13 17 33 34 59 45 34 10 15 17 25 27 15 18 2 >DD Q2A1 Q2A2 Q2A3 Q2A4 Q2B1 Q2B2 Q2B3 Q2B4 Q2B5 Q2C1 Q2C2 Q2C3 Q2C4 Q2C5 ∼20 30 40 50 60 70 80∼ 6 25 41 57 45 54 49 2 24 20 42 45 31 27 0 3 2 3 5 3 2 0 1 2 2 0 2 0 3 12 23 35 36 43 39 4 32 36 48 44 38 30 1 7 5 16 10 9 7 0 1 1 4 4 0 1 0 1 0 1 1 0 0 2 8 20 22 19 20 16 4 31 19 51 52 43 28 Q4D1 Q4D2 Q4D3 Q4D4 Q4D5 Q4E1 Q4E2 Q4E3 Q4E4 Q4E5 Q4F1 ∼20 30 40 50 60 70 80∼ 10 10 18 8 12 14 2 19 22 34 37 32 34 4 18 13 28 18 27 16 7 13 13 20 26 18 11 4 1 7 4 6 1 3 3 16 25 27 17 17 16 1 37 29 52 55 51 46 7 3 8 19 13 12 10 3 5 3 5 8 8 3 8 0 0 1 2 2 3 1 22 20 19 18 20 19 7 Q4F5 Q4G1 Q4G2 Q4G3 Q4G4 Q4G5 Q4H1 Q4H2 Q4H3 Q4H4 Q4H5 ∼20 30 40 50 60 70 80∼ 0 1 1 3 0 1 2 Q4I4 ∼20 30 40 50 60 70 80∼ > 1 1 0 2 1 0 0 36 40 50 47 43 43 12 20 23 47 42 43 32 5 Q4J1 Q4J2 Q4J3 Q4J4 Q4J5 5 8 10 9 8 5 0 28 22 31 29 26 13 1 14 16 32 24 25 20 4 11 14 22 26 20 28 8 3 5 9 7 11 12 6 3 1 4 4 2 2 3 2 1 3 2 2 0 0 0 0 0 0 0 1 0 25 33 37 39 32 25 5 29 29 60 44 47 42 11 7 3 3 8 7 5 4 0 0 4 3 3 5 0 0 0 0 1 1 1 0 2 10 16 19 17 19 23 0 4 8 10 6 8 8 0 0 1 2 1 0 2 Q4F2 Q4F3 Q4F4 26 32 54 45 34 37 2 7 4 18 17 27 18 6 6 8 12 12 9 3 3 Q4I1 Q4I2 Q4I3 40 49 68 65 64 56 15 19 14 31 22 23 20 4 1 1 5 6 2 2 1 ― 78 ― 社 会 学 部 紀 要 第118号 Exploratory Multivariate Statistical Data Analysis ──Multiple Factor Analysis── ABSTRACT Multiple factor analysis deals with a multiple table, composed of quantitative or categorical variables balancing the influence of the different sets on the first principal axes. Recently MFA function has been extended to the contingency tables. I explain this analysis using R and package FactoMineR, and demonstrate some Japanese applications. Key Words: Multiple factor analysis, R, FactoMineR
© Copyright 2025 Paperzz