සාධක විශ්ලේෂණය සහ ප්‍රධාන සංරචක විශ්ලේෂණය අතර ඇති වෙනස්කම් මොනවාද?


220

මා භාවිතා කරන සංඛ්‍යානමය පැකේජ ගණනාවක් මෙම සංකල්ප දෙක එකට ඔතා ඇති බව පෙනේ. කෙසේ වෙතත්, මම කල්පනා කරන්නේ එකිනෙකට වෙනස් උපකල්පන හෝ දත්ත 'විධිමත්භාවයන්' තිබේද යන්නයි. සැබෑ උදාහරණයක් ඇදහිය නොහැකි තරම් ප්‍රයෝජනවත් වනු ඇත.


2
බොහෝ විශ්ව විද්‍යාල පුස්තකාලවල ඇති පහත සඳහන් පොතේ ප්‍රධාන සංරචක විශ්ලේෂණය සහ සාධක විශ්ලේෂණ පරිච්ඡේදයන් ඔබේ ප්‍රශ්නය හරියටම අමතන්න
user31256

3
ඔබ පහත පිළිතුරු අමතරව හැකි ද කියවීමට මෙම සහ මෙම මගේ.
ttnphns

2
"මම PCA හෝ FA භාවිතා කළ යුතුද" වැනි තවත් හොඳ ප්‍රශ්නයක්: stats.stackexchange.com/q/123063/3277 .
ttnphns

3
nttnphns: මෙම ත්‍රෙඩ් එකේ පිළිතුරක් නිකුත් කිරීමට මම ඔබව උනන්දු කරවන්නෙමි, සමහර විට ඔබේ පිළිතුරු වෙනත් වි‍ශේෂිත ලැයිස්තුවකින් සමන්විත වේ. මෙය ඉහත ඔබගේ අදහස් ප්‍රතිස්ථාපනය කළ හැකිය (දැනට සබැඳි සමඟ අදහස් හතරක්), එය වඩාත් ප්‍රායෝගික වනු ඇත, විශේෂයෙන් ඔබ එක් එක් සබැඳිය කෙටියෙන් විවරණය කළහොත්. උදා: මෙම ගැටළුව පැහැදිලි කිරීම සඳහා මෙහි බලන්න, එම ගැටලුව පිළිබඳ පැහැදිලි කිරීමක් සඳහා එහි බලන්න. එය යෝජනාවක් පමණි, නමුත් මෙම ත්‍රෙඩ් එකෙන් එයින් බොහෝ ප්‍රයෝජන ලැබෙනු ඇතැයි මම විශ්වාස කරමි! එක් විශේෂ වාසියක් නම්, ඔබට සෑම විටම එම පිළිතුරට තවත් සබැඳි එක් කළ හැකිය.
amoeba

2
MathOverflow හි ද එවැනිම ප්‍රශ්නයක් අසන ලද අතර, මා විසින් විශිෂ්ට පිළිතුරක් ලෙස සලකන දේ ලැබුණි: mathoverflow.net/questions/40191/…
ඩැනියෙල් මොස්කොවිච්

Answers:


158

ප්‍රධාන සංරචක විශ්ලේෂණයට නිරීක්ෂණය කරන ලද විචල්‍යයන්ගේ රේඛීය සංයුක්ත නිස්සාරණය කිරීම ඇතුළත් වේ.

සාධක විශ්ලේෂණය පදනම් වී ඇත්තේ න්‍යායාත්මක ගුප්ත සාධක වලින් නිරීක්ෂණය කළ විචල්‍යයන් පුරෝකථනය කරන විධිමත් ආකෘතියක් මත ය.

මනෝ විද්‍යාවේදී මෙම ක්‍රම දෙක බොහෝ විට බහු පරිමාණ පරීක්ෂණ වලදී කුමන පරිමාණයන් මත පැටවිය යුතුද යන්න තීරණය කරනු ලැබේ. ඒවා සාමාන්‍යයෙන් සමාන වැදගත් නිගමනවලට එළඹේ (සාකච්ඡාවක් සඳහා කොම්රි (1988) පෞරුෂත්වය සහ සායනික මනෝ විද්‍යාව පිළිබඳ පරිමාණ සංවර්ධනයේ සාධක විශ්ලේෂණ ක්‍රම බලන්න). සමහර සංඛ්‍යාලේඛන පැකේජ ඒවා එකට එකතු වන්නේ ඇයිද යන්න පැහැදිලි කිරීමට මෙය උපකාරී වේ. "ප්‍රධාන සංරචක විශ්ලේෂණය" වැරදි ලෙස "සාධක විශ්ලේෂණය" ලෙස ලේබල් කර ඇති අවස්ථා ද මම දැක ඇත්තෙමි.

එය අනුව අතේ මාපට ඇඟිල්ල සරල පාලනය , මම යෝජනා ඔබ කැමතියි:

  1. නිරීක්ෂණය කරන ලද විචල්‍යයන්ට හේතු වන ගුප්ත සාධකවල න්‍යායාත්මක ආකෘතියක් ඔබ උපකල්පනය කරන්නේ නම් හෝ පරීක්ෂා කිරීමට අවශ්‍ය නම් සාධක විශ්ලේෂණය ක්‍රියාත්මක කරන්න.

  2. ප්‍රධාන සංරචක විශ්ලේෂණය ක්‍රියාත්මක කරන්න ඔබේ සහසම්බන්ධිත නිරීක්ෂණය කරන ලද විචල්‍යයන් වැදගත් ස්වාධීන සංයුක්ත විචල්‍යයන් කුඩා කට්ටලයක් දක්වා අඩු කිරීමට ඔබට අවශ්‍ය නම්.


5
එහි මාපට ඇඟිල්ල පාලනය කිරීම බෙහෙවින් ප්‍රයෝජනවත් වේ. එයට ස්තුතියි.
බ්‍රැන්ඩන් බර්ටෙල්සන්

1
මාපට ඇඟිල්ලේ රීතිය සම්බන්ධයෙන් (1): ගවේෂණාත්මක මුහුණුවරකට වඩා ස්ථිර සාධක සාධක විශ්ලේෂණයක් සහිත ගුප්ත සාධක පිළිබඳ න්‍යායාත්මක ආකෘතියක් මා පරීක්ෂා නොකරන්නේද?
රෝම

1
ඔව්මන්. සටන් විරාම ගිවිසුම මඟින් ඔබට EFA වලට වඩා ආකෘතිය පාලනය කළ හැකිය. උදා: ඔබට පැටවීම් බිංදුවට සීමා කළ හැකිය; සමාන පැටවීම්; සහසම්බන්ධිත අවශේෂ ඇත; ඉහළ පෙළේ සාධක එකතු කරන්න; ආදිය
ජෙරමි ඇන්ග්ලිම්

3
Er ජෙරොමි ඇන්ග්ලිම් පීසීඒ “වැදගත් ස්වාධීන සංයුක්ත විචල්‍යයන් කුඩා කට්ටලයක්” කරයි යැයි පැවසීම ඇත්තෙන්ම නිවැරදිද? නැතහොත් ඔබ සැබවින්ම "වැදගත් නොගැලපෙන සංයුක්ත විචල්‍යයන්ගේ කුඩා කට්ටලයක්" යැයි පැවසිය යුතුද? PCA හි භාවිතා වන යටින් පවතින දත්ත සාමාන්‍යයෙන් (බහුකාර්ය) බෙදා හරිනු නොලැබේ නම්, අඩු කළ මානයන්හි දත්ත එකිනෙකට සම්බන්ධ නොවන්නේද?
FXQuantTrader

1
නීතියේ 2 වන මාපටැඟිල්ල ලබා ගැනීම පහසුය, නමුත් පළමුවැන්න අදාළ කරගන්නේ කෙසේද? සමහර විට අමුතු බවක් පෙනේ, නමුත් නිරීක්ෂණය කළ විචල්‍යයන්ට එරෙහිව සාධක ආකෘතියක් ක්‍රියාත්මක කිරීමට මට අවශ්‍ය බව මම දන්නේ කවදාද?
බෙන්

48

මගේ ප්‍රතිචාරයෙන්:

පීසීඒ පසු භ්‍රමණයකින් (වරිමැක්ස් වැනි) තවමත් පීසීඒ ද?

ප්‍රධාන සංරචක විශ්ලේෂණය (පීසීඒ) සහ පොදු සාධක විශ්ලේෂණය (සීඑෆ්ඒ) එකිනෙකට වෙනස් ක්‍රම වේ. බොහෝ විට, ඔවුන් සමාන ප්‍රති results ල ලබා දෙන අතර, පීපීඒ එස්පීඑස්එස් සාධක විශ්ලේෂණ චර්යාවන්හි පෙරනිමි නිස්සාරණ ක්‍රමය ලෙස භාවිතා කරයි. මෙය නිසැකවම දෙදෙනා අතර වෙනස පිළිබඳව බොහෝ ව්‍යාකූලත්වයට හේතු වේ.

අවසාන කරුණ නම් මේවා සංකල්පමය වශයෙන් වෙනස් මාදිලි දෙකකි. PCA හි, සංරචක යනු සම්පූර්ණ විචල්‍යතාව උපරිම කරන සත්‍ය විකලාංග රේඛීය සංයෝජනයකි. FA හි, සාධක යනු විචල්‍යතාවයේ හවුල් කොටස උපරිම කරන රේඛීය සංයෝජනයන් ය - යටින් පවතින “ගුප්ත ව්‍යුහයන්” ය. FA බොහෝ විට "පොදු සාධක විශ්ලේෂණය" ලෙස හඳුන්වන්නේ එබැවිනි. FAA විවිධාකාර ප්‍රශස්තිකරණ ක්‍රියාකාරකම් භාවිතා කරන අතර එහි ප්‍රති result ලය PCA මෙන් නොව, භාවිතා කරන ප්‍රශස්තිකරණ ක්‍රියාවලිය සහ එම ක්‍රියාකාරකම් සඳහා ආරම්භක ස්ථාන මත රඳා පවතී. සරලවම එක අද්විතීය විසඳුමක් නොමැත.

R හි, ෆැක්ටනල් () ශ්‍රිතය මඟින් CFA හට උපරිම සම්භාවිතා නිස්සාරණයක් ලබා දේ. එබැවින්, එය PCA නිස්සාරණය මත පදනම් වූ SPSS ප්‍රති result ලයක් ප්‍රතිනිෂ්පාදනය කරනු ඇතැයි ඔබ අපේක්ෂා නොකළ යුතුය. එය හුදෙක් එකම ආකෘතියක් හෝ තර්කනයක් නොවේ. ඔබ එකම ඇල්ගොරිතම භාවිතා නොකරනු ඇති බැවින් ඔබ එස්පීඑස්එස් හි උපරිම ලයික්ලිහුඩ් නිස්සාරණය භාවිතා කළහොත් ඔබට එකම ප්‍රති result ලය ලැබේදැයි මට විශ්වාස නැත.

R හි වඩා හොඳ හෝ නරක සඳහා, කෙසේ වෙතත්, SPSS එහි පෙරනිමිය ලෙස සපයන මිශ්‍ර “සාධක විශ්ලේෂණය” ප්‍රතිනිෂ්පාදනය කළ හැකිය. ආර් හි ක්‍රියාවලිය මෙන්න, මෙම කේතය සමඟ, මට මෙම දත්ත කට්ටලය භාවිතා කරමින් එස්පීඑස්එස් ප්‍රධාන සංරචක “සාධක විශ්ලේෂණය” ප්‍රති result ලය ප්‍රතිනිෂ්පාදනය කළ හැකිය. (අවිනිශ්චිත වන ලකුණ හැර). එම ප්‍රති result ලය R හි ඇති ඕනෑම භ්‍රමණ ක්‍රමයක් භාවිතා කර භ්‍රමණය කළ හැකිය.

data(attitude)
# Compute eigenvalues and eigenvectors of the correlation matrix.
pfa.eigen <- eigen(cor(attitude))
# Print and note that eigenvalues are those produced by SPSS.
# Also note that SPSS will extract 2 components as eigenvalues > 1 = 2.
pfa.eigen$values
# Set a value for the number of factors (for clarity)
kFactors <- 2
# Extract and transform two components.
pfa.eigen$vectors[, seq_len(kFactors)]  %*% 
  diag(sqrt(pfa.eigen$values[seq_len(kFactors)]), kFactors, kFactors)

5
පැකේජයෙන් ඔබට එකම ප්‍රති results principal(attitude, 2, rotate="none")ල ලැබෙනු ඇති psychබවත්, කේසර්ගේ රීතිය (ev> 1) මානයන් පරීක්ෂා කිරීම සඳහා වඩාත්ම නිර්දේශිත ක්‍රමය නොවන බවත් (එය සාධක ගණන අධිතක්සේරු කරයි).
chl

5
ඔව්, මම දන්නවා මානසික විදුහල්පතිතුමා මෙය වසා දමයි. මගේ අරමුණ වූයේ ප්‍රධාන සංරචක නිස්සාරණ ක්‍රමය භාවිතා කිරීමේදී SPSS “සාධක විශ්ලේෂණය” කරන්නේ කුමක්ද යන්න පෙන්වීමයි. Iigenvalue රීතිය සාධක ගණන තෝරා ගැනීමට දුර්වල ක්‍රමයක් බව මම එකඟ වෙමි. නමුත්, එස්පීඑස්එස් පෙරනිමියෙන් කරන්නේ එයයි. මා නිරූපණය කළේ මෙයයි.
බ්‍රෙට්

1
factanal()EFA සපයන්නේ සටන් විරාම ගිවිසුම නොවේ. එසේම, මගේ අත්දැකීම් අනුව, එස්පීඑස්එස් හි උපරිම ලයික්ලිහුඩ් නිස්සාරණය factanal()කිසිදු භ්‍රමණයක් නොමැති බවට ලබා දී ඇති ප්‍රති result ලයම ලබා දිය යුතුය .
pe-perry

2
පහත දැක්වෙන අර්ථය කුමක්ද: 'FA හි, සාධක යනු විචල්‍යතාවයේ හවුල් කොටස උපරිම කරන රේඛීය සංයෝජනයන් ය - යටින් පවතින "ගුප්ත ඉදිකිරීම්" ය. '?
අනුමාන

1
පොදු FA වෙනුවට CFA ස්ථීර FA සඳහා ( පැහැදිලි කිරීමේ FA ට වඩා වෙනස් ) පෙනී සිටිය හැකි බව සලකන්න .
රිචඩ් හාඩි

33

FA හි ඔබ සාමාන්‍යයෙන් (අද්විතීයභාවය සහ ජාතිවාදය) යන දෙකම සමඟ කටයුතු කළද, ඔබේ පළමු කරුණ ගැන ඔබ නිවැරදිය. පීසීඒ සහ එෆ්ඒ අතර තේරීම මනෝමිතිකයන් අතර දීර්-කාලීන විවාදයකි. මම ඔබේ කරුණු එතරම් අනුගමනය කරන්නේ නැහැ. ගුප්ත සාධක තැනීම සඳහා කුමන ක්‍රමයක් භාවිතා කළත් ප්‍රධාන අක්ෂවල භ්‍රමණය යෙදිය හැකිය. ඇත්ත වශයෙන්ම, බොහෝ විට මෙය ප්‍රායෝගික හේතූන් මත භාවිතා කරන VARIMAX භ්‍රමණය (විකලාංග භ්‍රමණය, සහසම්බන්ධ නොවන සාධක සලකා බැලීම) වේ, පහසුම භ්‍රමණය වුවද (උදා: PROMAX) ) යථාර්ථය වඩා හොඳින් පිළිබිඹු කළ හැකිය (ගුප්ත ඉදිකිරීම් බොහෝ විට එකිනෙකට සම්බන්ධ වේ), අවම වශයෙන් FA සම්ප්‍රදායට අනුව, ඔබේ විචල්‍යයන් අතර නිරීක්ෂණය කරන ලද අන්තර් සහසම්බන්ධතාවයේ හදවතෙහි සැඟවුණු ඉදිකිරීමක් ඇතැයි ඔබ උපකල්පනය කරයි. කාරණය වන්නේ "දත්ත විශ්ලේෂණ" සම්ප්‍රදායේ මුල් විචල්‍යයන්ගේ රේඛීය සංයෝජනයන්හි අර්ථ නිරූපණය PCA හා VARIMAX භ්‍රමණය තරමක් දුරට විකෘති කිරීමයි (මයිකල් ටෙනෙන්හවුස්ගේ කාර්යය බලන්න). මනෝමිතික දෘෂ්ටි කෝණයකින්, FA ආකෘති වඩාත් සුදුසු වන්නේ මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්‍යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්‍රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්‍යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්‍රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). කාරණය වන්නේ "දත්ත විශ්ලේෂණ" සම්ප්‍රදායේ මුල් විචල්‍යයන්ගේ රේඛීය සංයෝජනයන්හි අර්ථ නිරූපණය PCA හා VARIMAX භ්‍රමණය තරමක් දුරට විකෘති කිරීමයි (මයිකල් ටෙනෙන්හවුස්ගේ කාර්යය බලන්න). මනෝමිතික දෘෂ්ටි කෝණයකින්, FA ආකෘති වඩාත් සුදුසු වන්නේ මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්‍යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්‍රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්‍යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්‍රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). කාරණය වන්නේ "දත්ත විශ්ලේෂණ" සම්ප්‍රදායේ මුල් විචල්‍යයන්ගේ රේඛීය සංයෝජනයන්හි අර්ථ නිරූපණය PCA හා VARIMAX භ්‍රමණය තරමක් දුරට විකෘති කිරීමයි (මයිකල් ටෙනෙන්හවුස්ගේ කාර්යය බලන්න). මනෝමිතික දෘෂ්ටි කෝණයකින්, FA ආකෘති වඩාත් සුදුසු වන්නේ මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්‍යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්‍රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්‍යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්‍රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). FA ආකෘති වඩාත් සුදුසු වන්නේ ඒවා මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්‍යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්‍රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්‍යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්‍රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). FA ආකෘති වඩාත් සුදුසු වන්නේ ඒවා මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්‍යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්‍රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්‍යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්‍රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව).

මෙම මාතෘකාව පිළිබඳ පහත සඳහන් සාකච්ඡා පළමුව කියවීමට මම ඔබට නිර්දේශ කරමි:


7
හුදෙක් මෙම ප්රශ්නය තවත් එක්, සමග ඒකාබද්ධ වී ඇති බැවින් මගේ පිළිතුර ඇත්තටම ලකුණු-මාතෘකාව ටිකක් බැලීමට හැකි බව කියන්න stats.stackexchange.com/questions/3369/... (මම මුලින් අග පිළිතුරු).
chl

6
අහ්, මම කල්පනා කරමින් සිටියේ ඇයි ඔබ මෙම ප්‍රශ්නයට සම්බන්ධ වූයේ, මෙම ප්‍රශ්නයේදී ... :)
බ්‍රැන්ඩන් බර්ටෙල්සන්

1
PCA followed by VARIMAX rotation somewhat distorts the interpretation of the linear combinations of the original variables in the "data analysis" tradition. Chl, ඔබට එය පැහැදිලි කළ හැකිද? එය හොඳය.
ttnphns

32

වෙබයේ යෝජිත නිර්වචන ගණනාවක් තිබේ. සංඛ්‍යාන ඉගෙනීම පිළිබඳ මාර්ගස්ථ පාරිභාෂික ශබ්ද මාලාවකින් එකක් මෙන්න :

ප්‍රධාන සංරචක විශ්ලේෂණය

දත්ත කට්ටලයක ප්‍රධාන අංග වන නව අංගයන් තැනීම. ප්‍රධාන සංරචක වන්නේ ආදාන අංගයන්ගේ රේඛීය සංයෝජනයන්ගෙන් සාදන ලද උපරිම විචල්‍යතාවයේ අහඹු විචල්‍යයන් ය. ඒ හා සමානව, ඒවා ප්‍රධාන සංරචක අක්ෂයන් වෙත ප්‍රක්ෂේපණය වන අතර ඒවා දත්ත කාණ්ඩයේ එක් එක් ලක්ෂ්‍යයට සාමාන්‍ය වර්ග දුර අවම කරන රේඛා වේ. අද්විතීය බව සහතික කිරීම සඳහා, ප්‍රධාන සංරචක අක්ෂ සියල්ලම විකලාංග විය යුතුය. PCA යනු ආදාන සහ ප්‍රතිදානයන් දෙකෙහිම ගෝස්සියානු ශබ්දය ඉදිරියේ රේඛීය ප්‍රතිවර්තනය සඳහා උපරිම සම්භාවිතා තාක්‍ෂණයකි. සමහර අවස්ථාවලදී, PCA JPEG රූප සම්පීඩනයේදී භාවිතා කරන DCT වැනි ෆූරියර් පරිවර්තනයකට අනුරූප වේ. "පිළිගැනීම සඳහා අයිජන්ෆේස්" (ටර්ක් සහ පෙන්ට්ලන්ඩ්, ජේ සංජානන ස්නායු විද්‍යාව 3 (1), 1991), බිෂොප්, "බලන්න.

සාධක විශ්ලේෂණය

PCA සාමාන්‍යකරණය කිරීම පැහැදිලිවම උපරිම සම්භාවිතාව මත පදනම් වේ. පීසීඒ මෙන්, සෑම දත්ත ලක්ෂ්‍යයක්ම උප අවකාශයක ලක්ෂ්‍යයක් සාම්පල ලබා ගැනීමෙන් පසුව පූර්ණ-මාන ගෝස්සියානු .ෝෂාවකින් එය අවුස්සනු ඇතැයි උපකල්පනය කෙරේ. වෙනස වන්නේ සාධක විශ්ලේෂණය මඟින් ශබ්දය අත්තනෝමතික විකර්ණ සහසංයුජ අනුකෘතියක් ලබා ගැනීමට ඉඩ දෙන අතර PCA උපකල්පනය කරන්නේ ශබ්දය ගෝලාකාර බවය. උප අවකාශය තක්සේරු කිරීමට අමතරව, සාධක විශ්ලේෂණය මඟින් ශබ්ද කෝවරියන්ස් අනුකෘතිය තක්සේරු කරයි. "සාධක විශ්ලේෂකවල මිශ්‍රණ සඳහා ඊඑම් ඇල්ගොරිතම" බලන්න .පීසීඒ සඳහා මානයන් තෝරා ගැනීම ".


2
සාධක විශ්ලේෂණ විස්තරය ප්‍රධාන කරුණ (විකර්ණ සහසංයුජතාව) ලබා ගනී, නමුත් PC තිහාසිකව PCA හි සාමාන්‍යකරණය ලෙස සංවර්ධනය නොවීය.
අනුමාන

1
ඉතින් මූලික වශයෙන්, PCA one svd හි සහසංයුජ අනුකෘතිය සහ FA හි සහසම්බන්ධතා අනුකෘතිය? ක්‍රම භාවිතයෙන් පසු සත්‍ය ගණිතය සොයා ගැනීම මට සැමවිටම අපහසුය. ඒවා යෙදෙන ක්ෂේත්‍රයෙන් බොහෝ පාරිභාෂිතය ගොඩනඟා ඇත. (මාතෘකාවෙන් බැහැරව: 70 දශකයේ එක් (1) පත්‍රයක් සොයා ගන්නා තෙක් මාවත ආකෘති නිර්මාණය යනු කුමක්දැයි වටහා ගැනීමට මට දහවල් කාලය ගත විය.
Loo ඩර් මාර්ක් වෑන්

30

මෙම ත්‍රෙඩ් එකේ ඉහළම පිළිතුරෙන් ඇඟවෙන්නේ පීසීඒ යනු මානයන් අඩු කිරීමේ තාක්‍ෂණයකි, එෆ්ඒ යනු ගුප්ත විචල්‍ය තාක්‍ෂණයකි. මෙය සංවේදී දැඩි ය . නමුත් මෙහි බොහෝ පිළිතුරු සහ වෙනත් තැන්වල බොහෝ ප්‍රතිකාර ක්‍රම PCA සහ FA සම්පූර්ණයෙන්ම වෙනස් ක්‍රම දෙකක් ලෙස ඉදිරිපත් කරයි. ප්‍රතිවිරුද්ධ අරමුණු, ක්‍රම සහ ප්‍රති come ල එකිනෙකට වෙනස් වේ. මම එකඟවෙන්නේ නැහැ; පීසීඒ ගුප්ත විචල්‍ය තාක්‍ෂණයක් ලෙස සලකන විට එය එෆ්ඒ වෙත බෙහෙවින් සමීප වන අතර ඒවා ඉතා සමාන ක්‍රමවේදයන් ලෙස දැකිය යුතුය.

පහත දැක්වෙන ත්‍රෙඩ් එකේ PCA සහ FA අතර ඇති සමානකම් හා වෙනස්කම් පිළිබඳව මම මගේම විස්තරයක් ඉදිරිපත් කළෙමි: EFA වෙනුවට PCA භාවිතා කිරීමට හොඳ හේතුවක් තිබේද? එසේම, PCA සාධක විශ්ලේෂණය සඳහා ආදේශකයක් විය හැකිද? එහිදී මම තර්ක කරන්නේ සරල ගණිතමය හේතූන් මත PCA සහ FA වල ප්‍රති come ල බෙහෙවින් සමාන වනු ඇතැයි අපේක්ෂා කළ හැකි අතර, විචල්‍යයන් ගණන ඉතා කුඩා නොවන නිසා (සමහර විට දුසිමකට වඩා වැඩි). ගණිතමය විස්තර සහ මොන්ටේ කාලෝ අනුකරණයන් සඳහා සම්බන්ධිත නූලෙහි මගේ [දිගු!] පිළිතුර බලන්න. මගේ තර්කයේ වඩාත් සංක්ෂිප්ත අනුවාදයක් සඳහා මෙහි බලන්න: පීසීඒ සහ එෆ්ඒ සමාන ප්‍රති results ල ලබා දෙන්නේ කුමන කොන්දේසි යටතේ ද?

මෙන්න මම එය උදාහරණයක් ලෙස පෙන්වීමට කැමතියි. මම UCI යන්ත්‍ර ඉගෙනුම් ගබඩාවෙන් වයින් දත්ත කට්ටලය විශ්ලේෂණය කරමි . එය p = විස්තර කර ඇති විවිධ මිදි තුනකින් වයින් සහිත තරමක් ප්‍රසිද්ධ දත්ත කට්ටලයකිn=178පි=13

වයින් දත්ත කට්ටලයේ සහසම්බන්ධ අනුකෘතිය

n=178

වයින් දත්ත කට්ටලයේ PCA සහ FA විශ්ලේෂණය

පි=131331

PCA සහ FA අතර කිසිදු වෙනසක් නැති බව සලකන්න! මෙහි සහ එහි කුඩා අපගමනයන් ඇත, නමුත් සාමාන්‍ය පින්තූරය බොහෝ දුරට සමාන වන අතර, සියලු පැටවීම් ඉතා සමාන වන අතර එකම දිශාවලට යොමු වේ. මෙය න්‍යායෙන් අපේක්ෂා කළ දෙයම වන අතර එය පුදුමයක් නොවේ. කෙසේ වෙතත්, එය නිරීක්ෂණය කිරීම උපදේශාත්මක ය.

පීඑස්. එකම දත්ත කට්ටලයේ වඩා ලස්සන PCA ද්වීපදයක් සඳහා, answervqv විසින් මෙම පිළිතුර බලන්න .

පීපීඑස්. PCA ගණනය කිරීම් සම්මත වන අතර, FA ගණනය කිරීම් සඳහා අදහස් දැක්වීමක් අවශ්‍ය විය හැකිය. සාධක පැටවීම ගණනය කරනු ලැබුවේ අභිසාරී වන තෙක් (පුනරාවර්තන 9) “පුනරාවර්තන ප්‍රධාන සාධක” ඇල්ගොරිතමයක් මගිනි. පැටවීම් අභිසාරී වූ පසු, ලකුණු ගණනය කරනු ලැබුවේ බාට්ලට්ගේ ක්‍රමයෙනි. මෙය ප්‍රමිතිගත ලකුණු ලබා දෙයි; අදාළ සාධක විචල්‍යයන් (පැටවීමේ දිග අනුව) මම ඒවා පරිමාණය කළෙමි.


1
PCA සහ සාධක විශ්ලේෂණ බිම් නිර්මාණය කිරීමට ඔබ භාවිතා කළ මෘදුකාංගය කුමක්ද?
rnso

1
මම මැට්ලබ් පාවිච්චි කළා. කේතය මගේ පිළිතුරට ඇලවීම ගැන මම සිතුවෙමි (සාමාන්‍යයෙන් මගේ පුරුද්ද මෙන්), නමුත් මෙම කාර්යබහුල ත්‍රෙඩ් එක තවත් අවුල් කිරීමට අවශ්‍ය නොවීය. නමුත් ඒ ගැන සිතා බලන්න, මම එය කිසියම් බාහිර වෙබ් අඩවියක පළ කර සබැඳියක් මෙහි තැබිය යුතුය. මම ඒක කරන්නම්.
amoeba

2
PCA සහ FA සමහර විට හා කිසිසේත්ම සමාන ප්‍රති results ල (පැටවීම්) ලබා නොදෙන බව සත්‍යයකි, එබැවින් සාධක විශ්ලේෂණය පුළුල් ලෙස අර්ථ දක්වා ඇති විට PCA FA හි නිශ්චිත අවස්ථාවක් ලෙස දැකිය හැකිය . තවමත් FA (sensu stricto) සහ PCA න්‍යායාත්මකව බෙහෙවින් වෙනස් ය.
ttnphns

2
(cont.) සාධක යනු අද්භූත ගුප්ත ගති ලක්ෂණ ය; pr. සංරචක යනු අනිත්‍ය ව්‍යුත්පන්නයන් ය. ඔබේ පැටවුම් බිම් දෙක ප්‍රායෝගිකව සමාන බවක් පෙනෙන්නට තිබුණද, න්‍යායාත්මකව ඒවා මූලික වශයෙන් වෙනස් වේ. වම්පස ඇති සංරචක තලය නිපදවා ඇත්තේ විචල්යයන්ගේ උප අවකාශයක් ලෙසිනි. සාධක තලය විචල්‍යයන්ගේ අවකාශයට වඩා වෙනස් අවකාශයක් ලෙස නිපදවන ලද අතර එමඟින් ඔවුන් නිවැරදි බිම් කොටසෙහි "පිටසක්වල" අවකාශයක් මත ප්‍රක්ෂේපණය කරයි.
ttnphns

3
(cont.) නමුත් නිවැරදි පින්තූරය (FA) සත්‍ය බයිප්ලොට් එකක් නොවේ , එය එකිනෙකට වෙනස් විසිරුම් ස්ථාන දෙකක, විවිධ අවකාශයන්ගේ ආවරණයක් වේ: පැටවීමේ කුමන්ත්‍රණය (අක්ෂයන් සත්‍ය සාධක වන තැන) සහ වස්තු ලකුණු කුමන්ත්‍රණය (අක්ෂ ඇති තැන) ඇස්තමේන්තුගත සාධක ලකුණු ලෙස). සත්‍ය සාධක අවකාශය "මාපිය" විචල්‍ය අවකාශය අභිබවා යන නමුත් සාධක ලකුණු අවකාශය එහි උප අවකාශය වේ. ඔබ විෂමජාතීය යුගල යුගල දෙකක් අධිප්‍රමාණය කර ඇත, නමුත් ඒවා එකම ලේබල් (යුගල දෙකෙහිම “සාධකය 1” සහ “සාධකය 2”) දරයි. එම තත්වය දැඩි ලෙස නොමඟ යවන අතර එය වම් එක මෙන් හොඳ විශ්වාසදායක ද්විභාෂාවක් යැයි සිතීමට අපව පොළඹවයි .
ttnphns

26

තාර්කික පියවරයන් තුළ විසිරුම් බිම් ආධාරයෙන් PCA එදිරිව සාධක විශ්ලේෂණය පිළිබඳ මූලික, නමුත් එක්තරා ආකාරයක වේදනාකාරී පැහැදිලි කිරීමක් . .

විචල්ය සාරාංශකරණය ලෙස PCA (විශේෂාංග නිස්සාරණය)

ඔබට දැනටමත් PCA පිළිබඳ අවබෝධයක් ඇතැයි සිතමි. දැන් පුනර්ජීවනය කිරීමට.

රූප විස්තරය මෙහි ඇතුළත් කරන්න

වී1වී2

පී1=11වී1+12වී2

පී2=21වී1+22වී2

එම සංගුණක භ්‍රමණය වන කොසයින් (= දිශා කොසයින්, ප්‍රධාන දිශාවන්) වන අතර ඒවා ඊජෙන්වෙක්ටර් ලෙස හැඳින්වේ. සහසංයුජ අනුකෘතියේ සමාන අගයන් ප්‍රධාන සංරචක විචල්‍යයන් වේ. PCA හි, අපි සාමාන්‍යයෙන් දුර්වල අන්තිම සංරචක ඉවතලන්නෙමු: මේ අනුව අපි මුලින් උපුටා ගත් සංරචක කිහිපයකින් දත්ත සාරාංශගත කරමු.

Covariances
        V1       V2 
V1  1.07652   .73915 
V2   .73915   .95534 

----PCA---- 
Eigenvalues      % 
P1  1.75756   86.500 
P2   .27430   13.500 

Eigenvectors
        P1       P2
V1   .73543  -.67761 
V2   .67761   .73543

අපගේ සැලසුම් කළ දත්ත සමඟ, P1 = .73543*V1 + .67761*V2අපි ඉවතලන P1 සංරචක අගයන් (ලකුණු) සහ P2 සංරචකය. P1 හි විචලතාව 1.75756එම covariance න්යාසයක 1 eigenvalue, සහ P1 පැහැදිලි එසේ 86.5%මුළු වන එක සමානයන් විචලනය(1.07652+.95534) = (1.75756+.27430) .

විචල්ය පුරෝකථනය ලෙස PCA ("ගුප්ත" ලක්ෂණය)

පී1 වී1වී2

වී1=11පී1+1

වී2=12පී1+2

රූප විස්තරය මෙහි ඇතුළත් කරන්න

වී1^=11පී1වී2^=12පී11=වී1-වී1^2=වී2-වී2^

දැන්, පීසීඒ හි ලක්ෂණය වන්නේ දත්තවල සෑම ලක්ෂ්‍යයක් සඳහාම අපි ඊ 1 සහ ඊ 2 ගණනය කර මෙම ඛණ්ඩාංක සැලසුම් කළහොත් - එනම් දෝෂවල විසිරීම පමණක් සිදු කළහොත් වලාකුළු “දෝෂ දත්ත” ඉවතලන සංරචකය වන පී 2 සමඟ සමපාත වේ. එය එසේ කරයි: වලාකුළු බීජ් වලාකුළට සමාන පින්තූරයක් මත සැලසුම් කර ඇත - තවද එය ඇත්ත වශයෙන්ම P2 සංරචක ලකුණු සමඟ ටයිල් කර ඇති පරිදි P2 අක්ෂය P2 ( රූපය 1 හි ) සාදයි .

පුදුමයක් නොවේ, ඔබ පැවසිය හැකිය. එය එතරම් පැහැදිලිය: PCA හි, ඉවතලන කනිෂ් component සංරචකය (ය) යනු අනාවැකි දෝෂ E හි නිශ්චිතවම දිරාපත් වන දෙයයි , ආකෘතියේ මුල් විචල්‍යයන් V පැහැදිලි කරන (ප්‍රතිෂ් ores ාපනය කරන) V හි ගුප්ත ලක්ෂණයෙන් (P). E දෝෂයන් එක්ව ඉතිරි වී ඇති සංරචක (ය) වලින් සමන්විත වේ. සාධක විශ්ලේෂණය කරන ස්ථානය මෙන්න PCA ට වඩා වෙනස් වීමට පටන් ගන්නා .

පොදු FA පිළිබඳ අදහස (ගුප්ත ලක්ෂණය)

විධිමත් ලෙස, උපුටා ගත් ගුප්ත ලක්ෂණය (ය) මගින් මැනිෆෙස්ට් විචල්‍යයන් පුරෝකථනය කරන ආකෘතිය පීසීඒ හි මෙන් එෆ්ඒ හි සමාන වේ; [ Eq.3 ]:

වී1=1එෆ්+1

වී2=2එෆ්+2

මෙහි F යනු දත්ත වලින් උපුටා ගත් සහ Eq.2 හි P1 වූ දේ ප්‍රතිස්ථාපනය කිරීමේ ගුප්ත පොදු සාධකයයි . ආකෘතියේ වෙනස නම්, FA හි, PCA මෙන් නොව, දෝෂ විචල්‍යයන් (E1 සහ E2) එකිනෙකා සමඟ සම්බන්ධ නොවීම අවශ්‍ය වේ .

Eq.3

හරි, නැවත ත්‍රෙඩ් එකට යන්න. සාධක විශ්ලේෂණයේ දී E1 සහ E2 අතර සම්බන්ධයක් නොමැත; මේ අනුව, ඒවා වටකුරු හෝ ඉලිප්සාකාර දෝෂ සහිත වලාකුළක් සෑදිය යුතුය. පීසීඒ හි සිටියදී ඔවුන්ගේ වලාකුළ සෘජු රේඛාවක් ලෙස විකර්ණව ගමන් කරන පී 2 සමඟ සමපාත විය. මෙම අදහස් දෙකම පින්තූරයේ දැක්වේ:

රූප විස්තරය මෙහි ඇතුළත් කරන්න

FA හි දෝෂ වටකුරු (විකර්ණ ලෙස දිගටි නොවේ) බව සලකන්න. FA හි සාධකය (ගුප්ත) තරමක් වෙනස් වේ, එනම් PCA හි “ගුප්ත” වන පළමු ප්‍රධාන අංගය එය නිවැරදි නොවේ. පින්තූරයේ, සාධක රේඛාව අමුතු ලෙස කේතුකාකාර ය - අවසානයේ එය පැහැදිලි වනු ඇත.

PCA සහ FA අතර මෙම වෙනසෙහි තේරුම කුමක්ද? විචල්‍යයන් සහසම්බන්ධිත වන අතර එය දත්ත වලාකුළෙහි විකර්ණ ඉලිප්සාකාර හැඩයෙන් දැකිය හැකිය. P1 උපරිම විචල්‍යතාව මඟ හැරියේය, එබැවින් ඉලිප්සාකාරය P1 වෙත සම-යොමු කෙරේ. එහි ප්‍රති P ලයක් වශයෙන් සහසම්බන්ධය P1 විසින්ම පැහැදිලි කරන ලදී; නමුත් එය දැනට පවතින සහසම්බන්ධතා ප්‍රමාණය ප්‍රමාණවත් ලෙස පැහැදිලි කර නැත ; එය දත්ත ලක්ෂ්‍යවල විචලනය පැහැදිලි කිරීමට මිස සහසම්බන්ධතාවයට නොවේ. ඇත්ත වශයෙන්ම, එය සහසම්බන්ධය සඳහා අධික ලෙස ගණනය කර ඇති අතර, එහි ප්‍රති result ලය වූයේ අතිරික්ත ගිණුමට වන්දි ලබා දෙන විකර්ණ, සහසම්බන්ධිත දෝෂ වල පෙනුමයි. P1 ට පමණක් සහසම්බන්ධතාවයේ / සහසම්බන්ධතාවයේ ශක්තිය විස්තරාත්මකව පැහැදිලි කළ නොහැක. සාධකය එෆ් හැකිඑය තනිවම කරන්න; එය කිරීමට හැකි වූ විට ඇති වන කොන්දේසිය හරියටම වැරදි අතර සම්බන්ධයක් නොමැති වීමට බල කළ හැකි ස්ථානයයි. දෝෂ වලාකුළ වටකුරු බැවින් සාධකය උකහා ගැනීමෙන් පසුව සහසම්බන්ධතාවයක් - ධනාත්මක හෝ negative ණාත්මකව පවතී - එබැවින් එය සියල්ලම මඟ හැරුණු සාධකය එයයි.

මානයන් අඩු කිරීමක් ලෙස, PCA විචල්‍යතාවය පැහැදිලි කරන නමුත් සහසම්බන්ධතා නිශ්චිතවම පැහැදිලි කරයි. FA විසින් සහසම්බන්ධතා පැහැදිලි කරන නමුත් PCA ට හැකි තරම් දත්ත විචල්‍යතාවයන් (පොදු සාධක අනුව) ගණනය කළ නොහැක. FA හි ඇති සාධක (ය) විචල්‍යතාවයේ එම කොටස සඳහා වන අතර එය ශුද්ධ සහසම්බන්ධ කොටස වන අතර එය කොමියුනිස්ට් ලෙස හැඳින්වේ ; එම නිසා සාධක ආදාන විචල්‍යයන් සහසම්බන්ධතාවයට ගෙන ඒම සඳහා “ඇතුළත” හෝ “පිටුපස” සැඟවී ඇති සැබෑ නමුත් පාලනය කළ නොහැකි බලවේග / ලක්ෂණ / ගති ලක්ෂණ ලෙස අර්ථ දැක්විය හැකිය. ඔවුන් සහසම්බන්ධය ගණිතමය වශයෙන් හොඳින් පැහැදිලි කරන බැවිනි. ප්‍රධාන සංරචක (පළමු ඒවා ස්වල්පයක්) එය ගණිතමය වශයෙන් ද පැහැදිලි නොකරන අතර එය “ගුප්ත ගති ලක්ෂණ” (හෝ එවැනි) ලෙස හැඳින්විය හැක්කේ යම් දුරකට හා තාවකාලිකව පමණි .

පැටවීම් ගුණ කිරීම යනු සහසම්බන්ධය පැහැදිලි කරන (ප්‍රතිෂ් ores ාපනය) හෝ සහසම්බන්ධතාවයේ ස්වරූපයයි - විශ්ලේෂණය පදනම් වී ඇත්තේ සහසම්බන්ධිත අනුකෘතියට වඩා සහසම්බන්ධිත අනුකෘතිය මත නම් (උදාහරණ ලෙස). ලබා දුන් දත්ත සමඟ මා කළ සාධක විශ්ලේෂණය a_1=.87352, a_2=.84528, එබැවින් නිෂ්පාදිතය a_1*a_2 = .73837සහසංයුජයට සමාන වේ .73915. අනෙක් අතට, පීසීඒ පැටවීම විය a1_1=.97497, a1_2=.89832ඒ නිසා, a1_1*a1_2 = .87584overestimates .73915සැලකිය යුතු.

පීසීඒ සහ එෆ්ඒ අතර ඇති ප්‍රධාන න්‍යායාත්මක වෙනස පැහැදිලි කිරීමෙන් පසුව, අදහස නිදර්ශනය කිරීම සඳහා අපගේ දත්ත වෙත ආපසු යමු.

FA: ආසන්න විසඳුම (සාධක ලකුණු)

පහත දැක්වෙන්නේ අප විසින් තාවකාලිකව "උප ප්‍රශස්ත සාධක විශ්ලේෂණය" ලෙස හඳුන්වන විශ්ලේෂණයේ ප්‍රති results ල පෙන්වන විසිරුම් තලයයි , රූපය 3 .

A technical detail (you may skip): PAF method used for factor extraction.
Factor scores computed by Regression method.
Variance of the factor scores on the plot was scaled to the true
factor variance (sum of squared loadings).

රූප විස්තරය මෙහි ඇතුළත් කරන්න

සිට පිටත්වීම් බලන්න Fig.2 පීසීඒ ය. දෝෂ වල ලා දුඹුරු වලාකුළු වටකුරු නොවේ, එය විකර්ණ ඉලිප්සාකාරය, නමුත් එය පැහැදිලිවම PCA හි සිදුවී ඇති තුනී විකර්ණ රේඛාවට වඩා තරබාරු ය. දෝෂ සම්බන්ධක (සමහර කරුණු සඳහා පෙන්වා ඇත) තවදුරටත් සමාන්තර නොවන බව සලකන්න (PCA හි, ඒවා අර්ථ දැක්වීම අනුව P2 ට සමාන්තර විය). එපමනක් නොව, උදාහරණයක් ලෙස, සාධකයේ F අක්ෂයට සමමිතිකව කැඩපතක් වන "F" සහ "E" යන ස්ථාන දෙස බැලුවහොත්, අනපේක්ෂිත ලෙස ඒවායේ අනුරූප සාධක ලකුණු තරමක් වෙනස් අගයන් බව ඔබට පෙනී යනු ඇත. වෙනත් වචන වලින් කිවහොත්, සාධක ලකුණු යනු රේඛීයව පරිවර්තනය කරන ලද ප්‍රධාන සංරචක ලකුණු පමණක් නොවේ: F සාධකය P1 ක්‍රමයට වඩා වෙනස් ආකාරයකින් සොයාගත හැකිය. එම කුමන්ත්රණය මත එකට පෙන්වා ඇත නම් සහ ඔවුන්ගේ අක්ෂ සම්පූර්ණයෙන්ම තරමක් උස් නැහැ Fig.4 :

රූප විස්තරය මෙහි ඇතුළත් කරන්න

ඒ හැරුණු විට ඒවා තරමක් වෙනස් දිශානතියකින් යුක්ත වන අතර, එෆ් (ලකුණු සමඟ ටයිල් කර ඇති පරිදි) කෙටි වේ, එනම් එය P1 ගිණුම් වලට වඩා කුඩා විචල්‍යතාවයකට හේතු වේ. කලින් සඳහන් කළ පරිදි, සාධකය V1 V2 හි සහසම්බන්ධතාවයට වගකිව යුතු විචල්‍යතාවයට පමණක් හේතු වේ, එනම් විචල්‍යයන් ප්‍රාථමික සහසංයුජයේ 0සිට තථ්‍ය සහසංයුජතාවයට ගෙන ඒමට ප්‍රමාණවත් වන සම්පූර්ණ විචල්‍යයේ කොටස..73915 .

FA: ප්‍රශස්ත විසඳුම (සත්‍ය සාධකය)

ප්‍රශස්ත සාධක විසඳුමක් වන්නේ දෝෂ වටකුරු හෝ විකර්ණ නොවන ඉලිප්සාකාර වලාකුළු වන විට ය: E1 සහ E2 සම්පුර්ණයෙන්ම එකිනෙකට සම්බන්ධ නොවේ . සාධක විශ්ලේෂණය ඇත්ත වශයෙන්ම නැවත පැමිණේ එවැනි ප්රශස්ත විසඳුම. ඉහත සඳහන් කළ ආකාරයට සරල විසිරුම් ස්ථානයක මම එය පෙන්වූයේ නැත. ඇයි මම කළේ? - මන්ද එය වඩාත් සිත්ගන්නා සුළු දෙය වනු ඇත.

හේතුව, ත්‍රිමාණ කුමන්ත්‍රණයක් අනුගමනය කරමින් ප්‍රමාණවත් තරම් විසිරුම් ස්ථානයක පෙන්වීමට නොහැකි වීමයි. එය න්‍යායාත්මකව තරමක් සිත්ගන්නා කරුණකි. E1 සහ E2 මුළුමනින්ම එකිනෙකට සම්බන්ධ නොවන බවට පත් කිරීම සඳහා, F, E1, E2 යන විචල්‍යයන් තුනම V1, V2 මගින් අර්ථ දක්වා ඇති අවකාශයේ (තලය) නොපවතින බව පෙනේ ; හා තුන එකිනෙකා සමග uncorrelated කළ යුතුය . 5D හි එවැනි විසිරුම් ස්ථානයක් ඇඳිය ​​හැකි යැයි මම විශ්වාස කරමි (සමහර විට සමහර ව්‍යායාම සමඟ - 4D වලින්), නමුත් අපි ජීවත් වන්නේ ත්‍රිමාණ ලෝකයේ, අහෝ. F සාධකය E1 සහ E2 යන දෙකටම සම්බන්ධ නොවිය යුතුය (ඒවා දෙකම එකිනෙකට සම්බන්ධ නොවන අතර) නිරීක්‍ෂණය කරන ලද දත්තවල එකම (පිරිසිදු) සහ සම්පූර්ණ සහසම්බන්ධතාවයේ ප්‍රභවය F විය යුතු බැවිනි . සාධක විශ්ලේෂණය සම්පූර්ණ විචලනය බෙදී යයි පිළිබඳpආදාන විචල්‍යයන් එකිනෙකට සම්බන්ධ නොවන (නොවර්වර්ලැපිං) කොටස් දෙකකට:කොමියුනිස්ට් කොටස ( m-මානීය, mපොදු සාධක පාලනය වන තැන) සහ අද්විතීය කොටස (p -මානීය, දෝෂ ඇති තැන, අද්විතීය සාධක ලෙසද හැඳින්වේ, අන්‍යෝන්‍ය වශයෙන් එකිනෙකට සම්බන්ධ නොවන).

එබැවින් අපගේ දත්තවල සත්‍ය සාධකය විසිරුම් ස්ථානයක නොපෙන්වා සිටීම ගැන සමාව දෙන්න. මෙහි සිදු කර ඇති පරිදි "විෂය අවකාශයේ" දෛශික හරහා එය ප්‍රමාණවත් ලෙස දෘශ්‍යමාන කළ හැකියදත්ත ලක්ෂ්‍ය නොපෙන්වා .

වඩා, කොටසේ "පොදු FA (ගුප්ත ලක්ෂණය) අදහස" මම සාධකය සැබෑ සාධකය අක්ෂය බව අනතුරු ඇඟවීමට කිරීම සඳහා ප්රදර්ශනය (F අක්ෂය) විරසකයක් නඩත්තු කෙරෙන තැනට වගබලා ගැනීමත් ලෙස නොවේ යානය V1 V2 මත තැන්පත් කර ඇත. එයින් අදහස් වන්නේ - ප්‍රධාන සංරචක P1 ට ප්‍රතිවිරුද්ධව - සාධකය F අක්ෂය අක්ෂයේ භ්‍රමණය නොවන අතර ඒවායේ අවකාශයේ V1 හෝ V2 අක්ෂය භ්‍රමණය නොවන අතර F ලෙස විචල්‍යය V1 සහ V2 විචල්‍යයන්ගේ රේඛීය සංයෝජනයක් නොවේ . එබැවින් F ආදර්ශනය කර ඇත (විචල්‍යයන් V1 v2 වලින් උපුටා ගන්නා ලදි) පිටත ස්වාධීන විචල්‍යයක් මෙන් නොව ඒවා ව්‍යුත්පන්නයක් නොවේ. PCA ආරම්භ වන ස්ථානයේ සිට Eq.1 වැනි සමීකරණ සාධක විශ්ලේෂණයේ සත්‍ය (ප්‍රශස්ත) සාධකය ගණනය කිරීමට නුසුදුසු වන අතර විධිමත් සමාවයවික සමීකරණ Eq.2 සහ Eq.3විශ්ලේෂණයන් දෙකටම වලංගු වේ. එනම්, පීසීඒ විචල්‍යයන් මඟින් සංරචක ජනනය කරන අතර සංරචක විචල්‍යයන් පුරෝකථනය කරයි; FA සාධකය (න්) තුළ විචල්‍යයන් ජනනය කරයි / පුරෝකථනය කරයි, නමුත් පසුපසට නොවේ - පොදු සාධක ආකෘතිය සංකල්පමය වශයෙන් එසේ උපකල්පනය කරයි , නිරීක්ෂණය කරන ලද විචල්‍යයන්ගෙන් තාක්ෂණික සාධක උපුටා ගත්තද.

පමණක් නොව සැබෑ සාධකය, සතන්හි විචල්ය ශ්රිතයක් නොවන සැබෑ සාධකය ගේ වටිනාකම් ඇත , සුවිශේෂ අර්ථ දක්වා නැත . වෙනත් වචන වලින් කිවහොත්, ඒවා හුදෙක් නොදන්නා කරුණකි. ඒ සියල්ලටම හේතුව අප සිටින්නේ 5D අධික විශ්ලේෂණ අවකාශයේ මිස අපගේ නිවසේ දත්ත 2D අවකාශයේ නොවේ. සාධක සාධක ලෙස හැඳින්වෙන සත්‍ය සාධක අගයන් සඳහා හොඳ ඇස්තමේන්තු ( ක්‍රම ගණනාවක් පවතී ) පමණි , අප වෙනුවෙන් ඇත. සාධකයන්ගේ ලකුණු V1 V2 තලයෙහි පිහිටා ඇති අතර ප්‍රධාන සංරචක ලකුණු මෙන් ඒවා V1, V2 හි රේඛීය ශ්‍රිත ලෙස ගණනය කෙරේ. ඔවුන්මම "FA: ආසන්න විසඳුම (සාධක ලකුණු)" කොටසේ කුමන්ත්‍රණය කළෙමි. ප්‍රධාන සංරචක ලකුණු සත්‍ය සංරචක අගයන් වේ; සාධක ලකුණු යනු අවිනිශ්චිත සත්‍ය සාධක අගයන් සඳහා සාධාරණ ආසන්න කිරීමක් පමණි.

FAA: ක්රියා පටිපාටිය වට කිරීම

මේ අනුව, "FA: ආසන්න විසඳුම (සාධක ලකුණු)" කොටසේ මා විසින් පෙන්වන ලද "සාධක විසඳුම" සැබවින්ම පදනම් වූයේ ප්‍රශස්ත පැටවීම් මත ය, එනම් සත්‍ය සාධක මත ය. නමුත් ඉරණම අනුව ලකුණු ප්‍රශස්ත නොවීය. සංරචක ලකුණු මෙන් නිරීක්‍ෂණය කරන ලද විචල්‍යයන්ගේ රේඛීය ශ්‍රිතයක් ලෙස ලකුණු ගණනය කරනු ලැබේ, එබැවින් ඒවා දෙකම විසිරුම් තලයක සැසඳිය හැකි අතර මම එය කළේ පීසීඒ අදහසේ සිට එෆ්ඒ අදහස දෙසට ක්‍රමයෙන් සමත් වීමක් පෙන්වීමටය.

“සාධක අවකාශයේ” සාධක ලකුණු සහිත එකම ද්වීපාර්ශ්වික සාධක පැටවීමේදී කුමන්ත්‍රණය කිරීමේදී යමෙක් කල්පනාකාරී විය යුතුය , බර පැටවීම සත්‍ය සාධකවලට අදාළ වන අතර අනෙක් කරුණු සාධකවලට අදාළ වන අතර ( මෙම ත්‍රෙඩ් එකේ මෙම පිළිතුරට මගේ අදහස් බලන්න ).

සාධක භ්‍රමණය (පැටවීම) ගුප්ත ලක්ෂණ අර්ථ නිරූපණය කිරීමට උපකාරී වේ. සාධක විශ්ලේෂණය ලෙස ඔබ PCA භාවිතා කරන්නේ නම් පැටවීම් භ්‍රමණය කිරීම PCA හි ද කළ හැකිය (එනම්, PCA විචල්ය පුරෝකථනය ලෙස බලන්න). විචල්යයන් වර්ධනය වන විට PCA FA සමඟ ප්රති results ල සමඟ අභිසාරී වේ ( ප්රායෝගික හා සංකල්පීය සමානකම් සහ ක්රම දෙක අතර වෙනස්කම් පිළිබඳ අතිශයින් පොහොසත් නූල් බලන්න ). මෙම පිළිතුර අවසානයේ PCA සහ FA අතර මගේ වෙනස්කම් ලැයිස්තුව බලන්න . අයිරිස් දත්ත කට්ටලය පිළිබඳ PCA එදිරිව FA හි පියවරෙන් පියවර ගණනය කිරීම් මෙහි ඇත. මෙම නූලෙන් පිටත මාතෘකාව පිළිබඳ අනෙකුත් සහභාගිවන්නන්ගේ පිළිතුරු සමඟ සැලකිය යුතු හොඳ සම්බන්ධතා ප්‍රමාණයක් ඇත; මට කණගාටුයි මම වර්තමාන පිළිතුරේ ඒවායින් කිහිපයක් පමණක් භාවිතා කළෙමි.

PCA සහ FA අතර ඇති වෙනස්කම් පිළිබඳ වෙඩි උණ්ඩ ලැයිස්තුවක් ද මෙහි බලන්න .


1
+1. ඔබ එය ලිවීම සතුටක්, මෙම නූලට නිසැකවම ඔබෙන් පිළිතුරක් නොලැබුණි. මම කියවීමට පෙර ඉහළට (මම කලාතුරකින් කරන), පසුව කියවීමෙන් සතුටක් ලැබුවෙමි. මට පසුව තවත් අදහස් දැක්විය හැකිය, නමුත් දැනට එක් කුඩා නට්පික් එකක්: ඔබ කිහිප වතාවක්ම ලියා ඇත්තේ FA හි දෝෂ වලාකුළ “වටකුරු” විය යුතු බවයි. නමුත් ඇත්ත වශයෙන්ම එය ඉලිප්සාකාර විය හැකිය (V1 සහ V2 සඳහා වූ සුවිශේෂතාවන්ට විවිධ විචල්‍යයන් තිබිය හැකි නිසා), එයට ශුන්‍ය සහසම්බන්ධතා තිබිය යුතුය. මෙම විස්තරය සමඟ පා readers කයන් ව්‍යාකූල කිරීමට ඔබට අවශ්‍ය නොවූ බව මම අනුමාන කරමි.
amoeba

1
වී1=1එෆ්+1වී2=2එෆ්+2(1,2)=එන්(0,මම)- දැන් V1 සහ V2 සාම්පල ජනනය කිරීමට මෙම සම්බන්ධතා භාවිතා කරන්න. V1 සහ V2 ජනනය කළ පසු, අප ප්‍රශස්ත FA සිදු කිරීමට නම්, (E1, E2) පිළිබඳ නිවැරදි ඇස්තමේන්තු නැවත ලබා ගත යුතු අතර, එය ඉලිප්සාකාර වලාකුළක් සාදනු ඇත. එපමනක් නොව, දැන් F, E1, E2 එකම තලයක V1 සහ V2 ලෙස දැක්විය හැකිය.
මී පැණි

as කසා, ඔබේ ප්‍රකාශය මගේ පිළිතුරට හෝ අමීබාගේ ප්‍රකාශයට ප්‍රශංසා කළාද? එෆ්ඒ හි ගුප්ත විචල්‍යයන් තුන මුල් අවකාශයේ නොපවතින බවත් ඔබට එය පෙන්විය හැකි බවත් මගේ ප්‍රධාන ප්‍රකාශයට පටහැනි නම්, එය පෙන්වන පිළිතුරක් නිකුත් නොකරන්නේ මන්ද? නමුත් ප්රශස්ත FA දී, දෝෂ බව කරුණාකර මතක තබා හරියටම නෑ, uncorrelated ඔවුන් සිතා ගැනීමට හැකි බව එන සාමාන්ය uncorrelated ජනගහනය.
ttnphns

nttnphns: ව්‍යාකූලත්වයට කණගාටුයි, මම ඔබේ ප්‍රධාන ප්‍රකාශය සැක කළා. මම එය දින කිහිපයකින් පිළිතුරක් ලෙස පෙන්වීමට උත්සාහ කරමි. ස්තූතියි!
මී පැණි

21

සාධක විශ්ලේෂණය සහ ප්‍රධාන සංරචක විශ්ලේෂණය අතර වෙනස්කම්:

Factor සාධක විශ්ලේෂණයේ දී ව්‍යුහාත්මක ආකෘතියක් සහ සමහර උපකල්පන ඇත. මේ සම්බන්ධයෙන් ගත් කල එය තනිකරම ගණිතමය පරිවර්තනයක් වන ප්‍රධාන සංරචක විශ්ලේෂණයට අදාළ නොවන සංඛ්‍යාන තාක්‍ෂණයකි.

Component ප්‍රධාන සංරචක විශ්ලේෂණයේ පරමාර්ථය වන්නේ විචලනය පැහැදිලි කිරීම වන අතර සාධක විශ්ලේෂණය මඟින් විචල්‍යයන් අතර සහසම්බන්ධය පැහැදිලි කරයි.

මේ දෙක අතර ව්‍යාකූලත්වයට ඇති ලොකුම හේතුව වන්නේ සාධක විශ්ලේෂණයේ සාධක නිස්සාරණ ක්‍රමයක් "ප්‍රධාන සංරචක ක්‍රමය" ලෙස හැඳින්වීමයි. කෙසේ වෙතත්, පීසීඒ භාවිතා කිරීම එක් දෙයක් වන අතර එෆ්ඒ හි ප්‍රධාන සංරචක ක්‍රමය භාවිතා කිරීම තවත් දෙයකි . නම් සමාන විය හැකි නමුත් සැලකිය යුතු වෙනස්කම් තිබේ. පළමුවැන්න ස්වාධීන විශ්ලේෂණ ක්‍රමයක් වන අතර දෙවැන්න හුදෙක් සාධක නිස්සාරණය කිරීමේ මෙවලමකි.


13

මට (සහ මෙය ප්‍රයෝජනවත් යැයි මම විශ්වාස කරමි) සාධක විශ්ලේෂණය PCA ට වඩා බෙහෙවින් ප්‍රයෝජනවත් වේ.

සාධක විශ්ලේෂණය තුළින් පරිමාණයක් විශ්ලේෂණය කිරීමේ සතුට මෑතකදී මට ලැබුණි. මෙම පරිමාණය (එය කර්මාන්තයේ බහුලව භාවිතා වුවද) PCA භාවිතා කරමින් සංවර්ධනය කරන ලද අතර මගේ දැනුමට අනුව සාධක විශ්ලේෂණය කර නොමැත.

මම සාධක විශ්ලේෂණය සිදු කරන විට (ප්‍රධාන අක්ෂය) අයිතම තුනක් සඳහා වන වර්ගීකරණ 30% ට වඩා අඩු බව මම සොයා ගතිමි, එයින් අදහස් වන්නේ අයිතමවල විචල්‍යතාවයෙන් 70% කට වඩා විශ්ලේෂණය නොකිරීමයි. පීසීඒ දත්ත නව සංයෝජනයක් බවට පරිවර්තනය කරන අතර ජාතිවාදය ගැන තැකීමක් නොකරයි. මගේ නිගමනය වූයේ මනෝමිතික දෘෂ්ටි කෝණයකින් පරිමාණය එතරම් හොඳ එකක් නොවන අතර මම මෙය වෙනත් සාම්පලයකින් තහවුරු කර ඇත්තෙමි.

අත්යවශ්යයෙන්ම, ඔබට සාධක භාවිතා කිරීම ගැන අනාවැකි කීමට අවශ්ය නම්, PCA භාවිතා කරන්න, ඔබට ගුප්ත සාධක තේරුම් ගැනීමට අවශ්ය නම්, සාධක විශ්ලේෂණය භාවිතා කරන්න.


11

@ StatisticsDocConsulting හි පිළිතුර පුළුල් කිරීම: EFA සහ PCA අතර පැටවීමේ වෙනස සුළු විචල්‍යයන් සමඟ සුළුපටු නොවේ. මෙය R හි නිරූපණය කිරීම සඳහා අනුකරණ ශ්‍රිතයක් මෙන්න:

simtestit=function(Sample.Size=1000,n.Variables=3,n.Factors=1,Iterations=100)
{require(psych);X=list();x=matrix(NA,nrow=Sample.Size,ncol=n.Variables)
for(i in 1:Iterations){for(i in 1:n.Variables){x[,i]=rnorm(Sample.Size)}
X$PCA=append(X$PCA,mean(abs(principal(x,n.Factors)$loadings[,1])))
X$EFA=append(X$EFA,mean(abs(factanal(x,n.Factors)$loadings[,1])))};X}

IterationsSample.Size=1000 යිIterationsprincipal()factanal() කාර්යයන් සහ ඔබේ පරිගණකය.

මෙම කේතය භාවිතා කරමින්, දත්ත නිෂ්පාදනය කිරීම සඳහා මම පුනරාවර්තන 500 බැගින් විචල්‍ය 3–100 සාම්පල අනුකරණය කර ඇත:

Y=data.frame(n.Variables=3:100,Mean.PCA.Loading=rep(NA,98),Mean.EFA.Loading=rep(NA,98))
for(i in 3:100)
{X=simtestit(n.Variables=i,Iterations=500);Y[i-2,2]=mean(X$PCA);Y[i-2,3]=mean(X$EFA)}

... විචල්යයන් ගණනකට මධ්යන්ය පැටවීම් (විචල්යයන් සහ පුනරාවර්තන හරහා) සංවේදීතාවයේ කුමන්ත්රණයක් සඳහා:

.067


11

ඇත්තෙන්ම හොඳ පෙළ පොතකින් උපුටා ගැනීමක් (බ්‍රවුන්, 2006, 22 පි. අවධාරණය එකතු කරන ලදි).
PCA = ප්‍රධාන සංරචක විශ්ලේෂණය
EFA = ගවේෂණාත්මක සාධක විශ්ලේෂණය
CFA = සනාථ කරන සාධක විශ්ලේෂණය

EFA හා සම්බන්ධ වුවද, ප්‍රධාන සංරචක විශ්ලේෂණය (PCA) නිතරම පොදු සාධක විශ්ලේෂණයේ තක්සේරු කිරීමේ ක්‍රමයක් ලෙස වැරදි ලෙස වර්ගීකරණය කර ඇත. පූර්ව ඡේදයේ (එම්එල්, පීඑෆ්) සාකච්ඡා කර ඇති ඇස්තමේන්තු මෙන් නොව, පීසීඒ පොදු සාධක ආකෘතිය මත පදනම් නොවන වෙනස් ප්‍රමාණාත්මක ක්‍රම සමූහයක් මත රඳා පවතී. PCA පොදු සහ අද්විතීය විචල්‍යතාවයන් වෙන් නොකරයි. ඒ වෙනුවට, PCA අරමුණු කරන්නේ ඒවා අතර ඇති සහසම්බන්ධතා පැහැදිලි කරනවාට වඩා නිරීක්ෂණය කරන ලද මිනුම්වල විචල්‍යතාවයට වගකිව යුතු බවයි. මේ අනුව, පසුකාලීන විශ්ලේෂණයන්හි දී භාවිතා කිරීම සඳහා විශාල මිනුම් මාලාවක් කුඩා, වඩා කළමනාකරණය කළ හැකි සංයුක්ත විචල්‍ය ගණනකට අඩු කිරීම සඳහා දත්ත අඩු කිරීමේ ක්‍රමවේදයක් ලෙස PCA වඩාත් උචිත ලෙස භාවිතා කරයි. කෙසේ වෙතත්, සමහර ක්‍රමවේද විද්‍යා PC යින් තර්ක කර ඇත්තේ පීසීඒ යනු ඊඑෆ්ඒ සඳහා සාධාරණ හෝ සමහර විට වඩා උසස් විකල්පයක් බවයි, PCA සතුව ප්‍රියජනක සංඛ්‍යානමය ගුණාංග කිහිපයක් ඇති බව සලකන විට (උදා: පරිගණකමය වශයෙන් සරල, නුසුදුසු විසඳුම් වලට ගොදුරු නොවන, බොහෝ විට EFA හි ප්‍රති results ල වලට සමාන ප්‍රති results ල ලබා දෙයි, ප්‍රධාන අංගයක් මත සහභාගිවන්නාගේ ලකුණු ගණනය කිරීමට PCA සතු හැකියාව සහ අවිනිශ්චිත ස්වභාවය EFA එවැනි ගණනය කිරීම් සංකීර්ණ කරයි). මෙම ප්‍රශ්නය පිළිබඳ විවාදය දිගටම පැවතුනද, ෆැබ්රිගර් සහ වෙනත් අය. (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්‍රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). බොහෝ විට EFA හි ප්‍රති results ල වලට සමාන ප්‍රති results ල ලබා දෙයි, ප්‍රධාන අංගයක් මත සහභාගිවන්නාගේ ලකුණු ගණනය කිරීමට PCA සතු හැකියාව, EFA හි අවිනිශ්චිත ස්වභාවය එවැනි ගණනය කිරීම් සංකීර්ණ කරයි). මෙම ප්‍රශ්නය පිළිබඳ විවාදය දිගටම පැවතුනද, ෆැබ්රිගර් සහ වෙනත් අය. (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්‍රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). බොහෝ විට EFA හි ප්‍රති results ල වලට සමාන ප්‍රති results ල ලබා දෙයි, ප්‍රධාන අංගයක් මත සහභාගිවන්නාගේ ලකුණු ගණනය කිරීමට PCA සතු හැකියාව, EFA හි අවිනිශ්චිත ස්වභාවය එවැනි ගණනය කිරීම් සංකීර්ණ කරයි). මෙම ප්‍රශ්නය පිළිබඳ විවාදය දිගටම පැවතුනද, ෆැබ්රිගර් සහ වෙනත් අය. (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්‍රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්‍රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්‍රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993).කෙසේ වෙතත්, විශ්ලේෂණයක අභිබවා යන තාර්කික හා ආනුභවික අරමුණු පොදු සාධක ආකෘතියට අනුකූල නම්, එය PCA පැවැත්වීම සංකල්පමය හා ගණිතමය වශයෙන් නොගැලපේ; එනම්, නිරීක්‍ෂණය කරන ලද මිනුම්වල මිනුම් දෝෂයක් පවතින බව හඳුනාගෙන, ගුප්ත මානයන් කුඩා සංඛ්‍යාවක් සහිත දර්ශක සමූහයක අන්තර් සම්බන්ධතා ප්‍රතිනිෂ්පාදනය කිරීම ප්‍රකාශිත පරමාර්ථය නම් EFA වඩාත් යෝග්‍ය වේ.ෆ්ලොයිඩ් සහ විඩාමාන් (1995), පීසීඒ වෙතින් ලබාගත් ඒවාට වඩා ඊඑෆ්ඒ මත පදනම් වූ ඇස්තමේන්තු සීඑෆ්ඒ වෙත සාමාන්‍යකරණය කිරීමට වැඩි ඉඩක් ඇති බව සඳහන් කරයි. පීසීඒ මෙන් නොව ඊඑෆ්ඒ සහ සීඑෆ්ඒ පොදු සාධක ආකෘතිය මත පදනම් වේ. පරිමාණ සංවර්ධනය හා වලංගු කිරීම සඳහා සටන් විරාම ගිවිසුම සඳහා පුර්වගාමියෙකු ලෙස EFA බොහෝ විට භාවිතා කරනු ලැබේ යන කාරණය සැලකිල්ලට ගනිමින් මෙය සැලකිය යුතු කරුණකි. PCA සහ EFA අතර ඇති පරිගණකමය වෙනස්කම් පිළිබඳ සවිස්තරාත්මක නිරූපණයක් බහුකාර්ය සහ සාධක විශ්ලේෂණ පෙළපොත් වලින් සොයාගත හැකිය (උදා: ටබච්නික් සහ ෆිදෙල්, 2001).

බ්රවුන්, ටීඒ (2006). ව්‍යවහාරික පර්යේෂණ සඳහා තහවුරු කිරීමේ සාධක විශ්ලේෂණය. නිව් යෝර්ක්: ගිල්ෆර්ඩ් ප්‍රෙස්.


10

PCA එකක් FAA එකක් ලෙස කෙනෙකුට සිතිය හැකිය, එහිදී සියලු විචල්‍යයන් සඳහා වර්ග 1 ට සමාන යැයි උපකල්පනය කෙරේ. ප්‍රායෝගිකව, මෙයින් අදහස් කරන්නේ අඩු ජනවාර්ගිකත්වය හේතුවෙන් FA හි සාපේක්ෂව අඩු සාධක පැටවීමක් ඇති අයිතමවලට PCA හි වැඩි පැටවීමක් ඇති බවයි. විශ්ලේෂණයේ මූලික පරමාර්ථය වන්නේ අයිතමයේ දිග කපා අඩු හෝ අඩු බරක් ඇති අයගේ බැටරියක් පිරිසිදු කිරීම හෝ අයිතම සංචිතයේ හොඳින් නිරූපණය නොවන සංකල්ප හඳුනා ගැනීම නම් මෙය යෝග්‍ය අංගයක් නොවේ.


6

ටිපින් සහ බිස්චොප් විසින් රචිත ලිපියක ප්‍රොබබලිස්ටික් පීසීඒ (පීපීසීඒ) සහ සාධක විශ්ලේෂණය අතර ඇති දැඩි සම්බන්ධතාවය සාකච්ඡා කෙරේ. පීපීසීඒ සම්භාව්‍ය පීසීඒ වලට වඩා FA ට වඩා සමීප ය. පොදු ආකෘතිය වන්නේ

y=μ+ඩබ්ලිව්x+ε

ඩබ්ලිව්ආර්පි,..x~එන්(0,මම)ε~එන්(0,Ψ)

  • Ψ
  • Ψ=σ2මම

මයිකල් ඊ. ටිපින්, ක්‍රිස්ටෝපර් එම්. බිෂොප් (1999). සම්භාවිතා ප්‍රධාන සංරචක විශ්ලේෂණය , රාජකීය සංඛ්‍යාන සංගමයේ ජර්නලය, 61 වන වෙළුම, 3 කලාපය, පිටු 611–622


2
+1. ඔව්. PCA සහ FA අතර සම්බන්ධතාවය අවබෝධ කර ගැනීම සඳහා PPCA අවබෝධ කර ගැනීම අත්‍යවශ්‍ය බව මම විශ්වාස කරමි. නමුත් PCA / PPCA සම්බන්ධතාවය සාකච්ඡා කිරීමෙන් ඔබට ඔබේ පිළිතුර වැඩිදියුණු කළ හැකිය.
amoeba

3

මෙම ප්‍රතිචාර කිසිවක් පරිපූර්ණ නොවේ. එක්කෝ FA හෝ PCA සමහර ප්‍රභේද ඇත. කුමන ප්‍රභේද සංසන්දනය කර ඇත්දැයි අප පැහැදිලිව පෙන්වා දිය යුතුය. මම උපරිම සම්භාවිතා සාධක විශ්ලේෂණය සහ හොටෙලිං හි පීසීඒ සංසන්දනය කරමි. ගුප්ත විචල්‍යය සාමාන්‍ය ව්‍යාප්තියක් අනුගමනය කරන බව කලින් උපකල්පනය කළ නමුත් PCA ට එවැනි උපකල්පනයක් නොමැත. මෙය විසඳුම, සංරචක කැදැල්ල, විසඳුමේ අද්විතීයභාවය, ප්‍රශස්තිකරණ ඇල්ගොරිතම වැනි වෙනස්කම් වලට තුඩු දී ඇත.


1
ඔබට මේ පිළිබඳව මඳක් පුළුල් කළ හැකිදැයි මම කල්පනා කරමි - අවසාන වාක්‍යයේ වෙනස්කම් ඇති බව ඔබ පවසා ඇත, නමුත් එම වෙනස්කම් මොනවාද යන්න පිළිබඳව වැඩි තොරතුරු ලබා දී නැත, නැතහොත් එම වෙනස්කම් වැදගත් වන්නේ කෙසේද?
රිදී මාළු

1
වඩාත් දුරස්ථ ක්‍රම දෙකක් තෝරා ගැනීම සහ ඒවා සැබවින්ම වෙනස් යැයි කියා ගැනීම - ඔබ මෙන් - පරිපූර්ණ තර්කනයක් ද නොවේ. යමෙක් මේ දෙක සමාන වන්නේ කෙසේදැයි සොයාගෙන වාර්තා කළ යුතුය. විකල්පයක් ලෙස, යමෙකුට බොහෝ සමාන ක්‍රම (සරල පීසීඒ එදිරිව පීඒඑෆ් වැනි ) තෝරාගෙන ඒවා වෙනස් වන්නේ කෙසේදැයි වාර්තා කළ හැකිය.
ttnphns

1
හොටෙලිං හි පීසීඒ ගුප්ත ගවුසියානුවන් උපකල්පනය කරයි.
අනුමාන කිරීම්

1

මෙම තනතුර සඳහා හොඳ පිළිතුරු රාශියක් ඇති නමුත් මෑතකදී මට තවත් වෙනසක් හමු විය.

පොකුරුකරණය යනු PCA සහ FA විවිධ ප්‍රති .ල ලබා දෙන එක් යෙදුමකි. දත්තවල බොහෝ විශේෂාංග ඇති විට, ඉහළ පළාත් සභා දිශාවන් සොයා ගැනීමට සහ මෙම පළාත් සභා වල දත්ත ප්‍රක්ෂේපණය කිරීමට යමෙකු උත්සාහ කළ හැකිය, පසුව පොකුරුකරණය සමඟ ඉදිරියට යන්න. බොහෝ විට මෙය දත්තවල ආවේනික පොකුරු වලට බාධා කරයි - මෙය හොඳින් ඔප්පු වූ ප්‍රති .ලයකි. පර්යේෂකයෝ යෝජනා කරන්නේ උප-අභ්‍යවකාශ පොකුරු ක්‍රම සමඟ ඉදිරියට යාමටයි, එමඟින් ආකෘතියේ අඩු මානයන්හි ගුප්ත සාධක සොයා බලයි.

මෙම වෙනස නිදර්ශනය කිරීම Crabsසඳහා ආර්. කකුළුවන්ගේ දත්ත කට්ටලය පේළි 200 ක් සහ තීරු 8 ක් ඇති අතර, කකුළුවන් 50 ක් මත රූප විද්‍යාත්මක මිනුම් 5 ක් විස්තර කරයි. කකුළුවන්.

library(MASS)
data(crabs)
lbl <- rep(1:4,each=50)
pc <- princomp(crabs[,4:8])
plot(pc) # produce the scree plot
X <- as.matrix(crabs[,4:8]) %*% pc$loadings
library(mclust)
res_12 <- Mclust(X[,1:2],G=4)
plot(res_12)


res_23 <- Mclust(X[,2:3],G=4)
plot(res_23)

PC1 සහ PC2 භාවිතා කරමින් පොකුරුකරණය: රූප විස්තරය මෙහි ඇතුළත් කරන්න

PC2 සහ PC3 භාවිතා කරමින් පොකුරුකරණය: රූප විස්තරය මෙහි ඇතුළත් කරන්න

#using PC1 and PC2:
     1  2  3  4
  1 12 46 24  5
  2 36  0  2  0
  3  2  1 24  0
  4  0  3  0 45

#using PC2 and PC3:
    1  2  3  4
  1 36  0  0  0
  2 13 48  0  0
  3  0  1  0 48
  4  1  1 50  2

ඉහත බිම් කැබලි වලින් අපට දැකිය හැකි පරිදි, PC2 සහ PC3 PC1 වලට වඩා වෙනස් වෙනස්කම් සහිත තොරතුරු රැගෙන යයි.

සාධක විශ්ලේෂක මිශ්‍රණයක් භාවිතා කරමින් ගුප්ත සාධක භාවිතා කරමින් යමෙකු පොකුරු කිරීමට උත්සාහ කරන්නේ නම්, පළමු පළාත් සභා දෙක භාවිතා කිරීමට සාපේක්ෂව වඩා හොඳ ප්‍රති result ලයක් අපට පෙනේ.

mfa_model <- mfa(y, g = 4, q = 2)
  |............................................................| 100%
table(mfa_model$clust,c(rep(1,50),rep(2,50),rep(3,50),rep(4,50)))

     1  2  3  4
  1  0  0  0 45
  2 16 50  0  0
  3 34  0  0  0
  4  0  0 50  5

මෙම පිළිතුර සැබවින්ම ප්‍රශ්නයට පිළිතුරු සපයන බවට මා සැක කරන බව පැවසිය යුතුය. පිළිතුර PCA හෝ FA වලින් පසුව පොකුරු විශ්ලේෂණය ගැන මිස PCA සහ FA ගැන නොවේ. එහෙත් ඒ සම්බන්ධයෙන් පවා පිළිතුර අඳුරු හෝ නිම නොකළ ය. ඔබ පෙන්වන වෙනස පැහැදිලි කළ යුත්තේ කෙසේද?
ttnphns

පොකුරු විශ්ලේෂණය පිළිබඳ පිළිතුර සමඟ මම එකඟ වෙමි. කෙසේ වෙතත්, OP විසින් PCA / FA සමඟ සැබෑ ජීවිතයක් ඉල්ලා ඇති අතර එහිදී එකක් අනෙකට වඩා භාවිතා කළ යුතුය. සාමාන්‍යයෙන් පීසීඒ හෝ එෆ්ඒ කිසි විටෙකත් අවසාන ඉලක්කය නොවේ - උදා: සමාජ විද්‍යාවන්හි අවසාන පරමාර්ථය වනුයේ විෂයයන් විවිධ පොකුරු / කණ්ඩායම් වලට බෙදීමයි. මගේ පිළිතුර එවැනි සිදුවීම් ආමන්ත්‍රණය කරයි. මගේ පිළිතුර වැඩිදියුණු කළ හැකි යැයි ඔබ සිතන්නේ නම්, පෙන්වා දීමට නිදහස් වන්න.
මී පැණි

ඔබ සොයා ගැනීම පැහැදිලි කළහොත් ඔබේ පිළිතුර සැබවින්ම අදාළ වනු ඇතැයි මම සිතමි. PCA සහ FA අතර ඇති වෙනස්කම් ක්‍රම දෙක සඳහා සහජයෙන්ම ඇති බව ඔබ කියා සිටී (ඒවා පොකුරුකරණය යටතේ පමණක් පෙනේ). ක්‍රමවල ආකෘතිවල වෙනස්කම් වලින් න්‍යායාත්මකව වෙනස්කම් ඇති වන්නේ කෙසේද හෝ ඇයි යන්න ඔබ පෙන්විය යුතු යැයි හෝ අවම වශයෙන් අනුමාන කළ යුතු යැයි මම සිතමි.
ttnphns
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.