මා භාවිතා කරන සංඛ්යානමය පැකේජ ගණනාවක් මෙම සංකල්ප දෙක එකට ඔතා ඇති බව පෙනේ. කෙසේ වෙතත්, මම කල්පනා කරන්නේ එකිනෙකට වෙනස් උපකල්පන හෝ දත්ත 'විධිමත්භාවයන්' තිබේද යන්නයි. සැබෑ උදාහරණයක් ඇදහිය නොහැකි තරම් ප්රයෝජනවත් වනු ඇත.
මා භාවිතා කරන සංඛ්යානමය පැකේජ ගණනාවක් මෙම සංකල්ප දෙක එකට ඔතා ඇති බව පෙනේ. කෙසේ වෙතත්, මම කල්පනා කරන්නේ එකිනෙකට වෙනස් උපකල්පන හෝ දත්ත 'විධිමත්භාවයන්' තිබේද යන්නයි. සැබෑ උදාහරණයක් ඇදහිය නොහැකි තරම් ප්රයෝජනවත් වනු ඇත.
Answers:
ප්රධාන සංරචක විශ්ලේෂණයට නිරීක්ෂණය කරන ලද විචල්යයන්ගේ රේඛීය සංයුක්ත නිස්සාරණය කිරීම ඇතුළත් වේ.
සාධක විශ්ලේෂණය පදනම් වී ඇත්තේ න්යායාත්මක ගුප්ත සාධක වලින් නිරීක්ෂණය කළ විචල්යයන් පුරෝකථනය කරන විධිමත් ආකෘතියක් මත ය.
මනෝ විද්යාවේදී මෙම ක්රම දෙක බොහෝ විට බහු පරිමාණ පරීක්ෂණ වලදී කුමන පරිමාණයන් මත පැටවිය යුතුද යන්න තීරණය කරනු ලැබේ. ඒවා සාමාන්යයෙන් සමාන වැදගත් නිගමනවලට එළඹේ (සාකච්ඡාවක් සඳහා කොම්රි (1988) පෞරුෂත්වය සහ සායනික මනෝ විද්යාව පිළිබඳ පරිමාණ සංවර්ධනයේ සාධක විශ්ලේෂණ ක්රම බලන්න). සමහර සංඛ්යාලේඛන පැකේජ ඒවා එකට එකතු වන්නේ ඇයිද යන්න පැහැදිලි කිරීමට මෙය උපකාරී වේ. "ප්රධාන සංරචක විශ්ලේෂණය" වැරදි ලෙස "සාධක විශ්ලේෂණය" ලෙස ලේබල් කර ඇති අවස්ථා ද මම දැක ඇත්තෙමි.
එය අනුව අතේ මාපට ඇඟිල්ල සරල පාලනය , මම යෝජනා ඔබ කැමතියි:
නිරීක්ෂණය කරන ලද විචල්යයන්ට හේතු වන ගුප්ත සාධකවල න්යායාත්මක ආකෘතියක් ඔබ උපකල්පනය කරන්නේ නම් හෝ පරීක්ෂා කිරීමට අවශ්ය නම් සාධක විශ්ලේෂණය ක්රියාත්මක කරන්න.
ප්රධාන සංරචක විශ්ලේෂණය ක්රියාත්මක කරන්න ඔබේ සහසම්බන්ධිත නිරීක්ෂණය කරන ලද විචල්යයන් වැදගත් ස්වාධීන සංයුක්ත විචල්යයන් කුඩා කට්ටලයක් දක්වා අඩු කිරීමට ඔබට අවශ්ය නම්.
මගේ ප්රතිචාරයෙන්:
පීසීඒ පසු භ්රමණයකින් (වරිමැක්ස් වැනි) තවමත් පීසීඒ ද?
ප්රධාන සංරචක විශ්ලේෂණය (පීසීඒ) සහ පොදු සාධක විශ්ලේෂණය (සීඑෆ්ඒ) එකිනෙකට වෙනස් ක්රම වේ. බොහෝ විට, ඔවුන් සමාන ප්රති results ල ලබා දෙන අතර, පීපීඒ එස්පීඑස්එස් සාධක විශ්ලේෂණ චර්යාවන්හි පෙරනිමි නිස්සාරණ ක්රමය ලෙස භාවිතා කරයි. මෙය නිසැකවම දෙදෙනා අතර වෙනස පිළිබඳව බොහෝ ව්යාකූලත්වයට හේතු වේ.
අවසාන කරුණ නම් මේවා සංකල්පමය වශයෙන් වෙනස් මාදිලි දෙකකි. PCA හි, සංරචක යනු සම්පූර්ණ විචල්යතාව උපරිම කරන සත්ය විකලාංග රේඛීය සංයෝජනයකි. FA හි, සාධක යනු විචල්යතාවයේ හවුල් කොටස උපරිම කරන රේඛීය සංයෝජනයන් ය - යටින් පවතින “ගුප්ත ව්යුහයන්” ය. FA බොහෝ විට "පොදු සාධක විශ්ලේෂණය" ලෙස හඳුන්වන්නේ එබැවිනි. FAA විවිධාකාර ප්රශස්තිකරණ ක්රියාකාරකම් භාවිතා කරන අතර එහි ප්රති result ලය PCA මෙන් නොව, භාවිතා කරන ප්රශස්තිකරණ ක්රියාවලිය සහ එම ක්රියාකාරකම් සඳහා ආරම්භක ස්ථාන මත රඳා පවතී. සරලවම එක අද්විතීය විසඳුමක් නොමැත.
R හි, ෆැක්ටනල් () ශ්රිතය මඟින් CFA හට උපරිම සම්භාවිතා නිස්සාරණයක් ලබා දේ. එබැවින්, එය PCA නිස්සාරණය මත පදනම් වූ SPSS ප්රති result ලයක් ප්රතිනිෂ්පාදනය කරනු ඇතැයි ඔබ අපේක්ෂා නොකළ යුතුය. එය හුදෙක් එකම ආකෘතියක් හෝ තර්කනයක් නොවේ. ඔබ එකම ඇල්ගොරිතම භාවිතා නොකරනු ඇති බැවින් ඔබ එස්පීඑස්එස් හි උපරිම ලයික්ලිහුඩ් නිස්සාරණය භාවිතා කළහොත් ඔබට එකම ප්රති result ලය ලැබේදැයි මට විශ්වාස නැත.
R හි වඩා හොඳ හෝ නරක සඳහා, කෙසේ වෙතත්, SPSS එහි පෙරනිමිය ලෙස සපයන මිශ්ර “සාධක විශ්ලේෂණය” ප්රතිනිෂ්පාදනය කළ හැකිය. ආර් හි ක්රියාවලිය මෙන්න, මෙම කේතය සමඟ, මට මෙම දත්ත කට්ටලය භාවිතා කරමින් එස්පීඑස්එස් ප්රධාන සංරචක “සාධක විශ්ලේෂණය” ප්රති result ලය ප්රතිනිෂ්පාදනය කළ හැකිය. (අවිනිශ්චිත වන ලකුණ හැර). එම ප්රති result ලය R හි ඇති ඕනෑම භ්රමණ ක්රමයක් භාවිතා කර භ්රමණය කළ හැකිය.
data(attitude)
# Compute eigenvalues and eigenvectors of the correlation matrix.
pfa.eigen <- eigen(cor(attitude))
# Print and note that eigenvalues are those produced by SPSS.
# Also note that SPSS will extract 2 components as eigenvalues > 1 = 2.
pfa.eigen$values
# Set a value for the number of factors (for clarity)
kFactors <- 2
# Extract and transform two components.
pfa.eigen$vectors[, seq_len(kFactors)] %*%
diag(sqrt(pfa.eigen$values[seq_len(kFactors)]), kFactors, kFactors)
principal(attitude, 2, rotate="none")
ල ලැබෙනු ඇති psych
බවත්, කේසර්ගේ රීතිය (ev> 1) මානයන් පරීක්ෂා කිරීම සඳහා වඩාත්ම නිර්දේශිත ක්රමය නොවන බවත් (එය සාධක ගණන අධිතක්සේරු කරයි).
factanal()
EFA සපයන්නේ සටන් විරාම ගිවිසුම නොවේ. එසේම, මගේ අත්දැකීම් අනුව, එස්පීඑස්එස් හි උපරිම ලයික්ලිහුඩ් නිස්සාරණය factanal()
කිසිදු භ්රමණයක් නොමැති බවට ලබා දී ඇති ප්රති result ලයම ලබා දිය යුතුය .
FA හි ඔබ සාමාන්යයෙන් (අද්විතීයභාවය සහ ජාතිවාදය) යන දෙකම සමඟ කටයුතු කළද, ඔබේ පළමු කරුණ ගැන ඔබ නිවැරදිය. පීසීඒ සහ එෆ්ඒ අතර තේරීම මනෝමිතිකයන් අතර දීර්-කාලීන විවාදයකි. මම ඔබේ කරුණු එතරම් අනුගමනය කරන්නේ නැහැ. ගුප්ත සාධක තැනීම සඳහා කුමන ක්රමයක් භාවිතා කළත් ප්රධාන අක්ෂවල භ්රමණය යෙදිය හැකිය. ඇත්ත වශයෙන්ම, බොහෝ විට මෙය ප්රායෝගික හේතූන් මත භාවිතා කරන VARIMAX භ්රමණය (විකලාංග භ්රමණය, සහසම්බන්ධ නොවන සාධක සලකා බැලීම) වේ, පහසුම භ්රමණය වුවද (උදා: PROMAX) ) යථාර්ථය වඩා හොඳින් පිළිබිඹු කළ හැකිය (ගුප්ත ඉදිකිරීම් බොහෝ විට එකිනෙකට සම්බන්ධ වේ), අවම වශයෙන් FA සම්ප්රදායට අනුව, ඔබේ විචල්යයන් අතර නිරීක්ෂණය කරන ලද අන්තර් සහසම්බන්ධතාවයේ හදවතෙහි සැඟවුණු ඉදිකිරීමක් ඇතැයි ඔබ උපකල්පනය කරයි. කාරණය වන්නේ "දත්ත විශ්ලේෂණ" සම්ප්රදායේ මුල් විචල්යයන්ගේ රේඛීය සංයෝජනයන්හි අර්ථ නිරූපණය PCA හා VARIMAX භ්රමණය තරමක් දුරට විකෘති කිරීමයි (මයිකල් ටෙනෙන්හවුස්ගේ කාර්යය බලන්න). මනෝමිතික දෘෂ්ටි කෝණයකින්, FA ආකෘති වඩාත් සුදුසු වන්නේ මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). කාරණය වන්නේ "දත්ත විශ්ලේෂණ" සම්ප්රදායේ මුල් විචල්යයන්ගේ රේඛීය සංයෝජනයන්හි අර්ථ නිරූපණය PCA හා VARIMAX භ්රමණය තරමක් දුරට විකෘති කිරීමයි (මයිකල් ටෙනෙන්හවුස්ගේ කාර්යය බලන්න). මනෝමිතික දෘෂ්ටි කෝණයකින්, FA ආකෘති වඩාත් සුදුසු වන්නේ මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). කාරණය වන්නේ "දත්ත විශ්ලේෂණ" සම්ප්රදායේ මුල් විචල්යයන්ගේ රේඛීය සංයෝජනයන්හි අර්ථ නිරූපණය PCA හා VARIMAX භ්රමණය තරමක් දුරට විකෘති කිරීමයි (මයිකල් ටෙනෙන්හවුස්ගේ කාර්යය බලන්න). මනෝමිතික දෘෂ්ටි කෝණයකින්, FA ආකෘති වඩාත් සුදුසු වන්නේ මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). FA ආකෘති වඩාත් සුදුසු වන්නේ ඒවා මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව). FA ආකෘති වඩාත් සුදුසු වන්නේ ඒවා මිනුම් දෝෂ සඳහා පැහැදිලිවම වගකිව යුතු බැවිනි, නමුත් PCA ඒ ගැන තැකීමක් නොකරයි. කෙටියෙන් කිවහොත්, පීසීඒ භාවිතා කරමින් ඔබ එක් එක් සංරචක (සාධකය) විචල්යයන්ගේ රේඛීය සංයෝජනයක් ලෙස ප්රකාශ කරන අතර එෆ්ඒ හි මේවා විචල්යයන් වන්නේ සාධකවල රේඛීය සංයෝජනයන් ලෙස ප්රකාශ වන (ඔබ පැවසූ පරිදි වර්ගවාදී සහ අද්විතීය සංරචක ඇතුළුව).
මෙම මාතෘකාව පිළිබඳ පහත සඳහන් සාකච්ඡා පළමුව කියවීමට මම ඔබට නිර්දේශ කරමි:
PCA followed by VARIMAX rotation somewhat distorts the interpretation of the linear combinations of the original variables in the "data analysis" tradition
. Chl, ඔබට එය පැහැදිලි කළ හැකිද? එය හොඳය.
වෙබයේ යෝජිත නිර්වචන ගණනාවක් තිබේ. සංඛ්යාන ඉගෙනීම පිළිබඳ මාර්ගස්ථ පාරිභාෂික ශබ්ද මාලාවකින් එකක් මෙන්න :
ප්රධාන සංරචක විශ්ලේෂණය
දත්ත කට්ටලයක ප්රධාන අංග වන නව අංගයන් තැනීම. ප්රධාන සංරචක වන්නේ ආදාන අංගයන්ගේ රේඛීය සංයෝජනයන්ගෙන් සාදන ලද උපරිම විචල්යතාවයේ අහඹු විචල්යයන් ය. ඒ හා සමානව, ඒවා ප්රධාන සංරචක අක්ෂයන් වෙත ප්රක්ෂේපණය වන අතර ඒවා දත්ත කාණ්ඩයේ එක් එක් ලක්ෂ්යයට සාමාන්ය වර්ග දුර අවම කරන රේඛා වේ. අද්විතීය බව සහතික කිරීම සඳහා, ප්රධාන සංරචක අක්ෂ සියල්ලම විකලාංග විය යුතුය. PCA යනු ආදාන සහ ප්රතිදානයන් දෙකෙහිම ගෝස්සියානු ශබ්දය ඉදිරියේ රේඛීය ප්රතිවර්තනය සඳහා උපරිම සම්භාවිතා තාක්ෂණයකි. සමහර අවස්ථාවලදී, PCA JPEG රූප සම්පීඩනයේදී භාවිතා කරන DCT වැනි ෆූරියර් පරිවර්තනයකට අනුරූප වේ. "පිළිගැනීම සඳහා අයිජන්ෆේස්" (ටර්ක් සහ පෙන්ට්ලන්ඩ්, ජේ සංජානන ස්නායු විද්යාව 3 (1), 1991), බිෂොප්, "බලන්න.
සාධක විශ්ලේෂණය
PCA සාමාන්යකරණය කිරීම පැහැදිලිවම උපරිම සම්භාවිතාව මත පදනම් වේ. පීසීඒ මෙන්, සෑම දත්ත ලක්ෂ්යයක්ම උප අවකාශයක ලක්ෂ්යයක් සාම්පල ලබා ගැනීමෙන් පසුව පූර්ණ-මාන ගෝස්සියානු .ෝෂාවකින් එය අවුස්සනු ඇතැයි උපකල්පනය කෙරේ. වෙනස වන්නේ සාධක විශ්ලේෂණය මඟින් ශබ්දය අත්තනෝමතික විකර්ණ සහසංයුජ අනුකෘතියක් ලබා ගැනීමට ඉඩ දෙන අතර PCA උපකල්පනය කරන්නේ ශබ්දය ගෝලාකාර බවය. උප අවකාශය තක්සේරු කිරීමට අමතරව, සාධක විශ්ලේෂණය මඟින් ශබ්ද කෝවරියන්ස් අනුකෘතිය තක්සේරු කරයි. "සාධක විශ්ලේෂකවල මිශ්රණ සඳහා ඊඑම් ඇල්ගොරිතම" බලන්න .පීසීඒ සඳහා මානයන් තෝරා ගැනීම ".
මෙම ත්රෙඩ් එකේ ඉහළම පිළිතුරෙන් ඇඟවෙන්නේ පීසීඒ යනු මානයන් අඩු කිරීමේ තාක්ෂණයකි, එෆ්ඒ යනු ගුප්ත විචල්ය තාක්ෂණයකි. මෙය සංවේදී දැඩි ය . නමුත් මෙහි බොහෝ පිළිතුරු සහ වෙනත් තැන්වල බොහෝ ප්රතිකාර ක්රම PCA සහ FA සම්පූර්ණයෙන්ම වෙනස් ක්රම දෙකක් ලෙස ඉදිරිපත් කරයි. ප්රතිවිරුද්ධ අරමුණු, ක්රම සහ ප්රති come ල එකිනෙකට වෙනස් වේ. මම එකඟවෙන්නේ නැහැ; පීසීඒ ගුප්ත විචල්ය තාක්ෂණයක් ලෙස සලකන විට එය එෆ්ඒ වෙත බෙහෙවින් සමීප වන අතර ඒවා ඉතා සමාන ක්රමවේදයන් ලෙස දැකිය යුතුය.
පහත දැක්වෙන ත්රෙඩ් එකේ PCA සහ FA අතර ඇති සමානකම් හා වෙනස්කම් පිළිබඳව මම මගේම විස්තරයක් ඉදිරිපත් කළෙමි: EFA වෙනුවට PCA භාවිතා කිරීමට හොඳ හේතුවක් තිබේද? එසේම, PCA සාධක විශ්ලේෂණය සඳහා ආදේශකයක් විය හැකිද? එහිදී මම තර්ක කරන්නේ සරල ගණිතමය හේතූන් මත PCA සහ FA වල ප්රති come ල බෙහෙවින් සමාන වනු ඇතැයි අපේක්ෂා කළ හැකි අතර, විචල්යයන් ගණන ඉතා කුඩා නොවන නිසා (සමහර විට දුසිමකට වඩා වැඩි). ගණිතමය විස්තර සහ මොන්ටේ කාලෝ අනුකරණයන් සඳහා සම්බන්ධිත නූලෙහි මගේ [දිගු!] පිළිතුර බලන්න. මගේ තර්කයේ වඩාත් සංක්ෂිප්ත අනුවාදයක් සඳහා මෙහි බලන්න: පීසීඒ සහ එෆ්ඒ සමාන ප්රති results ල ලබා දෙන්නේ කුමන කොන්දේසි යටතේ ද?
මෙන්න මම එය උදාහරණයක් ලෙස පෙන්වීමට කැමතියි. මම UCI යන්ත්ර ඉගෙනුම් ගබඩාවෙන් වයින් දත්ත කට්ටලය විශ්ලේෂණය කරමි . එය p = විස්තර කර ඇති විවිධ මිදි තුනකින් වයින් සහිත තරමක් ප්රසිද්ධ දත්ත කට්ටලයකි
PCA සහ FA අතර කිසිදු වෙනසක් නැති බව සලකන්න! මෙහි සහ එහි කුඩා අපගමනයන් ඇත, නමුත් සාමාන්ය පින්තූරය බොහෝ දුරට සමාන වන අතර, සියලු පැටවීම් ඉතා සමාන වන අතර එකම දිශාවලට යොමු වේ. මෙය න්යායෙන් අපේක්ෂා කළ දෙයම වන අතර එය පුදුමයක් නොවේ. කෙසේ වෙතත්, එය නිරීක්ෂණය කිරීම උපදේශාත්මක ය.
පීඑස්. එකම දත්ත කට්ටලයේ වඩා ලස්සන PCA ද්වීපදයක් සඳහා, answervqv විසින් මෙම පිළිතුර බලන්න .
පීපීඑස්. PCA ගණනය කිරීම් සම්මත වන අතර, FA ගණනය කිරීම් සඳහා අදහස් දැක්වීමක් අවශ්ය විය හැකිය. සාධක පැටවීම ගණනය කරනු ලැබුවේ අභිසාරී වන තෙක් (පුනරාවර්තන 9) “පුනරාවර්තන ප්රධාන සාධක” ඇල්ගොරිතමයක් මගිනි. පැටවීම් අභිසාරී වූ පසු, ලකුණු ගණනය කරනු ලැබුවේ බාට්ලට්ගේ ක්රමයෙනි. මෙය ප්රමිතිගත ලකුණු ලබා දෙයි; අදාළ සාධක විචල්යයන් (පැටවීමේ දිග අනුව) මම ඒවා පරිමාණය කළෙමි.
තාර්කික පියවරයන් තුළ විසිරුම් බිම් ආධාරයෙන් PCA එදිරිව සාධක විශ්ලේෂණය පිළිබඳ මූලික, නමුත් එක්තරා ආකාරයක වේදනාකාරී පැහැදිලි කිරීමක් . .
ඔබට දැනටමත් PCA පිළිබඳ අවබෝධයක් ඇතැයි සිතමි. දැන් පුනර්ජීවනය කිරීමට.
එම සංගුණක භ්රමණය වන කොසයින් (= දිශා කොසයින්, ප්රධාන දිශාවන්) වන අතර ඒවා ඊජෙන්වෙක්ටර් ලෙස හැඳින්වේ. සහසංයුජ අනුකෘතියේ සමාන අගයන් ප්රධාන සංරචක විචල්යයන් වේ. PCA හි, අපි සාමාන්යයෙන් දුර්වල අන්තිම සංරචක ඉවතලන්නෙමු: මේ අනුව අපි මුලින් උපුටා ගත් සංරචක කිහිපයකින් දත්ත සාරාංශගත කරමු.
Covariances
V1 V2
V1 1.07652 .73915
V2 .73915 .95534
----PCA----
Eigenvalues %
P1 1.75756 86.500
P2 .27430 13.500
Eigenvectors
P1 P2
V1 .73543 -.67761
V2 .67761 .73543
අපගේ සැලසුම් කළ දත්ත සමඟ, P1 = .73543*V1 + .67761*V2
අපි ඉවතලන P1 සංරචක අගයන් (ලකුණු) සහ P2 සංරචකය. P1 හි විචලතාව 1.75756
එම covariance න්යාසයක 1 eigenvalue, සහ P1 පැහැදිලි එසේ 86.5%
ම මුළු වන එක සමානයන් විචලනය(1.07652+.95534) = (1.75756+.27430)
.
දැන්, පීසීඒ හි ලක්ෂණය වන්නේ දත්තවල සෑම ලක්ෂ්යයක් සඳහාම අපි ඊ 1 සහ ඊ 2 ගණනය කර මෙම ඛණ්ඩාංක සැලසුම් කළහොත් - එනම් දෝෂවල විසිරීම පමණක් සිදු කළහොත් වලාකුළු “දෝෂ දත්ත” ඉවතලන සංරචකය වන පී 2 සමඟ සමපාත වේ. එය එසේ කරයි: වලාකුළු බීජ් වලාකුළට සමාන පින්තූරයක් මත සැලසුම් කර ඇත - තවද එය ඇත්ත වශයෙන්ම P2 සංරචක ලකුණු සමඟ ටයිල් කර ඇති පරිදි P2 අක්ෂය P2 ( රූපය 1 හි ) සාදයි .
පුදුමයක් නොවේ, ඔබ පැවසිය හැකිය. එය එතරම් පැහැදිලිය: PCA හි, ඉවතලන කනිෂ් component සංරචකය (ය) යනු අනාවැකි දෝෂ E හි නිශ්චිතවම දිරාපත් වන දෙයයි , ආකෘතියේ මුල් විචල්යයන් V පැහැදිලි කරන (ප්රතිෂ් ores ාපනය කරන) V හි ගුප්ත ලක්ෂණයෙන් (P). E දෝෂයන් එක්ව ඉතිරි වී ඇති සංරචක (ය) වලින් සමන්විත වේ. සාධක විශ්ලේෂණය කරන ස්ථානය මෙන්න PCA ට වඩා වෙනස් වීමට පටන් ගන්නා .
විධිමත් ලෙස, උපුටා ගත් ගුප්ත ලක්ෂණය (ය) මගින් මැනිෆෙස්ට් විචල්යයන් පුරෝකථනය කරන ආකෘතිය පීසීඒ හි මෙන් එෆ්ඒ හි සමාන වේ; [ Eq.3 ]:
මෙහි F යනු දත්ත වලින් උපුටා ගත් සහ Eq.2 හි P1 වූ දේ ප්රතිස්ථාපනය කිරීමේ ගුප්ත පොදු සාධකයයි . ආකෘතියේ වෙනස නම්, FA හි, PCA මෙන් නොව, දෝෂ විචල්යයන් (E1 සහ E2) එකිනෙකා සමඟ සම්බන්ධ නොවීම අවශ්ය වේ .
හරි, නැවත ත්රෙඩ් එකට යන්න. සාධක විශ්ලේෂණයේ දී E1 සහ E2 අතර සම්බන්ධයක් නොමැත; මේ අනුව, ඒවා වටකුරු හෝ ඉලිප්සාකාර දෝෂ සහිත වලාකුළක් සෑදිය යුතුය. පීසීඒ හි සිටියදී ඔවුන්ගේ වලාකුළ සෘජු රේඛාවක් ලෙස විකර්ණව ගමන් කරන පී 2 සමඟ සමපාත විය. මෙම අදහස් දෙකම පින්තූරයේ දැක්වේ:
FA හි දෝෂ වටකුරු (විකර්ණ ලෙස දිගටි නොවේ) බව සලකන්න. FA හි සාධකය (ගුප්ත) තරමක් වෙනස් වේ, එනම් PCA හි “ගුප්ත” වන පළමු ප්රධාන අංගය එය නිවැරදි නොවේ. පින්තූරයේ, සාධක රේඛාව අමුතු ලෙස කේතුකාකාර ය - අවසානයේ එය පැහැදිලි වනු ඇත.
PCA සහ FA අතර මෙම වෙනසෙහි තේරුම කුමක්ද? විචල්යයන් සහසම්බන්ධිත වන අතර එය දත්ත වලාකුළෙහි විකර්ණ ඉලිප්සාකාර හැඩයෙන් දැකිය හැකිය. P1 උපරිම විචල්යතාව මඟ හැරියේය, එබැවින් ඉලිප්සාකාරය P1 වෙත සම-යොමු කෙරේ. එහි ප්රති P ලයක් වශයෙන් සහසම්බන්ධය P1 විසින්ම පැහැදිලි කරන ලදී; නමුත් එය දැනට පවතින සහසම්බන්ධතා ප්රමාණය ප්රමාණවත් ලෙස පැහැදිලි කර නැත ; එය දත්ත ලක්ෂ්යවල විචලනය පැහැදිලි කිරීමට මිස සහසම්බන්ධතාවයට නොවේ. ඇත්ත වශයෙන්ම, එය සහසම්බන්ධය සඳහා අධික ලෙස ගණනය කර ඇති අතර, එහි ප්රති result ලය වූයේ අතිරික්ත ගිණුමට වන්දි ලබා දෙන විකර්ණ, සහසම්බන්ධිත දෝෂ වල පෙනුමයි. P1 ට පමණක් සහසම්බන්ධතාවයේ / සහසම්බන්ධතාවයේ ශක්තිය විස්තරාත්මකව පැහැදිලි කළ නොහැක. සාධකය එෆ් හැකිඑය තනිවම කරන්න; එය කිරීමට හැකි වූ විට ඇති වන කොන්දේසිය හරියටම වැරදි අතර සම්බන්ධයක් නොමැති වීමට බල කළ හැකි ස්ථානයයි. දෝෂ වලාකුළ වටකුරු බැවින් සාධකය උකහා ගැනීමෙන් පසුව සහසම්බන්ධතාවයක් - ධනාත්මක හෝ negative ණාත්මකව පවතී - එබැවින් එය සියල්ලම මඟ හැරුණු සාධකය එයයි.
මානයන් අඩු කිරීමක් ලෙස, PCA විචල්යතාවය පැහැදිලි කරන නමුත් සහසම්බන්ධතා නිශ්චිතවම පැහැදිලි කරයි. FA විසින් සහසම්බන්ධතා පැහැදිලි කරන නමුත් PCA ට හැකි තරම් දත්ත විචල්යතාවයන් (පොදු සාධක අනුව) ගණනය කළ නොහැක. FA හි ඇති සාධක (ය) විචල්යතාවයේ එම කොටස සඳහා වන අතර එය ශුද්ධ සහසම්බන්ධ කොටස වන අතර එය කොමියුනිස්ට් ලෙස හැඳින්වේ ; එම නිසා සාධක ආදාන විචල්යයන් සහසම්බන්ධතාවයට ගෙන ඒම සඳහා “ඇතුළත” හෝ “පිටුපස” සැඟවී ඇති සැබෑ නමුත් පාලනය කළ නොහැකි බලවේග / ලක්ෂණ / ගති ලක්ෂණ ලෙස අර්ථ දැක්විය හැකිය. ඔවුන් සහසම්බන්ධය ගණිතමය වශයෙන් හොඳින් පැහැදිලි කරන බැවිනි. ප්රධාන සංරචක (පළමු ඒවා ස්වල්පයක්) එය ගණිතමය වශයෙන් ද පැහැදිලි නොකරන අතර එය “ගුප්ත ගති ලක්ෂණ” (හෝ එවැනි) ලෙස හැඳින්විය හැක්කේ යම් දුරකට හා තාවකාලිකව පමණි .
පැටවීම් ගුණ කිරීම යනු සහසම්බන්ධය පැහැදිලි කරන (ප්රතිෂ් ores ාපනය) හෝ සහසම්බන්ධතාවයේ ස්වරූපයයි - විශ්ලේෂණය පදනම් වී ඇත්තේ සහසම්බන්ධිත අනුකෘතියට වඩා සහසම්බන්ධිත අනුකෘතිය මත නම් (උදාහරණ ලෙස). ලබා දුන් දත්ත සමඟ මා කළ සාධක විශ්ලේෂණය a_1=.87352, a_2=.84528
, එබැවින් නිෂ්පාදිතය a_1*a_2 = .73837
සහසංයුජයට සමාන වේ .73915
. අනෙක් අතට, පීසීඒ පැටවීම විය a1_1=.97497, a1_2=.89832
ඒ නිසා, a1_1*a1_2 = .87584
overestimates .73915
සැලකිය යුතු.
පීසීඒ සහ එෆ්ඒ අතර ඇති ප්රධාන න්යායාත්මක වෙනස පැහැදිලි කිරීමෙන් පසුව, අදහස නිදර්ශනය කිරීම සඳහා අපගේ දත්ත වෙත ආපසු යමු.
පහත දැක්වෙන්නේ අප විසින් තාවකාලිකව "උප ප්රශස්ත සාධක විශ්ලේෂණය" ලෙස හඳුන්වන විශ්ලේෂණයේ ප්රති results ල පෙන්වන විසිරුම් තලයයි , රූපය 3 .
A technical detail (you may skip): PAF method used for factor extraction.
Factor scores computed by Regression method.
Variance of the factor scores on the plot was scaled to the true
factor variance (sum of squared loadings).
සිට පිටත්වීම් බලන්න Fig.2 පීසීඒ ය. දෝෂ වල ලා දුඹුරු වලාකුළු වටකුරු නොවේ, එය විකර්ණ ඉලිප්සාකාරය, නමුත් එය පැහැදිලිවම PCA හි සිදුවී ඇති තුනී විකර්ණ රේඛාවට වඩා තරබාරු ය. දෝෂ සම්බන්ධක (සමහර කරුණු සඳහා පෙන්වා ඇත) තවදුරටත් සමාන්තර නොවන බව සලකන්න (PCA හි, ඒවා අර්ථ දැක්වීම අනුව P2 ට සමාන්තර විය). එපමනක් නොව, උදාහරණයක් ලෙස, සාධකයේ F අක්ෂයට සමමිතිකව කැඩපතක් වන "F" සහ "E" යන ස්ථාන දෙස බැලුවහොත්, අනපේක්ෂිත ලෙස ඒවායේ අනුරූප සාධක ලකුණු තරමක් වෙනස් අගයන් බව ඔබට පෙනී යනු ඇත. වෙනත් වචන වලින් කිවහොත්, සාධක ලකුණු යනු රේඛීයව පරිවර්තනය කරන ලද ප්රධාන සංරචක ලකුණු පමණක් නොවේ: F සාධකය P1 ක්රමයට වඩා වෙනස් ආකාරයකින් සොයාගත හැකිය. එම කුමන්ත්රණය මත එකට පෙන්වා ඇත නම් සහ ඔවුන්ගේ අක්ෂ සම්පූර්ණයෙන්ම තරමක් උස් නැහැ Fig.4 :
ඒ හැරුණු විට ඒවා තරමක් වෙනස් දිශානතියකින් යුක්ත වන අතර, එෆ් (ලකුණු සමඟ ටයිල් කර ඇති පරිදි) කෙටි වේ, එනම් එය P1 ගිණුම් වලට වඩා කුඩා විචල්යතාවයකට හේතු වේ. කලින් සඳහන් කළ පරිදි, සාධකය V1 V2 හි සහසම්බන්ධතාවයට වගකිව යුතු විචල්යතාවයට පමණක් හේතු වේ, එනම් විචල්යයන් ප්රාථමික සහසංයුජයේ 0
සිට තථ්ය සහසංයුජතාවයට ගෙන ඒමට ප්රමාණවත් වන සම්පූර්ණ විචල්යයේ කොටස..73915
.
ප්රශස්ත සාධක විසඳුමක් වන්නේ දෝෂ වටකුරු හෝ විකර්ණ නොවන ඉලිප්සාකාර වලාකුළු වන විට ය: E1 සහ E2 සම්පුර්ණයෙන්ම එකිනෙකට සම්බන්ධ නොවේ . සාධක විශ්ලේෂණය ඇත්ත වශයෙන්ම නැවත පැමිණේ එවැනි ප්රශස්ත විසඳුම. ඉහත සඳහන් කළ ආකාරයට සරල විසිරුම් ස්ථානයක මම එය පෙන්වූයේ නැත. ඇයි මම කළේ? - මන්ද එය වඩාත් සිත්ගන්නා සුළු දෙය වනු ඇත.
හේතුව, ත්රිමාණ කුමන්ත්රණයක් අනුගමනය කරමින් ප්රමාණවත් තරම් විසිරුම් ස්ථානයක පෙන්වීමට නොහැකි වීමයි. එය න්යායාත්මකව තරමක් සිත්ගන්නා කරුණකි. E1 සහ E2 මුළුමනින්ම එකිනෙකට සම්බන්ධ නොවන බවට පත් කිරීම සඳහා, F, E1, E2 යන විචල්යයන් තුනම V1, V2 මගින් අර්ථ දක්වා ඇති අවකාශයේ (තලය) නොපවතින බව පෙනේ ; හා තුන එකිනෙකා සමග uncorrelated කළ යුතුය . 5D හි එවැනි විසිරුම් ස්ථානයක් ඇඳිය හැකි යැයි මම විශ්වාස කරමි (සමහර විට සමහර ව්යායාම සමඟ - 4D වලින්), නමුත් අපි ජීවත් වන්නේ ත්රිමාණ ලෝකයේ, අහෝ. F සාධකය E1 සහ E2 යන දෙකටම සම්බන්ධ නොවිය යුතුය (ඒවා දෙකම එකිනෙකට සම්බන්ධ නොවන අතර) නිරීක්ෂණය කරන ලද දත්තවල එකම (පිරිසිදු) සහ සම්පූර්ණ සහසම්බන්ධතාවයේ ප්රභවය F විය යුතු බැවිනි . සාධක විශ්ලේෂණය සම්පූර්ණ විචලනය බෙදී යයි පිළිබඳp
ආදාන විචල්යයන් එකිනෙකට සම්බන්ධ නොවන (නොවර්වර්ලැපිං) කොටස් දෙකකට:කොමියුනිස්ට් කොටස ( m
-මානීය, m
පොදු සාධක පාලනය වන තැන) සහ අද්විතීය කොටස (p
-මානීය, දෝෂ ඇති තැන, අද්විතීය සාධක ලෙසද හැඳින්වේ, අන්යෝන්ය වශයෙන් එකිනෙකට සම්බන්ධ නොවන).
එබැවින් අපගේ දත්තවල සත්ය සාධකය විසිරුම් ස්ථානයක නොපෙන්වා සිටීම ගැන සමාව දෙන්න. මෙහි සිදු කර ඇති පරිදි "විෂය අවකාශයේ" දෛශික හරහා එය ප්රමාණවත් ලෙස දෘශ්යමාන කළ හැකියදත්ත ලක්ෂ්ය නොපෙන්වා .
වඩා, කොටසේ "පොදු FA (ගුප්ත ලක්ෂණය) අදහස" මම සාධකය සැබෑ සාධකය අක්ෂය බව අනතුරු ඇඟවීමට කිරීම සඳහා ප්රදර්ශනය (F අක්ෂය) විරසකයක් නඩත්තු කෙරෙන තැනට වගබලා ගැනීමත් ලෙස නොවේ යානය V1 V2 මත තැන්පත් කර ඇත. එයින් අදහස් වන්නේ - ප්රධාන සංරචක P1 ට ප්රතිවිරුද්ධව - සාධකය F අක්ෂය අක්ෂයේ භ්රමණය නොවන අතර ඒවායේ අවකාශයේ V1 හෝ V2 අක්ෂය භ්රමණය නොවන අතර F ලෙස විචල්යය V1 සහ V2 විචල්යයන්ගේ රේඛීය සංයෝජනයක් නොවේ . එබැවින් F ආදර්ශනය කර ඇත (විචල්යයන් V1 v2 වලින් උපුටා ගන්නා ලදි) පිටත ස්වාධීන විචල්යයක් මෙන් නොව ඒවා ව්යුත්පන්නයක් නොවේ. PCA ආරම්භ වන ස්ථානයේ සිට Eq.1 වැනි සමීකරණ සාධක විශ්ලේෂණයේ සත්ය (ප්රශස්ත) සාධකය ගණනය කිරීමට නුසුදුසු වන අතර විධිමත් සමාවයවික සමීකරණ Eq.2 සහ Eq.3විශ්ලේෂණයන් දෙකටම වලංගු වේ. එනම්, පීසීඒ විචල්යයන් මඟින් සංරචක ජනනය කරන අතර සංරචක විචල්යයන් පුරෝකථනය කරයි; FA සාධකය (න්) තුළ විචල්යයන් ජනනය කරයි / පුරෝකථනය කරයි, නමුත් පසුපසට නොවේ - පොදු සාධක ආකෘතිය සංකල්පමය වශයෙන් එසේ උපකල්පනය කරයි , නිරීක්ෂණය කරන ලද විචල්යයන්ගෙන් තාක්ෂණික සාධක උපුටා ගත්තද.
පමණක් නොව සැබෑ සාධකය, සතන්හි විචල්ය ශ්රිතයක් නොවන සැබෑ සාධකය ගේ වටිනාකම් ඇත , සුවිශේෂ අර්ථ දක්වා නැත . වෙනත් වචන වලින් කිවහොත්, ඒවා හුදෙක් නොදන්නා කරුණකි. ඒ සියල්ලටම හේතුව අප සිටින්නේ 5D අධික විශ්ලේෂණ අවකාශයේ මිස අපගේ නිවසේ දත්ත 2D අවකාශයේ නොවේ. සාධක සාධක ලෙස හැඳින්වෙන සත්ය සාධක අගයන් සඳහා හොඳ ඇස්තමේන්තු ( ක්රම ගණනාවක් පවතී ) පමණි , අප වෙනුවෙන් ඇත. සාධකයන්ගේ ලකුණු V1 V2 තලයෙහි පිහිටා ඇති අතර ප්රධාන සංරචක ලකුණු මෙන් ඒවා V1, V2 හි රේඛීය ශ්රිත ලෙස ගණනය කෙරේ. ඔවුන්මම "FA: ආසන්න විසඳුම (සාධක ලකුණු)" කොටසේ කුමන්ත්රණය කළෙමි. ප්රධාන සංරචක ලකුණු සත්ය සංරචක අගයන් වේ; සාධක ලකුණු යනු අවිනිශ්චිත සත්ය සාධක අගයන් සඳහා සාධාරණ ආසන්න කිරීමක් පමණි.
මේ අනුව, "FA: ආසන්න විසඳුම (සාධක ලකුණු)" කොටසේ මා විසින් පෙන්වන ලද "සාධක විසඳුම" සැබවින්ම පදනම් වූයේ ප්රශස්ත පැටවීම් මත ය, එනම් සත්ය සාධක මත ය. නමුත් ඉරණම අනුව ලකුණු ප්රශස්ත නොවීය. සංරචක ලකුණු මෙන් නිරීක්ෂණය කරන ලද විචල්යයන්ගේ රේඛීය ශ්රිතයක් ලෙස ලකුණු ගණනය කරනු ලැබේ, එබැවින් ඒවා දෙකම විසිරුම් තලයක සැසඳිය හැකි අතර මම එය කළේ පීසීඒ අදහසේ සිට එෆ්ඒ අදහස දෙසට ක්රමයෙන් සමත් වීමක් පෙන්වීමටය.
“සාධක අවකාශයේ” සාධක ලකුණු සහිත එකම ද්වීපාර්ශ්වික සාධක පැටවීමේදී කුමන්ත්රණය කිරීමේදී යමෙක් කල්පනාකාරී විය යුතුය , බර පැටවීම සත්ය සාධකවලට අදාළ වන අතර අනෙක් කරුණු සාධකවලට අදාළ වන අතර ( මෙම ත්රෙඩ් එකේ මෙම පිළිතුරට මගේ අදහස් බලන්න ).
සාධක භ්රමණය (පැටවීම) ගුප්ත ලක්ෂණ අර්ථ නිරූපණය කිරීමට උපකාරී වේ. සාධක විශ්ලේෂණය ලෙස ඔබ PCA භාවිතා කරන්නේ නම් පැටවීම් භ්රමණය කිරීම PCA හි ද කළ හැකිය (එනම්, PCA විචල්ය පුරෝකථනය ලෙස බලන්න). විචල්යයන් වර්ධනය වන විට PCA FA සමඟ ප්රති results ල සමඟ අභිසාරී වේ ( ප්රායෝගික හා සංකල්පීය සමානකම් සහ ක්රම දෙක අතර වෙනස්කම් පිළිබඳ අතිශයින් පොහොසත් නූල් බලන්න ). මෙම පිළිතුර අවසානයේ PCA සහ FA අතර මගේ වෙනස්කම් ලැයිස්තුව බලන්න . අයිරිස් දත්ත කට්ටලය පිළිබඳ PCA එදිරිව FA හි පියවරෙන් පියවර ගණනය කිරීම් මෙහි ඇත. මෙම නූලෙන් පිටත මාතෘකාව පිළිබඳ අනෙකුත් සහභාගිවන්නන්ගේ පිළිතුරු සමඟ සැලකිය යුතු හොඳ සම්බන්ධතා ප්රමාණයක් ඇත; මට කණගාටුයි මම වර්තමාන පිළිතුරේ ඒවායින් කිහිපයක් පමණක් භාවිතා කළෙමි.
PCA සහ FA අතර ඇති වෙනස්කම් පිළිබඳ වෙඩි උණ්ඩ ලැයිස්තුවක් ද මෙහි බලන්න .
සාධක විශ්ලේෂණය සහ ප්රධාන සංරචක විශ්ලේෂණය අතර වෙනස්කම්:
Factor සාධක විශ්ලේෂණයේ දී ව්යුහාත්මක ආකෘතියක් සහ සමහර උපකල්පන ඇත. මේ සම්බන්ධයෙන් ගත් කල එය තනිකරම ගණිතමය පරිවර්තනයක් වන ප්රධාන සංරචක විශ්ලේෂණයට අදාළ නොවන සංඛ්යාන තාක්ෂණයකි.
Component ප්රධාන සංරචක විශ්ලේෂණයේ පරමාර්ථය වන්නේ විචලනය පැහැදිලි කිරීම වන අතර සාධක විශ්ලේෂණය මඟින් විචල්යයන් අතර සහසම්බන්ධය පැහැදිලි කරයි.
මේ දෙක අතර ව්යාකූලත්වයට ඇති ලොකුම හේතුව වන්නේ සාධක විශ්ලේෂණයේ සාධක නිස්සාරණ ක්රමයක් "ප්රධාන සංරචක ක්රමය" ලෙස හැඳින්වීමයි. කෙසේ වෙතත්, පීසීඒ භාවිතා කිරීම එක් දෙයක් වන අතර එෆ්ඒ හි ප්රධාන සංරචක ක්රමය භාවිතා කිරීම තවත් දෙයකි . නම් සමාන විය හැකි නමුත් සැලකිය යුතු වෙනස්කම් තිබේ. පළමුවැන්න ස්වාධීන විශ්ලේෂණ ක්රමයක් වන අතර දෙවැන්න හුදෙක් සාධක නිස්සාරණය කිරීමේ මෙවලමකි.
මට (සහ මෙය ප්රයෝජනවත් යැයි මම විශ්වාස කරමි) සාධක විශ්ලේෂණය PCA ට වඩා බෙහෙවින් ප්රයෝජනවත් වේ.
සාධක විශ්ලේෂණය තුළින් පරිමාණයක් විශ්ලේෂණය කිරීමේ සතුට මෑතකදී මට ලැබුණි. මෙම පරිමාණය (එය කර්මාන්තයේ බහුලව භාවිතා වුවද) PCA භාවිතා කරමින් සංවර්ධනය කරන ලද අතර මගේ දැනුමට අනුව සාධක විශ්ලේෂණය කර නොමැත.
මම සාධක විශ්ලේෂණය සිදු කරන විට (ප්රධාන අක්ෂය) අයිතම තුනක් සඳහා වන වර්ගීකරණ 30% ට වඩා අඩු බව මම සොයා ගතිමි, එයින් අදහස් වන්නේ අයිතමවල විචල්යතාවයෙන් 70% කට වඩා විශ්ලේෂණය නොකිරීමයි. පීසීඒ දත්ත නව සංයෝජනයක් බවට පරිවර්තනය කරන අතර ජාතිවාදය ගැන තැකීමක් නොකරයි. මගේ නිගමනය වූයේ මනෝමිතික දෘෂ්ටි කෝණයකින් පරිමාණය එතරම් හොඳ එකක් නොවන අතර මම මෙය වෙනත් සාම්පලයකින් තහවුරු කර ඇත්තෙමි.
අත්යවශ්යයෙන්ම, ඔබට සාධක භාවිතා කිරීම ගැන අනාවැකි කීමට අවශ්ය නම්, PCA භාවිතා කරන්න, ඔබට ගුප්ත සාධක තේරුම් ගැනීමට අවශ්ය නම්, සාධක විශ්ලේෂණය භාවිතා කරන්න.
@ StatisticsDocConsulting හි පිළිතුර පුළුල් කිරීම: EFA සහ PCA අතර පැටවීමේ වෙනස සුළු විචල්යයන් සමඟ සුළුපටු නොවේ. මෙය R හි නිරූපණය කිරීම සඳහා අනුකරණ ශ්රිතයක් මෙන්න:
simtestit=function(Sample.Size=1000,n.Variables=3,n.Factors=1,Iterations=100)
{require(psych);X=list();x=matrix(NA,nrow=Sample.Size,ncol=n.Variables)
for(i in 1:Iterations){for(i in 1:n.Variables){x[,i]=rnorm(Sample.Size)}
X$PCA=append(X$PCA,mean(abs(principal(x,n.Factors)$loadings[,1])))
X$EFA=append(X$EFA,mean(abs(factanal(x,n.Factors)$loadings[,1])))};X}
Iterations
Sample.Size
Iterations
principal()
factanal()
කාර්යයන් සහ ඔබේ පරිගණකය.
මෙම කේතය භාවිතා කරමින්, දත්ත නිෂ්පාදනය කිරීම සඳහා මම පුනරාවර්තන 500 බැගින් විචල්ය 3–100 සාම්පල අනුකරණය කර ඇත:
Y=data.frame(n.Variables=3:100,Mean.PCA.Loading=rep(NA,98),Mean.EFA.Loading=rep(NA,98))
for(i in 3:100)
{X=simtestit(n.Variables=i,Iterations=500);Y[i-2,2]=mean(X$PCA);Y[i-2,3]=mean(X$EFA)}
... විචල්යයන් ගණනකට මධ්යන්ය පැටවීම් (විචල්යයන් සහ පුනරාවර්තන හරහා) සංවේදීතාවයේ කුමන්ත්රණයක් සඳහා:
ඇත්තෙන්ම හොඳ පෙළ පොතකින් උපුටා ගැනීමක් (බ්රවුන්, 2006, 22 පි. අවධාරණය එකතු කරන ලදි).
PCA = ප්රධාන සංරචක විශ්ලේෂණය
EFA = ගවේෂණාත්මක සාධක විශ්ලේෂණය
CFA = සනාථ කරන සාධක විශ්ලේෂණය
EFA හා සම්බන්ධ වුවද, ප්රධාන සංරචක විශ්ලේෂණය (PCA) නිතරම පොදු සාධක විශ්ලේෂණයේ තක්සේරු කිරීමේ ක්රමයක් ලෙස වැරදි ලෙස වර්ගීකරණය කර ඇත. පූර්ව ඡේදයේ (එම්එල්, පීඑෆ්) සාකච්ඡා කර ඇති ඇස්තමේන්තු මෙන් නොව, පීසීඒ පොදු සාධක ආකෘතිය මත පදනම් නොවන වෙනස් ප්රමාණාත්මක ක්රම සමූහයක් මත රඳා පවතී. PCA පොදු සහ අද්විතීය විචල්යතාවයන් වෙන් නොකරයි. ඒ වෙනුවට, PCA අරමුණු කරන්නේ ඒවා අතර ඇති සහසම්බන්ධතා පැහැදිලි කරනවාට වඩා නිරීක්ෂණය කරන ලද මිනුම්වල විචල්යතාවයට වගකිව යුතු බවයි. මේ අනුව, පසුකාලීන විශ්ලේෂණයන්හි දී භාවිතා කිරීම සඳහා විශාල මිනුම් මාලාවක් කුඩා, වඩා කළමනාකරණය කළ හැකි සංයුක්ත විචල්ය ගණනකට අඩු කිරීම සඳහා දත්ත අඩු කිරීමේ ක්රමවේදයක් ලෙස PCA වඩාත් උචිත ලෙස භාවිතා කරයි. කෙසේ වෙතත්, සමහර ක්රමවේද විද්යා PC යින් තර්ක කර ඇත්තේ පීසීඒ යනු ඊඑෆ්ඒ සඳහා සාධාරණ හෝ සමහර විට වඩා උසස් විකල්පයක් බවයි, PCA සතුව ප්රියජනක සංඛ්යානමය ගුණාංග කිහිපයක් ඇති බව සලකන විට (උදා: පරිගණකමය වශයෙන් සරල, නුසුදුසු විසඳුම් වලට ගොදුරු නොවන, බොහෝ විට EFA හි ප්රති results ල වලට සමාන ප්රති results ල ලබා දෙයි, ප්රධාන අංගයක් මත සහභාගිවන්නාගේ ලකුණු ගණනය කිරීමට PCA සතු හැකියාව සහ අවිනිශ්චිත ස්වභාවය EFA එවැනි ගණනය කිරීම් සංකීර්ණ කරයි). මෙම ප්රශ්නය පිළිබඳ විවාදය දිගටම පැවතුනද, ෆැබ්රිගර් සහ වෙනත් අය. (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). බොහෝ විට EFA හි ප්රති results ල වලට සමාන ප්රති results ල ලබා දෙයි, ප්රධාන අංගයක් මත සහභාගිවන්නාගේ ලකුණු ගණනය කිරීමට PCA සතු හැකියාව, EFA හි අවිනිශ්චිත ස්වභාවය එවැනි ගණනය කිරීම් සංකීර්ණ කරයි). මෙම ප්රශ්නය පිළිබඳ විවාදය දිගටම පැවතුනද, ෆැබ්රිගර් සහ වෙනත් අය. (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). බොහෝ විට EFA හි ප්රති results ල වලට සමාන ප්රති results ල ලබා දෙයි, ප්රධාන අංගයක් මත සහභාගිවන්නාගේ ලකුණු ගණනය කිරීමට PCA සතු හැකියාව, EFA හි අවිනිශ්චිත ස්වභාවය එවැනි ගණනය කිරීම් සංකීර්ණ කරයි). මෙම ප්රශ්නය පිළිබඳ විවාදය දිගටම පැවතුනද, ෆැබ්රිගර් සහ වෙනත් අය. (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993). (1999) සාධක විශ්ලේෂණයේ දී PCA හි ස්ථානය සඳහා වන තර්කයට විරුද්ධ හේතු කිහිපයක් සපයයි. මෙම කතුවරුන් EFA සහ PCA එකිනෙකට වෙනස් ප්රති results ල ලබා දෙන අවස්ථා අවධාරනය කරයි; උදාහරණයක් ලෙස, ජාතිවාදය අඩු වූ විට හෝ දී ඇති සාධකය පිළිබඳ දර්ශක කිහිපයක් පමණක් ඇති විට (cf. විදාමන්, 1993).කෙසේ වෙතත්, විශ්ලේෂණයක අභිබවා යන තාර්කික හා ආනුභවික අරමුණු පොදු සාධක ආකෘතියට අනුකූල නම්, එය PCA පැවැත්වීම සංකල්පමය හා ගණිතමය වශයෙන් නොගැලපේ; එනම්, නිරීක්ෂණය කරන ලද මිනුම්වල මිනුම් දෝෂයක් පවතින බව හඳුනාගෙන, ගුප්ත මානයන් කුඩා සංඛ්යාවක් සහිත දර්ශක සමූහයක අන්තර් සම්බන්ධතා ප්රතිනිෂ්පාදනය කිරීම ප්රකාශිත පරමාර්ථය නම් EFA වඩාත් යෝග්ය වේ.ෆ්ලොයිඩ් සහ විඩාමාන් (1995), පීසීඒ වෙතින් ලබාගත් ඒවාට වඩා ඊඑෆ්ඒ මත පදනම් වූ ඇස්තමේන්තු සීඑෆ්ඒ වෙත සාමාන්යකරණය කිරීමට වැඩි ඉඩක් ඇති බව සඳහන් කරයි. පීසීඒ මෙන් නොව ඊඑෆ්ඒ සහ සීඑෆ්ඒ පොදු සාධක ආකෘතිය මත පදනම් වේ. පරිමාණ සංවර්ධනය හා වලංගු කිරීම සඳහා සටන් විරාම ගිවිසුම සඳහා පුර්වගාමියෙකු ලෙස EFA බොහෝ විට භාවිතා කරනු ලැබේ යන කාරණය සැලකිල්ලට ගනිමින් මෙය සැලකිය යුතු කරුණකි. PCA සහ EFA අතර ඇති පරිගණකමය වෙනස්කම් පිළිබඳ සවිස්තරාත්මක නිරූපණයක් බහුකාර්ය සහ සාධක විශ්ලේෂණ පෙළපොත් වලින් සොයාගත හැකිය (උදා: ටබච්නික් සහ ෆිදෙල්, 2001).
බ්රවුන්, ටීඒ (2006). ව්යවහාරික පර්යේෂණ සඳහා තහවුරු කිරීමේ සාධක විශ්ලේෂණය. නිව් යෝර්ක්: ගිල්ෆර්ඩ් ප්රෙස්.
PCA එකක් FAA එකක් ලෙස කෙනෙකුට සිතිය හැකිය, එහිදී සියලු විචල්යයන් සඳහා වර්ග 1 ට සමාන යැයි උපකල්පනය කෙරේ. ප්රායෝගිකව, මෙයින් අදහස් කරන්නේ අඩු ජනවාර්ගිකත්වය හේතුවෙන් FA හි සාපේක්ෂව අඩු සාධක පැටවීමක් ඇති අයිතමවලට PCA හි වැඩි පැටවීමක් ඇති බවයි. විශ්ලේෂණයේ මූලික පරමාර්ථය වන්නේ අයිතමයේ දිග කපා අඩු හෝ අඩු බරක් ඇති අයගේ බැටරියක් පිරිසිදු කිරීම හෝ අයිතම සංචිතයේ හොඳින් නිරූපණය නොවන සංකල්ප හඳුනා ගැනීම නම් මෙය යෝග්ය අංගයක් නොවේ.
ටිපින් සහ බිස්චොප් විසින් රචිත ලිපියක ප්රොබබලිස්ටික් පීසීඒ (පීපීසීඒ) සහ සාධක විශ්ලේෂණය අතර ඇති දැඩි සම්බන්ධතාවය සාකච්ඡා කෙරේ. පීපීසීඒ සම්භාව්ය පීසීඒ වලට වඩා FA ට වඩා සමීප ය. පොදු ආකෘතිය වන්නේ
මයිකල් ඊ. ටිපින්, ක්රිස්ටෝපර් එම්. බිෂොප් (1999). සම්භාවිතා ප්රධාන සංරචක විශ්ලේෂණය , රාජකීය සංඛ්යාන සංගමයේ ජර්නලය, 61 වන වෙළුම, 3 කලාපය, පිටු 611–622
මෙම ප්රතිචාර කිසිවක් පරිපූර්ණ නොවේ. එක්කෝ FA හෝ PCA සමහර ප්රභේද ඇත. කුමන ප්රභේද සංසන්දනය කර ඇත්දැයි අප පැහැදිලිව පෙන්වා දිය යුතුය. මම උපරිම සම්භාවිතා සාධක විශ්ලේෂණය සහ හොටෙලිං හි පීසීඒ සංසන්දනය කරමි. ගුප්ත විචල්යය සාමාන්ය ව්යාප්තියක් අනුගමනය කරන බව කලින් උපකල්පනය කළ නමුත් PCA ට එවැනි උපකල්පනයක් නොමැත. මෙය විසඳුම, සංරචක කැදැල්ල, විසඳුමේ අද්විතීයභාවය, ප්රශස්තිකරණ ඇල්ගොරිතම වැනි වෙනස්කම් වලට තුඩු දී ඇත.
මෙම තනතුර සඳහා හොඳ පිළිතුරු රාශියක් ඇති නමුත් මෑතකදී මට තවත් වෙනසක් හමු විය.
පොකුරුකරණය යනු PCA සහ FA විවිධ ප්රති .ල ලබා දෙන එක් යෙදුමකි. දත්තවල බොහෝ විශේෂාංග ඇති විට, ඉහළ පළාත් සභා දිශාවන් සොයා ගැනීමට සහ මෙම පළාත් සභා වල දත්ත ප්රක්ෂේපණය කිරීමට යමෙකු උත්සාහ කළ හැකිය, පසුව පොකුරුකරණය සමඟ ඉදිරියට යන්න. බොහෝ විට මෙය දත්තවල ආවේනික පොකුරු වලට බාධා කරයි - මෙය හොඳින් ඔප්පු වූ ප්රති .ලයකි. පර්යේෂකයෝ යෝජනා කරන්නේ උප-අභ්යවකාශ පොකුරු ක්රම සමඟ ඉදිරියට යාමටයි, එමඟින් ආකෘතියේ අඩු මානයන්හි ගුප්ත සාධක සොයා බලයි.
මෙම වෙනස නිදර්ශනය කිරීම Crabs
සඳහා ආර්. කකුළුවන්ගේ දත්ත කට්ටලය පේළි 200 ක් සහ තීරු 8 ක් ඇති අතර, කකුළුවන් 50 ක් මත රූප විද්යාත්මක මිනුම් 5 ක් විස්තර කරයි. කකුළුවන්.
library(MASS)
data(crabs)
lbl <- rep(1:4,each=50)
pc <- princomp(crabs[,4:8])
plot(pc) # produce the scree plot
X <- as.matrix(crabs[,4:8]) %*% pc$loadings
library(mclust)
res_12 <- Mclust(X[,1:2],G=4)
plot(res_12)
res_23 <- Mclust(X[,2:3],G=4)
plot(res_23)
PC1 සහ PC2 භාවිතා කරමින් පොකුරුකරණය:
PC2 සහ PC3 භාවිතා කරමින් පොකුරුකරණය:
#using PC1 and PC2:
1 2 3 4
1 12 46 24 5
2 36 0 2 0
3 2 1 24 0
4 0 3 0 45
#using PC2 and PC3:
1 2 3 4
1 36 0 0 0
2 13 48 0 0
3 0 1 0 48
4 1 1 50 2
ඉහත බිම් කැබලි වලින් අපට දැකිය හැකි පරිදි, PC2 සහ PC3 PC1 වලට වඩා වෙනස් වෙනස්කම් සහිත තොරතුරු රැගෙන යයි.
සාධක විශ්ලේෂක මිශ්රණයක් භාවිතා කරමින් ගුප්ත සාධක භාවිතා කරමින් යමෙකු පොකුරු කිරීමට උත්සාහ කරන්නේ නම්, පළමු පළාත් සභා දෙක භාවිතා කිරීමට සාපේක්ෂව වඩා හොඳ ප්රති result ලයක් අපට පෙනේ.
mfa_model <- mfa(y, g = 4, q = 2)
|............................................................| 100%
table(mfa_model$clust,c(rep(1,50),rep(2,50),rep(3,50),rep(4,50)))
1 2 3 4
1 0 0 0 45
2 16 50 0 0
3 34 0 0 0
4 0 0 50 5