සහසම්බන්ධය හෝ සහසංයුජතාව පිළිබඳ PCA?


162

සහසම්බන්ධිත අනුකෘතිය සහ සහසංයුජ අනුකෘතිය මත ප්‍රධාන සංරචක විශ්ලේෂණය (පීසීඒ) සිදු කිරීම අතර ඇති ප්‍රධාන වෙනස්කම් මොනවාද? ඔවුන් එකම ප්‍රති results ල ලබා දෙනවාද?


2
ප්‍රමාද වූ පිළිතුරක්, නමුත් ලියොන්හි ජෛව තොරතුරු තාක්ෂණ දෙපාර්තමේන්තුවේ බහුකාර්ය දත්ත විශ්ලේෂණය "à ලා ෆ්‍රැන්චයිස්" පිළිබඳ ඉතා ප්‍රයෝජනවත් අත්පත්‍රිකා ඔබට සොයාගත හැකිය . මේවා පැමිණෙන්නේ R ade4 පැකේජයේ කතුවරුන්ගෙනි . එය ප්‍රංශ භාෂාවෙන් වුවද.
chl

4
අමතර සාකච්ඡාව සඳහා කරුණාකර stats.stackexchange.com/questions/62677/… වෙත පිවිසෙන්න .
whuber

Answers:


138

විචල්‍ය පරිමාණයන් සමාන වන විට සහ විචල්‍යයන් විවිධ පරිමාණයන්හි ඇති විට සහසම්බන්ධිත අනුකෘතිය භාවිතා කිරීමට ඔබ නැඹුරු වේ.

සහසම්බන්ධිත අනුකෘතිය භාවිතා කිරීම එක් එක් විචල්‍යයන් ප්‍රමිතිකරණයට සමාන වේ (අර්ථය 0 සහ සම්මත අපගමනය 1). පොදුවේ ගත් කල, ප්‍රමිතිකරණයෙන් හා රහිතව PCA විවිධ ප්‍රති .ල ලබා දෙනු ඇත. විශේෂයෙන් කොරපොතු වෙනස් වන විට.

උදාහරණයක් ලෙස, මෙම R heptathlonදත්ත කට්ටලය දෙස බලන්න . සමහර විචල්‍යයන්ගේ සාමාන්‍ය අගය 1.8 ක් පමණ (උස පැනීම) වන අතර අනෙක් විචල්‍යයන් (මීටර 800 ධාවනය) 120 ක් පමණ වේ.

library(HSAUR)
heptathlon[,-8]      # look at heptathlon data (excluding 'score' variable)

මෙම ප්‍රතිදානයන්:

                   hurdles highjump  shot run200m longjump javelin run800m
Joyner-Kersee (USA)   12.69     1.86 15.80   22.56     7.27   45.66  128.51
John (GDR)            12.85     1.80 16.23   23.65     6.71   42.56  126.12
Behmer (GDR)          13.20     1.83 14.20   23.10     6.68   44.54  124.20
Sablovskaite (URS)    13.61     1.80 15.23   23.92     6.25   42.78  132.24
Choubenkova (URS)     13.51     1.74 14.76   23.93     6.32   47.46  127.90
...

දැන් අපි පීසීඒ සහසංයුජතාව සහ සහසම්බන්ධය මත කරමු:

# scale=T bases the PCA on the correlation matrix
hep.PC.cor = prcomp(heptathlon[,-8], scale=TRUE)
hep.PC.cov = prcomp(heptathlon[,-8], scale=FALSE)

biplot(hep.PC.cov)
biplot(hep.PC.cor)  

සහසම්බන්ධය හෝ සහසංයුජතාව පිළිබඳ PCA

සහසංයුජතාව පිළිබඳ PCA ආධිපත්‍යය දරන්නේ run800mසහ javelin: PC1 බොහෝ දුරට සමාන වේ run800m(සහ විචල්‍යතාවයෙන් 82% පැහැදිලි කරයි ) සහ PC2 බොහෝ දුරට සමාන වේ javelin(එකට ඔවුන් 97% පැහැදිලි කරයි ). සහසම්බන්ධය පිළිබඳ PCA වඩා තොරතුරු සහගත වන අතර දත්ත හා විචල්‍යයන් අතර සම්බන්ධතාවයේ යම් ව්‍යුහයක් හෙළි කරයි (නමුත් පැහැදිලි කරන ලද විචල්‍යයන් 64% සහ 71% දක්වා පහත වැටෙන බව සලකන්න ).

සහසංයුජ හෝ සහසම්බන්ධිත අනුකෘතිය භාවිතා කරන්නේද යන්න නොසලකා බාහිර පුද්ගලයින් ( මෙම දත්ත කට්ටලයේ) පිටස්තරයින් බව සලකන්න .


මම පළමුව විචල්යයන් z- ලකුණු බවට පරිවර්තනය කළහොත් තත්වය කුමක්ද?
ජිර්කා-x1

9
Ir ජිර්කා-එක්ස් 1 ප්‍රමිතිගත විචල්‍යයන්ගේ (එනම් z ලකුණු) සහසංයුජ අනුකෘතිය සහසම්බන්ධිත අනුකෘතියට සමාන වේ.
ඇලෙක්සිස්

Lex ඇලෙක්සිස් එබැවින් ප්‍රමිතිගත විචල්‍යයන්ගේ සහසංයුජ අනුකෘතිය ප්‍රමිතිගත විචල්‍යයන්ගේ සහසම්බන්ධිත අනුකෘතියට සමාන බව අනුමාන කළ හැකිද?
jb

1
සම්මත දත්ත සඳහා am ජේමිබුලොක් ( කෝවරියන්ස් න්‍යාසය) = ආර් (සහසම්බන්ධිත අනුකෘතිය). R = R දත්ත ප්‍රමිතිගත වුවත් නැතත් (සහසම්බන්ධය දත්තවල රේඛීය පරිවර්තනයන්ට සංවේදී නොවේ. එබැවින්, උදාහරණයක් ලෙස, ඔබට X සහ Y තිබේ නම් සහ ඒවා r X Y සමඟ සහසම්බන්ධ වේ නම්, X = a X + b සහ Y * = වන Y + X * හා Y * සමග ද Correlate r X YΣRR=RXYrXYX=aX+bY=aY+b XYrXY).
ඇලෙක්සිස්

එක් වැදගත් දැනුම්දීමක්: ඔබේ PCA හි සහසංයුජතාව භාවිතා කරන විට, ඔබේ පළාත් සභා එකිනෙකා අතර සහසම්බන්ධ නොවනු ඇත, එය සහසම්බන්ධය මත පදනම් වූ PCA සඳහා සත්‍ය නොවේ. බහු විචල්‍ය රේඛා පැහැදිලි කිරීමේ විචල්‍ය සමූහයක ප්‍රතිගාමී වීමට පෙර PCA සිදු කිරීමට අදහස් කරන විට මෙය විශේෂයෙන් වැදගත් වේ. කෙසේ වෙතත් මේ පිටුපස ඇති න්‍යාය පැහැදිලි නැත. මෙම වෙනස පිළිබඳව යමෙකුට යම් ආලෝකයක් හෙළි කළ හැකිද?
ouranos

56

බහුපාර්ශවීය විශ්ලේෂණයන් හඳුන්වා දෙමින් බර්නාඩ් ෆ්ලූරි සිය විශිෂ්ට ග්‍රන්ථයේ මෙය ප්‍රධාන සංරචකවල දේපල විරෝධී ක්‍රියාවක් ලෙස විස්තර කළේය. සහසම්බන්ධය හෝ සහසම්බන්ධය අතර තෝරා ගැනීමට වඩා එය ඇත්තෙන්ම නරක ය. ඔබ ඒකක වෙනස් කළහොත් (උදා: එක්සත් ජනපද විලාසිතාවේ ගැලුම්, අඟල් ආදිය සහ යුරෝපා සංගම් විලාසිතාවේ ලීටර්, සෙන්ටිමීටර) ඔබට දත්තවල සැලකිය යුතු වෙනස් ප්‍රක්ෂේපණයක් ලැබෙනු ඇත.

සහසම්බන්ධිත අනුකෘති ස්වයංක්‍රීයව භාවිතා කිරීමට එරෙහි තර්කය නම්, එය ඔබේ දත්ත ප්‍රමිතිකරණය කිරීමේ තරමක් ම්ලේච්ඡ ක්‍රමයකි. එම හෙප්තතලෝන් දත්ත සමඟ ඉතා පැහැදිලිව පෙනෙන කෝවරියන්ස් න්‍යාසය ස්වයංක්‍රීයව භාවිතා කිරීමේ ගැටළුව නම්, ඉහළම විචල්‍යතාවයෙන් යුත් විචල්‍යයන් පළමු ප්‍රධාන සංරචකය (දේපල උපරිම කරන විචල්‍යතාව) ආධිපත්‍යය දරනු ඇත.

එබැවින් භාවිතා කිරීමට ඇති “හොඳම” ක්‍රමය පදනම් වී ඇත්තේ ආත්මීය තේරීමක්, ප්‍රවේශමෙන් සිතා බැලීම සහ යම් අත්දැකීම් මත ය.


47

UNTRANSFORMED (RAW) දත්ත: ඔබට අමු, පරිවර්තනය නොකළ දත්ත සඳහා පුළුල් ලෙස වෙනස් වන පරිමාණයන් සහිත විචල්‍යයන් තිබේ නම්, එනම්, දිනකට කැලරි ප්‍රමාණය, ජාන ප්‍රකාශනය, ug / dl, ng / dl ඒකකවල ELISA / Luminex, ඇණවුම් කිහිපයක් මත පදනම්ව ප්‍රෝටීන් ප්‍රකාශනයේ විශාලත්වය, පසුව සහසම්බන්ධය PCA වෙත ආදානයක් ලෙස භාවිතා කරන්න. කෙසේ වෙතත්, ඔබගේ සියලු දත්ත පදනම් වී ඇත්තේ සමාන පරාසයකින් හා පරිමාණයකින් එකම වේදිකාවක සිට ජාන ප්‍රකාශනය මත නම්, හෝ ඔබ ලොග් කොටස් වත්කම් ප්‍රතිලාභ සමඟ වැඩ කරන්නේ නම්, සහසම්බන්ධය භාවිතා කිරීමෙන් විශාල තොරතුරු ප්‍රමාණයක් ඉවතට යනු ඇත.

RCCR10010C1R

ZC

RC

(P<0.05)n=100

  1. Ri=1,2,,100.
  2. pcti=Ri/(n+1)
  3. N(0,1)ZZi=Φ1(pcti)

pcti1.96=Φ1(0.025)pcti=0.9751.96=Φ1(0.975)

VDW ලකුණු භාවිතා කිරීම ජාන විද්‍යාවේ ඉතා ජනප්‍රිය වන අතර එහිදී බොහෝ විචල්‍යයන් VDW ලකුණු බවට පරිවර්තනය වන අතර පසුව විශ්ලේෂණයට ඇතුළත් වේ. VDW ලකුණු භාවිතා කිරීමේ වාසිය නම්, ස්කයිනස් සහ පිටස්තර බලපෑම් දත්ත වලින් ඉවත් කර ඇති අතර, ඉලක්කය සාමාන්‍ය තත්වයේ ප්‍රතිවිරෝධතා යටතේ විශ්ලේෂණයක් සිදු කිරීම නම් එය භාවිතා කළ හැකිය - තවද සෑම විචල්‍යයක්ම කිසිදු ප්‍රමිතියකින් තොරව බෙදා හැරිය යුතුය. හෝ පිටස්තරයින්.


7
මෙය මෙහි වඩාත්ම සංවේදී පිළිතුර වන අතර, එය ඇත්ත වශයෙන්ම නිසි මතයක් ලබා දෙන බැවින් සුදුසු අවස්ථාවන්හිදී සහසංයුජතාව ජය ගනී. හැකි නම් සහස්‍යතාවයට වැඩි කැමැත්තක් දැක්විය යුත්තේ මන්ද යන්න පිළිබඳව දැඩි පදනමක් ලබා නොදී මෙහි සහ වෙනත් තැන්වල බොහෝ පිළිතුරු සුපුරුදු “එය රඳා පවතී” යනුවෙන් සඳහන් කරයි . මෙන්න ලෙප් කරන්නේ: සහසම්බන්ධය මගින් සිදුකරන කිසිදු තොරතුරක් සහසම්බන්ධය ඉවත් නොකරයි. කොටස් දත්ත උදාහරණයක් හොඳ එකක්: ඉහළ බීටා තොග ඇත්තෙන්ම ඉහළ පැටවීම ඇත නමුත් ඔවුන් බොහෝ විට කළ යුත්තේ , හුදෙක් තවත් අස්ථාවර බව ඕනෑම විශ්ලේෂණය ඕනෑම අංගයක් වැනි සාමාන්යයෙන් වැඩි (හේතුව තුළ) අපූරු ය.
තෝමස් බ්‍රවුන්

3
ඇත්ත වශයෙන්ම ඉහළ විචල්‍යතාවය විශ්ලේෂණයේ සිත්ගන්නා සුළු පැතිකඩක් ද නැද්ද යන්න පිළිබඳ ගැටලුව විශ්ලේෂණය කළ යුතුය. එය එසේ නොවේ නම්, ඇත්ත වශයෙන්ම සහසම්බන්ධය වඩා හොඳ වන අතර ඒකක වෙනස් නම් එය අනිවාර්යයෙන්ම දරයි.
තෝමස් බ්‍රවුන්

නියම පිළිතුර +1. මූල්‍යයේ බැඳුම්කර ields ලදාව පිළිබඳ කාලීන ව්‍යුහ විශ්ලේෂණය සඳහා PCA යෙදීම තවත් එක් උදාහරණයක් විය හැකි යැයි මම සිතමි. විවිධ පරිණතභාවයන්හි අස්වැන්නෙහි විචල්‍යතාවයන් වෙනස් වේ, නමුත් ඒවා සියල්ලම අස්වැන්න බැවින්, වෙනස් වන පරිමාණයන් සාමාන්‍යයෙන් පිළිගත නොහැකි තරම් පුළුල් නොවේ. ඇත්ත වශයෙන්ම, ඇතැම් පරිණත අස්වැන්නෙහි වැඩි / අඩු අස්ථාවරත්වය පොහොසත් තොරතුරු සපයයි.
නිකලස්

13

පොදු පිළිතුරක් නම්, විචල්‍යයන් එකම පරිමාණයෙන් පවතින විට සහසංයුජතාව භාවිතා වන බව යෝජනා කිරීම සහ ඒවායේ පරිමාණයන් වෙනස් වන විට සහසම්බන්ධය. කෙසේ වෙතත්, මෙය සත්‍ය වන්නේ විචල්‍යයන්ගේ පරිමාණය සාධකයක් නොවන විට පමණි. එසේ නොමැති නම්, කිසිවෙකු කවදා හෝ සහසම්බන්ධිත PCA කරන්නේ ඇයි? සෑම විටම සහසම්බන්ධතා PCA සිදු කිරීම වඩා ආරක්ෂිත වේ.

ඔබේ විචල්‍යයන්ට මීටර සහ කිලෝග්‍රෑම් වැනි විවිධ මිනුම් ඒකක ඇති බව සිතන්න. මෙම අවස්ථාවේදී ඔබ මීටර හෝ සෙන්ටිමීටර භාවිතා කරන්නේද යන්න ගැටළුවක් නොවිය යුතුය, එබැවින් සහසම්බන්ධිත අනුකෘතිය භාවිතා කළ යුතු යැයි ඔබට තර්ක කළ හැකිය.

දැන් විවිධ ප්‍රාන්තවල ජනගහනය සලකා බලන්න. මිනුම් ඒකක සමාන වේ - මිනිසුන්ගේ ගණන් (අංකය). දැන්, පරිමාණයන් වෙනස් විය හැකිය: DC සතුව 600K සහ CA - 38M පුද්ගලයින් සිටී. අප මෙහි සහසම්බන්ධිත අනුකෘතිය භාවිතා කළ යුතුද? එය රඳා පවතියි. සමහර යෙදුම් වලදී අපට අවශ්‍ය වන්නේ රාජ්‍යයේ ප්‍රමාණය අනුව සකස් කිරීමයි. සහසංයුජ අනුකෘතිය භාවිතා කිරීම රාජ්‍යයේ ප්‍රමාණයට හේතු වන සාධක ගොඩනැගීම සඳහා එක් ක්‍රමයකි.

එබැවින් මගේ පිළිතුර නම් මුල් විචල්‍යයේ විචල්‍යතාවය වැදගත් වන විට සහසංයුජ අනුකෘතිය භාවිතා කිරීම සහ එය නොමැති විට සහසම්බන්ධය භාවිතා කිරීමයි.


2

මෙම විකල්පයන් උපරිම සම්භාවිතාවයේ ප්‍රධාන සංරචක විශ්ලේෂණ ආකෘතිය (එම්එල්පීසීඒ) [1,2] අනුව සාකච්ඡා කිරීම මට පෞද්ගලිකව ඉතා වටිනවා. එම්එල්පීසීඒ හි එක් පරිමාණයක් (හෝ භ්‍රමණය) අදාළ වේ, එනම් මනින ලද විචල්‍යයන්හි මිනුම් දෝෂ ස්වාධීන වන අතර සම්මත සාමාන්‍ය බෙදාහැරීම අනුව බෙදා හරිනු ලැබේ. මෙම පරිමාණය උපරිම සම්භාවිතා පරිමාණය (MALS) ලෙසද හැඳින්වේ [3]. සමහර අවස්ථාවලදී, PCA ආකෘතිය සහ MALS පරිමාණය / භ්‍රමණය නිර්වචනය කරන පරාමිතිය එකට තක්සේරු කළ හැකිය [4].

සහසම්බන්ධය මත පදනම් වූ සහ සහසංයුජතාව මත පදනම් වූ පීසීඒ අර්ථ නිරූපණය කිරීම සඳහා යමෙකුට මෙසේ තර්ක කළ හැකිය:

  1. මිනුම් දෝෂවල විචල්‍ය-සහසංයුජ අනුකෘතිය එහි විකර්ණයේ සමාන මූලද්‍රව්‍ය සමඟ විකර්ණ ලෙස උපකල්පනය කළ විට කෝවරියන්ස් මත පදනම් වූ PCA MLPCA ට සමාන වේ. සම්භාවිතා ප්‍රධාන සංරචක විශ්ලේෂණය (පීපීසීඒ) ආකෘතිය [5] යෙදීමෙන් මිනුම් දෝෂ විචල්‍යතා පරාමිතිය තක්සේරු කළ හැකිය. මම අධ්‍යයනය කර ඇති අවස්ථා කිහිපයකදී මෙය සාධාරණ උපකල්පනයක් ලෙස මම දකිමි, විශේෂයෙන් සියලු මිනුම් එකම වර්ගයේ විචල්‍යතාවයකින් යුක්ත වන විට (උදා: සියලු ප්‍රවාහ, සියලු උෂ්ණත්ව, සියලු සාන්ද්‍රණ හෝ සියලු අවශෝෂණ මිනුම්). ඇත්ත වශයෙන්ම, එවැනි විචල්යයන් සඳහා මිනුම් දෝෂ ස්වාධීනව හා සමානව බෙදා හරිනු ඇතැයි උපකල්පනය කිරීම ආරක්ෂිත විය හැකිය.
  2. සහසම්බන්ධතා මත පදනම් වූ PCA, මිනුම් දෝෂවල විචල්‍ය-සහසංයුජ අනුකෘතිය විකර්ණ ලෙස උපකල්පනය කරන සෑම අවස්ථාවකම විකර්ණ සමානුපාතිකව අනුරූපී මනින ලද විචල්‍යයේ සමස්ත විචල්‍යතාවයට සමානුපාතික වේ. මෙය ජනප්‍රිය ක්‍රමයක් වන අතර, මම අධ්‍යයනය කරන බොහෝ අවස්ථාවන්හි සමානුපාතික උපකල්පනය අසාධාරණ යැයි මම පෞද්ගලිකව සොයා ගතිමි. ප්‍රති consequ ලයක් ලෙස, මෙයින් අදහස් කරන්නේ සහසම්බන්ධය මත පදනම් වූ පීසීඒ එම්එල්පීසීඒ ආකෘතියක් ලෙස අර්ථ නිරූපණය කළ නොහැකි බවයි. (1) සහසංයුජ මත පදනම් වූ පීසීඒ හි උපකල්පන අදාළ නොවන අවස්ථාවන්හිදී සහ (2) එම්එල්පීසීඒ අර්ථ නිරූපණය ඉතා වටිනා නම්, ඒ වෙනුවට එම්එල්පීසීඒ ක්‍රමයක් භාවිතා කිරීමට මම නිර්දේශ කරමි [1-4].
  3. සහසම්බන්ධය මත පදනම් වූ සහ සහසංයුජතාව මත පදනම් වූ පීසීඒ විසින් එකම ප්‍රති results ල ලබා දෙනු ඇත - පරිමාණ ගුණකය වෙතින් කොටස - එක් එක් විචල්‍යය සඳහා වන තනි විචල්‍යයන් සියල්ලම එකිනෙකට හරියටම සමාන වන විට. මෙම තනි විචල්‍යයන් සමාන නමුත් සමාන නොවන විට, ක්‍රම දෙකම සමාන ප්‍රති .ල ලබා දෙනු ඇත.

දැනටමත් ඉහත අවධාරණය කර ඇති පරිදි, අවසාන තේරීම රඳා පවතින්නේ ඔබ කරන උපකල්පන මත ය. ඊට අමතරව, ඕනෑම විශේෂිත ආකෘතියක උපයෝගීතාව ඔබේ විශ්ලේෂණයේ සන්දර්භය සහ අරමුණ මත රඳා පවතී. ජෝර්ජ් ඊපී බොක්ස් උපුටා දැක්වීමට: "සියලුම මාදිලි වැරදියි, නමුත් සමහර ඒවා ප්‍රයෝජනවත් වේ".

[1] වෙන්ට්සෙල්, පීඩී, ඇන්ඩ rew ස්, ඩීටී, හැමිල්ටන්, ඩීසී, ෆේබර්, කේ., සහ කොවල්ස්කි, බීආර් (1997). උපරිම සම්භාවිතාව ප්‍රධාන සංරචක විශ්ලේෂණය. රසායන විද්‍යාව පිළිබඳ ජර්නලය, 11 (4), 339-366.

[2] වෙන්ට්සෙල්, පීඩී, සහ ලොන්ස්, එම්ටී (1999). සහසම්බන්ධිත මිනුම් දෝෂ සහිත උපරිම සම්භාවිතාව ප්‍රධාන සංරචක විශ්ලේෂණය: න්‍යායාත්මක හා ප්‍රායෝගික සලකා බැලීම්. රසායන විද්‍යාව සහ බුද්ධිමත් රසායනාගාර පද්ධති, 45 (1-2), 65-85.

[3] හොෆ්ස්ලූට්, එච්.සී., වෙරෝඩන්, පා.ම., වෙස්ටර්හුයිස්, ජේ.ඒ, සහ ස්මිල්ඩ්, ඒ.කේ (2006). උපරිම සම්භාවිතාව පරිමාණය (MALS). රසායන විද්‍යාව පිළිබඳ ජර්නලය, 20 (3‐4), 120-127.

[4] නාරාසිම්න්, එස්., සහ ෂා, එස්එල් (2008). PCA භාවිතා කරමින් is ෝෂාකාරී දත්ත වලින් ආදර්ශ හඳුනා ගැනීම සහ දෝෂ සහසංයුජ අනුකෘතිය. පාලන ඉංජිනේරු පුහුණුව, 16 (1), 146-155.

[5] ටිපින්, එම්ඊ, සහ බිෂොප්, සීඑම් (1999). සම්භාවිතා ප්‍රධාන සංරචක විශ්ලේෂණය. රාජකීය සංඛ්‍යාන සංගමයේ ජර්නලය: බී කාණ්ඩය (සංඛ්‍යාන ක්‍රමවේදය), 61 (3), 611-622.


-1

සෘජු හා සරල: කොරපොතු සමාන නම් cov-PCA, එසේ නොවේ නම්, corr-PCA භාවිතා කරන්න; එසේ නොමැති නම්, එසේ නොකිරීමට ඔබට ආරක්ෂාවක් තිබේ නම් හොඳයි. සැකයක් ඇත්නම්, විචල්‍යතාවන්ගේ (ANOVA) සමානාත්මතාවය සඳහා F- පරීක්ෂණයක් භාවිතා කරන්න. එය එෆ් පරීක්ෂණයෙන් අසමත් වුවහොත්, කෝර් භාවිතා කරන්න; එසේ නොමැතිනම් cov භාවිතා කරන්න.


2
-1. එෆ්-පරීක්ෂණයක් පැවැත්වීම මෙහි අදාළ වන්නේ මන්දැයි මම නොදනිමි. පීසීඒ යනු ගවේෂණාත්මක ක්‍රමයක් මිස තහවුරු කිරීමේ ක්‍රමයක් නොවේ (සංඛ්‍යානමය පරීක්ෂණ ලෙස).
amoeba

-5

පරිමාණය මත පදනම් වූ තර්ක (එකම භෞතික ඒකකවල ප්‍රකාශිත විචල්‍යයන් සඳහා) තරමක් දුර්වල බව පෙනේ. සම්මත අපගමනය 0.001 සහ 0.1 අතර වෙනස් වන (මානයන් රහිත) විචල්‍ය සමූහයක් ගැන සිතන්න. 1 හි සම්මත අගය හා සසඳන විට, මේ දෙකම 'කුඩා' හා සංසන්දනාත්මක මට්ටම්වල උච්චාවචනයන් ලෙස පෙනේ. කෙසේ වෙතත්, ඔබ ඒවා ඩෙසිබල් වලින් ප්‍රකාශ කරන විට, මෙය පිළිවෙලින් -10 හා 0 dB ට එරෙහිව -60 dB පරාසයක් ලබා දෙයි. එවිට මෙය බොහෝ විට 'විශාල පරාසයක්' ලෙස වර්ගීකරණය කරනු ඇත - විශේෂයෙන් ඔබ සම්මත අපගමනය 0 ට ආසන්න නම්, එනම් us ණ අනන්තය dB.

මගේ යෝජනාව වනුයේ සහසම්බන්ධතාවයක් සහ සහසම්බන්ධතා මත පදනම් වූ පීසීඒ එකක් කිරීමයි. දෙදෙනාම එකම (හෝ බොහෝ සමාන, මෙයින් අදහස් කරන්නේ කුමක් වුවත්) පළාත් සභා ලබා දෙන්නේ නම්, ඔබට අර්ථවත් පිළිතුරක් ලැබී ඇති බව ඔබට සහතික විය හැකිය. ඔවුන් පුළුල් ලෙස විවිධ පළාත් සභා ලබා දෙන්නේ නම් PCA භාවිතා නොකරන්න, මන්ද එක් ගැටලුවකට වෙනස් පිළිතුරු දෙකක් ප්‍රශ්න විසඳීමට සංවේදී ක්‍රමයක් නොවන බැවිනි.


9
(-1) “එකම ගැටළුවට වෙනස් පිළිතුරු දෙකක්” ලබා ගැනීම බොහෝ විට අදහස් කරන්නේ ඔබේ විශ්ලේෂණ අරමුණු සඳහා සුදුසු වන්නේ කුමන තාක්‍ෂණයද යන්න ගැන නොසිතා ඔබ සිහියෙන් තොර බවය. එක් හෝ (ඔබ පවසන පරිදි) ශිල්පීය ක්‍රම දෙකම සංවේදී නොවන බව එයින් අදහස් නොකෙරේ, නමුත් අවම වශයෙන් එකක් හෝ ගැටලුවට හෝ දත්ත සඳහා සුදුසු නොවනු ඇත. තවද, බොහෝ අවස්ථාවන්හීදී සහසම්බන්ධය මත පදනම් වූ PCA සහ සහසම්බන්ධතා මත පදනම් වූ PCA එකිනෙකට වෙනස් පිළිතුරු ලබා දිය යුතු යැයි අපේක්ෂා කළ හැකිය . සියල්ලට පසු, ඔවුන් දත්තවල විවිධ පැතිකඩයන් මනිනු ලබයි. දෙකම පෙරනිමියෙන් කිරීම තේරුමක් නැත.
whuber

ඇත්ත වශයෙන්ම සහසම්බන්ධය සහ සහසංයුජතාවයෙන් PCA භාවිතා කරන විට වෙනස් පිළිතුරු 2 ක් ලබා ගැනීම ඉතා සාධාරණ ය. කොටස් නඩුවේදී, ඔබ බීටා (හෝ සම්මත අපගමනය) සැලකිල්ලට ගත යුතුද යන ප්‍රශ්නයකි
ජුවාන්සෙන්ට්‍රෝ
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.