පොදු සංඛ්‍යානමය පාප මොනවාද?


233

මම මනෝ විද්‍යාව පිළිබඳ උපාධි අපේක්ෂකයෙක් වන අතර, සංඛ්‍යාලේඛන පිළිබඳ වැඩි වැඩියෙන් ස්වාධීන අධ්‍යයන කටයුතුවල යෙදෙන විට, මගේ විධිමත් පුහුණුවේ ඇති අඩුපාඩුව ගැන මම වඩ වඩාත් මවිත වෙමි. පෞද්ගලික හා දෙවන අත්දැකීම් වලින් පෙනී යන්නේ උපාධි අපේක්ෂකයින් සහ උපාධිධාරී පුහුණුවීම්වල සංඛ්‍යානමය දෘඩතාවයේ හිඟකම මනෝ විද්‍යාව තුළ සර්වසම්පූර්ණ බවයි. එනිසා, මා වැනි ස්වාධීන ඉගෙනුම් කරුවන්ට "සංඛ්‍යානමය පව්" ලැයිස්තුවක් නිර්මාණය කිරීම ප්‍රයෝජනවත් වනු ඇතැයි මම සිතුවෙමි, සිසුන්ට ශ්‍රේණිගත කිරීම සඳහා උගන්වන ලද සංඛ්‍යානමය පරිචයන් සම්මත භාවිතයක් ලෙස ලැයිස්තුගත කිරීම ඇත්ත වශයෙන්ම උසස් (වඩා බලවත්, හෝ නම්‍යශීලී, හෝ ශක්තිමත්, ආදිය) නවීන ක්‍රම හෝ අවලංගු බව පෙන්වයි. වෙනත් ක්‍ෂේත්‍රයන්හි ද මෙවැනිම තත්ත්වයක් අත්විඳිය හැකි යැයි අපේක්‍ෂාවෙන් මම ප්‍රජා විකියක් යෝජනා කරමි.


5
"පාපය" සමහර විට ගිනි අවුලුවන බවත් සංඛ්‍යාන විශ්ලේෂණයේ සමහර අංග කළු-සුදු නොවන බවත් මම දනිමි. මගේ අභිප්‍රාය වන්නේ සාමාන්‍යයෙන් උගන්වනු ලබන පුරුද්දක් පැහැදිලිවම නුසුදුසු අවස්ථාවන්ගෙන් ඉල්ලා සිටීමයි.
මයික් ලෝරන්ස්

5
ඔබ කැමති නම් ජීව විද්‍යාව / ජීවිත විද්‍යා සිසුන් මිශ්‍රණයට එකතු කළ හැකිය;)
නිකෝ

1
සමහර විට එය ජීවිත විද්‍යා සංඛ්‍යානමය පව් ලෙස නැවත සඳහන් කළ හැකිද? ... හෝ ඊට වඩා විශේෂිත යමක් ...
ජෝන්

1
hwhuber හොඳ පිළිතුරු කිහිපයක් තිබුනි, එබැවින් මම ඒවා දෙකම ඒකාබද්ධ කළෙමි.

1
හායි m අමන්දා, කතාවේ ඇති දේ ගැන ඔබට මෙහි යම් ඇඟවීමක් කළ හැකිද? රික්-රෝල් කිරීමේ හැකියාවට කිසිවෙකු කැමති නැත.
naught101

Answers:


119

දත්ත බැලීමට (කුමන්ත්‍රණය) කිරීමට අපොහොසත් වීම.


+1 හොඳයි! මම කම්පනයට පත්වූයේ මෙය තවම සඳහන් කර නොමැති නිසාය.
whuber

1
ඉතා, ඉතා වැදගත්!
deps_stats

1
බොහෝ විට වඩාත් පොදු එකකි.
කාලෝස් සිනෙලි

115

P- අගයන් පිළිබඳ බොහෝ අර්ථකථන පව්කාර ය! සාම්ප්‍රදායිකව p- අගයන් භාවිතා කිරීම ඉතා දෝෂ සහිත ය; මගේ මතය අනුව, උපකල්පිත පරීක්ෂණ සහ වැදගත්කම පිළිබඳ පරීක්ෂණ ඉගැන්වීම සඳහා සම්මත ප්‍රවේශයන් ප්‍රශ්න කරයි.

හැලර් සහ ක්‍රවුස් සොයාගෙන ඇත්තේ සංඛ්‍යාලේඛන උපදේශකවරුන් p-values ​​වැරදි ලෙස අර්ථකථනය කිරීමට තරම් සිසුන් සිටින බවයි. . හබාර්ඩ් කඩදාසි ද බැලීමට වටී.

හැලර් සහ ක්‍රවුස්. වැදගත්කම පිළිබඳ වැරදි අර්ථකථන: සිසුන් තම ගුරුවරුන් සමඟ බෙදාගන්නා ගැටළුවක් . මනෝවිද්‍යාත්මක පර්යේෂණ ක්‍රම (2002) වෙළුම. 7 (1) පි. 1-20 ( PDF )

හබාර්ඩ් සහ බයාරි. සම්භාව්‍ය සංඛ්‍යාන පරීක්ෂණයේදී සාක්ෂි (p) හා දෝෂ (α ගේ) එදිරිව මිනුම් පිළිබඳ ව්‍යාකූලත්වය . ඇමරිකානු සංඛ්‍යාන (2003) වෙළුම. 57 (3)

ගුඩ්මන්. සාක්ෂි පදනම් කරගත් වෛද්‍ය සංඛ්‍යාලේඛන දෙසට. 1: පී අගය වැරැද්ද. Intern න් ඉන්ටර් මෙඩ් (1999) වෙළුම. 130 (12) පි. 995-1004 ( PDF )

මෙයද බලන්න:

වැගන් නිෂ්පාදකයින්, ඊ.ජේ. P අගයන්හි ව්‍යාප්ත ගැටළු වලට ප්‍රායෝගික විසඳුමක්. මනෝවිද්‍යාත්මක බුලටින් සහ සමාලෝචනය, 14 (5), 779-804.

අත්හදා බැලීම් කරන්නා විසින් කරන ලද තේරීම් හේතුවෙන් p- අගයක නාමික “නිවැරදි” අර්ථ නිරූපණය පවා වැරදියි.

යාවත්කාලීන කිරීම (2016) : 2016 දී ඇමරිකානු සංඛ්‍යාන සංගමය p- අගයන් පිළිබඳ ප්‍රකාශයක් නිකුත් කළේය, මෙහි බලන්න . මෙය එක්තරා ආකාරයකට මනෝවිද්‍යාත්මක සඟරාවක් විසින් මීට වසරකට පමණ පෙර නිකුත් කරන ලද “p- අගයන් තහනම් කිරීම” සඳහා වූ ප්‍රතිචාරයකි .


2
Ic මයිකල් (+1) මම සාරාංශ හා නොකල පී.ඩී.එෆ්. ඔබට කමක් නැතැයි සිතමි.
chl

7
+1, නමුත් මම විවේචනාත්මක අදහස් දැක්වීමට කැමතියි. ආරම්භක රේඛාව සම්බන්ධයෙන් ගත් කල, යමෙකුට හොඳින් කිව හැකි ඕනෑම සංකල්පයක “සියල්ලම පාහේ” (මිනුම් න්‍යායාත්මක අර්ථයෙන්) අර්ථ නිරූපණයන් වැරදියි, මන්ද එකක් පමණක් නිවැරදි ය. දෙවනුව, ඔබ “සාම්ප්‍රදායික භාවිතය” සහ “සම්මත ප්‍රවේශයන්” යැයි පැවසූ විට ඔබ යොමු කරන්නේ කුමක් ද? මෙම නොපැහැදිලි යොමු කිරීම් පිදුරු මිනිසෙකු මෙන් පෙනේ. උදාහරණයක් ලෙස සංඛ්‍යාලේඛන අධ්‍යාපනය පිළිබඳ සාහිත්‍යයෙන් කෙනෙකුට සොයාගත හැකි දේ සමඟ ඒවා එකඟ නොවේ.
whuber

4
H වබර් ගුඩ්මන් කඩදාසි දෙස බලන්න. එය c ෂධවේදය පිළිබඳ මගේ අත්දැකීම් සමඟ හොඳින් ගැලපේ. ක්‍රම පවසන්නේ "P <0.05 සංඛ්‍යානමය වැදගත්කමක් ලෙස ගත් ප්‍රති Results ල" සහ පසුව ප්‍රති <ල p <0.05 සඳහා +, ++ p <0.01 සඳහා ++ සහ p <0.0001 සඳහා +++ සමඟ ඉදිරිපත් කරනු ලැබේ. ලා නියමන් සහ පියර්සන් යන දෝෂ අනුපාත පාලනය කිරීම මෙම ප්‍රකාශයෙන් ගම්‍ය වේ, නමුත් විවිධ මට්ටමේ p භාවිතා කිරීම මඟින් ෆිෂර්ගේ ප්‍රවේශය යෝජනා කරන්නේ p අගය ශුන්‍ය උපකල්පිතයට එරෙහි සාක්ෂි වල ශක්තියේ දර්ශකයකි. ගුඩ්මන් පෙන්වා දෙන පරිදි, ඔබට එකවර දෝෂ අනුපාත පාලනය කිරීමට සහ සාක්ෂි වල ශක්තිය තක්සේරු කළ නොහැක.
මයිකල් ලිව්

8
Ic මයිකල් එවැනි වාර්තාකරණය සඳහා විකල්ප, වඩා ත්‍යාගශීලී අර්ථකථන තිබේ. නිදසුනක් වශයෙන්, පා readers කයන්ට තමන්ගේ වැදගත්කමේ එළිපත්ත ක්‍රියාත්මක කිරීමට අවශ්‍ය විය හැකි බව කතුවරයා දැන සිටිය හැකි අතර එම නිසා ඔවුන්ට උපකාර කිරීම සඳහා p- අගයන් සලකුණු කිරීම කරන්න. විකල්පයක් ලෙස, කතුවරයා විය හැකි බහුවිධ සැසඳීම් ගැටළු පිළිබඳව දැනුවත්ව සිටිය හැකි අතර බොන්ෆෙරෝනි වැනි ගැලපුමක වෙනස් මට්ටම් භාවිතා කරයි. සමහර විට p- අගයන් අනිසි ලෙස භාවිතා කිරීම සම්බන්ධයෙන් දොස් පැවරිය යුත්තේ කතුවරයා නොව පා er කයාගේ පාමුල ය.
whuber

4
H වබර් මම සම්පුර්ණයෙන්ම එකඟ වෙමි, නමුත් ඔබ යෝජනා කරන දේ සමහර කුඩා කොටස් වලින් සත්‍ය වේ ('සම්පූර්ණයෙන්ම' සීමා කළ අනුවාදය). P අගයන් නිශ්චිත අගයන්ට වඩා තරු එකක්, දෙකක් හෝ තුනකින් වාර්තා කළ යුතු බව සඳහන් කරන සමහර සඟරා ඇත, එබැවින් එම සඟරා ප්‍රති come ල සඳහා යම් වගකීමක් බෙදා ගනී. කෙසේ වෙතත්, එම වැරදි ලෙස සලකනු ලබන අවශ්‍යතාවය සහ පැහැදිලිවම p අගයන් බොළඳ ලෙස භාවිතා කිරීම යන දෙකම මගේ රාක්කවල ඇති හඳුන්වාදීමේ සංඛ්‍යාලේඛන පෙළ කිහිපයක දෝෂ අනුපාත සහ සාක්ෂි අතර ඇති වෙනස්කම් පිළිබඳ පැහැදිලි පැහැදිලි කිරීමක් නොමැති වීමේ ප්‍රති result ලයක් විය හැකිය.
මයිකල් ලිව්

74

පුරෝකථන ආකෘතියක් මත වැඩ කිරීමේදී මට හමු වූ භයානකම උගුල වන්නේ පරීක්ෂණ දත්ත කට්ටලයක් “අවසාන” කාර්ය සාධන ඇගයීම සඳහා කැප කිරීම සඳහා කල්තියා වෙන් කර නොගැනීමයි.

පරාමිතීන් අතුගා දැමීමේදී, පෙර තෝරාගැනීමේදී, ඉගෙනීමේ ඇල්ගොරිතම නැවැත්වීමේ නිර්ණායක තෝරාගැනීමේදී ඔබට කෙසේ හෝ පරීක්ෂණ දත්ත භාවිතා කිරීමට අවස්ථාවක් තිබේ නම් ඔබේ ආකෘතියේ පුරෝකථන නිරවද්‍යතාවය අධිතක්සේරු කිරීම ඇත්තෙන්ම පහසුය ...

මෙම ගැටළුව මඟහරවා ගැනීම සඳහා, නව දත්ත කට්ටලයක වැඩ ආරම්භ කිරීමට පෙර ඔබේ දත්ත පහත පරිදි බෙදිය යුතුය:

  • සංවර්ධන කට්ටලය
  • ඇගයීම් කට්ටලය

ඉන්පසු ඔබේ සංවර්ධන කට්ටලය "පුහුණු සංවර්ධන කට්ටලයක්" සහ "පරීක්ෂණ සංවර්ධන කට්ටලයක්" ලෙස බෙදන්න, එහිදී ඔබ විවිධ පරාමිතීන් සහිත විවිධ ආකෘතීන් පුහුණු කිරීම සඳහා පුහුණු සංවර්ධන කට්ටලය භාවිතා කරන අතර පරීක්ෂණ සංවර්ධන කට්ටලයේ කාර්ය සාධනය අනුව හොඳම දේ තෝරා ගන්න. හරස් වලංගුකරණයකින් ඔබට ජාලක සෙවීම කළ හැකි නමුත් සංවර්ධන කට්ටලය මත පමණි. ආකෘති තේරීම 100% ක් සිදු නොකරන අතර කිසි විටෙකත් ඇගයීම් කට්ටලය භාවිතා නොකරන්න.

ආකෘති තේරීම සහ පරාමිතීන් පිළිබඳව ඔබට විශ්වාසයක් ඇති වූ පසු, තෝරාගත් ආකෘතියේ “සැබෑ” පුරෝකථන නිරවද්‍යතාව පිළිබඳ අදහසක් ලබා ගැනීම සඳහා ඇගයීම් කට්ටලය මත 10 ගුණයක හරස් වලංගුකරණයක් සිදු කරන්න.

ඔබේ දත්ත තාවකාලික නම්, කාල කේතයක් මත සංවර්ධනය / ඇගයීම් භේදය තෝරා ගැනීම වඩාත් සුදුසුය: "අනාවැකි කීම දුෂ්කර ය - විශේෂයෙන් අනාගතය ගැන."


5
මම මෙය ප්‍රතිපත්තිමය වශයෙන් එකඟ වන නමුත් කුඩා දත්ත කට්ටලයක් සම්බන්ධයෙන් (මට බොහෝ විට ඇත්තේ 20-40 අවස්ථා පමණි) වෙනම ඇගයීම් කට්ටලයක් භාවිතා කිරීම ප්‍රායෝගික නොවේ. කැදැලි හරස් වලංගුකරණයට මෙය මඟහරවා ගත හැකි නමුත් කුඩා දත්ත කට්ටල පිළිබඳ අශුභවාදී ඇස්තමේන්තු වලට තුඩු දිය හැකිය
BGreene

11
පොදුවේ ගත් කල, දත්ත බෙදීම විශ්වාසදායක වීමට විශාල දත්ත කට්ටලයක් අවශ්‍ය වේ. බූට්ස්ට්‍රැප් සමඟ දැඩි අභ්‍යන්තර වලංගු කිරීම එතරම් ආකර්ෂණීය වන්නේ එබැවිනි.
ෆ්‍රෑන්ක් හැරල්

විශේෂයෙන් සංවර්ධන කට්ටලය අතීත දත්ත සහ ඇගයීම අනාගත දත්ත සැකසූ විට. සියලු ආකෘති සුසර කිරීමෙන් පසුව, සම්පූර්ණ සංවර්ධන කට්ටලයේ ස්ථාවර පරාමිතීන් සමඟ අවසාන ආකෘතිය පුහුණු කර එය සමඟ ඇති සමස්ත ඇගයීම් පුරෝකථනය කරන්න. සැබෑ තත්වයක් තුළ, ඔබ කෙසේ හෝ විස්තර කරන ආකාරයට අනාගත දත්ත හරහා වලංගු කළ නොහැක, එබැවින් ඔබ අදාළ සියලු අතීත දත්ත භාවිතා කරනු ඇත.
ඩේවිඩ් අර්නස්ට්

64

සංඛ්‍යාලේඛන (උපකල්පිත පරීක්ෂණ) වෙනුවට දත්ත කැණීම් (උපකල්පිත සොයා ගැනීම) සිදු කළ විට p- අගයන් වාර්තා කිරීම.


2
ඔබට (හෝ යමෙකුට) විස්තාරණය කළ හැකිද?
asac


බහු උපකල්පිත පරීක්ෂණ සඳහා නිවැරදි කරන ලද p- අගයන් ගැන කුමක් කිව හැකිද (බොන්ෆෙරෝනි ක්‍රමයේ යම් රසයක් හෝ වඩා දියුණු නිවැරදි කිරීමක් සමඟ)? දත්ත කැණීමේ සන්දර්භය තුළ වුවද එය හොඳ යැයි මම සිතමි.
asac

මම සාමාන්‍ය අදහසට කැමතියි, නමුත් සංඛ්‍යාලේඛන උපකල්පිත පරීක්ෂණ සමඟ සැසඳීම විකෘතියකි.
rolando2

47

මට කරදර කරන වැරදි කිහිපයක්:

  1. අපක්ෂපාතී තක්සේරුකරුවන් පක්ෂග්‍රාහී තක්සේරුකරුවන්ට වඩා හොඳ යැයි උපකල්පනය කිරීම.

  2. ඉහළ හොඳ ආකෘතියක් අදහස් කරයි යැයි උපකල්පනය කිරීම , අඩු R 2 නරක ආකෘතියක් අදහස් කරයි.R2R2

  3. සහසම්බන්ධය වැරදි ලෙස අර්ථ නිරූපණය කිරීම / යෙදීම.

  4. සම්මත දෝෂයකින් තොරව ලක්ෂ්‍ය ඇස්තමේන්තු වාර්තා කිරීම.

  5. වඩා ශක්තිමත්, වඩා හොඳ ක්‍රියාකාරී, අර්ධ-පරාමිතික නොවන ක්‍රම පවතින විට යම් ආකාරයක බහුකාර්ය සාමාන්‍යයක් (රේඛීය වෙනස්කම් කිරීමේ විශ්ලේෂණය වැනි) උපකල්පනය කරන ක්‍රම භාවිතා කිරීම.

  6. කිසියම් සම්බන්ධතාවයකට කොපමණ සාක්ෂි තිබේද යන්න මිනුම ලෙස නොව, පුරෝකථනය කරන්නෙකු සහ ප්‍රතිචාරය අතර ශක්තියේ මිනුමක් ලෙස p- අගය භාවිතා කිරීම .


5
ඔබ මේවා වෙනම විකල්ප වලට වෙන් කරනවාද?
රුසෙල්පියර්ස්

46

පරීක්ෂාව කල්පිත එදිරිව එච් 1 : μ 0 (අ Gaussian පරිසරයක දී උදාහරණයක් ලෙස)H0:μ=0H1:μ0

ආකෘතියක සාධාරණීකරණය කිරීමට (එනම් " H 0 ප්‍රතික්ෂේප නොවේ" සහ " H 0 මිශ්‍ර කරන්නμ=0H0H0 සත්‍ය වේ").

එම වර්ගයේ (ඉතා නරක) තර්කනයට ඉතා හොඳ නිදසුනක් නම්, ගවුසියානුවන් දෙදෙනෙකුගේ විචල්‍යයන් සමානද (නැද්ද යන්න) පරීක්ෂා කිරීමට පෙර ඒවායේ මධ්‍යන්‍යය සමානද නැද්ද යන්න පරික්ෂා කිරීමේදී.

සාමාන්‍ය බව සාධාරණීකරණය කිරීම සඳහා ඔබ සාමාන්‍යය බව (සාමාන්‍යයට එදිරිව) පරීක්ෂා කරන විට තවත් උදාහරණයක් සිදු වේ. සෑම සංඛ්‍යාලේඛන ician යෙක්ම එය කර ඇත්තේ ජීවිතය තුළද? එය බාඩ් :) (සහ ගෝස්සියානු නොවන බවට ශක්තිමත් බව පරීක්ෂා කිරීමට මිනිසුන් තල්ලු කළ යුතුය)


7
එකම තර්කනය ("එච් 1 සඳහා සාක්‍ෂි නොමැතිවීම" "එච් 1 නොමැති බවට සාක්ෂි" ලෙස ගැනීම) මූලික වශයෙන් යටින් පවතින්නේ සියලු යහපත්-යෝග්‍යතා පරීක්ෂණ සඳහා ය. “පරීක්ෂණය සැලකිය යුතු මට්ටමක නොතිබුණි, එබැවින් X සාධකයෙහි බලපෑමක් නැත / විචල්‍ය Y හි බලපෑමක් නැත” යනුවෙන් මිනිසුන් පවසන විට තර්කනය බොහෝ විට වර්ධනය වේ. පරීක්ෂණයේ බලය පිළිබඳ තර්කානුකූලව කරුණු ඉදිරිපත් කිරීමත් සමඟ පාපය අඩු බව මම අනුමාන කරමි (උදා: නිශ්චිත අදාළ බලපෑමක් ඇති ප්‍රමාණයකට අනුව යම් බලයක් කරා ළඟා වීමට නියැදි ප්‍රමාණය පිළිබඳ පූර්ව තක්සේරුවක්).
caracal

ඔබ බලය පිළිබඳව කිසිදු නිගමනයකට එළඹෙන්නේ නැත්නම්, මම කියන්නේ ක්ලාම් කිරීම සත්‍ය නොවන අතර එය ප්‍රතික්ෂේප නොකරන විට එය ඉතා නරක වන අතර H 1 ක්ලාම් කිරීම සත්‍ය වන අතර H 0 ප්‍රතික්ෂේප කිරීම ටිකක් වැරදියි :). H0H1H0
රොබින් ජිරාඩ්

මහා!! ඔව්, මෙය මා පිස්සු
වට්ටයි

3
මම සංඛ්‍යාත්මකව සාක්ෂරතාවයට පත්වීමට උත්සාහ කරන අතර වරින් වර මේ සඳහා වැටෙමි. විකල්ප මොනවාද? ඔබේ ආකෘතිය වෙනස් කරන්න, එවිට පැරණි ශුන්‍යය බවට පත්වේ ? මට සිතිය හැකි අනෙක් විකල්පය නම්, ඔබේ අධ්‍යයනයට ප්‍රමාණවත් තරම් බලයක් තිබීමයි. ශුන්‍යය ප්‍රතික්ෂේප කිරීමට අපොහොසත් වීම ප්‍රායෝගිකව ශුන්‍යය සනාථ කිරීමට තරම් සමීප වේ. උදා: ඔබේ සෛල වලට ප්‍රතික්‍රියාකාරකයක් එක් කිරීමෙන් 2% කට වඩා විනාශ නොවන බවට වග බලා ගැනීමට ඔබට අවශ්‍ය නම්, සතුටුදායක ව්‍යාජ negative ණාත්මක අනුපාතයකට බලය. H1
ඩොක්බකට්ස්

Based ඩොක්බකට්ස් සමානතා පරීක්ෂණ ඒක පාර්ශවීය පරීක්ෂණ දෙකක් සමඟ බලය පදනම් කරගත් ප්‍රවේශයට වඩා දැඩි ය. නමුත් ඔබට ප්‍රායෝගික සමානතාව ගැන කථා කළ හැකි අවම අදාළ බලපෑම් ප්‍රමාණයක් පහළින් සැකසිය යුතුය.
ඩේවිඩ් අර්නස්ට්

42

චාරිත්රානුකූල සංඛ්යා ලේඛන.

මෙම "පාපය" යනු ඔබට උගන්වා ඇති ඕනෑම දෙයක් එහි යෝග්‍යතාවය නොසලකා එය ක්‍රියාවට නැංවීමයි. එය සංඛ්‍යාලේඛන අනුව ය, ඔබේ සංඛ්‍යාලේඛන ඔබ වෙනුවෙන් තෝරා ගැනීමට යන්ත්‍රයට ඉඩ දීම ඉහළින් එක මට්ටමකි.

උදාහරණ ලෙස සංඛ්‍යාලේඛන මට්ටමේ සිසුන් සෑම දෙයක්ම ඔවුන්ගේ නිහතමානී ටී-ටෙස්ට් සහ ඇනෝවා මෙවලම් කට්ටලයට ගැලපෙන ලෙස සකසා ගැනීමට උත්සාහ කරයි, නැතහොත් යමෙකු තමන් වෙත යන බව සොයා ගන්නා ඕනෑම වේලාවක "ඔහ්, මට නිශ්චිත දත්ත තිබේ, මම එක්ස් භාවිතා කළ යුතුය" දත්ත, හෝ අසනු ලබන ප්‍රශ්නය සලකා බලන්න.

මෙම පාපයේ විචලනයකට ඇතුළත් වන්නේ ඔබ තේරුම් නොගත් කේතයක් භාවිතා කිරීම පමණි, නමුත් ඔබට තේරුම් ගත හැකි නිමැවුම් නිපදවීමට, නමුත් "පස්වන තීරුව, පේළි 8 ක් පමණ පහළට" හෝ ඔබ සොයන පිළිතුර කුමක් දැයි දැන ගන්න.


6
අවාසනාවකට මෙන්, ඔබ සංඛ්‍යානමය අනුමානයන් ගැන උනන්දුවක් නොදක්වන්නේ නම් හෝ වේලාව සහ / හෝ සම්පත් හිඟ නම්, චාරිත්‍රය ඉතා සිත්ගන්නාසුලු බවක් පෙනේ ...
සම්භාවිතාවය

මට නම් එපිග්‍රෑඩ්ගේ විස්තරය අනුමාන කිරීම ගැන අනවශ්‍ය ලෙස සැලකිලිමත් වන අතර පරාවර්තනය, සොයා ගැනීම සහ හේතුව සලකා බැලීම වැනි දේවල් නොසලකා හරින අයෙකි.
rolando2

41

විශ්ලේෂණය "සරල කිරීම" සඳහා හෝ අඛණ්ඩ අනාවැකි කරුවාගේ බලපෑමේ රේඛීය නොවන "ගැටළුව" විසඳීම සඳහා අඛණ්ඩ පුරෝකථන විචල්‍යයක ද්වි පරමාණුකරණය.


18
ලබාගත් ප්‍රති results ල වැරදි නොවන බැවින් මෙය සැබවින්ම “පාපයක්” යැයි මම නොසිතමි. කෙසේ වෙතත්, එය බොහෝ ප්‍රයෝජනවත් තොරතුරු ඉවත දමනු ඇත, එබැවින් හොඳ පුහුණුවක් නොවේ.
රොබ් හින්ඩ්මන්

2
මෙම රේඛා ඔස්සේ, ආන්තික කණ්ඩායම් භාවිතා කිරීම මඟින් ඇස්තමේන්තුගත බලපෑම් ප්‍රමාණයන් සැලසුම් කරන අතර මධ්‍යන්‍ය හෝ මධ්‍ය භේදයක් ඇස්තමේන්තු යටතේ බලපෑමේ ප්‍රමාණයන් භාවිතා කරයි.
රුසෙල්පියර්ස්

2
එකිනෙකට වෙනස් ජනගහනයක් දෙකක් හෝ වැඩි ගණනක් සිටී නම් මෙය පාපයක් නොවේ. ඔබට වෙන් කළ හැකි පංති හෝ උප ජනගහනයක් ඇතැයි සිතමු, එවිට එය බැහැර කිරීම අර්ථවත් කරයි. ඉතා සුළු උදාහරණයක්: මම වෙබ් අඩවිය / ස්ථානය / නගරය / රට හෝ අග / දිගු සඳහා දර්ශක භාවිතා කරනවාද?
ඉරේටර්

3
+1 වන අතර ඔවුන් ද්වි පරමාණුක කප්පාදුව තෝරා ගැනීම ආරම්භ කරන විට එය බරපතල පාපයක් බවට පත්වන අතර එමඟින් එය යම් ආකාරයක වෙනසක් ප්‍රශස්ත කර පසුව පරීක්ෂා කරනු ලැබේ.
එරික්

6
TE සමුපකාරය (කාණ්ඩ දෙකකට හෝ වැඩි ගණනකට) එකතු කිරීමට සැබෑ හේතුව ඔබ ලබා ගැනීමට පටන් ගනී, එයට හේතුව එක් අයෙකුට ප්‍රාථමිකයක් තිබීමයි විචල්‍යතාව එම කාණ්ඩවලට අර්ථාන්විතව ඛණ්ඩනය වී ඇති බව විශ්වාස කිරීමට න්‍යායාත්මක හේතු ඇති බැවිනි. උදාහරණයක් ලෙස, අපි සෛල ට්රිලියන හෝ එසේ එකතු සමන්විත උපකල්පනය මත මෙම සියලු කාලය කරන්න තනි හෝ යාබඳව පැය 24 පෘථිවිය මත මෙහි කාලය අර්ථවත්ව ඒකකයක් ලෙස අර්ථ කර ඇති බවට ය. නමුත් අත්තනෝමතික ලෙස එක්රැස් කිරීම යනු තොරතුරු (උදා: සංඛ්‍යානමය බලය) “ඉවතලීම” පමණක් නොව, සංසිද්ධි අතර සම්බන්ධතා පිළිබඳ (බරපතල) නැඹුරුවකට තුඩු දිය හැකිය.
ඇලෙක්සිස්

41

ප්‍රශ්නයට සැබවින්ම පිළිතුරු නොදෙන නමුත් මෙම විෂය පිළිබඳ සම්පූර්ණ පොතක් තිබේ:

ෆිලිප් අයි. ගුඩ්, ජේම්ස් විලියම් හාඩින් (2003). සංඛ්‍යාලේඛනවල පොදු දෝෂ (සහ ඒවා වළක්වා ගන්නේ කෙසේද). විලේ. ISBN 9780471460688


6
+1 මෙම පොත එළියට ආ විගසම එය කියවීමට මම වග බලා ගත්තෙමි. සංඛ්‍යානමය වැරැදි කිරීමට මට ඕනෑ තරම් අවස්ථාවන් ලැබේ, එබැවින් ඒවා කිරීමට පෙර ඒවා පෙන්වා දීමට මම සැමවිටම කෘත ful වෙමි!
whuber


36

ආකෘති තෝරාගැනීමෙන් පසු පියවරෙන් පියවර ප්‍රතිගාමී වීම සහ වෙනත් ආකාරයේ පරීක්ෂණ.

පවත්නා සබඳතා පිටුපස කිසිදු ප්‍රාථමික උපකල්පනයක් නොමැතිව ආකෘති නිර්මාණය සඳහා ස්වාධීන විචල්‍යයන් තෝරා ගැනීම තාර්කික වැරැදි හෝ ව්‍යාජ සහසම්බන්ධතාවන්ට හේතු විය හැක.

ප්‍රයෝජනවත් යොමු කිරීම් (ජීව විද්‍යාත්මක / ජෛව විද්‍යාත්මක දෘෂ්ටි කෝණයකින්):

  1. කොසැක්, එම්., සහ අසිවෙඩෝ, ආර්. (2011). අනුක්‍රමික මාර්ග විශ්ලේෂණ ආකෘති තැනීම සඳහා පියවරෙන් පියවර විචල්‍ය තේරීම භාවිතා කිරීම අර්ථවත්ද? භෞතවේදය ප්ලාන්ටාරම්, 141 (3), 197-200. doi: 10.1111 / j.1399-3054.2010.01431.x

  2. වයිටිංහැම්, එම්.ජේ, ස්ටීවන්ස්, පී., බ්‍රැඩ්බරි, ආර්.බී., සහ ෆ්‍රීක්ලෙටන්, ආර්.පී. (2006). අප තවමත් පරිසර විද්‍යාව හා හැසිරීම තුළ පියවරෙන් පියවර ආකෘතිකරණය භාවිතා කරන්නේ ඇයි? සත්ව පරිසර විද්‍යාව පිළිබඳ ජර්නලය, 75 (5), 1182–9. doi: 10.1111 / j.1365-2656.2006.01141.x

  3. ෆ්‍රෑන්ක් හැරල්, ප්‍රතිගාමී ආකෘති නිර්මාණ උපායමාර්ග , ස්ප්‍රින්ගර් 2001.


32

සම්මන්ත්‍රණ පත්‍රිකා සහ සඟරා වල පවා මා පුදුමයට පත් කරවන දෙයක් නම්, බහු සැසඳීම් (උදා: ද්විභාෂා සහසම්බන්ධතා) සහ සියලු p <.05s “වැදගත්” ලෙස වාර්තා කිරීම (මේ මොහොතේ එහි නිවැරදිභාවය හෝ වැරදි නොසලකා හැරීම).

මනෝවිද්‍යා උපාධිධාරීන් ගැන ඔබ අදහස් කරන්නේ කුමක්දැයි මම දනිමි, එසේම මම මනෝ විද්‍යාව පිළිබඳ ආචාර්ය උපාධියක් අවසන් කර ඇති අතර මම තවමත් ඉගෙන ගන්නේ ඇත්තටම පමණි. එය තරමක් නරක ය, මම සිතන්නේ මනෝ විද්‍යාව අප එය භාවිතා කිරීමට යන්නේ නම් ප්‍රමාණාත්මක දත්ත විශ්ලේෂණය වඩාත් බැරෑරුම් ලෙස ගත යුතු ය (එය පැහැදිලිවම අප විසින් කළ යුතු ය)


9
මෙය විශේෂයෙන් වැදගත් වේ. මට මතකයි රාමසාන් මව්වරුන් නිරාහාරව සිටින ළදරුවන්ට නරකද යන්න පිළිබඳ අධ්‍යයනයක් කියවීම. එය පිළිගත හැකි පෙනුමක් (අඩු ආහාර, අඩු උපත් බර), නමුත් පසුව මම උපග්‍රන්ථය දෙස බැලුවෙමි. උපකල්පන දහස් ගණනක් සහ ඒවායින් සියයට කිහිපයක් "සැලකිය යුතු" පරාසයක පැවතුනි. "රාමදාන් 2, 4 හෝ 6 වන මාසය නම් එය දරුවාට නරක ය" වැනි අමුතු "නිගමන" ඔබට ලැබේ.
කාලෝස්

29

ගවේෂණාත්මක වීම නමුත් තහවුරු කිරීමක් ලෙස පෙනී සිටීම. මෙම හැකි එක් විශ්ලේෂණය උපාය (එනම් ආකෘතිය සුදුසු, විචල්ය තෝරා ගැනීම සහ එසේ මත) දත්ත ධාවනය හෝ පදවනු ප්රතිඵල වෙනස් කිරීම වන විට සිදු නමුත් විවෘතව මෙම ප්රකාශ කළ පසුව පමණක් ප්රතිඵල නම් "හොඳම" (එනම්, කුඩාම p-වටිනාකම් සමග) වාර්තා එය එකම විශ්ලේෂණය විය. ක්‍රිස් බීලි විසින් සිදු කරන ලද බහුවිධ පරීක්ෂණ සහ විද්‍යාත්මක වාර්තාවල ඉහළ ව්‍යාජ ධනාත්මක අනුපාතයක් ඇති වුවහොත් මෙය ද අදාළ වේ.


26

මම බොහෝ විට දකින සහ සෑම විටම මගේ ආම්පන්න අඹරන දෙය නම්, එක් කණ්ඩායමක සංඛ්‍යානමය වශයෙන් වැදගත් ප්‍රධාන බලපෑමක් සහ තවත් කණ්ඩායමක සංඛ්‍යානමය වශයෙන් වැදගත් නොවන ප්‍රධාන බලපෑමක් ඇඟවුම් කරන්නේ x කණ්ඩායම් අන්තර්ක්‍රියාකාරිත්වයේ සැලකිය යුතු බලපෑමක් ඇති බවය.


24

සහසම්බන්ධය යන්නෙන් ගම්‍ය වන අතර එය ශුන්‍ය උපකල්පිතය පිළිගැනීම තරම් නරක නැත.


නමුත් සමහර විට ... සමහර විට හේතු විය හැකි දිශාවන් ඉතා අසමාන සම්භාවිතාවන් ඇත. වයස සහ උස අතර සහසම්බන්ධයක් උස නිසා ඇතිවිය හැකි යැයි මම නොසිතමි. එසේම, මෙය චර්යාත්මක විද්‍යා පුහුණුව සාමාන්‍යයෙන් බෙහෙවින් සංවේදී වන එකක් යැයි මම සිතමි.
ජෝන්

ඇත්ත වශයෙන්ම, යමක් පේජ් A and B are correlatedසාමාන්යයෙන් දකින්න පමණක් A causes Bනොව B causes A... (හා ගැන අමතක Cහේතු වන Aහා B)
ඇන්ඩෘ Holzner

12
ගූගල් විසින් වසරකට ඩොලර් 65B වෙනසක් සිදු කරයි ...
නීල් මැක්ගුගන්

6
මම ඔබේ කරුණු සමඟ එකඟ වන අතර ඒවා සියල්ලම වලංගු වේ. නමුත් ගූගල් හි ලාභයෙන් ගම්‍ය වන්නේ: සහසම්බන්ධය => හේතුවද?
සන්කූල්සු

4
ගූගල් එම මුදල් සියල්ලම කරන්නේ හේතුව ගැන සැලකිලිමත් නොවී ය. ඇත්ත වශයෙන්ම, එය එසේ වන්නේ ඇයි? පුරෝකථනය යනු කාරණයයි ...
conjugateprior

24

විශේෂයෙන් වසංගතවේදය හා මහජන සෞඛ්‍යය තුළ - සංගමයේ සාපේක්ෂ මිනුම් (උපද්‍රව අනුපාතය, පරස්පර අනුපාතය හෝ අවදානම් අනුපාතය) වල ප්‍රස්ථාර වාර්තා කිරීමේදී ල ar ු ගණක පරිමාණය වෙනුවට අංක ගණිතය භාවිතා කිරීම.

වැඩි විස්තර මෙතැනින් .



23

ANOVA භාවිතා කරමින් අනුපාත දත්ත විශ්ලේෂණය කිරීම (නිරවද්‍යතාව යනාදිය), එමඟින් අනුපාත දත්ත ඇත්ත වශයෙන්ම ද්විමය වශයෙන් බෙදා හරින විට ගෝස්සියානු බෙදා හැරීමේ දෝෂයක් ඇතැයි උපකල්පනය කරයි. ඩික්සන් (2008) මෙම පාපයේ ප්‍රතිවිපාක සහ වඩාත් සුදුසු විශ්ලේෂණ ප්‍රවේශයන් ගවේෂණය කිරීම පිළිබඳ සාකච්ඡාවක් සපයයි.


4
මෙය විශ්ලේෂණයේ බලය කොපමණ අඩු කරයිද? එය වඩාත්ම ගැටළු සහගත වන්නේ කුමන තත්වයන් යටතේද? බොහෝ අවස්ථාවන්හීදී ANOVA හි උපකල්පන වලින් බැහැරවීම වැදගත් ප්‍රති come ලවලට සැලකිය යුතු ලෙස බලපාන්නේ නැත.
මයිකල් ලිව්

ANOVA ක්‍රියා පටිපාටිය සඳහා ඇති විකල්පය කුමක්ද?
හෙන්රික්

Ic මයිකල් ලිව් සහ හෙන්රික්: ඩික්සන් (2008) වෙත සබැඳියක් ඇතුළත් කිරීම සඳහා මම මෙම ප්‍රවේශය යාවත්කාලීන කළෙමි
මයික් ලෝරන්ස්

2
නමුත් කෙටියෙන් කිවහොත්, අගයන් පරාසය සංකෝචනය වී ඇති අතර ගෝස්සියානු උපකල්පන සපුරාලීමට නොහැකි බැවින් නිරීක්ෂණය කළ සම්භාවිතාවන් අඩු හෝ ඉහළ මට්ටමක පවතින විට එය වඩාත් ගැටළු සහගත වේ.
රුසෙල්පියර්ස්

මෙය ද්විමය අගයට ආසන්න වශයෙන් ආසන්න වශයෙන් තරම් නරක ය - අනුපාතය ගණනය කිරීමේදී භාවිතා කරන හරය මගින් එක් එක් සිද්ධිය කිරා මැන බැලුවහොත් එය හොඳින් විය යුතුය. එය 10% ට අඩු සහ 90% ට වැඩි අනුපාත සඳහා දුර්වල ලෙස ක්‍රියා කරනු ඇතැයි අපේක්ෂා කෙරේ.
සම්භාවිතාවය

18

වර්තමාන ජනප්‍රිය එකක් වන්නේ බලපෑමේ විචල්‍යතාවයට පමණක් සම්බන්ධ වන විට නැවත නැවත මිනුම් සැලසුම් කිරීමේදී අමු කාර්ය සාධන අගයන් වටා 95% ක විශ්වාසනීය අන්තරයන් සැලසුම් කිරීමයි. නිදසුනක් ලෙස, ANOVA හි පුනරාවර්තී මිනුම්වල MSE වෙතින් දෝෂ පදය ව්‍යුත්පන්න කර ඇති විශ්වාසනීය අන්තරයන් සහිත පුනරාවර්තන මිනුම් සැලසුමක ප්‍රතික්‍රියා වේලාවන්. මෙම විශ්වාසනීය අන්තරයන් සංවේදී කිසිවක් නියෝජනය නොකරයි. නිරපේක්ෂ ප්‍රතික්‍රියා කාලය ගැන ඔවුන් කිසිවක් නියෝජනය නොකරයි. බලපෑම වටා විශ්වාසනීය අන්තරයන් ජනනය කිරීම සඳහා ඔබට දෝෂ පදය භාවිතා කළ හැකි නමුත් එය කලාතුරකින් සිදු වේ.


මේ සියල්ලටම වඩා පොදු භාවිතයක් ඉල්ලා සිටීමෙන් විචාරකයින් වළක්වාලීමට සම්මත ලිපියක් තිබේද?
රුසෙල්පියර්ස්

මා දන්නා එකම විවේචනය වන්නේ බ්ලූයින් සහ රියෝපෙල් (2005) නමුත් ඔවුන් කාරණයේ හදවතට වැටෙන්නේ නැත. මාසන් සහ ලොෆ්ටස් (2003, රූප සටහන 4, දකුණු පුවරුව බලන්න ... ඒවා වම් පසින් ඉවත් කර ඇත්නම් ඔබ එය නිවැරදිව කළ යුතුව තිබුණි) ).
ජෝන්

පැහැදිලිව කිවහොත්, එම සීඅයිඅයි හි ඇති ගැටළුව නම්, ඒවා තනිකරම කොන්දේසි අතර ඇති වෙනස්කම් සම්බන්ධයෙන් අනුමාන හේතුන් සඳහා භාවිතා කර ඇති අතර එම නිසා පීඑල්එස්ඩී වලට වඩා නරක ය ... ඇත්ත වශයෙන්ම මම ඒවාට වඩා කැමැත්තෙමි. අවම වශයෙන් ඔවුන් අවංක ය.
ජෝන්

17

මයිකල් ලිව් පවසන බොහෝ දේ සමඟ මට සම්බන්ධ විය හැකි අතර, සම්භාවිතා අනුපාතයන්ට පක්ෂව p- අගයන් අතහැර දැමීම තවමත් වඩාත් පොදු ගැටළුවක් මග හැරී ඇත - ප්‍රති size ලවලට සැලකිය යුතු අර්ථයක් ලබා දීමට අවශ්‍ය වන බලපෑම් ප්‍රමාණයන්ට වඩා සම්භාවිතා ප්‍රති results ල අධික ලෙස අවධාරණය කිරීම. මෙම වර්ගයේ දෝෂය සෑම හැඩයකින්ම සහ ප්‍රමාණයකින්ම පැමිණෙන අතර එය වඩාත් ද්‍රෝහී සංඛ්‍යානමය වැරැද්දක් බව මට පෙනේ. ජේ. කොහෙන් සහ එම්. ඕක්ස් සහ වෙනත් අය ඇඳීම, මම මේ පිළිබඳව http://integrativestatistics.com/insidious.htm හි ලියා ඇත .


3
ප්‍රති size ල ප්‍රමාණයක් ලබා ගන්නා සෑම දෙයක්ම සාධනීය අනුපාතය (LR) අත්කර නොගන්නේ කෙසේද යන්න පිළිබඳව මට සැබවින්ම පැහැදිලි නැත, එසේම පහසුවෙන් අර්ථ නිරූපණය කළ හැකි පරිමාණයක් භාවිතා කරයි (දත්ත Z සඳහා Y ට වඩා X ගුණයක් වැඩි සාක්ෂි අඩංගු වේ). බලපෑමේ ප්‍රමාණය සාමාන්‍යයෙන් පැහැදිලි කළ නොහැකි විචල්‍යතාවයට පැහැදිලි කරන ලද යම් ආකාරයක අනුපාතයක් පමණක් වන අතර (කැදැල්ලක දී) LR යනු බලපෑමක් ඇති ආකෘතියක් සහ නැති ආකෘතියක් අතර පැහැදිලි කළ නොහැකි විචල්‍යතාවයේ අනුපාතයයි. බලපෑමේ ප්‍රමාණය සහ එල්ආර් අතර අවම වශයෙන් ශක්තිමත් සහසම්බන්ධයක් තිබිය යුතු නොවේද, එසේ නම්, සම්භාවිතා අනුපාත පරිමාණයට යාමෙන් අහිමි වන්නේ කුමක්ද?
මයික් ලෝරන්ස්

මයික් - ඔබ මා උනන්දු කර ඇත, නමුත් ඔබේ ලකුණු කණ්ඩායම් අතර මධ්‍යන්‍ය වෙනස්කම් තරම් සරල ලෙස බලපානවාද? ගිහි පුද්ගලයෙකුට මේවා පහසුවෙන් අර්ථ නිරූපණය කළ හැකි අතර විශ්වාසනීය කාල පරතරයන් ද පැවරිය හැකිය.
rolando2

අහ්, එබැවින් බලපෑමේ ප්‍රමාණය අනුව, ඔබ අදහස් කරන්නේ නිරපේක්ෂ ප්‍රති size ල ප්‍රමාණය, තමාටම තේරුමක් නැති අගයක්, නමුත් එය සාපේක්ෂ ප්‍රති size ල ප්‍රමාණයට පරිවර්තනය කිරීමෙන් (මා සඳහන් කළ පරිදි යම් විචල්‍යතාවයකින් බෙදීමෙන්) හෝ ගණනය කිරීමෙන් අර්ථවත් කළ හැකිය. නිරපේක්ෂ බලපෑම් ප්‍රමාණය සඳහා විශ්වාසනීය පරතරයක්. ඉහත මගේ තර්කය LRs එදිරිව සාපේක්ෂ බලපෑම් ප්‍රමාණයන්ට අදාළ වේ. බලපෑමේ සත්‍ය වටිනාකම උනන්දුවක් දක්වන අවස්ථාවන්හිදී (උදා: අනාවැකි) ගණනය කිරීමේ බලපෑම සීඅයිඅයි සඳහා උපයෝගීතාවයක් තිබිය හැකි නමුත්, බලපෑම් සඳහා / විපක්ෂව සාක්ෂි ගැන කතා කිරීම සඳහා වඩාත් බුද්ධිමත් පරිමාණයක් ලෙස මම තවමත් එල්ආර් සමඟ සිටිමි.
මයික් ලෝරන්ස්

LRs එදිරිව CIs භාවිතය සන්දර්භය අනුව වෙනස් වනු ඇතැයි මම අනුමාන කරමි, ඒවා පහත පරිදි ප්‍රයෝජනවත් ලෙස සාරාංශගත කළ හැකිය: විද්‍යාවේ වඩාත් ගවේෂණාත්මක අවධීන්, සංසිද්ධිවල පැවැත්ම / නොපැවතීම මගින් දළ වශයෙන් සංලක්ෂිත වන, සාක්ෂි ප්‍රමාණ කිරීමට LR වලට වැඩි කැමැත්තක් දැක්විය හැකිය. අනෙක් අතට, විද්‍යාවේ වඩා දියුණු අවධීන් වලදී සීඅයි වලට වැඩි කැමැත්තක් දැක්විය හැකිය, එහිදී අපේක්ෂිත ප්‍රති of ල පරාසයන් ඇතුළුව සූක්ෂ්ම අනාවැකි පළ කිරීමට න්‍යායන් ප්‍රමාණවත් ලෙස පිරිපහදු කරනු ලැබේ, හෝ ඊට ප්‍රතිවිරුද්ධව, විවිධ පරාසයන්හි බලපෑම් විශාලත්වයන් විවිධ න්‍යායන්ට සහාය වන විට. අවසාන වශයෙන්, ඕනෑම ආකෘතියකින් ජනනය වන අනාවැකි සඳහා සීඅයි අවශ්‍ය වේ.
මයික් ලෝරන්ස්

0|β|=1|β|>1|β|1β=0β0

14

උපාධි අපේක්ෂකයින් පිළිබඳ මගේ හඳුන්වාදීමේ මනෝමිතික පා course මාලාව අවම වශයෙන් සති දෙකක්වත් ගත කර ඇත. පියවරෙන් පියවර ප්‍රතිගාමී වීම හොඳ අදහසක් වන තත්වයක් තිබේද?


6
"හොඳ අදහස" තත්වය මත රඳා පවතී. ඔබට අනාවැකි උපරිම කිරීමට අවශ්‍ය වූ විට එය භයානක අදහසක් නොවේ - එය අධික ලෙස ගැළපීමට තුඩු දිය හැකි වුවද. එය නොවැළැක්විය හැකි දුර්ලභ අවස්ථා කිහිපයක් තිබේ - ආකෘති තෝරා ගැනීම සඳහා මග පෙන්වීමට න්‍යායක් නොමැති අවස්ථාවල. මම පියවරෙන් පියවර ප්‍රතිගාමී වීම “පාපයක්” ලෙස නොසලකමි, නමුත් ආකෘති තෝරා ගැනීම සඳහා න්‍යාය ප්‍රමාණවත් වන විට එය භාවිතා කිරීම.
රුසෙල්පියර්ස්

20
සමහර විට පාපය පියවරෙන් පියවර ප්‍රතිගාමී වීමෙන් ලබාගත් ආකෘතියක් පිළිබඳ සංඛ්‍යානමය පරීක්ෂණ සිදු කරයි.
රොබ් හින්ඩ්මන්

3
ඔබ හරස් වලංගුකරණයක් භාවිතා කරන්නේ නම් හොඳයි, සහ නිස්සාරණය නොකරන්න. P- අගයන් අර්ථ විරහිත බැවින් ඒවා ප්‍රකාශයට පත් නොකරන්න.
නීල් මැක්ගුගන්

මම පියවරෙන් පියවර ප්‍රතිගාමීත්වය භාවිතා කරන ව්‍යාපෘතියක වැඩ කරමින් සිටිමි. එයට හේතුව මා සතුව ඩී >> එන් ඇති අතර, ඩී යනු මානයන් වන අතර එන් නියැදි ප්‍රමාණයයි (මේ අනුව සියලු විචල්‍යයන් සමඟ එක් ආකෘතියක් භාවිතා කිරීම ප්‍රතික්ෂේප කරයි), විශේෂාංගවල උප කුලක එකිනෙකට බෙහෙවින් සහසම්බන්ධ වී ඇත, මට සංඛ්‍යානමය වශයෙන් ප්‍රතිපත්තිමය මාර්ගයක් අවශ්‍යය සමහර විට 2-3 “හොඳම” විශේෂාංග තෝරා ගැනීමේදී, අවම වශයෙන් කිසියම් ආකාරයක ගතානුගතික නිවැරදි කිරීමකින් තොරව P- අගයන් වාර්තා කිරීමට මම අදහස් නොකරමි.
dsimcha

14

දෝෂය සාමාන්‍යයෙන් බෙදා හරින අතර ප්‍රතිකාර අතර නිරන්තර විචල්‍යතාවයක් ඇති බවට උපකල්පනය පරීක්ෂා කිරීමට අපොහොසත් වීම. මෙම උපකල්පනයන් සැමවිටම පරීක්‍ෂා නොකෙරේ, එබැවින් අවම වශයෙන් වර්ග ආකෘති ආකෘති ගැළපීම බොහෝ විට භාවිතා කරනුයේ එය ඇත්ත වශයෙන්ම නුසුදුසු විටය.


12
දත්ත සාමාන්‍ය නොවන හෝ විෂමජාතීය වූ විට අවම වශයෙන් වර්ග ඇස්තමේන්තු කිරීම නුසුදුසු වන්නේ කුමක් ද? එය සම්පුර්ණයෙන්ම කාර්යක්ෂම නොවේ, නමුත් එය තවමත් අපක්ෂපාතී හා ස්ථාවර වේ.
රොබ් හින්ඩ්මන්

3
දත්ත විෂමජාතීය නම් ඔබට නියැදි අනාවැකි වලින් ඉතා සාවද්‍ය ලෙස අවසන් විය හැකිය, මන්ද ප්‍රතිගාමී ආකෘතිය ඉහළ විචල්‍යතාවයක් ඇති ප්‍රදේශවල සාම්පලවල දෝෂය අවම කිරීමට දැඩි උත්සාහයක් දරනු ඇති අතර අඩු විචල්‍යතාවයකින් යුත් ප්‍රදේශවල සාම්පලවල ප්‍රමාණවත් නොවේ. මෙයින් අදහස් කරන්නේ ඔබට ඉතා නරක පක්ෂග්‍රාහී ආකෘතියකින් අවසන් විය හැකි බවයි. අනාවැකි වල දෝෂ තීරු වැරදියි යන්න ද එයින් අදහස් වේ.
ඩික්රාන් අඟහරු

6
නැත, එය අපක්ෂපාතී ය, නමුත් ඔබ පැහැදිලි කරන හේතු සඳහා ඔබ වඩාත් කාර්යක්ෂම ක්‍රමයක් භාවිතා කළාට වඩා විචලනය විශාල වේ. ඔව්, පුරෝකථන කාල පරතරයන් වැරදිය.
රොබ් හින්ඩ්මන්

4
ඔව් (මා භාවිතා කළේ සංඛ්‍යානමය අර්ථයකට වඩා වාචිකව භාවිතා කිරීම යන්නෙන් අදහස් කරන්නේ ආකෘතිය විශේෂාංග අවකාශයේ ඉහළ විචල්‍යතා කලාපවල නිරීක්ෂණ කෙරෙහි ක්‍රමානුකූලව පක්ෂග්‍රාහී වූ බවයි - මියා කුල්පා!) - ඉහළ විචල්‍යතාවයෙන් අදහස් වන්නේ වඩාත් නිවැරදි වනු ඇත. සීමිත දත්ත කට්ටලයක් භාවිතා කරමින් දුර්වල ආකෘතියක් ලබා ගැනීමේ වැඩි අවස්ථාවක් තිබේ. එය ඔබේ ප්‍රශ්නයට සාධාරණ පිළිතුරක් ලෙස පෙනේ. අපක්ෂපාතී බව එතරම් සැනසීමක් ලෙස මම නොසලකමි - වැදගත් දෙය නම් මා සතුව ඇත්ත වශයෙන්ම මා සතුව ඇති දත්ත පිළිබඳව හොඳ අනාවැකි ලබා දිය යුතු අතර බොහෝ විට විචල්‍යතාව වඩාත් වැදගත් වේ.
ඩික්රාන් අඟහරු

12

මගේ පැරණි සංඛ්‍යාලේඛන මහාචාර්යවරයාට පිටස්තරයින් සමඟ ගනුදෙනු කිරීම සඳහා “නියමානුකූල රීතියක්” තිබුණි: ඔබේ විසිරුම් ස්ථානයේ පිටස්තරයෙකු ඔබ දුටුවහොත් එය ඔබේ මාපටැඟිල්ලෙන් ආවරණය කරන්න :)


මෙය වින්සෝරයිසේෂණයට සමාන වන අතර එය එතරම් භයානක නොවේ.
අරි බී. ෆ්‍රීඩ්මන්

12

මෙය ඔබ සොයන දෙයට වඩා පොප්-සංඛ්‍යාලේඛන පිළිතුරක් විය හැකිය, නමුත්:

දත්ත ඉහළ මට්ටමක පවතින විට පිහිටීම පිළිබඳ දර්ශකයක් ලෙස මධ්‍යන්‍යය භාවිතා කිරීම .

මෙය එසේ නොවේ ඔබ සහ ඔබේ ප්‍රේක්ෂකයින් ඔබ කතා කරන්නේ කුමක් දැයි දන්නේ නම් අනිවාර්යයෙන්ම ගැටළුවක් , නමුත් මෙය සාමාන්‍යයෙන් එසේ නොවන අතර මධ්‍යන්‍යය බොහෝ විට සිදුවන්නේ කුමක්ද යන්න පිළිබඳව වඩා හොඳ අදහසක් ලබා දෙනු ඇත.

මගේ ප්‍රියතම උදාහරණය මධ්යන්ය වැටුප්, සාමාන්යයෙන් "සාමාන්ය වැටුප්" ලෙස වාර්තා වේ. රටක ආදායම / ධනය අසමානතාවය මත පදනම්ව, මෙය මධ්‍ය වැටුපට වඩා බෙහෙවින් වෙනස් විය හැකි අතර, එමඟින් සැබෑ ජීවිතයේ මිනිසුන් සිටින තැනට වඩා හොඳ දර්ශකයක් ලබා දේ. උදාහරණයක් ලෙස, අපට සාපේක්ෂව අඩු අසමානතාවයක් ඇති ඕස්ට්‍රේලියාවේ, මධ්‍යන්‍යය මධ්‍යන්‍යයට වඩා 10-15% අඩුය . එක්සත් ජනපදයේ වෙනස බොහෝ සෙයින් පැහැදිලි ය , මධ්‍යන්‍යය මධ්‍යන්‍යයෙන් 70% ට වඩා අඩු වන අතර පරතරය වැඩි වේ.

"සාමාන්‍ය" (මධ්යන්ය) වැටුප් පිළිබඳ වාර්තා කිරීම වරෙන්තු වලට වඩා රෝසීය පින්තූරයක් ලබා දෙන අතර විශාල පිරිසකට "සාමාන්ය" මිනිසුන් තරම් උපයන්නේ නැත යන සාවද්‍ය හැඟීම ද ලබා දිය හැකිය.


ප්‍රවණතා විශ්ලේෂණයට අදාළ වන බැවින් මේ පිළිබඳව අර්ධ සම්බන්ධිත සාකච්ඡාවක් ඇත: tamino.wordpress.com/2012/03/29/…
naught101

2
මෙය හුදෙක් නොගැලපීම හා සම්බන්ධ නොවේ, නමුත් සාමාන්‍ය ගැටළුවක් වන්නේ විසුරුවා හැරීම සැලකිල්ලට නොගෙන මධ්‍යන්‍ය හෝ වෙනත් කේන්ද්‍රීය ප්‍රවනතාවයක් ප්‍රමාණවත් නොවන බවයි. උදාහරණයක් ලෙස, කණ්ඩායම් දෙකක මධ්‍යස්ථයන් සමාන නම්, නමුත් අන්තර් කාර්තු පරාසය එක් ජනගහනයකට 100 ගුණයක් විශාල විය. මධ්යන්යය දෙස බැලූ විට, ඔබ කියනුයේ ඔවුන් "එකම ජනගහන ව්‍යාප්තියක්" බවයි, යථාර්ථයේ දී ඒවා බෙහෙවින් වෙනස් වනු ඇත. ගැටළු ඇති කරන විවිධ මාතයන් ගැන සඳහන් නොකල යුතුය ...
සම්භාවිතාවය

නමුත්, සමහර අරමුණු අදහස් සඳහා වන අදාළ: වැටුප් යනු පුළුල් වැටුප් මුදලක් අර්ථවත් බව තේරුම, විචල්ය. සමහර (උප) කාණ්ඩයක මුළු වැටුප් ආදායම අදාළ වන ප්‍රශ්න සඳහා, මාධ්‍යයන් නිවැරදි දෙය වේ: මුළු මුදල ලබා ගත හැක්කේ මධ්‍යන්‍යයෙන් නොව මධ්‍යන්‍යයෙන් ය.
kjetil b halvorsen

jkjetilbhalvorsen: එසේනම් මුළු මුදල පමණක් භාවිතා නොකරන්නේ ඇයි?
naught101

n

10

P- අගය යනු ශුන්‍ය උපකල්පනය සත්‍ය වන සම්භාවිතාව සහ (1-p) යනු විකල්ප කල්පිතය සත්‍ය බවට සම්භාවිතාවය, ශුන්‍ය උපකල්පනය ප්‍රතික්ෂේප කිරීමට අපොහොසත් වීම යන්නෙන් අදහස් වන්නේ විකල්ප කල්පිතය ව්‍යාජ ය.


1
සිත්ගන්නා කරුණ නම්, ඇට්කින් පෙන්වන්නේ මෙම අනුපාතය යනු සම්භාවිතා අනුපාතය වඩා අඩු විය හැකි පශ්චාත් සම්භාවිතාව බවයි 1(නිරීක්ෂණය කරන ලද ස්ථාවර දත්ත සඳහා)
සම්භාවිතා විද්යාත්මක

සිත්ගන්නා කරුණ නම්, ඒ ගැන කියවීමට මට යොමු කිරීමක් කළ හැකිද?
දික්රාන් අඟහරු

2
(මෙන්න ඔබ යන්න) [ ece.uvic.ca/~bctill/papers/mocap/Aitkin_1997.pdf] පුද්ගලිකව, මට එය සිත්ගන්නාසුළු වුවත්, පශ්චාත් අනුපාත බෙදා හැරීමේ සම්භාවිතාව අනුපාතය ඇයි යන ප්‍රශ්නය සමඟ මම පොරබදිමි . උනන්දුව.
සම්භාවිතා

10

ඩිර්කාන්ට සමාන නහරයක - ශුන්‍ය උපකල්පිතය සත්‍ය බවට සාක්‍ෂි විධිමත් පියවරක් ලෙස p- අගයන් භාවිතා කිරීම. එයට හොඳ සුවදායී හා බුද්ධිමය වශයෙන් හොඳ ලක්ෂණ ඇත, නමුත් මූලික වශයෙන් එය අසම්පූර්ණ සාක්ෂි මිනුමකි, මන්ද එය විකල්ප කල්පිතයට කිසිදු සඳහනක් නොකරයි. දත්ත ශුන්‍යය යටතේ විය නොහැකි වුවත් (කුඩා p අගයකට තුඩු දෙයි), දත්ත ඊටත් වඩා අසීරු විය හැකිය , විකල්ප කල්පිතය යටතේ .

උපකල්පිත පරීක්ෂණයේ සමහර ශෛලීන් සමඟ සම්බන්ධ වන p- අගයන් සමඟ ඇති අනෙක් ගැටළුව, ඉතා අපැහැදිලි “විශාල වටිනාකම” හැරුණු විට ඔබ තෝරා ගත යුතු සංඛ්‍යාලේඛන මොනවාදැයි ඔබට පවසන මූලධර්මයක් නොමැත. "ශුන්‍ය උපකල්පනය සත්‍ය නම් විය නොහැක්කකි". නැවත වරක්, ඔබට අසම්පූර්ණ බව පෙනේ, මන්ද ඔබට "විශාල වටිනාකමක්" තිබිය යුතුය"ඉඩ නම් විකල්ප කල්පිතය සත්ය" පරීක්ෂණ සංඛ්යා ලේඛන ක අතිරේක කලපුවේ කිලෝමීටරයක් ලක්ෂණය ලෙස.


මම පිළිතුරු නොදෙන්නේ මට එක දෙයක් සිතීමේ කරදරයට යාමට අවශ්‍ය නැති නිසාත්, ඒ කාරණය සඳහා දැනටමත් ලබා දී ඇති සියල්ල හරහා මම නැවත නැවත නොකිරීමට වග බලා ගන්න නිසාත්! නමුත් මම හිතන්නේ මට උදව් කළ හැකිය. ගුඩ් ඇන්ඩ් හාඩින් විසින් "සංඛ්‍යාලේඛනවල පොදු දෝෂ සහ ඒවා වළක්වා ගන්නේ කෙසේද" නමින් පොතක් තිබේ. ඔබට එහි විශිෂ්ට උදාහරණ රාශියක් සොයාගත හැකිය. එය දැනටමත් එහි සිව්වන සංස්කරණයට පිවිසෙන ජනප්‍රිය ග්‍රන්ථයකි.
මයිකල් ආර්. චර්නික්

ඇල්ට්මන්ගේ චැප්මන් ඇන්ඩ් හෝල් / සීආර්සී සමඟ “වෛද්‍ය පර්යේෂණයේ ප්‍රායෝගික සංඛ්‍යාලේඛන” යන ග්‍රන්ථය වෛද්‍ය සාහිත්‍යය පිළිබඳ පරිච්ඡේදයක් ඇති අතර ප්‍රකාශිත පුවත්පත්වල සිදු වූ සංඛ්‍යානමය පාපයන් බොහොමයක් අනාවරණය වේ.
මයිකල් ආර්. චර්නික්

9

ඉල්ලුම් කිරීම සහ සමහර විට ප්‍රවාහ සටහන ලබා ගැනීම : ඔබේ විචල්‍යයන්ගේ මට්ටම කුමක්ද සහ ඔබ සොයන්නේ කුමන ආකාරයේ සම්බන්ධතාවයක්ද යන්න ඔබ පවසන චිත්‍රමය දෙය වන අතර වෙළඳ නාම නාම පරීක්ෂණයක් හෝ වෙළඳ නාම නාම සංඛ්‍යාලේඛනයක් ලබා ගැනීම සඳහා ඔබ ඊතල අනුගමනය කරයි. . සමහර විට අද්භූත 'පරාමිතික' සහ 'පරාමිතික නොවන' මාර්ග සමඟ ඉදිරිපත් කෙරේ.


9

සාපේක්ෂ සංඛ්‍යාත නිදර්ශනය කිරීම සඳහා පයි ප්‍රස්ථාර භාවිතා කිරීම. තවත් මෙහි .


2
වෙබ් අඩවියේ යම් තර්ක ඇතුළත් කිරීම හොඳය.
naught101

9

"නිරපේක්ෂ සත්‍යය" මැනීම සඳහා උපකල්පිත පරීක්ෂණයේ සංඛ්‍යාන / සම්භාවිතාව භාවිතා කිරීම. සංඛ්‍යාලේඛනවලට මෙය කළ නොහැකි අතර, ඒවා ප්‍රයෝජනවත් විය හැක්කේ විකල්ප අතර තීරණය කිරීමේදී පමණි, ඒවා සංඛ්‍යානමය පරමාදර්ශයට “පිටතින්” නියම කළ යුතුය. “ශුන්‍ය උපකල්පනය සංඛ්‍යාලේඛන මගින් සත්‍ය බව ඔප්පු වේ” වැනි ප්‍රකාශයන් වැරදිය. සංඛ්‍යාලේඛන මඟින් ඔබට පැවසිය හැක්කේ “විකල්ප උපකල්පිතයට සාපේක්ෂව ශුන්‍ය උපකල්පනය දත්ත වලට අනුග්‍රහය දක්වයි” යන්නයි. ශුන්‍ය උපකල්පනය හෝ විකල්පය සත්‍ය විය යුතු යැයි ඔබ උපකල්පනය කරන්නේ නම් , ඔබට “ශූන්‍යය සත්‍ය බව ඔප්පු විය” යැයි පැවසිය හැකිය, නමුත් මෙය ඔබේ උපකල්පනයේ සුළු ප්‍රති ence ලයක් පමණි, දත්ත මගින් නිරූපණය කරන කිසිවක් නොවේ.


9

එකම දත්ත මත එකම හෝ සමාන අත්හදා බැලීමක් 20 වතාවක් පුනරාවර්තනය කර සංඛ්‍යානමය වශයෙන් වැදගත් ප්‍රති result ලයක් වාර්තා කිරීම α=0.05. අහම්බෙන් මේ ගැන විකට චිත්‍රයක් තිබේ .

Ogrisel ගේ පිළිතුරට සමානව (හෝ බොහෝ දුරට සමාන) , ජාලක සෙවුමක් සිදු කර හොඳම ප්‍රති .ලය පමණක් වාර්තා කරයි.


මම හිතන්නේ ඔබ අමරණීය එකක් වුවද වෙනස් විකට චිත්‍රයකට සම්බන්ධ වීමට අදහස් කර ඇත.
රෝලන්ඩෝ 2

සමහර විට, මගේ මතකයේ තිබූ දේ මට හොඳින් මතක නම්: xkcd.com/882
ඇන්ඩෲ

8

(සුළු වාසනාවකින් මෙය මතභේදාත්මක වනු ඇත.)

විද්‍යාත්මක අත්හදා බැලීම් සංඛ්‍යානමය විශ්ලේෂණය සඳහා නේමන්-පියර්සන් ප්‍රවේශයක් භාවිතා කිරීම. නැතහොත්, නරකම දෙය නම්, නේමන්-පියර්සන් සහ ෆිෂර්ගේ වැරදි අර්ථ දක්වා ඇති දෙමුහුන් වර්ගයක් භාවිතා කිරීමයි.


නොදැන සිටීම ගැන කණගාටුයි, නමුත් විද්‍යාත්මක අත්හදා බැලීම් (ප්‍රති come ල) විශ්ලේෂණය කිරීම සඳහා නේමන්-පියර්සන් ඉදිකිරීමේ වරද කුමක්ද?
ඇන්ඩ්‍රේ හොල්ස්නර්

Nd ඇන්ඩ්‍රේ මෙම ප්‍රකාශය thread මයිකල් ලිව් විසින් මෙම ත්‍රෙඩ් එකේ වෙනත් තැනක ( stats.stackexchange.com/questions/4551/… ) ඉදිරිපත් කළ තවත් ප්‍රකාශයක් සමඟ සමීපව සම්බන්ධ විය හැකි යැයි මම සිතමි .
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.