1 ට වැඩි සම්භාවිතා බෙදාහැරීමේ අගය හරිද?


153

මත බොළඳ Bayes classifiers විකිපීඩියා, නිදහස් විශ්වකෝෂය පිළිබඳ පිටුව , මේ මාර්ගයක් තිබේ:

p(height|male)=1.5789 (1 ට වැඩි සම්භාවිතා ව්‍යාප්තියක් හරි. එය සීනුව වක්‍රය යටතේ ඇති ප්‍රදේශය 1 ට සමාන වේ.)

අගය හරි වන්නේ කෙසේද? සියලු සම්භාවිතා අගයන් පරාසය තුළ ප්‍රකාශිත යැයි මම සිතුවෙමි . තවද, එවැනි අගයක් තිබිය හැකි බැවින්, පිටුවෙහි පෙන්වා ඇති උදාහරණයෙන් එම අගය ලබා ගන්නේ කෙසේද?0 පි 1>10p1


2
ඕනෑම කාල පරාසයක් තුළ ඒකාබද්ධ වූ තාක් දුරට එය ඕනෑම ධනාත්මක සංඛ්‍යාවක් විය හැකි සම්භාවිතා ity නත්ව ශ්‍රිතයේ උස විය හැකි බව මා දුටු විට, අනුකලනය 1 ට වඩා අඩු හෝ සමාන වේ. විකිපීඩියාව එම ප්‍රවේශය නිවැරදි කළ යුතුය.
මයිකල් ආර්. චර්නික්

16
මෙය අනාගත පා readers කයන්ට ප්‍රයෝජනවත් විය හැකි බැවින්, මෙම ප්‍රශ්නයේ පොදු කොටසෙහි ජ්‍යාමිතික පරිවර්තනයක් මම ඉදිරිපත් කරමි: " ට නොඉක්මවන හැඩයක් ඕනෑම දිශාවකට ට වඩා දිගු කළ හැක්කේ කෙසේද?" නිශ්චිතවම, හැඩය යනු පී.ඩී.එෆ් හි ප්‍රස්ථාරයෙන් මායිම් කර ඇති ඉහළ අර්ධ තලයේ කොටස වන අතර ප්‍රශ්නයේ දිශාව සිරස් වේ. ජ්‍යාමිතික සැකසුම තුළ (සම්භාවිතා අර්ථ නිරූපනයේ දීප්තිය) ට නොඅඩු පාදමේ සෘජුකෝණාස්රයක් සහ උස වැනි උදාහරණ ගැන සිතීම පහසුය . 1 1 / 2 2111/22
whuber

විකිපීඩියා ලිපිය දැන් සම්භාවිතා pP
ity නත්වය

මම මෙය ඊළඟ මිනිහා සඳහා මෙහි
ජෝෂුවා

1
සමුච්චිත බෙදාහැරීමේ ශ්‍රිතයකට (පී.ඩී.එෆ් හි අනුකලනය) 1 ට වඩා ඉහළින් යා නොහැකි බව සඳහන් කිරීම වටී. සීඩීඑෆ් බොහෝ අවස්ථාවන්හිදී භාවිතා කිරීමට වඩා බුද්ධිමත් ය.
naught101

Answers:


169

මෙම විකී පිටුව සම්භාවිතාව ලෙස මෙම අංකය සඳහන් කිරීමෙන් භාෂාව අනිසි ලෙස භාවිතා කරයි. එය එසේ නොවන බව ඔබ නිවැරදිය. එය ඇත්ත වශයෙන්ම අඩියකට සම්භාවිතාවකි . විශේෂයෙන්, 1.5789 (අඩි 6 ක උසකට) වටිනාකමෙන් ඇඟවෙන්නේ අඩි 5.99 ත් 6.01 ත් අතර උසක සම්භාවිතාව පහත සඳහන් ඒකක රහිත අගයට ආසන්න බවයි:

1.5789[1/foot]×(6.015.99)[feet]=0.0316

මෙම අගය කළ යුතුය ඔබ දන්නා පරිදි, 1 ඉක්මවා නැත. (කුඩා පරාසයක උස (මෙම උදාහරණයේ 0.02) සම්භාවිතා උපකරණයේ තීරණාත්මක කොටසකි. එය උසෙහි “අවකලනය” වන අතර එය මම කෙටියෙන් ලෙස හඳුන්වන්නෙමි.) යම් ඒකකයක සම්භාවිතාව නමින් ඝනත්වයකින් ඒකක පරිමාවකට මහා වැනි අනෙකුත් ඝනත්වයකින් වෙත සාම්යයක්.d(height)

තලයෙහි සම්භාවිතාව ඝනත්වයකින් අත්තනෝමතික විශාල වටිනාකම් පවා අනන්ත අය විය හැකිය.

ගැමා බෙදා හැරීම

මෙම උදාහරණයෙන් පෙන්වන්නේ ගැමා ව්‍යාප්තියක් සඳහා සම්භාවිතා හැඩයේ පරාමිතිය සහ පරිමාණය ). ඝනත්වය බොහෝ අඩු නිසා , වක්රය වඩා ඉහළ සිටිය යුතුය ක් ප්රදේශයේ ඇති කිරීම සඳහා සියලු සම්භාවිතාව බෙදාහැරීම් සඳහා අවශ්ය.1 / 5 1 1 13/21/5111

බීටා බෙදා හැරීම

මෙම ity නත්වය ( පරාමිතීන් සහිත බීටා බෙදාහැරීමක් සඳහා ) සහ දී අසීමිත වේ . මුළු ප්‍රදේශය තවමත් සීමිතයි (සහ සමානයි )!0 1 11/2,1/10011


එම උදාහරණයේ දී අඩි 1.5789 / ක වටිනාකම ලබා ගන්නේ පිරිමින්ගේ උස සාමාන්‍ය ව්‍යාප්තියක් අඩි 5.855 ක් වන අතර විචලනය වර්ග අඩි 3.50e-2 වේ. (මෙය පෙර වගුවකින් සොයාගත හැකිය.) එම විචල්‍යයේ වර්ග මූලය අඩි 0.18717 ක සම්මත අපගමනයයි. මධ්යන්යයේ SD තැටි සංඛ්යාව ලෙස අපි අඩි 6 ක් නැවත ප්රකාශ කරමු:

z=(65.855)/0.18717=0.7747

සම්මත අපගමනය අනුව බෙදීම සම්බන්ධතාවයක් ඇති කරයි

dz=d(height)/0.18717

සාමාන්‍ය සම්භාවිතා ity නත්වය, අර්ථ දැක්වීම අනුව සමාන වේ

12πexp(z2/2)dz=0.29544 d(height)/0.18717=1.5789 d(height).

(ඇත්තටම, මම මොහු වංචා: මම හුදෙක් (6, 5,855, 0,18717, අසත්ය) ගණනය NORMDIST කිරීමට එක්සෙල් ඉල්ලා ඒත් මම ඇත්තටම වග බලා ගන්න, සූත්රය එරෙහිව එය පරීක්ෂා කළා..) අපි ඉවත් කළ විට අත්යවශ්ය අවකල චෙෂයර් කැට්ගේ සිනහව මෙන් ඉතිරිව ඇත්තේ අංකය පමණි . සම්භාවිතාවක් ඇති කිරීම සඳහා සංඛ්‍යාවේ උසෙහි කුඩා වෙනසකින් ගුණ කළ යුතු බව අප, පා readers කයින් තේරුම් ගත යුතුය.1.5789d(height)1.5789


එම විකී පිටුවේ දක්වා ඇති උදාහරණය, ​​පෝස්ටර් ගණනය කිරීම සඳහා සත්‍ය සම්භාවිතාවන් වෙනුවට සම්භාවිතා ities නත්වයන් භාවිතා කරන බව මම සටහන් කරමි, අනුමාන වශයෙන් ඒකක සංසන්දනය කිරීමේදී ඒකක එක සමාන වන්නේ නම් සංසන්දනාත්මක අරමුණු සඳහා අවශ්‍ය නොවේ. මෙය දීර් ing කිරීම, යමෙකුට සාමාන්‍ය බව උපකල්පනය කිරීමට අවශ්‍ය නැති නමුත් ඒ වෙනුවට යමෙකුට ity නත්වය තක්සේරු කළ හැකි ආනුභවික දත්ත තිබේ නම්, උදා: කර්නල් dens නත්ව ඇස්තමේන්තුවක්, x- අක්ෂයේ දී දී ඇති අගයකට කියවීමක් භාවිතා කිරීම වලංගු ද? අහිංසක බේස් වර්ගීකරණයේ පෝස්ටර් ගණනය කිරීම සඳහා ආදානය ලෙස kde, ඒකකයකට සමාන යැයි උපකල්පනය කර?
babelproofreader

1
abbabelproofreader මම විශ්වාස කරන්නේ පෝස්ටර් යනු පුහුණු දත්ත හරහා ප්‍රියර්වරුන්ගේ බේසියානු යාවත්කාලීන කිරීම් බවයි. ඒ හා සමානව kde එකක් සෑදිය හැක්කේ කෙසේද යන්න පැහැදිලි නැත, නමුත් මම මෙම ප්‍රදේශයේ විශේෂ expert යෙක් නොවේ. ඔබේ ප්‍රශ්නය වෙනමම පළ කිරීම ගැන සලකා බැලීමට තරම් සිත්ගන්නා සුළුය.
whuber

හොඳ අවකලනය යනු කුමක්දැයි ඔබ තීරණය කරන්නේ කෙසේද? ඒ වෙනුවට ඔබ 1 හි අවකලනය තෝරාගෙන ඇත්නම් කුමක් කළ යුතුද? සම්භාවිතාව 1 ට වඩා විශාල විය හැකිද? මගේ ව්‍යාකූලත්වයට කණගාටුයි. ඔබට පැහැදිලි කළ හැකිද?
fiacobelli

3
reeTree ත්රිකෝණයක ප්රදේශය එහි පාදමේ දිග හා උසෙහි භාගයක් වේ.
whuber

1
9 user929304 ඔබට ආයාචනා කරන ඕනෑම න්‍යායාත්මක පෙළපොතක් වෙත යොමු විය හැකිය: මෙය සම්භාවිතාව සහ සංඛ්‍යාලේඛනවල මූලධර්මවල කොටසකි. සම්භාවිතාව මෙම විශේෂ සංකල්පය ඝනත්වය වැනි වඩා හොඳ හඳුන්වාදීමේ පොත්, දී අවසරයෙන් සාකච්ඡා කරයි Freedman, Pisani, Purves .
whuber

45

විචල්‍යය අඛණ්ඩව පවතින සම්භාවිතා ස්කන්ධ ශ්‍රිත අතර විචල්‍යය විවික්ත වන සහ සම්භාවිතා ity නත්ව ශ්‍රිත අතර වෙනස තේරුම් නොගැනීමෙන් මෙය පොදු වැරැද්දකි. සම්භාවිතා ව්‍යාප්තිය යනු කුමක්දැයි බලන්න :

අඛණ්ඩ සම්භාවිතාව ශ්‍රිතයන් අර්ථ දැක්වෙන්නේ අඛණ්ඩ කාල පරාසයක් තුළ අසීමිත සංඛ්‍යාවක් සඳහා වන අතර, එක් ලක්ෂ්‍යයක සම්භාවිතාව සෑම විටම ශුන්‍ය වේ. සම්භාවිතාව මනිනු ලබන්නේ තනි ලක්ෂ්‍යයකට නොව කාල පරතරයන් මගිනි. එනම්, එකිනෙකට වෙනස් ලක්ෂ්‍ය දෙකක් අතර වක්‍රය යටතේ ඇති ප්‍රදේශය එම පරතරය සඳහා සම්භාවිතාව අර්ථ දක්වයි. මෙයින් අදහස් කරන්නේ සම්භාවිතා ශ්‍රිතයේ උස ඇත්ත වශයෙන්ම එකකට වඩා වැඩි විය හැකි බවයි. අනුකලනය එකකට සමාන විය යුතු දේපල, සියලු සම්භාවිතාවන්ගේ එකතුව එකකට සමාන විය යුතු විවික්ත බෙදාහැරීම් සඳහා දේපල වලට සමාන වේ.


14
එන්අයිඑස්ටී සාමාන්‍යයෙන් බලයලත් ය, නමුත් මෙහි එය තාක්‍ෂණිකව වැරදිය. ඇත්ත වශයෙන්ම ඔවුන් අනන්ත කාර්දිනල්තා පිළිබඳ අවධානය වෙනතකට යොමු කරමින් සිටී, නමුත් මෙහි තර්කනය නොමඟ යවන සුළුය. උපුටා දැක්වීමේ පළමු වාක්‍යය මඟ හැරීම ඔවුන්ට වඩා හොඳය.
whuber

උපකල්පිත අඛණ්ඩ පී.ඩී.එෆ් යැයි උපකල්පනය කරමින් , එක් අවස්ථාවක සම්භාවිතාව සාමාන්‍යයෙන් අසීමිත ලෙස කුඩා වේ ( කැල්කියුලස් හි සීමාවන් සිතන්න ). බොහෝ විට "සෑම විටම ශුන්‍ය" නම්, අර්ථ දැක්වීම අනුව , එවැනි ප්‍රති result ලයක් ලබා ගත නොහැක.
නොබාර්

23

අන්තරයක් පුරා අඛණ්ඩ ඒකාකාර බෙදාහැරීමක් මෙම ප්‍රශ්නයට සෘජු උදාහරණයක් සපයයි යැයි මම සිතමි : අඛණ්ඩ ඒකාකාර බෙදාහැරීමක දී එක් එක් ලක්ෂ්‍යයේ ity නත්වය සෑම ලක්ෂ්‍යයකම (ඒකාකාර ව්‍යාප්තිය) සමාන වේ. එපමණක් නොව, සෘජුකෝණාස්රයට පහළින් ඇති ප්‍රදේශය එකක් විය යුතු නිසා (සාමාන්‍ය වක්‍රයට පහළින් ඇති ප්‍රදේශය එකක් විය යුතුය) අගය විය යුතුය. මන්දයත් පාදක සහ ප්‍රදේශය සහිත ඕනෑම සෘජුකෝණාස්රයක උස .1 / ( b - a ) b - a 1 1 / ( b - a )[a,b]1/(ba)ba11/(ba)

එබැවින් පරතරය හි අගය , පරතරය මත එය , ...1 / ( 0.5 - 0 ) = 2 [ 0 , 0.1 ] 10[0,0.5]1/(0.50)=2[0,0.1]10


4

මෙම ත්‍රෙඩ් එකේ ආරම්භක ලිපි වලට පසුව විකිපීඩියා ලිපිය සංස්කරණය කර ඇත්දැයි මම නොදනිමි, නමුත් දැන් එය පවසන්නේ "1 ට වඩා වැඩි අගයක් මෙහි හරි බව සලකන්න - එය සම්භාවිතාවට වඩා සම්භාවිතා ity නත්වයකි, මන්ද උසයි අඛණ්ඩ විචල්‍යයකි. ”, සහ අවම වශයෙන් මෙම ආසන්නතම සන්දර්භය තුළ, P සම්භාවිතාව සඳහා භාවිතා කරන අතර p සම්භාවිතා ity නත්වය සඳහා භාවිතා වේ. ඔව්, ලිපිය සමහර ස්ථානවල සම්භාවිතාව යන්නෙන් අදහස් කරන අතර අනෙක් ස්ථානවල සම්භාවිතා ity නත්වය ලෙස භාවිතා කරයි.

මුල් ප්‍රශ්නයට ආපසු "සම්භාවිතා බෙදා හැරීමේ අගය 1 ඉක්මවිය හැකිද?" නැත, නමුත් එය සිදු කර ඇති බව මම දැක ඇත්තෙමි (පහත මගේ අවසාන ඡේදය බලන්න).

සම්භාවිතාව අර්ථ නිරූපණය කරන්නේ කෙසේද යන්න මෙහි දැක්වේ> 1. පළමුවෙන්ම, ක්‍රීඩාවේදී අප නිතර අසන හා සමහර විට වැඩ කරන පරිදි මිනිසුන්ට 150% ක උත්සාහයක් ලබා දිය හැකි බව මතක තබා ගන්න https://www.youtube.com/watch?v=br_vSdAOHQQ . යමක් සිදුවනු ඇතැයි ඔබට විශ්වාස නම්, එය 1 ක සම්භාවිතාවක් වේ. සිදුවීම සිදුවනු ඇතැයි 150% ක් විශ්වාස කරන බැවින් 1.5 ක සම්භාවිතාවක් අර්ථ දැක්විය හැකිය - එය 150% උත්සාහයක් ලබා දීම වැනි ය.

ඔබට සම්භාවිතාව> 1 තිබිය හැකි නම්, ඔබට සම්භාවිතාවක් තිබිය හැකි යැයි සිතමි <0. Neg ණාත්මක සම්භාවිතාවන් පහත පරිදි අර්ථ දැක්විය හැකිය. 0.001 ක සම්භාවිතාවක් යනු සිදුවීම සිදුවීමට කිසිදු ඉඩක් නොමැති බවයි. සම්භාවිතාව = 0 යන්නෙහි තේරුම “මාර්ගයක් නැත” යන්නයි. -1.2 වැනි negative ණාත්මක සම්භාවිතාවක් "ඔබ විහිළු කළ යුතුය" යන්නට අනුරූප වේ.

මම දශක 3 කට පෙර පාසලෙන් පිටතදී කිරි වැරූ පිරිමි ළමයෙකු ලෙස සිටියදී, ගුවන් සේවයේ ශබ්ද බාධකය බිඳ දැමීමට වඩා විශ්මය ජනක සිදුවීමක් මා දුටුවා, එනම් සම්භාවිතාවයේ එක්සත් බාධක බිඳ දැමීම. විශ්ලේෂකයෙකු ආචාර්ය උපාධියක් ලබා ඇත. භෞතික විද්‍යාවේ දී X වස්තුව හඳුනා ගැනීමේ සම්භාවිතාව ගණනය කිරීම සඳහා ආකෘතියක් සංවර්ධනය කිරීම සඳහා වසර 2 ක් පූර්ණ කාලීනව (බොහෝ විට 150% ක් ලබා දී ඇත), අවසානයේදී ඔහුගේ ආකෘතිය සහ විශ්ලේෂණය එක්සත් ජනපදයට සමීපව අනුබද්ධ විද්‍යා scientists යින් සහ ඉංජිනේරුවන් කිහිප දෙනෙකුගේ සම වයස් සමාලෝචනය සාර්ථකව නිම කරන ලදී. රජය. X වස්තුව යනු කුමක්දැයි මම ඔබට නොකියමි, නමුත් X වස්තුව සහ එය හඳුනා ගැනීමේ සම්භාවිතාව එක්සත් ජනපද රජයට සැලකිය යුතු උනන්දුවක් දක්වයි. ආකෘතියට = Prob සඳහා සූත්‍රයක් ඇතුළත් විය (සිදුවීම y සිදු වේ). P y P y P y P y P y P y P yPyPyසහ තවත් සමහර පද සියල්ලම අවසාන සූත්‍රයට ඒකාබද්ධ වූ අතර එය ප්‍රොබ් (වස්තුව X අනාවරණය විය). ඇත්ත වශයෙන්ම, කොල්මෝගොරොව් සම්ප්‍රදායේ සම්භාවිතාවයේ “සාම්ප්‍රදායික” මෙන්ම ප්‍රොබ්හි ගණනය කළ අගයන් (වස්තුව X අනාවරණය වේ) [0,1] පරාසය තුළ විය. එහි මුල් ස්වරූපයෙන් සෑම විටම [0,1] අතර සම්මත ෆෝට්රාන් හෝ ඕනෑම විද්‍යාත්මක කැල්කියුලේටරයකින් ලබා ගත හැකි "උද්‍යාන-විවිධ" අද්භූත කාර්යයන් සම්බන්ධ විය. කෙසේ වෙතත්, විශ්ලේෂකයාට සහ දෙවියන් වහන්සේට පමණක් දන්නා හේතුවක් නිසා (සමහර විට එය ඔහුගේ භෞතික විද්‍යා පන්තිවල සහ පොත්වල සිදු කර ඇති බව ඔහු දැක ඇති නිසා විය හැකිය, නමුත් එය ක්‍රියාත්මක වන අවස්ථා කිහිපයක් ඔහුට පෙන්වූ බව ඔහු දැන සිටියේ නැත. නැත, මෙම පුද්ගලයාගේ නම සහ විද්‍යාත්මක / ගණිතමය විනිශ්චය ඩිරැක්ගේ තීන්දුව නොවේ),PyPy(සහ ඉතිරි පදය නොසලකා හරින්න), මෙතැන් සිට එය ලෙස . සඳහා අවසාන ප්‍රකාශනයට ඇතුළත් කරන ලද හි මෙම වාර දෙකේ ටේලර් ප්‍රසාරණයයි (වස්තුව X අනාවරණය විය). මා ඔහුට පෙන්වා දෙන තුරු ඔහු නොදැන සිටි දෙය නම්, සියලු පරාමිතීන් සඳහා ඔහුගේ මූලික සිද්ධි අගයන් භාවිතා කරමින් දළ වශයෙන් 1.2 ට සමාන බවයි. ඇත්ත වශයෙන්ම එය සඳහා හැකි වියPyPyPyPy1.8 ක් දක්වා ඉහළට. එකමුතු බාධකය සම්භාවිතාවයෙන් බිඳී ගියේ එලෙසිනි. අඳුරු සම්මන්ත්‍රණ ශාලාවක බැටරි බලයෙන් ක්‍රියා කරන ක්‍රෙඩිට් කාඩ් ප්‍රමාණයේ කැෂියෝ විද්‍යාත්මක කැල්කියුලේටරය පිළිබඳව ඉක්මන් ගණනය කිරීම් සිදු කර ඇති බව මා ඔහුට පෙන්වා දෙන තෙක් ඔහු මෙම පුරෝගාමී ක්‍රියාව ඉටු කළ බව ඔහු දැන සිටියේ නැත. සූර්ය බලයෙන් ක්‍රියාත්මක වන කැල්කියුලේටරය). එය හරියට චක් යෙගර් තම ගුවන් යානයේ ඉරිදා භ්‍රමණය සඳහා පිටත්ව යෑමට සමාන වන අතර, මාස කිහිපයකට පසුව ඔහු ශබ්ද බාධකය බිඳ දැමූ බව දැනුම් දෙනු ලැබේ.


මරු කතාව. උපුටා දැක්වීමක් වැනි ඔබට මේ පිළිබඳ තවත් තොරතුරු තිබේද?
ජේ ෂයිලර් රාඩ්ට්

1
@ ජේ ෂයිලර් රාඩ්ට් මෙය stats.stackexchange.com/questions/4220/… , ha ha හි ලේඛනගත කර ඇත .
මාර්ක් එල්. ස්ටෝන්

0

Xf(x)f(x)dxf(x)f(height|male)f(height|male)dheight

XP(X[x,x+dx))=f(x)dxP(X[a,b])=abf(x)dxP(X=x)=P(X[x,x])=0


-1

සම්භාවිතා ity නත්ව කුමන්ත්‍රණයක නිශ්චිත පරාමිති අගයක ලක්ෂ්‍ය අගය සම්භාවිතාවක් වනු ඇත, නේද? එසේ නම්, P (උස | පිරිමි) L (උස | පිරිමි) ලෙස වෙනස් කිරීමෙන් ප්‍රකාශය නිවැරදි කළ හැකිය.

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.