බීටා බෙදා හැරීම පිටුපස ඇති බුද්ධිය කුමක්ද?


466

වියාචනය: මම සංඛ්‍යාලේඛන ician යෙක් නොව මෘදුකාංග ඉංජිනේරුවෙක්මි. සංඛ්‍යාලේඛන පිළිබඳ මගේ දැනුමෙන් වැඩි ප්‍රමාණයක් ලැබෙන්නේ ස්වයං අධ්‍යාපනයෙනි, එබැවින් මෙහි සිටින අනෙක් පුද්ගලයින්ට සුළු දෙයක් ලෙස පෙනෙන සංකල්ප තේරුම් ගැනීමේදී මට තවමත් බොහෝ හිඩැස් ඇත. එබැවින් පිළිතුරු වලට නිශ්චිත නිශ්චිත කොන්දේසි සහ වැඩි පැහැදිලි කිරීම් ඇතුළත් කර ඇත්නම් මම ඉතා ස්තූතිවන්ත වෙමි. ඔබ ඔබේ ආච්චි සමඟ කතා කරන බව සිතන්න :)

මම ග්රහණය කර ගැනීමට උත්සාහ කරනවා ස්වභාවය පිළිබඳ බීටා බෙදාහැරීමේ - එය කිරීම සඳහා වන අතර ඒ එකිනෙකාගේ ක්ෂේත්ර තුළ, තොරතුරු පරිවර්තනය කරන්නේ කෙසේද යන්න විය යුතු දේ. අප කතා කරන්නේ නම්, සාමාන්‍ය බෙදාහැරීමක් නම්, යමෙකුට එය දුම්රියේ පැමිණීමේ වේලාව ලෙස හැඳින්විය හැකිය: බොහෝ විට එය නියමිත වේලාවට පැමිණේ, මඳක් අඩුවෙන් එය මිනිත්තු 1 කට පෙර හෝ මිනිත්තු 1 ක් ප්‍රමාද වන අතර ඉතා කලාතුරකින් එය වෙනස සමඟ පැමිණේ මධ්යන්යයෙන් මිනිත්තු 20 ක. ඒකාකාර බෙදාහැරීම, විශේෂයෙන්, ලොතරැයියේ එක් එක් ටිකට් පත සඳහා ඇති අවස්ථාව විස්තර කරයි. ද්විමය ව්‍යාප්තිය කාසි පෙරළීම් සමඟ විස්තර කළ හැකිය. නමුත් බීටා බෙදා හැරීම පිළිබඳ එවැනි අවබෝධාත්මක පැහැදිලි කිරීමක් තිබේද?

අපි කියමු, සහ . බීටා බෙදාහැරීම මේ අවස්ථාවේ දී පෙනේ (ආර් වලින් ජනනය වේ):α=.99β=.5B(α,β)

රූප විස්තරය මෙහි ඇතුළත් කරන්න

නමුත් ඇත්ත වශයෙන්ම එයින් අදහස් කරන්නේ කුමක්ද? Y- අක්ෂය පැහැදිලිවම සම්භාවිතා ity නත්වයකි, නමුත් X- අක්ෂයේ ඇත්තේ කුමක්ද?

මෙම උදාහරණය හෝ වෙනත් ඕනෑම පැහැදිලි කිරීමක් මම බෙහෙවින් අගය කරමි.


13
Y- අක්ෂය සම්භාවිතාවක් නොවේ (එය පැහැදිලිය, මන්ද අර්ථ දැක්වීම අනුව සම්භාවිතාව පිටත පැවතිය නොහැක , නමුත් මෙම කුමන්ත්‍රණය දක්වා විහිදෙන අතර ප්‍රතිපත්තිමය වශයෙන් ). එය සම්භාවිතා ity නත්වයකි : ඒකකයකට සම්භාවිතාව (සහ ඔබ අනුපාතයක් ලෙස විස්තර කර ඇත). [0,1]50xx
whuber

4
hwhuber: ඔව්, මට තේරෙනවා PDF යනු කුමක්ද - එය මගේ විස්තරයේ වැරැද්දක්. වලංගු සටහනකට ස්තූතියි!
මිතුරා

1
මම උත්සාහ කර විමර්ශනය සොයාගනු ඇත, නමුත් ආකෘතිය සමඟ සාමාන්‍යකරණය කළ බීටා බෙදාහැරීම සඳහා වඩාත් විකාර හැඩයන් කිහිපයක් මම දනිමි . එසේම, ඔබට එය දත්ත-දුප්පත් පරිසරවල විශේෂ expert දත්ත වලට (මිනි, මාදිලිය, උපරිම) ගැලපෙන අතර එය බොහෝ විට ත්‍රිකෝණාකාර බෙදාහැරීමක් භාවිතා කිරීමට වඩා හොඳය (අවාසනාවකට බොහෝ විට IEs භාවිතා කරයි). a+(ba)Beta(α1,α2)
SecretAgentMan

3
ඔබ පැහැදිලිවම ඩොයිෂ් බාන් නම් දුම්රිය සමාගම සමඟ ගමන් කර නැත. ඔබ අඩු ශුභවාදී වනු ඇත.
හෙනින් - මොනිකා නැවත ස්ථාපනය කරන්න

Answers:


658

කෙටි අනුවාදය නම්, බීටා බෙදා හැරීම සම්භාවිතා ව්‍යාප්තියක් නියෝජනය කිරීමක් ලෙස වටහා ගත හැකිය , එනම්, එම සම්භාවිතාව කුමක්දැයි අප නොදන්නා විට එය සම්භාවිතාවේ ඇති විය හැකි සියලු අගයන් නියෝජනය කරයි. මෙන්න මේ පිළිබඳ මගේ ප්‍රියතම බුද්ධිමය පැහැදිලි කිරීම:

බේස්බෝල් පහත ඕනෑම කෙනෙකු සමඟ හුරු පුරුදු පිතිකරු, සාමාන්යය -simply ක්රීඩකයා පදනම ලැබෙන වාර ගණන (එය පමණක් අතර ප්රතිශතයක් තියෙන්නේ ඒ නිසා ඔහු පන්දුවට පහර දී ඉහළ යයි වාර ගණන බෙදීම පහර 0සහ 1). .266සාමාන්‍යයෙන් සාමාන්‍ය පිතිකරණ සාමාන්‍යයක් .300ලෙස සලකනු ලබන අතර එය විශිෂ්ට එකක් ලෙස සැලකේ.

අපට බේස්බෝල් ක්‍රීඩකයෙකු සිටින බව සිතන්න, ඔහුගේ වාරයේ දිගු පිතිකරණ සාමාන්‍යය කුමක් වේදැයි අනාවැකි කීමට අපට අවශ්‍යය. ඔහුගේ පිතිකරණ සාමාන්‍යය අපට මෙතෙක් භාවිතා කළ හැකි යැයි ඔබ පැවසිය හැකිය- නමුත් මෙය වාරයක් ආරම්භයේ දී ඉතා දුර්වල පියවරක් වනු ඇත! ක්‍රීඩකයෙක් එක් වරක් පන්දුවට පහර දී තනි 1.000පහරක් ලබා ගන්නේ නම් , ඔහුගේ පිතිකරණ සාමාන්‍යය කෙටියෙන් වන අතර, ඔහු පිටතට පහර දුන්නොත්, ඔහුගේ පිතිකරණ සාමාන්‍යය වේ 0.000. ඔබ පස් වතාවක් හෝ හය වතාවක් පන්දුවට පහර දුන්නොත් එය වඩා හොඳ නොවේ- ඔබට වාසනාවන්ත ඉරියව්වක් ලබා ගත හැකි අතර සාමාන්‍යයක් 1.000හෝ අවාසනාවන්ත ඉරියව්වක් ලබාගෙන සාමාන්‍යයක් ලබා ගත හැකිය 0, මේ දෙකම දුරස්ථව හොඳ පුරෝකථනය කරන්නෙකු නොවේ ඔබ එම වාරයේදී පන්දුවට පහර දෙනු ඇත.

පළමු පහර කිහිපය තුළ ඔබගේ පිතිකරණ සාමාන්‍යය ඔබේ අවසාන පිතිකරණ සාමාන්‍යය පිළිබඳ හොඳ පුරෝකථනයක් නොවන්නේ ඇයි? ක්‍රීඩකයෙකුගේ පළමු පන්දුවට පහර දීම වැඩ වර්ජනයක් වන විට, සෑම කන්නයකදීම ඔහුට කිසි විටෙකත් පහරක් නොලැබෙනු ඇතැයි කිසිවෙකු පුරෝකථනය නොකරන්නේ ඇයි? මොකද අපි යන්නේ පූර්ව අපේක්ෂාවන් සමඟ . අපට ඉතිහාසය තුල, සමය පුරා බොහෝ පිතිකරු සාමාන්ය බර වගේ දෙයක් අතර විනාශයක අදියරට ඇති බව දැන .215හා .360දෙපස සමහර ඉතා දුර්ලභ හැරෙන්නට,. ආරම්භයේදීම ක්‍රීඩකයෙකුට වැඩ වර්ජන කිහිපයක් ලැබුනහොත් එයින් ඇඟවෙන්නේ ඔහු සාමාන්‍යයට වඩා ටිකක් නරක අතට හැරෙනු ඇති බවයි, නමුත් ඔහු බොහෝ දුරට එම පරාසයෙන් බැහැර නොවන බව අපි දනිමු.

ද්විමය ව්‍යාප්තියකින් (සාර්ථකත්වයන් හා අසාර්ථකත්වයන් මාලාවක්) නිරූපණය කළ හැකි අපගේ පිතිකරණ සාමාන්‍ය ගැටලුව සැලකිල්ලට ගෙන, මෙම පූර්ව අපේක්ෂාවන් නිරූපණය කිරීමට හොඳම ක්‍රමය (සංඛ්‍යාලේඛන අනුව අප කලින් අමතන්නේ ) බීටා බෙදා හැරීමයි - එය කියන්නේ, ක්‍රීඩකයා ඔහුගේ පළමු පිතිකරණය දැකීමට පෙර, ඔහුගේ පිතිකරණ සාමාන්‍යය දළ වශයෙන් අපේක්ෂා කරන දේ. බීටා බෙදාහැරීමේ වසම (0, 1)සම්භාවිතාවයකට සමානය, එබැවින් අපි නිවැරදි මාර්ගයේ සිටින බව අපි දැනටමත් දනිමු, නමුත් මෙම කාර්යය සඳහා බීටා වල යෝග්‍යතාවය ඉන් ඔබ්බට යයි.

ක්‍රීඩකයාගේ වාරය පුරාම පිතිකරණ සාමාන්‍යය බොහෝ දුරට පවතිනු ඇතැයි අපි අපේක්ෂා කරමු .27, නමුත් එය සාධාරණව සිට පරාසය දක්වා .21විය .35හැකිය. පරාමිතීන් සහිත බීටා බෙදාහැරීමකින් මෙය නිරූපණය කළ හැකිය සහ :α=81β=219

curve(dbeta(x, 81, 219))

බීටා (81, 219)

මම හේතු දෙකක් නිසා මෙම පරාමිතීන් ඉදිරිපත් කළෙමි:

  • මධ්යන්යය is αα+β=8181+219=.270
  • කුමන්ත්‍රණයේ ඔබට දැකිය හැකි පරිදි, මෙම බෙදාහැරීම මුළුමනින්ම පාහේ පිහිටා ඇත (.2, .35)- පිතිකරණ සාමාන්‍යයක් සඳහා සාධාරණ පරාසය.

බීටා බෙදාහැරීමේ dens නත්ව බිම් කොටසක x අක්ෂය නියෝජනය කරන්නේ කුමක්දැයි ඔබ ඇසුවා - මෙහි එය ඔහුගේ පිතිකරණ සාමාන්‍යය නියෝජනය කරයි. මේ අවස්ථාවේ දී, y- අක්ෂය සම්භාවිතාවක් (හෝ වඩාත් නිවැරදිව සම්භාවිතා ity නත්වය) පමණක් නොව, x- අක්ෂය ද වේ (පිතිකරණ සාමාන්‍යය යනු පහරකෑමේ සම්භාවිතාවක් පමණි, සියල්ලට පසු)! බීටා බෙදා සම්භාවිතා ව්යාප්තියක් නියෝජනය බඹලොව ක .

නමුත් බීටා බෙදා හැරීම එතරම් සුදුසු වන්නේ ඇයිද යන්න මෙන්න. හිතන්න ක්‍රීඩකයාට එක පහරක් ලැබෙයි කියලා. මෙම වාරය සඳහා ඔහුගේ වාර්තාව දැන් 1 hit; 1 at bat. එසේ නම් අප ඇති යාවත්කාලීන අපි ටිකක් පුරා අපගේ නව තොරතුරු පිළිඹිබු කිරීම සඳහා මේ මුළු වක්රය පැටවීමට අවශ්ය අපගේ probabilities-. මෙය සනාථ කිරීම සඳහා ගණිතය ටිකක් සම්බන්ධ වී ඇති අතර ( එය මෙහි පෙන්වා ඇත ), ප්‍රති result ලය ඉතා සරල ය . නව බීටා බෙදාහැරීම වනුයේ:

Beta(α0+hits,β0+misses)

කොහෙද α0 සහ β0 අපි with- ආරම්භ පරාමිතීන් අනුව, මේ අවස්ථාවේ දී,, 81 සහ 219. ය යන α 1 (ඔහුගේ එකක් ලියන්නේ) විසින් වන අතර වැඩි වී ඇත β (කිසිදු වදින්නේ නැහැ තවමත්) සියලු දී වැඩි වී නැහැ. ඒ කියන්නේ අපේ නව බෙදාහැරීම Beta(81+1,219) , හෝ:

curve(dbeta(x, 82, 219))

රූප විස්තරය මෙහි ඇතුළත් කරන්න

එය යන්තම් වෙනස් වී ඇති බව සැලකිල්ලට ගන්න- වෙනස සැබවින්ම පියවි ඇසට නොපෙනේ! (එයට හේතුව එක් පහරකින් කිසිවක් අදහස් නොකෙරේ).

කෙසේ වෙතත්, වාරය තුළ ක්‍රීඩකයා වැඩි වැඩියෙන් පහර දෙන තරමට, නව සාක්ෂි වලට සරිලන පරිදි වක්‍රය වැඩි වන අතර, අපට වැඩි සාක්ෂි ඇති බව මත පදනම්ව එය තව තවත් පටු වනු ඇත. මෙම වාරයෙන් අඩක් ඔහු 300 වතාවක් පන්දුවට පහර දී ඇති අතර, එම කාලය තුළ 100 ක්ම පහර දුන්නේය. නව බෙදාහැරීම , හෝ:Beta(81+100,219+200)

curve(dbeta(x, 81+100, 219+200))

රූප විස්තරය මෙහි ඇතුළත් කරන්න

වක්‍රය දැන් පෙරට වඩා තුනී වී දකුණට (ඉහළ පිතිකරණ සාමාන්‍යයට) මාරු වී ඇති බව සැලකිල්ලට ගන්න- ක්‍රීඩකයාගේ පිතිකරණ සාමාන්‍යය කුමක්ද යන්න පිළිබඳව අපට හොඳ අවබෝධයක් ඇත.

මෙම සූත්‍රයේ වඩාත්ම සිත් ගන්නා සුළු ප්‍රතිදානයන්ගෙන් එකක් වන්නේ එහි ප්‍රති ing ලයක් ලෙස ඇති බීටා බෙදාහැරීමේ අපේක්ෂිත අගයයි, එය මූලික වශයෙන් ඔබගේ නව තක්සේරුවයි. බීටා බෙදාහැරීමේ අපේක්ෂිත වටිනාකම is බව මතක තබා ගන්න . මේ අනුව, සැබෑ පිතිකරුවන් 300 ක පහර 100 කට පසු , නව බීටා බෙදාහැරීමේ අපේක්ෂිත වටිනාකම - එය බොළඳ ඇස්තමේන්තුවට වඩා අඩු බව සලකන්න ක , නමුත් ඇස්තමේන්තු වඩා වැඩි ඔබ (සමග වාරය ආරම්භαα+β 81+10081+10081+100+219+200=.303100100+200=.3338181+219=.270). මෙම සූත්‍රය ක්‍රීඩකයෙකුගේ පහරවල් සහ පහරවල් ගණනට “ආරම්භයක්” එකතු කිරීමට සමාන බව ඔබට පෙනෙනු ඇත- ඔබ කියන්නේ “මෙම වාරයේදී ඔහු පහරවල් 81 ක් සහ ඔහුගේ වාර්තා නොවන පහර 219 ක් සමඟින් ආරම්භ කරන්න” යනුවෙනි. ).

මේ අනුව, බීටා බෙදා හැරීම සම්භාවිතා ව්යාප්තිය නියෝජනය සඳහා හොඳම බඹලොව ක අප දන්නා එහිදී නැහැ සම්භාවිතා කල්තියා දේ, නමුත් අපි යම් සාධාරණ අනුමාන ඇති නඩුව:.


5
මිතුරා: එය උදව් කිරීම ගැන සතුටුයි- ඔබ බේස්බෝල් අනුගමනය කරනු ඇතැයි මම බලාපොරොත්තු වෙමි (එසේ නොමැතිනම් එය තේරුම් ගත හැකිදැයි මම කල්පනා කරමි!)
ඩේවිඩ් රොබින්සන්

11
විවිධ සමාලෝචන සංඛ්‍යාවක් සහිත ද්විමය ඇමසන් විකුණුම් ශ්‍රේණිගත කිරීම් භාවිතා කරමින් ජෝන් කුක්ගේ සමාන උදාහරණයක් මෙන්න. අදහස් දැක්වීමේදී පෙර තෝරා ගැනීම පිළිබඳ සාකච්ඡාව විශේෂයෙන් ආලෝකමත් වේ: johndcook.com/blog/2011/09/27/bayesian-amazon/#comments
දිමිත්‍රි වී. මාස්ටරොව්

4
ඔබ Jeffreys 'පෙර, එක්ක යන්න නම් පූර්ව අවශ්යතාවක් බීටා-බෙදා (නොවන බව පෙන්වා යුතු පමණක් සම්භාවිතාව බීටා බෙදා ගත යුතුය -.α0=β0=1/2
නීල් ජී

5
+ ඔබට වැඩි දත්ත ඇති විට බෙදා හැරීම යාවත්කාලීන කරන්නේ කෙසේද යන්න පිළිබඳ ඔබේ පැහැදිලි කිරීමට මම කැමතියි.
මයික් ඩන්ලාවි

3
27 user27997 අය අපේක්ෂිත මධ්යන්ය .27 ලබා දුන් අතර, පිතිකරණ සාමාන්යයන් සඳහා දළ වශයෙන් යථාර්ථවාදී වන සම්මත අපගමනය (.025 පමණ). අහඹු ලෙස, මෙහි අපේක්ෂිත මධ්‍යන්‍යයෙන් හා විචල්‍යතාවයෙන් α සහ β ගණනය කරන්නේ කෙසේද යන්න පිළිබඳ පැහැදිලි කිරීමක් මම ලබා දෙමි .
ඩේවිඩ් රොබින්සන්

49

බීටා බෙදා සීමිත පරාසයක ඇති බව, ආදර්ශ දේවල් 0 1 වැනි කිරීමට භාවිතා කරයි.

උදාහරණ නම්, සාර්ථකත්වය සහ අසාර්ථකත්වය වැනි ප්‍රති two ල දෙකක් පමණක් ඇති පරීක්ෂණයක සාර්ථකත්වයේ සම්භාවිතාවයි. ඔබ සීමිත අත්හදා බැලීම් සංඛ්‍යාවක් කළහොත් සහ සමහර ඒවා සාර්ථක නම්, බීටා බෙදාහැරීමකින් ඔබට පවසන දේ නිරූපණය කළ හැකිය.

තවත් උදාහරණයක් වන්නේ ඇණවුම් සංඛ්‍යාලේඛන ය . උදාහරණයක් ලෙස, ඔබ අහඹු සංඛ්‍යා 0,1 ක් (4 කියන්න) උත්පාදනය කර ඒවා වර්ග කරන්නේ නම්, 3 වන ව්‍යාප්තිය කුමක්ද?

නියැදීමෙන් මෘදුකාංග කාර්ය සාධනය හඳුනා ගැනීම සඳහා මම ඒවා භාවිතා කරමි. ඔබ අහඹු ලෙස වැඩසටහනක් නතර නම් වතාවක්, සහ ඒක ඔබ එය ඇත්ත වශයෙන්ම ඔබ ඉවත් කළ හැකි යම් දෙයක් කරන්නේ, බලන්න ඒ කාලයේ ගේ > 1 , පසුව එසේ කිරීමෙන් එය ගලවා ගැනීමට කාලය භාගය නියෝජනය කරමින්, බී ටී වූ ( s + 1 , ( n - s ) + 1 ) , සහ වේගවත් කිරීමේ සාධකය බීටාප්‍රයිම් බෙදාහැරීමක් ඇත.nss>1Beta(s+1,(ns)+1)

ඒ ගැන වැඩි විස්තර ...


45

හි ස්වාධීන ඒකාකාර බෙදාහැරීම්වල අහඹු නියැදියක් සඳහා ඇණවුම් සංඛ්‍යාලේඛනයක් ලෙස බීටා බෙදා හැරීම ද පෙනේ .(0,1)

හරියටම, ඉඩ , ... , යූ n විය n ස්වාධීන සසම්භාවී විචල්යයන්, එක් එක් නිල ඇඳුම් බෙදා හැරීම සහිත ( 0 , 1 ) . විසින් දකුණු ආසියාතික සමාජ U ( 1 ) , ... , යූ ( n ) අහඹු නියැදි අනුපිළිවෙල සංඛ්යා ලේඛන ( U 1 , ... , යූ n ) වටිනාකම් තෝරා බේරා ගැනීමේ විසින් අර්ථ, යූ 1 , ... , යූ nU1Unn(0,1)U(1)U(n)(U1,,Un)U1Unඅනුපිළිවෙල වැඩි කිරීමේදී. විශේෂයෙන් සහ U ( n ) = max ( U i ) . එවිට සෑම k = 1 , , n සඳහා U ( k )බීටා ( k , n + 1 - k ) බව කෙනෙකුට පෙන්විය හැකිය .U(1)=min(Ui)U(n)=max(Ui)U(k)Beta(k,n+1k)k=1,,n

මෙම ප්‍රති result ලයෙන් පෙන්නුම් කරන්නේ බීටා බෙදාහැරීම් ස්වාභාවිකවම ගණිතයේ දිස්වන අතර එයට ගණිතයේ රසවත් යෙදුම් කිහිපයක් ඇති බවයි.


31

ප්‍රධාන පෙළඹවීම් දෙකක් තිබේ:

පළමුව, බීටා බෙදා හැරීම බර්නූලි බෙදා හැරීමට පෙර සංයුක්ත වේ. එයින් අදහස් වන්නේ ඔබ නැවත නැවත කාසි පෙරළීම මගින් තක්සේරු කරන කාසියක නැඹුරුව වැනි නොදන්නා සම්භාවිතාවක් තිබේ නම්, කාසි පෙරළීම් අනුපිළිවෙලක් මගින් නොදන්නා නැඹුරුව මත ඇතිවීමේ සම්භාවිතාව බීටා බෙදා හරිනු ඇති බවයි.

දෙවනුව, බීටා බෙදාහැරීම on ාතීය පවුලක් වීමේ ප්‍රතිවිපාකය නම් එය ප්‍රමාණවත් සංඛ්‍යාලේඛන සමූහයක් සඳහා වන උපරිම එන්ට්‍රොපි බෙදා හැරීමයි. බීටා බෙදාහැරීමේ අවස්ථාවෙහිදී, මෙම සංඛ්‍යාලේඛන [ 0 , 1 ] හි x සඳහා සහ ලොග් ( 1 - x ) වේ . එයින් අදහස් වන්නේ ඔබ x 1 , , x n සාම්පල සමූහයක් සඳහා මෙම ප්‍රමාණවත් සංඛ්‍යාලේඛනවල සාමාන්‍ය මිනුම් පමණක් තබා ගන්නේ නම්, සාම්පල බෙදා හැරීම පිළිබඳව ඔබට කළ හැකි අවම උපකල්පනය නම් එය බීටා බෙදා හැරීම බවයි.log(x)log(1x)x[0,1]x1,,xn

[0,1] ට වඩා සාමාන්‍යයෙන් දේවල් ආකෘතිකරණය කිරීම සඳහා බීටා බෙදා හැරීම විශේෂිත නොවේ, මන්ද බොහෝ බෙදාහැරීම් එම ආධාරකයට කපා දැමිය හැකි අතර බොහෝ අවස්ථාවන්හිදී එය වඩාත් අදාළ වේ.


25

රූප විස්තරය මෙහි ඇතුළත් කරන්න

සමහර ඊ-වාණිජ්‍ය වෙබ් අඩවි වල විකුණුම්කරුවෙකුට ශ්‍රේණිගත කිරීම් 500 ක් ලැබෙනු ඇතැයි සිතමු. එයින් 400 ක් හොඳ සහ 100 නරක ය.

p

0.8 = 400/500 නිසා විකුණුම්කරුගේ ශ්‍රේණිගත කිරීම් අනුව බොළඳ ගුණාත්මකභාවය 80% කි. නමුත් අප නොදන්නා ශ්‍රේණිගත කිරීම් අනුව “සත්‍ය” ගුණාංගය.

p=77%

p

α=400+1β=100+1

p

library(ggplot2)

# 90% positive of 10 ratings
o1 <- 9
o0 <- 1
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim1 <- data.frame(p=rep(0:M/M,v))
df_beta1 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

# 80% positive of 500 ratings
o1 <- 400
o0 <- 100
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim2 <- data.frame(p=rep(0:M/M,v))
df_beta2 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

ggplot(data=df_sim1,aes(p)) +
    scale_x_continuous(breaks=0:10/10) +

    geom_histogram(aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta1 ,aes(p,y),colour=I("red"),size=2,alpha=.5) +

    geom_histogram(data=df_sim2, aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta2,aes(p,y),colour=I("orange"),size=2,alpha=.5)

http://www.joyofdata.de/blog/an-intuitive-interpretation-of-the-beta-distribution/


3
ඔබගේ දායකත්වය වෙනුවෙන් ස්තුතියි! මම වුවද, යම් දෙයක් ගැන පුදුම වෙනවා: මේ histogram පුරාවෘත්තය රාජ්යයන් කියලා පෙන්වන්න, නමුත් බීටා ඝනත්වයකින්, ඔබ මේ පිළිබඳව ද ප්රතිඵල විස්තර කියා පෙනී ද්විපද අනුහුරුකරණ ( "ඒක කොහොමද බොහෝ විට අනුරූපන සිදුවුයේ"). නමුත් නිදර්ශනයේ තරමක් සමීප බවක් පෙනෙන්නට තිබුණද, මේ දෙක වෙනස් දේවල් ය. (එය විශාල පරාමිතීන් සහිත බීටා හි සාමාන්‍ය තත්වයට හා
ද්විමය

එය හොඳ කරුණකි! නමුත් එය නිවැරදිව නැවත මුද්‍රණය කරන්නේ කෙසේදැයි මට විශ්වාස නැත. මම හිස්ටෝග්‍රැම් එක කුමන්ත්‍රණය කරනවා නම්, ඇත්ත වශයෙන්ම, එහි විශාලත්වය අනුව ඔබට වැඩි dens නත්වයක් නොපෙනේ. ඉතින් ඔව්, හිස්ටෝග්‍රැම් ඇත්ත වශයෙන්ම මම අනුමාන කරන්නේ හුදෙක් පරිමාණයෙන් අඩු නොව ඇත්ත වශයෙන්ම මුල් ඇස්තමේන්තුගත (ඇස්තමේන්තුගත) ity නත්වයයි. ලකුණු ගණන සැලකිල්ලට ගෙන මට සාධකයක් හදුනාගෙන එය රේඛීයව පරිමාණය කළ හැකි නමුත් එය හරියටම සමාන ප්ලස් එකක් ලෙස පෙනෙනු ඇත (ඇත්ත වශයෙන්ම) මට සැසඳීමට අවශ්‍ය වන්නේ බීටා dens නත්වය සමාකරණයේ ප්‍රති result ලයේ with නත්වය ( මුල් හිස්ටෝග්‍රෑම්වල ity නත්වය).
රෆායෙල්

9

නියැදි සමානුපාතිකයන් සඳහා පෙර ලෙස බීටා ආර්.වී. ජනනය කිරීම සඳහා වන තාර්කිකත්වය මෙතෙක් පිළිතුරු වල පෙර සූදානම මගින් ආවරණය වූ අතර සංඛ්‍යාලේඛන ඇණවුම් කිරීම සඳහා එක් දක්ෂ පිළිතුරක් බීටා ආර්.වී.

බීටා බෙදා හැරීම් ද පැන නගින්නේ ගැමා (k_i, 1) RV දෙකක් අතර ඇති සරල සම්බන්ධතාවයකිනි, i = 1,2 ඒවා X ලෙස හඳුන්වයි. X / (X + Y) බීටා බෙදාහැරීමක් ඇත.

ගැමා ආර්.වී.වරුන්ට දැනටමත් ස්වාධීන සිදුවීම් සඳහා ආකෘති නිර්මාණය කිරීමේදී ඔවුන්ගේ තාර්කිකත්වය ඇත, එබැවින් එය ඔබගේ ප්‍රශ්නය නොවන බැවින් මම එයට ආමන්ත්‍රණය නොකරමි. නමුත් අනුපිළිවෙලින් ඉටු කරන ලද කාර්යයන් දෙකෙන් එකක් සම්පූර්ණ කිරීම සඳහා වැය කරන ලද “කාලයෙන් කොටසක්” ස්වභාවිකවම බීටා බෙදාහැරීමකට යොමු වේ.


1
+1 බීටා බෙදාහැරීමක් සෑදීමට ගැමා භාවිතා කිරීම ගැන පෙන්වා දීම ගැන ස්තූතියි. මම අසා ඇත්තෙමි, ඔබට බීටා ඩිරිච්ලෙට් බවට සාමාන්‍යකරණය කිරීමට අවශ්‍ය නම්, ඔබ හුදෙක් ගැමාස් හරයට දමන්න. සමහර විට සංඛ්‍යාලේඛන ian යෙක් එය දන්නා නමුත්, නිශ්චිත නිරීක්‍ෂණයක විශ්වාසනීය කාල පරතරයන් දෙස බැලීමේදී එය මට ප්‍රයෝජනවත් විය.
මයික් ඩන්ලාවි

5

x(1x)f(x;α,β)=constantxα1(1x)β11/B(α,β)αβඅසමත් වීමේ දායකත්වය සඳහා "බරක්" වැනි ය. ඔබට ද්විමාන පරාමිති අවකාශයක් ඇත (එකක් සාර්ථක දායකත්වය සහ අසාර්ථක දායකත්වය සඳහා) එය සිතීමට හා තේරුම් ගැනීමට අපහසු වේ.


3

මෙහි ඇති බොහෝ පිළිතුරු ප්‍රවේශයන් දෙකක් ආවරණය කරන බව පෙනේ: බේසියානු සහ ඇණවුම් සංඛ්‍යාන. ග්‍රහණය කර ගැනීමට පහසුම යැයි මා සිතන ද්විභාෂාවෙන් දෘෂ්ටිකෝණයක් එක් කිරීමට මම කැමතියි.

බීටා බෙදාහැරීමක් සඳහා වන ප්‍රතිභානය අප ද්විමාන බෙදාහැරීමේ කාචයෙන් බැලූ විට එය ක්‍රියාත්මක වේ.

රූප විස්තරය මෙහි ඇතුළත් කරන්න

xp

αβ

α1β1nnxαβαββα

αβαβ

හැඩතල පිටුපස ඇති ප්‍රතිභානය

αβ

ඒ. බෙල් හැඩය

රූප විස්තරය මෙහි ඇතුළත් කරන්න

α=8β=2α+βαβ

බී. සෘජු රේඛා

රූප විස්තරය මෙහි ඇතුළත් කරන්න

බීටා පීඩීඑෆ් ද සරල රේඛාවක් විය හැකිය.

ඇ. U- හැඩය

රූප විස්තරය මෙහි ඇතුළත් කරන්න

α<1β<1

හැඩතල පිටුපස ඇති ප්‍රතිභානය

බීටා (2,2) සීනුව හැඩැති වන්නේ ඇයි?

α1β1

එසේම, බීටා (1,1) යන්නෙන් අදහස් වන්නේ ඔබ හිසට ශුන්‍යය සහ වලිගය සඳහා ශුන්‍යය ලබා ගත් බවයි. සාර්ථකත්වයේ සම්භාවිතාව පිළිබඳ ඔබගේ අනුමානය [0,1] පුරාම සමාන විය යුතුය. තිරස් සරල රේඛාව එය සනාථ කරයි.

බීටා (0.5, 0.5) සඳහා වන ප්‍රතිභානය කුමක්ද?

එය U- හැඩැති වන්නේ ඇයි? Negative ණ (-0.5) හිස් සහ වලිග තිබීම යන්නෙන් අදහස් කරන්නේ කුමක්ද? මේ සඳහා මට තවම පිළිතුරක් නොමැත. මම මෙය Stackexchange වෙතින් විමසූ නමුත් තවමත් ප්‍රතිචාරය ලැබී නැත. යූ හැඩැති බීටා ගැන ඔබට හොඳ අදහසක් තිබේ නම්, කරුණාකර මට දන්වන්න!


1
'සම්භාවිතාව ආකෘති' යන්නෙන් ඔබ අදහස් කරන්නේ කුමක්ද? බේසියානු සන්දර්භයෙන් පිටත 'සම්භාවිතාව අහඹු විචල්‍යයක්' යන්නෙන් ඔබ අදහස් කරන්නේ කුමක්ද?
සෙක්ස්ටස් එම්පිරිකස්

1
මම ඇත්තටම මෙම ප්‍රවේශයට කැමතියි, ඔවුන් දෙදෙනා ස්වභාවයෙන්ම සම්බන්ධයි. ද්විමය සංගුණකය අර්ථ දක්වන්නේ සාධක තුනක නිෂ්පාදනයක් ලෙස ය. පීඩීඑෆ් හි සාමාන්‍යකරණය කරන බීටා ශ්‍රිතය ගැමා ශ්‍රිත තුනක නිෂ්පාදනයක් මගින් අර්ථ දැක්විය හැකිය. ගැමා ශ්‍රිතයක් යනු ධන නිඛිලවල සිට සියලු සංඛ්‍යා දක්වා සාධක සාධක විස්තාරණය කිරීම සඳහා වචනාර්ථයෙන් හැක් කිරීමකි (හරි, 'විශ්ලේෂණාත්මක අඛණ්ඩතාව'). ඇත්ත වශයෙන්ම, ගැමාස්හි පරාමිතීන් පූර්ණ සංඛ්‍යාවක් වන බීටා මඟින් ඔබට k + 1 සමඟ ද්විමාන සංගුණකය හා සමාන අගයක් ලබා දෙයි.
jkm

3

උපුටා ගත් උදාහරණයේ පරාමිතීන් වන්නේ පෙර වර්ෂයේ සිට ඇල්ෆා = 81 සහ බීටා = 219 [වවුලන් 300 දී පහර 81 ක් හෝ (81 සහ 300 - 81 = 219)]

පහරවල් 81 ක් සහ පිටත 219 ක් යැයි ඔවුන් උපකල්පනය කරන්නේ කුමක් දැයි මම නොදනිමි, නමුත් ඉංග්‍රීසියෙන්, එය ප්‍රාථමික උපකල්පනයකි.

සමය ඉදිරියට යත්ම වක්‍රය වමට හෝ දකුණට මාරුවෙන ආකාරය සහ මෝඩල් සම්භාවිතාව වමට හෝ දකුණට මාරු වන නමුත් තවමත් වක්‍රය පවතින බව සැලකිල්ලට ගන්න.

විශාල අංකවල ලා අවසානයේදී පිතිකරණ සාමාන්‍යය .270 දක්වා තල්ලු කරයිදැයි මට සිතේ.

පොදුවේ ඇල්ෆා සහ බීටා අනුමාන කිරීම සඳහා, පූර්ව සිදුවීම් ගණන (වවුලන්ගේ), පිතිකරණ සාමාන්‍යය දන්නා පරිදි, මුළු පහරවල් (ඇල්ෆා), බීටා හෝ සම්පූර්ණ මුළු us ණ අසමත්වීම් ලබා ගනී) සහ වොයිලා - ඔබට ඔබේ සූත්‍රය ඇත. ඉන්පසු, පෙන්වා ඇති පරිදි අතිරේක දත්ත වැඩ කරන්න.


2

F(X)=tanh((x/p)n)

මාර්ගය වන විට, ඔබ අන්වීක්ෂීය නිරීක්‍ෂණයකින් ප්‍රමාණයේ ව්‍යාප්තියක් නිපදවා ඔබට අංශු ව්‍යාප්තියක් තිබේ නම් සහ ඔබේ ඉලක්කය වන්නේ පරිමාව බෙදා හැරීම සමඟ වැඩ කිරීමයි. මුල් බෙදාහැරීම දකුණට මායිම්ව ලබා ගැනීම අනිවාර්යයෙන්ම පාහේ අනිවාර්ය වේ. එබැවින්, නව පරිමාව බෙදා හැරීමේදී කිසිදු මාදිලියක් නොපෙන්වන බව හෝ ඔබ වැඩ කරන කාල පරතරයෙන් මධ්‍ය හෝ මධ්‍යම ප්‍රමාණයේ නොවන බව ඔබට විශ්වාස බැවින් පරිවර්තනය වඩාත් ස්ථාවර වේ. ඊට අමතරව, ඔබ ග්‍රීන්ලන්ඩ් අප්‍රිකානු බලපෑමෙන් වළකින්න.

ඔබට සාමාන්‍ය හැඩතල, එනම් ගෝලයක් හෝ ප්‍රිස්මයක් තිබේ නම් පරිවර්තනය ඉතා පහසුය. ඔබ බීටා අංකයේ ඇල්ෆා පරාමිතියට ඒකක තුනක් එකතු කර පරිමාව බෙදා හැරීම කළ යුතුය.


2
වෙබ් අඩවියට සාදරයෙන් පිළිගනිමු. මෙය OP හි ප්‍රශ්නයට පිළිතුරක් ලෙස අදහස් කළේද? බීටා බෙදා හැරීම පිටුපස ඇති ප්‍රතිභානයට මෙය සම්බන්ධ වන්නේ කෙසේදැයි ඔබට පැහැදිලි කළ හැකිද?
gung - මොනිකා නැවත

1
බීටා බෙදාහැරීමක් පිළිබඳ ප්‍රතිභාව පැහැදිලි කිරීමට කරුණාකර සංස්කරණය කරන්න.
Glen_b -Reinstate Monica

0

දී තවත් ප්රශ්නයක් ද, බීටා බෙදාහැරීමේ ගැන බීටා පිටුපස පහත දෙබස් කවන ශිල්පීනියක සපයනු ලැබේ:

වෙනත් වචන වලින් කිවහොත්, බීටා බෙදා හැරීම ව්‍යාකූල ව්‍යාප්තියක මධ්‍යයේ සම්භාවිතාව බෙදා හැරීම ලෙස දැකිය හැකිය.

වැඩි විස්තර සඳහා කරුණාකර සම්පූර්ණ පිළිතුර https://stats.stackexchange.com/a/429754/142758 බලන්න.


0

ඩේවිඩ් රොබින්සන් පිළිගත් පිළිතුරෙහි විස්තර කර ඇති පරිදි “සම්භාවිතාවන්ගේ සම්භාවිතා ව්‍යාප්තිය” අර්ථ නිරූපණය කරන්නේ කෙසේද යන්නත්, ඉතා සරල නිදර්ශන සහ ව්‍යුත්පන්නයන් භාවිතා කරමින් අනුපූරක කරුණු කිහිපයක් එකතු කරන ආකාරයත් මෙහි දැනටමත් බොහෝ විශ්මය ජනක පිළිතුරු ඇත.

මෙය සිතා බලන්න, අපට කාසියක් ඇති අතර එය පහත දැක්වෙන අවස්ථා තුනෙහි පෙරළන්න: 1) එය පස් වතාවක් විසි කර TTTTT ලබා ගන්න (වලිග පහක් සහ ශුන්‍ය හිස); තත්වය 2) එකම කාසියක් භාවිතා කර එය පස් වතාවක් විසි කර HTTHH (හිස් තුනක් සහ වලිග දෙකක්) ලබා ගන්න; 3 වන අවස්ථාවෙහිදී) එකම කාසියක් ලබාගෙන එය දස වතාවක් විසි කර THHTHHTHTH (හිස් හයක් සහ වලිග හතරක්) ලබා ගන්න.

0.6 නමුත් විශ්වාසය ඉහළ මට්ටමක පවතින බව අපි දනිමු. එබැවින් කාසියක් පෙරළීමේ සම්භාවිතාව තක්සේරු කිරීමට එය ප්‍රමාණවත් නොවේ. තොරතුරු, ඒ වෙනුවට, අපට කාසිය පෙරළීමට පෙර සහ ඉහත අවස්ථා තුනේ එක් එක් පියවර සඳහා සම්භාවිතා බෙදාහැරීමක් අවශ්‍ය වේ.

බීටා(θ|αඑච්,αටී)θαඑච්αටී


බීටා(θ|1,1)

p = seq(0,1, length=100)
plot(p, dbeta(p, 1, 1), ylab="dbeta(p, 1, 1)", type ="l", col="blue")

Beta(\theta|1, 1) ඇත්ත වශයෙන්ම අපට පහත දැක්වෙන ව්‍යුත්පන්නයෙන් ක්‍රම දෙක සම්බන්ධ කළ හැකිය:

E[Beta(θ|αH,αT)]=01θP(θ|αH,αT)dθthe numerator/normalization is a constant=01θ{θαH1(1θ)αT1} dθB(αH,αT)definition of Beta; the numerator is a constant=B(αH+1,αT)B(αH,αT)θθαH1=θαH=Γ(αH+1)Γ(αT)Γ(αH+αT+1)Γ(αH+αT)Γ(αH)Γ(αT)=αHαH+αT

අපේක්ෂාව බව අපට පෙනේ11+1=50


NT=5NH=0D

බීටා(θ|ඩී,αඑච්,αටී)αපී(ඩී|θ,αඑච්,αටී)පී(θ|αඑච්,αටී)සම්භාවිතාව × පෙර=පී(ඩී|θ)පී(θ|αඑච්,αටී)නිරූපණය කරන ලද බෙල්ල ලෙසαθඑන්එච්(1-θ)එන්ටීθαඑච්-1(1-θ)αටී-1=θඑන්එච්+αඑච්-1(1-θ)එන්ටී+αටී-1=බීටා(θ|αඑච්+එන්එච්,αටී+එන්ටී)

prior and evidence

ඩීαඑච්αටීθ

බීටා(θ|1+0,1+5)

p = seq(0,1, length=100)
plot(p, dbeta(p, 1+0, 1+5), ylab="dbeta(p, 1+0, 1+5)", type ="l", col="blue")

Beta(\theta|1+0, 1+5)

[බීටා(θ|1+0,1+5)]=1+01+0+1+5


බීටා(θ|ඩී,αඑච්,αටී)=බීටා(θ|1+3,1+2)

p = seq(0,1, length=100)
plot(p, dbeta(p, 1+3, 1+2), ylab="dbeta(p, 1+3, 1+2)", type ="l", col="blue")

Beta(\theta|4, 3)

Beta(θ|D,αH,αT)=Beta(θ|1+6,1+4)

p = seq(0,1, length=100)
plot(p, dbeta(p, 1+6, 1+4), ylab="dbeta(p, 1+6, 1+4)", type ="l", col="blue")

Beta(\theta|7, 5)

1+31+3+1+2=0.5711+61+6+1+4=0.58333+2=66+4 ) නමුත් දෙවන වක්‍රය වඩා උස හා පටු (වඩා විශ්වාසදායක) බව අපට පෙනේ. අපේක්ෂාවේ හරය විශ්වාසයේ මිනුමක් ලෙස අර්ථ දැක්විය හැකිය, වැඩි සාක්ෂි (අථත්ය හෝ තාත්වික) අපට වඩා විශ්වාසදායක වන්නේ පශ්චාත් සහ උස හා බීටා බෙදාහැරීමේ වක්රයයි. නමුත් නිකුතුවේදී අප එසේ කරන්නේ නම් තොරතුරු නැති වී යයි.

යොමුව:
1. https://math.stackexchange.com/a/497599/351322
2. 17.3.1.3 සම්භාවිතා චිත්‍රක ආකෘති මූලධර්ම සහ ශිල්පීය ක්‍රම


-2

මම හිතන්නේ බීටා බෙදා හැරීම පිටුපස කිසිදු බුද්ධියක් නැත! බීටා බෙදා හැරීම FIX පරාසය සමඟ ඉතා නම්‍යශීලී බෙදාහැරීමක් පමණි! A සහ b නිඛිල සඳහා එය සමඟ කටයුතු කිරීම පවා පහසුය. බීටා හි බොහෝ විශේෂ අවස්ථා වල ඒකාකාර ව්‍යාප්තිය වැනි ස්වදේශීය අර්ථයක් ඇත. එබැවින් දත්ත මේ ආකාරයට ආකෘතිගත කිරීමට අවශ්‍ය නම් හෝ තරමක් වැඩි නම්යශීලීභාවයකින් යුතුව බීටා ඉතා හොඳ තේරීමක් වේ.

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.