මාකෝව් චේන් මොන්ටේ කාලෝ (එම්.සී.එම්.සී.) ලේපර්සන්ට පැහැදිලි කරන්නේ කෙසේද?


245

සමහර විට සංකල්පය, එය භාවිතා කරන්නේ ඇයි සහ උදාහරණයක්.


17
මාතෘකාව පිළිබඳ මගේ ප්‍රියතම පත්‍රය මෙන්න: citeseerx.ist.psu.edu/viewdoc/…

මෙම වෙබ් අඩවියෙන් ඔබට MCMC හි හොඳ චිත්‍රක නිරූපණයක් සහ ප්‍රයෝජනවත් සබැඳි කිහිපයක් හමුවනු ඇත.
සර්ජි

3
MCMC ඇල්ගොරිතම අවබෝධ කර ගැනීම සඳහා ඔබ එය සැබවින්ම භාවිතා කරන්නේ කුමක් ද යන්න සහ එය ලබා දී ඇති බෙදාහැරීමකට පරිවර්තනය වන්නේ කෙසේද යන්න තේරුම් ගත යුතුය. මම ඒ සඳහා වූ සමස්ත ප්‍රතිභානය සහ යෙදුම් ගැන බ්ලොග් කළෙමි. ඔබට ඒවා මෙතැනට පිවිසිය හැකිය: mlwhiz.com/blog/2015/08/19/MCMC_Algorithms_Beta_Distribution mlwhiz.com/blog/2015/08/21/MCMC_Algorithms_Cryptography
රාහුල් අගර්වාල්

MCMC පිළිබඳ සවිස්තරාත්මක පැහැදිලි කිරීමක් ඉදිරිපත් කරන කරුණාකර පහත දැක්වෙන repo වෙත යොමු වන්න. github.com/bashhwu/Sample-based-inference/blob/master/…
බෂාර් මොහොමඩ්

Answers:


228

පළමුව, මාකෝව් දාමයක් යනු කුමක්දැයි අප තේරුම් ගත යුතුය. විකිපීඩියාවෙන් පහත කාලගුණ උදාහරණය සලකා බලන්න . ඕනෑම දිනයක කාලගුණය ප්‍රාන්ත දෙකකට පමණක් වර්ග කළ හැකි යැයි සිතමු: අව්ව සහ වැසි. අතීත අත්දැකීම් මත පදනම්ව, අපි පහත දේ දනිමු:

P(Next day is Sunny|Given today is Rainy)=0.50

ඊළඟ දවසේ කාලගුණය අව්ව හෝ වැසි සහිත බැවින් එය පහත පරිදි වේ:

P(Next day is Rainy|Given today is Rainy)=0.50

ඒ හා සමානව, ඉඩ දෙන්න:

P(Next day is Rainy|Given today is Sunny)=0.10

එමනිසා, එය පහත පරිදි වේ:

P(Next day is Sunny|Given today is Sunny)=0.90

ඉහත අංක හතර සංක්‍රාන්ති අනුකෘතියක් ලෙස සංයුක්තව නිරූපණය කළ හැකි අතර එය කාලගුණය එක් ප්‍රාන්තයක සිට තවත් ප්‍රාන්තයකට ගමන් කිරීමේ සම්භාවිතාව පහත පරිදි වේ.

P=[SRS0.90.1R0.50.5]

පිළිතුරු ලැබෙන ප්‍රශ්න කිහිපයක් අපට ඇසිය හැකිය:


Q1: අද කාලගුණය හිරු එළිය නම් හෙට කුමක් විය හැකිද?

A1: සිදුවන්නේ කුමක් දැයි අපි නොදනිමු. අපට කිව හැකි හොඳම දෙය නම් අව් රශ්මියක් ඇතිවීමට ඉඩ ඇති අතර වැසි සහිත විය හැකි බවයි.10 %90%10%


Q2: අද සිට දින දෙකක් ගැන කුමක් කිව හැකිද?

A2: එක් දින පුරෝකථනය: අව්ව, වැසි. එබැවින්, දැන් සිට දින දෙකක්:10 %90%10%

පළමු දිනය හිරු එළිය විය හැකි අතර ඊළඟ දවසේ ද අව්ව විය හැකිය. මෙය සිදුවීමට ඇති අවස්ථා: .0.9×0.9

හෝ

පළමු දිනය වැසි සහිත විය හැකි අතර දෙවන දිනය අව්ව විය හැක. මෙය සිදුවීමට ඇති අවස්ථා: .0.1×0.5

එමනිසා, කාලගුණය දින දෙකකින් අව්ව වීමට ඇති සම්භාවිතාව:

P(Sunny 2 days from now=0.9×0.9+0.1×0.5=0.81+0.05=0.86

ඒ හා සමානව, එය වැසි සහිත වීමේ සම්භාවිතාව:

P(Rainy 2 days from now=0.1×0.5+0.9×0.1=0.05+0.09=0.14


රේඛීය වීජ ගණිතයේ (සංක්‍රාන්ති මෙට්‍රික්ස්) මෙම ගණනය කිරීම් එක් පියවරක සිට තවත් පියවරකට (හිරු සිට හිරු දක්වා ( ), හිරු සිට වැසි ( ), වැසි සිට හිරු ( ) හෝ වැසි සිට වැසි ( )) ගණනය කළ සම්භාවිතාවන් සමඟ:S 2 R R 2 S R 2 R.S2SS2RR2SR2R

රූප විස්තරය මෙහි ඇතුළත් කරන්න

අපි අනාගත රාජ්ය (සම්භාවිතාව ගණනය කරන ආකාරය දකින රූපය පහළ කොටස මත හෝ වන බඹලොව (සම්භාවිතාව මහා උත්සවය, ලබා දෙන) සෑම රාජ්ය (සනී හෝ වැසි සහිත) සඳහා) දැන් කාලය ශුන්යයේ දී ( හෝ ) සරල අනුකෘති ගුණ කිරීම ලෙස.t + 2 P M F t 0t+1t+2PMFt0

ඔයාට මේ වගේ අනාවැකි පළ කාලගුණ තබා නම්, එම අවසානයේදී දක්නට ලැබෙනු ඇත එහිදී -th දින අනාවැකිය, ඉතා විශාල (කියන්න ය පහත සඳහන් 'සමතුලිත' බඹලොව කිරීමට ගෙවයි,):n 30nn30

P(Sunny)=0.833

හා

P(Rainy)=0.167

වෙනත් වචන වලින් කිවහොත්, -th දිනය සහ දිනය සඳහා ඔබගේ පුරෝකථනය එලෙසම පවතී. මීට අමතරව, 'සමතුලිතතා' සම්භාවිතාව අද කාලගුණය මත රඳා නොපවතින බව ඔබට පරීක්ෂා කළ හැකිය. අද කාලගුණය අව්ව හෝ වැසි සහිත යැයි උපකල්පනය කිරීමෙන් ඔබ ආරම්භ කළහොත් ඔබට කාලගුණය සඳහා එකම පුරෝකථනයක් ලැබෙනු ඇත.n + 1nn+1

ඉහත උදාහරණය ක්‍රියාත්මක වන්නේ මා මෙහි සාකච්ඡා නොකරන කොන්දේසි කිහිපයක් රාජ්‍ය සංක්‍රාන්ති සම්භාවිතාවන් සපුරාලන්නේ නම් පමණි. එහෙත්, මෙම 'ලස්සන' මාකෝව් දාමයේ පහත ලක්ෂණ සැලකිල්ලට ගන්න (ලස්සන = සංක්‍රාන්ති සම්භාවිතාව කොන්දේසි සපුරාලයි):

ආරම්භක ආරම්භක තත්වය නොසලකා අපි අවසානයේදී ප්‍රාන්තවල සමතුලිතතා සම්භාවිතා ව්‍යාප්තියකට ලඟාවෙමු.

මාකෝව් චේන් මොන්ටේ කාලෝ ඉහත ලක්ෂණය පහත පරිදි ගසාකයි:

ඉලක්ක බෙදාහැරීමකින් අහඹු ලෙස දිනුම් ඇදීමට අපට අවශ්‍යය. 'ලස්සන' මාකෝව් දාමයක් තැනීමේ ක්‍රමයක් අපි හඳුනා ගනිමු. එහි සමතුලිතතා සම්භාවිතා ව්‍යාප්තිය අපගේ ඉලක්ක ව්‍යාප්තියයි.

අපට එවැනි දාමයක් තැනිය හැකි නම්, අපි අත්තනෝමතික ලෙස යම් ස්ථානයකින් ආරම්භ කර මාකෝව් දාමය බොහෝ වාරයක් පුනරාවර්තනය කරමු (අපි කාලගුණය වාරයක් පුරෝකථනය කරන ආකාරය වැනි ). අවසානයේදී, අප ජනනය කරන දිනුම් ඇදීම් අපේ ඉලක්ක බෙදාහැරීමෙන් එන බවක් පෙනේ.n

මොන්ටේ කාලෝ සං .ටකය වන ආරම්භක දිනුම් ඇදීම් කිහිපයක් ඉවත දැමීමෙන් පසුව අපි දිනුම් ඇදීම්වල නියැදි සාමාන්‍යය ගැනීමෙන් පොලී ප්‍රමාණය (උදා.

'ලස්සන' මාකෝව් දම්වැල් තැනීමට ක්‍රම කිහිපයක් තිබේ (උදා: ගිබ්ස් නියැදිය, මෙට්‍රොපොලිස්-හේස්ටිං ඇල්ගොරිතම).


2
එය මනාව ලියා ඇති පිළිතුරකි. කෙසේ වෙතත්, එය බොහෝ විට සංක්‍රාන්ති න්‍යාසයන් සාකච්ඡා කරන ස්ථානයේ ලේපර්සන්ගේ අවධානය නැති කර දමනු ඇත.
rraadd88

1
නියම පිළිතුර. අවසාන ඉලක්කය යම් පොලී ප්‍රමාණයක් තීරණය කිරීම (උදා: අනුමාන පරාමිතීන්ගේ මධ්‍යන්‍ය හෝ මාදිලිය) යන කාරණය පිළිබඳව කලින් (හෝ වඩාත් විස්තරාත්මකව) පැහැදිලි කිරීම ප්‍රයෝජනවත් වනු ඇතැයි මම සිතමි. මෙය නිවැරදි අයිතියක් ද?
ඔස්ටින් ෂින්

104

(ස්වාධීන දාමය) මෙට්‍රොපොලිස්-හේස්ටිංස් ඇල්ගොරිතමයෙන් ලබා ගත හැකි ලස්සන හා සරල බුද්ධියක් ඇතැයි මම සිතමි.

පළමුව, ඉලක්කය කුමක්ද? MCMC හි පරමාර්ථය වන්නේ ඕනෑම අවස්ථාවක එහි නිශ්චිත උස නොදැන නූතන සම්භාවිතා ව්‍යාප්තියකින් සාම්පල ලබා ගැනීමයි. එම්.සී.සී. "එහා මෙහා ඇවිදීම" ක්‍රියාවලිය නිවැරදිව සකසා ඇත්නම්, මෙම සමානුපාතිකතාව (කාලය හා බෙදාහැරීමේ උස අතර) සාක්ෂාත් කර ගැනීමට ඔබට සහතික විය හැකිය.

සිතාමතාම, අපට කිරීමට අවශ්‍ය වන්නේ, එක් එක් ස්ථානයක අප ගත කරන කාලය (හෝ # සාම්පල #) එම ස්ථානයේ මතුපිට උසට සමානුපාතික වන පරිදි යම් (ගැටිති) මතුපිටක ඇවිදීමයි. ඉතින්, උදා: අපි මීටර් 100 ක උන්නතාංශයක පිහිටි කඳු මුදුනක මීටර් 50 ක උන්නතාංශයක පිහිටි කඳු මුදුනක ගත කිරීමට කැමතියි. හොඳ දෙය නම් පෘෂ් on යේ ඇති ලක්ෂ්‍යවල නිරපේක්ෂ උස නොදැන සිටියත් අපට මෙය කළ හැකිය: අප දැනගත යුත්තේ සාපේක්ෂ උස පමණි. උදා: එක් කඳු මුදුනක් A කඳු මුදුන B ට වඩා දෙගුණයක් උස නම්, අපි B හි ගත කරන කාලය මෙන් A හි දෙගුණයක් වැඩි කාලයක් ගත කිරීමට කැමැත්තෙමු.

මෙට්‍රොපොලිස්-හේස්ටිං ඇල්ගොරිතමයේ (නිදහස් දාම නියැදි) සරලම ප්‍රභේදය මෙය සාක්ෂාත් කරගනී: සෑම (විවික්ත) කාල පියවරක දී, අපි අහඹු ලෙස නව “යෝජිත” ස්ථානයක් තෝරා ගනිමු (සමස්ත පෘෂ් across ය පුරා ඒකාකාරව තෝරාගෙන ඇත). යෝජිත ස්ථානය අප දැන් සිටගෙන සිටින ස්ථානයට වඩා ඉහළ නම්, ඒ වෙත යන්න. යෝජිත ස්ථානය අඩු නම්, සම්භාවිතාව p සමඟ නව ස්ථානයට යන්න, මෙහි p යනු එම ලක්ෂ්‍යයේ උස වත්මන් ස්ථානයේ උසට අනුපාතයයි. (එනම්, හිස් ලබා ගැනීමේ සම්භාවිතාව සහිත කාසියක් පෙරළන්න; එය හිස එන්නේ නම්, නව ස්ථානයට යන්න; එය වලිගයක් එන්නේ නම්, අප සිටින තැන රැඳී සිටින්න). සෑම පියවරකදීම ඔබ සිටි ස්ථාන ලැයිස්තුවක් තබා ගන්න, එම ලැයිස්තුවට (අසමමිතිකව) පෘෂ් of යේ සෑම කොටසකම ගත කළ කාලය පිළිබඳ නිවැරදි අනුපාතය ඇත.

නව ස්ථාන යෝජනා කිරීම සඳහා වඩාත් සංකීර්ණ යෝජනා ක්‍රම සහ ඒවා පිළිගැනීමේ නීති ඇත, නමුත් මූලික අදහස තවමත්: (1) නව “යෝජිත” ස්ථානයක් තෝරන්න; (2) ඔබගේ වර්තමාන ස්ථානයට සාපේක්ෂව එම ස්ථානය කොතරම් ඉහළ හෝ පහළදැයි සොයා බලන්න; (3) ස්ථානයෙහි උසට සමානුපාතිකව කාලය ගත කිරීමේ සමස්ත ඉලක්කයට ගරු කරන අයුරින් එම ස්ථානයට රැඳී සිටින්න.

මෙය ප්‍රයෝජනවත් වන්නේ කුමක් සඳහා ද? A නොදන්නා නියතයක් වන A * P (කාලගුණය) තක්සේරු කිරීමට අපට ඉඩ සලසන කාලගුණයේ සම්භාවිතා ආකෘතියක් අප සතුව ඇතැයි සිතමු. (මෙය බොහෝ විට සිදු වේ - බොහෝ ආකෘතීන් ඔබට A යනු කුමක්දැයි තීරණය කළ නොහැකි ආකාරයෙන් සකස් කිරීමට පහසුය). එබැවින් අපට P ("හෙට වැස්ස") හරියටම තක්සේරු කළ නොහැක. කෙසේ වෙතත්, අපට MCMC නියැදිය ටික වේලාවක් ධාවනය කර පසුව විමසන්න: "හෙට වැසි" තත්වයෙන් අවසන් වූ සාම්පල (හෝ "ස්ථාන") මොනවාද? එම භාගය (ආකෘති පදනම් කරගත්) සම්භාවිතා කාලගුණ අනාවැකිය වනු ඇත.


7
+1. මගේ මතය අනුව, මෙම පිටුවෙහි ලැයිස්තුගත කර ඇති අය අතර වඩාත්ම විචක්ෂණශීලී ප්‍රතිසමයක් වන්නේ 'ඉබාගාතේ යාම' ය.
ෂුබාර්බ්

"ඕනෑම අවස්ථාවක එහි නිශ්චිත උස නොදැන" මෙය MCMC හි මූලික සීමාව නොවේ.
ජෙරමිකුන්

එම්එච් කරන්නේ කුමක්ද යන්න වටහා ගැනීම සඳහා අපට එතරම් කාලයක් ගත කිරීමට අවශ්‍ය නොවන පරිදි මෙම පැහැදිලි කිරීම පෙළපොත් වල තිබේ නම් මම ප්‍රාර්ථනා කරමි.
සඳුදා

91

මම බොහෝ විට මේ වගේ දෙයක් කියන්නම්:

"අපට සම්භාවිතාවන් ගැන කතා කිරීමට අවශ්‍ය ඕනෑම වේලාවක අපි සැබවින්ම ity නත්වයක් ඒකාබද්ධ කරමු. බේසියානු විශ්ලේෂණයේ දී, අප විසින් ඉදිරිපත් කරන dens නත්වයන් බොහොමයක් විශ්ලේෂණාත්මකව පත්‍රිකා ගත නොහැක: ඔබට ඒවා ඒකාබද්ධ කළ හැක්කේ - ඔබට ඒවා කිසිසේත් ඒකාබද්ධ කළ හැකි නම් - බොහෝ දුක් වේදනා සමඟ. එබැවින් අපි ඒ වෙනුවට කරන්නේ අහඹු විචල්‍යය බොහෝ දුරට අනුකරණය කිරීමයි, ඉන්පසු අපගේ අනුකලනය කරන ලද අහඹු සංඛ්‍යා වලින් සම්භාවිතාවන් සොයා ගන්න.එය X 10 ට වඩා අඩු සම්භාවිතාව දැන ගැනීමට අවශ්‍ය නම්, අපි ගණන් කරමු සසම්භාවී සසම්භාවී විචල්‍ය ප්‍රති results ල 10 ට වඩා අඩු වන අතර එය අපගේ ඇස්තමේන්තුව ලෙස භාවිතා කරන්න.එය “මොන්ටේ කාලෝ” කොටසයි, එය අහඹු සංඛ්‍යා මත පදනම් වූ සම්භාවිතාව පිළිබඳ තක්සේරුවකි.අපේ අනුමාන අහඹු සංඛ්‍යා සමඟ ඇස්තමේන්තුව ඉතා හොඳයි, නමුත් එය තවමත් සහජයෙන්ම අහඹුයි.

"ඉතින් ඇයි" මාකෝව් දාමය "? මන්ද, සමහර තාක්ෂණික තත්වයන් යටතේ, ඔබට අනුකරණය කිරීමට උත්සාහ කරන අහඹු විචල්‍යයට සමාන සීමිත බෙදාහැරීමක් ඇති මතක රහිත ක්‍රියාවලියක් (මාකෝවියානු එකක්) ජනනය කළ හැකිය.ඔබට ඕනෑම එකක් නැවත කියවිය හැකිය. සහසම්බන්ධිත සසම්භාවී සංඛ්‍යා ජනනය කරන විවිධ වර්ගයේ අනුකරණ ක්‍රියාවලීන් ගණන (එම සංඛ්‍යා වල වර්තමාන වටිනාකම මත පදනම්ව), සහ ඔබ ප්‍රති results ල ප්‍රමාණවත් ලෙස රැස් කළ පසු, ඔබට පෙනෙන සංඛ්‍යා රාශියක් සමඟ අවසන් වනු ඇති බවට ඔබට සහතිකයි. "ඔබට කෙසේ හෝ දැන ගැනීමට අවශ්‍ය වූ සංකීර්ණ බෙදාහැරීමෙන් ස්වාධීන සාම්පල ලබා ගැනීමට ඔබට හැකි විය.

"උදාහරණයක් ලෙස, සාමාන්‍ය සාමාන්‍ය අහඹු විචල්‍යයක් 0.5 ට වඩා අඩු යැයි මට තක්සේරු කිරීමට අවශ්‍ය නම්, සාමාන්‍ය සාමාන්‍ය බෙදාහැරීමකින් ස්වාධීන අවබෝධයන් දසදහසක් ජනනය කර 0.5 ට වඩා අඩු සංඛ්‍යාවක් ගණනය කළ හැකිය; මට කියන්න 6905 මුළු සාම්පල 10000 න් 0.5 ට වඩා අඩුය; මගේ ඇස්තමේන්තුව P (Z <0.5) 0.6905 වනු ඇත, එය සත්‍ය වටිනාකමට වඩා එතරම් දුර නොවේ. එය මොන්ටේ කාලෝ ඇස්තමේන්තුවක් වනු ඇත.

ක්‍රියා පටිපාටියෙන් මා ලබා ගන්නා සංඛ්‍යා ලැයිස්තුව සාමාන්‍ය අහඹු විචල්‍යයන් ජනනය කරන දෙයකින් දිනුම් ඇදීම් විශාල ප්‍රමාණයක් මෙන් බෙදා හරිනු ලැබේ. මෙය සාමාන්‍ය සාමාන්‍ය අහඹු විචල්‍යයක් සඳහා මාකෝව් චේන් මොන්ටේ කාලෝ අනුකරණයක් ලබා දෙනු ඇත. සම්භාවිතාවන් තක්සේරු කිරීමට මා මෙය භාවිතා කළේ නම්, එය MCMC ඇස්තමේන්තුවක් වනු ඇත.


7
එය හොඳ පැහැදිලි කිරීමකි, නමුත් තාක්‍ෂණික නොවන ලේපර්සන් සඳහා නොවේ. සංඛ්‍යාලේඛන විශ්ලේෂණයක් කිරීමට ඔබව කුලියට ගත් MBA වෙත එය පැහැදිලි කරන්නේ කෙසේදැයි දැන ගැනීමට OP ට අවශ්‍ය යැයි මම සැක කරමි! සම්මත අපගමනය පිළිබඳ සංකල්පය (වර්ගීකරණය, කෙසේ වෙතත්, වියුක්ත විය හැකි) වඩා හොඳින් තේරුම් ගත් කෙනෙකුට ඔබ MCMC විස්තර කරන්නේ කෙසේද?
හාර්ලන්

11
Ar හාර්ලන්: එය පාගා දැමීමට අපහසු රේඛාවක්; කෙනෙකු අඩු තරමින් සසම්භාවී විචල්යයක්, ඇයි අපි බඹලොව තක්සේරු කිරීමට අවශ්ය, සහ ඝනත්වය කාර්යය සමහර හිසට එල්ල අදහසක් විය, මම හිතන්නේ නැහැ එය අපට නැති නම් වේ MCMC වන ආකාරය හෝ ඇයි අර්ථාන්විතව පැහැදිලි කිරීමට ඔවුනට, "කුමක්" පමණක් නම්, එය "එය හිස මතට පැමිණීමේ සම්භාවිතාව තක්සේරු කිරීම සඳහා කාසියක් පෙරළීම වැනි, අනුකරණය කිරීමෙන් වෙනත් ආකාරයකින් කළ නොහැකි ගැටළුවක් සංඛ්‍යාත්මකව විසඳීමේ ක්‍රමයකි".
පොහොසත්

1
අවසාන ඡේදය සඳහා +1. අවම තාක්‍ෂණයන්ගෙන් එය අදහස හොඳින් ගෙන එයි.
whuber

සිසිල් පැහැදිලි කිරීම. මම හිතන්නේ මෙය තාක්‍ෂණික නොවන පුද්ගලයෙකුට විශිෂ්ටයි.
HelloWorld

සැකය - අවසාන ඡේදයේ දී, සංඛ්‍යා ලැයිස්තුව සාමාන්‍ය බෙදාහැරීමකින් පැමිණෙන්නේ ඇයි? එය මධ්‍යම සීමාවන් ප්‍රමේයය නිසාද? තව දුරටත්, අපට වෙනත් බෙදාහැරීමක් අනුකරණය කිරීමට අවශ්‍ය නම් කුමක් කළ යුතුද?
මනෝජ් කුමාර්

38

පුවරු ක්‍රීඩාවේ ඒකාධිකාරයේදී ඔබේ මිතුරන් පරාජය කිරීමට වඩා හොඳ උපාය මාර්ගයක් සොයා ගැනීමට ඔබට අවශ්‍ය යැයි සිතන්න. ක්‍රීඩාවට වැදගත් වන දේ ප්‍රශ්නයට සරල කරන්න: මිනිසුන් වැඩිපුරම පැමිණෙන්නේ කුමන දේපලද? පිළිතුර රඳා පවතින්නේ පුවරුවේ ව්‍යුහය, ක්‍රීඩාවේ නීති සහ ඩයිස් දෙකක විසි කිරීම මත ය.

ප්‍රශ්නයට පිළිතුරු දිය හැකි එක් ක්‍රමයක් මෙයයි. ඔබ ඩයිස් විසි කර නීති රීති අනුගමනය කරන විට පුවරුව වටා එක කැබැල්ලක් අනුගමනය කරන්න. එක් එක් දේපල මත ඔබ කොපමණ වාරයක් ගොඩබසිනවාදැයි ගණන් කරන්න (නැතහොත් ඔබ වෙනුවෙන් කාර්යය කිරීමට පරිගණකයක් වැඩසටහන් කරන්න). අවසානයේදී, ඔබට ප්‍රමාණවත් ඉවසීමක් තිබේ නම් හෝ ඔබේ පරිගණකයේ නීති රීති හොඳින් වැඩසටහන්ගත කර ඇත්නම්, වඩාත්ම ව්‍යාපාර ලබා ගන්නේ කුමන දේපලද යන්න පිළිබඳ හොඳ චිත්‍රයක් ඔබ ගොඩනඟනු ඇත. මෙය ඔබට බොහෝ විට දිනා ගැනීමට උපකාරී වේ.

ඔබ කර ඇත්තේ මාකෝව් චේන් මොන්ටේ කාලෝ (MCMC) විශ්ලේෂණයකි. මණ්ඩලය විසින් නීති රීති අර්ථ දක්වයි. ඔබ ඊළඟට ගොඩබසින ස්ථානය රඳා පවතින්නේ ඔබ දැන් සිටින ස්ථානය මත මිස ඔබ කලින් සිටි ස්ථානය මත නොව නිශ්චිත සම්භාවිතාවන් තීරණය වන්නේ ඩයිස් දෙකක විසිකිරීමෙනි. MCMC යනු මෙම අදහස ගණිතමය හෝ භෞතික පද්ධති සඳහා යොදා ගැනීම හෙට කාලගුණය කුමක් වනු ඇත්ද යන්න හෝ පරාග ධාන්ය අහඹු ලෙස ගෑස් අණු මගින් බුෆේ කිරීම අවසන් වන්නේ කොතැනද යන්න වැනි ය.


1
පැහැදිලි කිරීම සරල මොන්ටේ කාලෝ සමාකරණය මෙන් පෙනේ, නමුත් මාකෝව් දාමය ගැන කුමක් කිව හැකිද? මාකෝව් දාමය මෙම මොන්ටේ කාලෝ අනුකරණයට සම්බන්ධ වන්නේ කෙසේද?
එම්රාන් හුසේන්

Em එම්රාන් ග්‍රැහැම් කුක්සන්ගේ පිළිතුර දැනටමත් ඒකාධිකාරය සහ මාකෝව් දම්වැල් අතර සම්බන්ධයක් පැහැදිලි කරයි.
ග්ලෙන්_බී -රයින්ස්ටේට් මොනිකා

ඒකාධිකාරය මාකෝව් දාමයක් ලෙස ආදර්ශනය කළ හැකි අතර එහිදී එක් එක් දේපල / අවකාශය නෝඩ් / තත්වයක් වේ. ඔබ කිසියම් විශේෂිත අවකාශයක සිටින විට, ඔබට ඊළඟ අවකාශ 12 වෙත ගමන් කිරීමේ විවිධ සම්භාවිතාවන් ඇත (ඩයිස් 2 ක් භාවිතා කරන්නේ නම්) - මේවා මාකෝව් දාමයේ දාර / සම්බන්ධතා වේ. එක් එක් දාරයේ / සම්බන්ධතාවයේ සම්භාවිතාව සකස් කිරීම පහසුය: gwydir.demon.co.uk/jo/probability/calcdice.htm#sum

33

හරි, අවිධිමත් හා ගොරහැඩි පැහැදිලි කිරීමක් සඳහා මගේ හොඳම උත්සාහය මෙන්න.

මාකෝව් දාමයක් යනු අහඹු ක්‍රියාවලියක් වන අතර එය අනාගතය රඳා පවතින්නේ ක්‍රියාවලියේ වත්මන් තත්වය මත පමණක් වන අතර එය අතීතය නොවේ. අහඹු ක්‍රියාවලියකට උදාහරණයක් කොටස් හුවමාරුව විය හැකිය. මාකෝව් දාමයක උදාහරණයක් වනුයේ ඒකාධිකාරය හෝ සර්පයන් සහ ඉණිමඟ වැනි පුවරු ක්‍රීඩාවක් වන අතර එහිදී ඔබේ අනාගත තත්වය (ඩයි රෝල් කිරීමෙන් පසු) රඳා පවතින්නේ ඔබ රෝල් කිරීමට පෙර සිට ආරම්භ කළ ස්ථානය මත මිස ඔබේ පෙර තනතුරු කිසිවක් නොවේ. මාකෝව් දාමයක පෙළ පොත් උදාහරණයක් වන්නේ “බේබද්දන්ගේ ඇවිදීම” ය. බීමතින් සිටින කෙනෙකුට එක වේගයකින් වමට හෝ දකුණට පමණක් ගමන් කළ හැකි යැයි සිතන්න. බේබද්දන් සමාන සම්භාවිතාවක් සහිතව වමට හෝ දකුණට ගමන් කරයි. මෙය මාකෝව් දාමයක් වන අතර එහිදී බේබද්දන්ගේ අනාගත / ඊළඟ ස්ථානය රඳා පවතින්නේ ඔහු දැනට සිටින ස්ථානය මත පමණි.

මොන්ටේ කාලෝ ක්‍රම යනු ගණිතමය ඇල්ගොරිතම (හුදෙක් උපදෙස් මාලාවක්) වන අතර ඒවා අධ්‍යයනයට භාජනය වන යම් ක්‍රියාවලියකින් අහඹු ලෙස සාම්පල ලබා ගනී. ඒවා නිශ්චිතවම සොයා ගැනීමට අපහසු හෝ කාලය ගතවන දෙයක් තක්සේරු කිරීමේ ක්‍රමයකි. ඒවා මූලික වශයෙන් කිසියම් ගණිතමය හෝ භෞතික ක්‍රියාවලියක පරිගණක සමාකරණයේ ආකාරයකි. මොන්ටේ කාලෝ මොනිකරය පැමිණෙන්නේ කැසිනෝ හා අහඹු සංඛ්‍යා උත්පාදනය අතර ඇති ප්‍රතිසමයෙන් ය. මීට පෙර අපගේ පුවරු ක්‍රීඩා උදාහරණය වෙත ආපසු යාම, සමහර විට අපට දැන ගැනීමට අවශ්‍ය වන්නේ ඒකාධිකාරී මණ්ඩලයේ සමහර දේපල අනෙක් ඒවාට වඩා බොහෝ විට සංචාරය කර ඇත්ද යන්නයි. මොන්ටේ කාලෝ අත්හදා බැලීමකට නැවත නැවත දාදු කැටය පෙරළීම හා එක් එක් දේපල මත ඔබ ගොඩබසින වාර ගණන ගණනය කිරීම ඇතුළත් වේ. සංඛ්‍යාත්මක අනුකලනයන් ගණනය කිරීම සඳහා ද එය භාවිතා කළ හැකිය. (ඉතා අවිධිමත් ලෙස, අපට කිසියම් ශ්‍රිතයක ප්‍රස්තාරය යටතේ ඇති ප්‍රදේශය ලෙස අනුකලනය ගැන සිතිය හැකිය. ) මොන්ටේ කාලෝ අනුකලනය ඉහළ මානයන්හි ශ්‍රිතයන්හි අහඹු නියැදියක් ලබා ගැනීමෙන් සහ මෙම විවිධ ලක්ෂ්‍යවල යම් ආකාරයක සාමාන්‍යයක් ගණනය කිරීමෙන් විශිෂ්ට ලෙස ක්‍රියා කරයි. නියැදි ප්‍රමාණය වැඩි කිරීමෙන්, විශාල සංඛ්‍යාවක නියමය අපට කියා සිටින්නේ වැඩි වැඩියෙන් ආවරණය කිරීමෙන් අපගේ දළ විශ්ලේෂණයේ නිරවද්‍යතාව වැඩි කළ හැකි බවයි.

පොදු ගැටලු විසඳීම සඳහා බහුවිධ අනුකලනයන් ගණනය කළ යුතු බේසියානු අනුමානය, පරිගණක ජීව විද්‍යාව වැනි ක්ෂේත්‍රවල ඇති දුෂ්කර ගැටලු විසඳීම සඳහා මෙම සංකල්ප දෙක එකට එකතු කළ හැකිය. පියවර ගණනාවකට පසු අපේක්ෂිත සම්භාවිතා ව්‍යාප්තියට පරිවර්තනය වන මාකෝව් දාමයක් තැනීම මෙහි අදහසයි. පියවර විශාල ගණනකින් පසු දාමයේ තත්වය අපේක්ෂිත බෙදාහැරීමේ නියැදියක් ලෙස භාවිතා කරන අතර ක්‍රියාවලිය නැවත සිදු වේ. මාකෝව් දාමය උත්පාදනය සඳහා විවිධ ශිල්පීය ක්‍රම භාවිතා කරන විවිධ MCMC ඇල්ගොරිතම ඇත. පොදු ඒවා අතර මෙට්‍රොපොලිස්-හේස්ටිංස් සහ ගිබ්ස් නියැදිය ඇතුළත් වේ.


1
ඇත්තෙන්ම හොඳ පැහැදිලි කිරීමක්. එක් ව්‍යාකූලතාවයක් පමණක් ඉවත් නොකෙරේ. ඔබ පැවසූ පරිදි, "අදහස වන්නේ අපේක්ෂිත සම්භාවිතා ව්‍යාප්තියට පරිවර්තනය වන මාකෝව් දාමයක් තැනීමයි." ප්‍රාන්ත සඳහා ස්ථාවර රාජ්‍ය සම්භාවිතා ව්‍යාප්තිය අප දැනටමත් දන්නා බවක් පෙනේ, එසේ නම් අපට මාර්කෝව් දාමයක් තැනීමට අවශ්‍ය වන්නේ ඇයි? මාකෝව් දාමයේ පරමාර්ථය වන්නේ අප සතුව දැනටමත් පවතින ස්ථාවර රාජ්‍ය ව්‍යාප්තිය අපට ලබා දීම නොවේ ද? ඔබ අදහස් නොකළේ නම්, වර්තමාන තත්වය මත පදනම්ව n + 1 හි රාජ්‍ය සම්භාවිතාව ගණනය කිරීම සඳහා මාකෝව් දාමයක් ලබා ගැනීම තවමත් අවශ්‍ය වේ.
එම්රාන් හුසේන්

17

හැකර්වරුන් සඳහා බේසියානු ක්‍රම වලින් උපුටා ගැනීමකි

බේසියානු භූ දර්ශනය

NNp1p2

Exp(3)Exp(10)

පහත දෘශ්‍යකරණය මෙය පෙන්නුම් කරයි. තද රතු පැහැය, නොදන්නා අය එම ස්ථානයේ සිටින බවට පූර්ව සම්භාවිතාව. අනෙක් අතට, තද නිල් පැහැයෙන් යුත් ප්‍රදේශ නිරූපණය කරන්නේ නොදන්නා අයට අපගේ ප්‍රියර්ස් ඉතා අඩු සම්භාවිතාවක් ලබා දෙන බවයි.

රූප විස්තරය මෙහි ඇතුළත් කරන්න

මේවා 2D අවකාශයේ සරල උදාහරණ වන අතර අපගේ මොළයට පෘෂ් aces යන් හොඳින් වටහා ගත හැකිය. ප්‍රායෝගිකව, අපගේ ප්‍රියර්ස් විසින් ජනනය කරන ලද අවකාශයන් සහ පෘෂ් aces යන් වඩා ඉහළ මානයන් විය හැකිය.

XXඋස කඳු සෑදීම සඳහා මුල් මතුපිටට තල්ලු කරයි . කරන ලද මුදල ෙකොපමණද තල්ලු එසේ අඩු පෙර සම්භාවිතාව මාර්ගයෙන් වැඩි ප්රතිරෝධය බව, පෙර සම්භාවිතාව විසින් ප්රතිරෝධය ඇත. මේ අනුව ඉහත ද්විත්ව on ාතීය-පෙර අවස්ථාවෙහිදී (0,0) කෙළවර අසල පුපුරා යා හැකි කන්දක් (හෝ බහු කඳු) (5,5) ආසන්නයේ පුපුරා යන කඳු වලට වඩා බොහෝ ඉහළ අගයක් ගනී. (5,5). කන්ද, හෝ වඩාත් සාමාන්‍යයෙන්, කඳු වැටි, සැබෑ පරාමිතීන් සොයාගත හැකි ස්ථානවල පශ්චාත් සම්භාවිතාව පිළිබිඹු කරයි.

λ

රූප විස්තරය මෙහි ඇතුළත් කරන්න

Uniform(0,5)

කළු තිත සැබෑ පරාමිතීන් නියෝජනය කරයි. ඉහත අනුකරණය කළ පරිදි නියැදි ලක්ෂ්‍ය 1 ක් සමඟ වුවද, කඳුකරය සත්‍ය පරාමිතිය අඩංගු කිරීමට උත්සාහ කරයි. ඇත්ත වශයෙන්ම, නියැදි ප්‍රමාණය 1 සමඟ අනුමාන කිරීම ඇදහිය නොහැකි තරම් බොළඳ වන අතර, එවැනි කුඩා නියැදි ප්‍රමාණයක් තෝරා ගැනීම නිදර්ශනීය විය.

MCMC භාවිතා කරමින් භූ දර්ශනය ගවේෂණය කිරීම

NNNපශ්චාත් ව්‍යාප්තියෙන් මිස බෙදාහැරීමෙන් නොවේ. අපගේ කඳුකර ප්‍රතිසමතාව එහි සීමාවට දිගු කරමින්, MCMC විසින් "මම සොයන කන්දෙන් මෙම ගල් කැටය කොතරම් දුරට සොයාගත හැකිද?" යනුවෙන් නැවත නැවත ඇසීමට සමාන කාර්යයක් ඉටු කරයි. ප්‍රතිනිර්මාණය කිරීමේ අපේක්ෂාවෙන් පිළිගත් ගල් කැට දහස් ගණනක් ආපසු ලබා දීමෙන් එහි කාර්යය සම්පූර්ණ කරයි. මුල් කන්ද. MCMC හා PyMC lingo දී, "ගල් කැට" යන ආපසු අනුක්රමය බොහෝවිට හඳුන්වන සාම්පල වේ අංශු මාත්ර .

මම MCMC බුද්ධිමත්ව සෙවුම් කියන විට, මම MCMC ඇත අදහස් , බලාපොරොත්තු ඉහළ posterior සම්භාවිතාව පිළිබඳ ප්රදේශ කරා අභිසාරී. MCMC මෙය කරන්නේ අවට ඇති ස්ථාන ගවේෂණය කිරීමෙන් සහ ඉහළ සම්භාවිතාවක් ඇති ප්‍රදේශවලට යාමෙනි. නැවතත්, සමහර විට "අභිසාරී" යනු MCMC හි ප්‍රගතිය විස්තර කිරීමට නිවැරදි යෙදුමක් නොවේ. සංවර්‍ධනය කිරීම සාමාන්‍යයෙන් අභ්‍යවකාශයේ ලක්ෂ්‍යයක් කරා ගමන් කිරීම අදහස් කරයි, නමුත් MCMC අභ්‍යවකාශයේ පුළුල් ප්‍රදේශයක් දෙසට ගමන් කරන අතර අහඹු ලෙස එම ප්‍රදේශයේ ඇවිදිමින් එම ප්‍රදේශයෙන් සාම්පල ලබා ගනී.

මුලදී, සාම්පල දහස් ගණනක් පරිශීලකයා වෙත ආපසු ලබා දීම පශ්චාත් බෙදාහැරීම් විස්තර කිරීමට අකාර්යක්ෂම ක්‍රමයක් ලෙස පෙනේ. මෙය අතිශයින්ම කාර්යක්ෂම යැයි මම තර්ක කරමි. විකල්ප හැකියාවන් සලකා බලන්න ::

  1. “කඳු වැටි” සඳහා ගණිතමය සූත්‍රයක් නැවත ලබා දීම සඳහා අත්තනෝමතික කඳු මුදුන් සහ නිම්න සහිත එන්-මාන පෘෂ් ing යක් විස්තර කිරීම ඇතුළත් වේ.
  2. භූ දර්ශනයේ "උපරිමය" නැවත ලබා දීම, ගණිතමය වශයෙන් කළ හැකි සහ නොදන්නා අයගේ බොහෝ දුරට ඇස්තමේන්තු කළ හැකි ඉහළම ස්ථානය ලෙස කළ හැකි සංවේදී දෙයක්, භූ දර්ශනයේ හැඩය නොසලකා හැරීම, පශ්චාත් විශ්වාසය තීරණය කිරීමේදී ඉතා වැදගත් යැයි අප කලින් තර්ක කර ඇත. නොදන්නා දේ තුළ.

පරිගණකමය හේතූන් හැරුණු විට, සාම්පල නැවත ලබා දීමට ඇති ප්‍රබලම හේතුව නම්, අපට පහසුවෙන් විශාල සංඛ්‍යා නීතිය භාවිතා කළ හැකි වීමයි. මම මෙම සාකච්ඡාව ඊළඟ පරිච්ඡේදය සඳහා කල් තබමි.

MCMC සිදු කිරීමට ඇල්ගොරිතම

MCMC සිදු කරන ඇල්ගොරිතම විශාල පවුලක් ඇත. සරලවම, බොහෝ ඇල්ගොරිතම පහත පරිදි ඉහළ මට්ටමකින් ප්‍රකාශ කළ හැකිය:

1. Start at current position.
2. Propose moving to a new position (investigate a pebble near you ).
3. Accept the position based on the position's adherence to the data 
and prior distributions (ask if the pebble likely came from the mountain).
4. If you accept: Move to the new position. Return to Step 1.
5. After a large number of iterations, return the positions.

මේ ආකාරයෙන් අපි පශ්චාත් බෙදාහැරීම් පවතින ප්‍රදේශ දෙසට සාමාන්‍ය දිශාවට ගමන් කරන අතර ගමනේ දී අරපිරිමැස්මෙන් සාම්පල රැස් කරමු. අප පශ්චාත් බෙදාහැරීම කරා ළඟා වූ පසු, සාම්පල සියල්ලම පශ්චාත් ව්‍යාප්තියට අයත් බැවින් අපට පහසුවෙන් එකතු කර ගත හැකිය.

MCMC ඇල්ගොරිතමයේ වර්තමාන පිහිටීම අතිශයින්ම අඩු සම්භාවිතාවක් සහිත ප්‍රදේශයක තිබේ නම්, එය බොහෝ විට සිදුවන්නේ ඇල්ගොරිතම ආරම්භ වන විටය (සාමාන්‍යයෙන් අවකාශයේ අහඹු ස්ථානයක), ඇල්ගොරිතම පශ්චාත් සිට නොපැමිණෙන ස්ථානවල ගමන් කරයි නමුත් අසල ඇති සියල්ලටම වඩා හොඳයි. මේ අනුව ඇල්ගොරිතමයේ පළමු චලනයන් පශ්චාත් පරාවර්තනය නොවේ.


2
ගැටලුව විශේෂයෙන් MCMC හා සම්බන්ධ බව මට වැටහී ඇති අතර එය බේසියානු අනුමානය නොව, බේසියානු භූ දර්ශන සන්දර්භය තුළ MCMC ඉතා තේරුම්ගත හැකි බව මට පෙනේ.
Cam.Davidson.Pilon

12

එබැවින් සංඛ්‍යාලේඛන / සම්භාවිතා පෙළපොත්, විකිපීඩියා යනාදියෙන් උපුටා ගත් පිළිතුරු මෙහි ඕනෑ තරම් තිබේ. මම විශ්වාස කරන්නේ මා සේවය කරන ස්ථානයේ “ලේපර්සන්” ඇති බවය; මම හිතන්නේ ඔවුන් ඉන්නේ අලෙවිකරණ දෙපාර්තමේන්තුවේ. මට කවදා හෝ ඔවුන්ට තාක්ෂණික යමක් පැහැදිලි කිරීමට සිදුවුවහොත්, “පෙන්වන්න එපා” යන රීතිය මම ක්‍රියාත්මක කරමි. එම රීතිය මනසේ තබාගෙන, මම ඔවුන්ට මේ වගේ දෙයක් පෙන්වනු ඇත.

මෙහි අදහස නම් අක්ෂර වින්‍යාසය ඉගැන්වීමට මට ඉගැන්විය හැකි ඇල්ගොරිතමයක් කේත කිරීමට උත්සාහ කිරීමයි - නිශ්ශබ්ද ඊ සමඟ අවසන් වන වචනයකට අවසානයක් එකතු කරන විට, අවසාන ඊ අතහැර දමන්න වැනි නීති සිය ගණනක් (දහස්?) ඉගෙනීමෙන් නොවේ. අවසානය ස්වරයකින් ආරම්භ වන්නේ නම් . ක්‍රියා නොකිරීමට එක් හේතුවක් නම් මම එම නීති නොදැන සිටීමයි (මා කියවූ දෙය නිවැරදි යැයි මට විශ්වාස නැත). ඒ වෙනුවට මම එය නිවැරදිව අක්ෂර වින්‍යාසය සහිත වචන පොකුරක් පෙන්වමින් එම වචන වලින් නීති උකහා ගැනීමට ඉඩ දෙන්නෙමි, එය යන්ත්‍ර ඉගෙනීමේ සාරය වැඩි වශයෙන් හෝ අඩුය, ඇල්ගොරිතම නොසලකා - රටා නිස්සාරණය සහ රටා හඳුනාගැනීම .

සාර්ථකත්වයේ නිර්ණායකය ඇල්ගොරිතම මීට පෙර කවදාවත් දැක නැති වචනයක් නිවැරදිව අක්ෂර වින්‍යාසයයි (එය අහම්බෙන් සිදුවිය හැකි බව මට වැටහී ඇත, නමුත් එය අලෙවිකරණ යාලුවන්ට සිදු නොවනු ඇත, එබැවින් මම නොසලකා හරිමි - ප්ලස් මට ඇල්ගොරිතම ලැබෙනු ඇත එක් වචනයක් නොව බොහෝ දේ උච්චාරණය කිරීමට උත්සාහ කිරීම, එබැවින් වාසනාවන්ත අනුමාන කිහිපයකින් අප රැවටෙනු ඇතැයි සිතිය නොහැක).

පැයකට හෝ ඊට පෙර, මම හර්මන් හෙස්සි නවකතාව වන සිද්ධාර්ථ නම් විශිෂ්ට ව්‍යාපෘති ගුටන්බර්ග් අඩවියෙන් (සරල පෙළ ගොනුවක් ලෙස) බාගත කළෙමි . ඇල්ගොරිතම අක්ෂර වින්‍යාසය ඉගැන්වීමට මම මෙම නවකතාවේ වචන භාවිතා කරමි.

එබැවින් මම මෙම නවකතාව පරිලෝකනය කළ ඇල්ගොරිතම කේතනය කළෙමි, වරකට අකුරු තුනක් (සෑම වචනයක්ම අවසානයේ එක් අමතර අක්ෂරයක් ඇත, එය 'සුදු අවකාශය' හෝ වචනයේ අවසානය). අකුරු තුනකින් යුත් අනුපිළිවෙලින් ඔබට බොහෝ දේ පැවසිය හැකිය - නිදසුනක් ලෙස, 'q' අක්ෂරය සෑම විටම පාහේ 'u' අනුගමනය කරයි; 'ටයි' අනුක්‍රමය සාමාන්‍යයෙන් සිදුවන්නේ වචනයක අවසානයේ ය; z කලාතුරකින් සිදු වන අතර එසේ ය. (සටහන: සම්පූර්ණ වාක්‍යයකින් කථා කිරීමට එය පුහුණු කිරීම සඳහා මට එය පහසුවෙන්ම සම්පූර්ණ වචන පෝෂණය කළ හැකිය - හරියටම එකම අදහස, කේතයට කරකැවීම් කිහිපයක් පමණි.)

මේ කිසිවක් MCMC හා සම්බන්ධ නොවන අතර, එය පුහුණුවීමෙන් පසුව සිදු වේ, අපි ඇල්ගොරිතමයට අහඹු අකුරු කිහිපයක් (බීජයක් ලෙස) ලබා දී එය 'වචන' සෑදීමට පටන් ගනිමු. ඇල්ගොරිතම වචන ගොඩනඟන්නේ කෙසේද? එයට 'ක්වා' බ්ලොක් ඇති බව සිතන්න; ඊළඟට එය එකතු කරන්නේ කුමන ලිපියද? පුහුණුව අතරතුර, ඇල්ගොරිතම නවකතාවේ ඇති වචන දහස් ගණනින් දැවැන්ත l * etter-sequ සංඛ්‍යාත අනුකෘතියක් * සාදන ලදී. එම අනුකෘතියේ කොතැනක හෝ අකුරු තුනකින් යුත් 'ක්වා' සහ අනුක්‍රමය අනුගමනය කළ හැකි අක්ෂර සඳහා සංඛ්‍යාත වේ. ඇල්ගොරිතම මඟින් එය අනුගමනය කළ හැකි සංඛ්‍යාත මත පදනම්ව ලිපියක් තෝරා ගනී. ඊළඟට ඇල්ගොරිතම තෝරා ගන්නා ලිපිය රඳා පවතින්නේ - සහ තනිකරම - එහි වචන-ඉදිකිරීම් පෝලිමේ අවසාන තුන මත ය.

ඉතින් එය මාකෝව් චේන් මොන්ටේ කාලෝ ඇල්ගොරිතමයකි.

විවිධ මට්ටම්වල පුහුණුවීම් මත පදනම්ව ප්‍රති results ල පෙන්වීම එය ක්‍රියාත්මක වන ආකාරය නිදර්ශනය කිරීමට හොඳම ක්‍රමය යැයි මම සිතමි. නවකතාව වුවද ඇල්ගොරිතම සමත් වාර ගණන වෙනස් කිරීමෙන් පුහුණු මට්ටම වෙනස් වේ - එහි අකුරු-අනුක්‍රමික සංඛ්‍යාත අනුකෘතියේ විශ්වසනීයත්වය වැඩි වන තරමට පාස් වැඩි වේ. පහත දැක්වෙන්නේ 'සිද්ධාර්ථ' නවකතාව පිළිබඳ පුහුණුවීමෙන් පසුව - ඇල්ගොරිතම මඟින් අක්ෂර 100 කින් යුත් ප්‍රතිදානයක ප්‍රති output ලයකි.


නවකතාව හරහා තනි සටහනක්, සිද්ධාර්ථ :

එවිට හර්ක්ස් ජර් වයිෆ් සියළුම මෝතනි ස්ථාවරය ඔබ ලයිට් තාර්ටිම් මඩ සහිත සුලින්ටියන්එක්ස් ඔහුගේ සිහිකල්පනාව ඔහුගේ

(කෙලින්ම, වේල්ස් භාෂාව පරිපූර්ණ ලෙස කථා කිරීමට ඉගෙන ගෙන ඇත; මම එය අපේක්ෂා නොකළෙමි.)


නවකතාව හරහා දෙකක් පසු වූ පසු:

ඇක් වෝර් ප්‍රෙන්ස්කිනිත් ප්‍රදර්ශනය යනු දෙවරක් දැකගත හැකි වූ හෙතෙම තියටින් ගොඩබිම රැටින් කිරීම එහි ඩිම්බය විය


සාමාර්ථ 10 කින් පසු:

එසේ වුවද, අක්කරයෙන් යාච් pray ා කළ යුතුය. දැන් ඇගේ සුනඛ ලීවරයේ වේදනාව පාදයේ එක් එක් දුර්වල මතකය නොවේ


මෙන්න කේතය (පයිතන්හි, MCMC පැකේජයක් භාවිතා කර R හි මෙය කළ හැකි බව මට විශ්වාසයි. ඒවායින් කිහිපයක්ම පේළි 3-4 කින් ඇත)

def create_words_string(raw_string) :
  """ in case I wanted to use training data in sentence/paragraph form; 
      this function will parse a raw text string into a nice list of words;
      filtering: keep only words having  more than 3 letters and remove 
      punctuation, etc.
  """
  pattern = r'\b[A-Za-z]{3,}\b'
  pat_obj = re.compile(pattern)
  words = [ word.lower() for word in pat_obj.findall(raw_string) ]
  pattern = r'\b[vixlm]+\b'
  pat_obj = re.compile(pattern)
  return " ".join([ word for word in words if not pat_obj.search(word) ])

def create_markov_dict(words_string):
  # initialize variables
  wb1, wb2, wb3 = " ", " ", " "
  l1, l2, l3 = wb1, wb2, wb3
  dx = {}
  for ch in words_string :
    dx.setdefault( (l1, l2, l3), [] ).append(ch)
    l1, l2, l3 = l2, l3, ch
  return dx

def generate_newtext(markov_dict) :
  simulated_text = ""
  l1, l2, l3 = " ", " ", " "
  for c in range(100) :
    next_letter = sample( markov_dict[(l1, l2, l3)], 1)[0]
    simulated_text += next_letter
    l1, l2, l3 = l2, l3, next_letter
  return simulated_text

if __name__=="__main__" :
  # n = number of passes through the training text
  n = 1
  q1 = create_words_string(n * raw_str)
  q2 = create_markov_dict(q1)
  q3 = generate_newtext(q2)
  print(q3)

13
ඔබ ඉංග්‍රීසියෙන් අක්ෂර වින්‍යාසය සඳහා මාකෝව් ආකෘතියක් සාදා ඇති අතර එය දත්ත වලට ගැලපේ. නමුත් සවි කර ඇති ආකෘතියෙන් නියැදීම MCMC නොවේ . (එය සාම්පල ලබා ගන්නා “අපේක්ෂිත බෙදාහැරීම” කුමක්ද? පැහැදිලිවම, “ඉංග්‍රීසියෙන් නිසි ලෙස අක්ෂර වින්‍යාසය සහිත වචන” බෙදා හැරීම නොවේ. අභ්‍යාසය විවේචනය කිරීමට මා අදහස් නොකරමි; එය භාෂාව සඳහා මාකෝව් දාම ආකෘතියක කදිම නිරූපණයකි. නමුත් MCMC හි ප්‍රධාන අදහස වන්නේ මාකෝව් දාමයක් නිර්මාණය කිරීමයි, එවිට එහි සමතුලිත ව්‍යාප්තිය ඔබේ මනසෙහි යම් බෙදාහැරීමකට අනුරූප වන අතර මෙය සාක්ෂාත් කර ගන්නා බව පැහැදිලිව පෙනෙන්නට නැත.
jpillow

3

MCMC සාමාන්‍යයෙන් බොරතෙල් මොන්ටේ කාලෝ අනුකරණ ක්‍රමවේදයන්ට විකල්පයක් ලෙස භාවිතා කරයි. MCMC සහ අනෙකුත් මොන්ටේ කාලෝ ශිල්පීය ක්‍රම දෙකම දුෂ්කර අනුකලනයන් ඇගයීම සඳහා භාවිතා කරන නමුත් MCMC වඩාත් සාමාන්‍යයෙන් භාවිතා කළ හැකිය.

නිදසුනක් ලෙස, සංඛ්‍යාලේඛනවල පොදු ගැටළුවක් වන්නේ යම් සම්භාවිතා / ස්ථිතික ආකෘතියකට අදාළ මධ්‍යන්‍ය ප්‍රති come ල ගණනය කිරීමයි. එම්.සී.එම්.සී. සහ මොන්ටේ කාලෝ ශිල්පීය ක්‍රම දෙකම මෙම ගැටළුව විසඳනු ඇත්තේ සැබෑ මධ්‍යන්‍යය තක්සේරු කිරීමට අපට භාවිතා කළ හැකි අනුකරණ ප්‍රති come ල මාලාවක් ජනනය කිරීමෙනි.

MCMC සහ බොරතෙල් මොන්ටේ කාලෝ ශිල්පීය ක්‍රම දෙකම ක්‍රියාත්මක වන්නේ දී ඇති ප්‍රති come ලයට සමාන දිගු කාලීන සමාකරණ අනුපාතය එම ප්‍රති come ලයේ ආදර්ශ සම්භාවිතාවට සමාන වේ. එමනිසා, ප්‍රමාණවත් අනුකරණ ජනනය කිරීමෙන්, ක්‍රම දෙකෙන්ම නිපදවන ප්‍රති results ල නිවැරදි වනු ඇත.

* මම සමාන යැයි පැවසුවද පොදුවේ මැනිය හැකි කට්ටල ගැන කතා කළ යුතුය. කෙසේ වෙතත්, ලේපර්සන් කෙනෙකු මේ ගැන උනන්දු නොවනු ඇත *

කෙසේ වෙතත්, බොරතෙල් මොන්ටේ කාලෝ බොහෝ ස්වාධීන සමාකරණ නිපදවීමට සම්බන්ධ වන අතර, ඒ සෑම එකක්ම ආදර්ශනය කරන ලද බෙදාහැරීම් අනුව බෙදා හරිනු ලැබේ, MCMC යනු අහඹු ලෙස ඇවිදීම උත්පාදනය කිරීමකි.

එබැවින්, MCMC හි උපක්‍රමය, අහඹු ලෙස ඇවිදීමකි, එමඟින් අපේක්ෂිත දිගු කාලීන සංඛ්‍යාත සමඟ එක් එක් ප්‍රති come ල "සංචාරය" කරනු ඇත.

සරල උදාහරණයක් වනුයේ "A" ප්‍රති come ල සම්භාවිතාව 0.5 ක් සහ "B" ප්‍රති 0.5 ල 0.5 ක් යැයි පවසන ආකෘතියකින් අනුකරණය කිරීමයි. මෙම අවස්ථාවෙහිදී, මම "A" ස්ථානයේ අහඹු ලෙස ඇවිදීම ආරම්භ කර සෑම පියවරකදීම එය සම්භාවිතාව 0.2 (හෝ 0 ට වඩා වැඩි වෙනත් සම්භාවිතාවක් සහිතව) වෙත මාරු කළ යුතු යැයි නියම කළහොත්, විශාල ප්‍රමාණයකින් පසුව මට සහතික විය හැකිය අහඹු ලෙස ඇවිදීම පියවර 50% කින් දළ වශයෙන් එක් එක් "ඒ" සහ "බී" වෙත පැමිණීමට ඉඩ තිබුණි - අපගේ ආකෘතිය විසින් නියම කර ඇති සම්භාවිතාවන්ට අනුකූල වේ.

මෙය පැහැදිලිවම ඉතා නීරස උදාහරණයකි. කෙසේ වෙතත්, සම්මත මොන්ටේ කාලෝ හෝ වෙනත් ශිල්පීය ක්‍රම භාවිතා කිරීමට අපහසු අවස්ථාවන්හිදී MCMC බොහෝ විට අදාළ වන බව පෙනේ.

එය කුමක්ද සහ එය මෙහි ක්‍රියාත්මක වන්නේ ඇයිද යන්න පිළිබඳ මූලික කරුණු ආවරණය වන ලිපියක් ඔබට සොයාගත හැකිය:

http://wellredd.uk/basics-markov-chain-monte-carlo/


උසස් තත්ත්වයේ සංඛ්‍යාන තොරතුරු වල ස්ථිර ගබඩාවක් ප්‍රශ්න හා පිළිතුරු වශයෙන් ගොඩනැගීමට අපි උත්සාහ කරමු. සබැඳි කුණුවීමට යටත් වන සබැඳි පමණක් පිළිතුරු වළක්වා ගැනීමට අපි උත්සාහ කරමු ; එනිසා මෙය තමන්ගේම පිළිතුරකට වඩා අදහස් දැක්වීමකි. ඔබට හැකි නම්, සබැඳියේ ඇති තොරතුරු වල සාරාංශයක් ලබා දීමෙන් ඔබට එය පුළුල් කළ හැකිද (නැතහොත් අපට එය ඔබ වෙනුවෙන් අදහස් දැක්වීමක් බවට පරිවර්තනය කළ හැකිය).
ග්ලෙන්_බී -රයින්ස්ටේට් මොනිකා

2

මම ඩීඑන්ඒ විශ්ලේෂකයෙකු වන අතර එය ඩීඑන්ඒ සාක්ෂි අර්ථ නිරූපණය කිරීම සඳහා පූර්ණ අඛණ්ඩ සම්භාවිතා ජාන සැකසුම් මෘදුකාංගයක් භාවිතා කරන අතර මෙය ජූරි සභාවක් වෙත ක්‍රියා කරන්නේ කෙසේදැයි මට පැහැදිලි කළ යුතුය. සමස්ථ අවබෝධය වැඩිදියුණු කිරීමේ නාමයෙන් නිශ්චිත තොරතුරු වල නිරවද්‍යතාවය අප විසින් සරල කර ඇති බව පිළිගත යුතුය. එහෙත්, අධ්‍යයන උපාධි සහ වසර ගණනාවක වෘත්තීය පළපුරුද්ද නොමැතිව ඩීඑන්ඒ අර්ථ නිරූපණය සඳහා මෙම ක්‍රියාවලිය භාවිතා කරන්නේ කෙසේද යන්න ජූරි සභාවක් අවබෝධ කර ගැනීමේ සන්දර්භය තුළ, ඔවුන් සාරාංශය ලබා ගනී :)

පසුබිම: මෘදුකාංගය මෙට්‍රොපොලිස් හේස්ටිංස් එම්.සී.එම්.සී. සහ ඩී.එන්.ඒ පැතිකඩවල දන්නා හැසිරීම අනුකරණය කරන ජීව විද්‍යාත්මක ආකෘතියක් භාවිතා කරයි (ආදර්ශය ගොඩනගා ඇත්තේ රසායනාගාරය මගින් ජනනය කරන ලද වලංගු දත්ත පදනම් කරගෙන ය. ස්වාධීන දම්වැල් 8 ක් ඇති අතර, පිළිස්සීම වැඩි කිරීම නැවත ක්‍රියාත්මක කළ යුතුද යන්න තීරණය කිරීම සඳහා අපි අභිසාරීතාවය ඇගයීමට ලක් කරමු.

එම්.සී.සී. පරිගණකයක් මඟින් සිදු කරනු ලැබේ ... mcmc ඇල්ගොරිතම ක්‍රියාත්මක වන්නේ විසඳුමක් යෝජනා කිරීමෙන්, එම විසඳුම අනුකරණය කිරීමෙන් පසුව, එම අනුකරණය මගින් සත්‍ය සාක්ෂි දත්ත නිරීක්‍ෂණය කරන ආකාරය පිළිබිඹු කරයි ... සාක්ෂි නිරීක්‍ෂණයට ගැලපෙන අනුකරණයකට වඩා වැඩි සම්භාවිතාවක් ඇත නිරීක්‍ෂණයට නොගැලපෙන අනුකරණය ... යෝජිත විසඳුම් පිළිබඳ නැවත නැවතත් නියැදි / අනුමාන කිරීම් හරහා, මාකෝව් දම්වැල් අඩු සම්භාවිතා විසඳුම් වලින් ඉහළ සම්භාවිතා විසඳුම් දෙසට move ත් වී නිරීක්ෂණය කරන ලද සාක්ෂි පැතිකඩ වඩා හොඳින් ගැලපෙන / පැහැදිලි කරන, අවසානයේ සමතුලිතතාවය තෙක් අත්කර ගත්,ඇල්ගොරිතමයට සැලකිය යුතු ලෙස වැඩි සම්භාවිතාවක් ලබා දෙන නව යෝජනා නියැදි කිරීමට සීමිත හැකියාවක් ඇත

මෙට්රොපොලිස් හේස්ටිංස් ගැන විමසූ විට: එය MCMC ඇල්ගොරිතමයේ ශෝධනයක් බව අපි පැහැදිලි කරන්නේ එහි තීරණ ගැනීමේ ක්‍රියාවලිය යෝජනාවක් පිළිගැනීම හෝ ප්‍රතික්ෂේප කිරීම ... සාමාන්‍යයෙන් මෙය පැහැදිලි කරනු ලබන්නේ "උණුසුම් / සීතල" ළමා ක්‍රීඩාවේ ප්‍රතිසමයක් සමඟිනි. ජූරි සභාව විශේෂයෙන් තරුණ වන විට දකුණට හෝ වමට ස්වයිප් කරන්න !! : p නමුත් අපගේ උණුසුම් / සීතල ප්‍රතිසමයන් භාවිතා කරමින්, අපි සැමවිටම උණුසුම් අනුමානයක් පිළිගන්නා අතර ඉඳහිට සීතල අනුමාන කිරීමක් පිළිගනිමු. සමහර විට සීතල අනුමානය පිළිගැනීමේ අරමුණ පැහැදිලි කරන්නේ දම්වැල් නියැදිය පුළුල් පරාසයක විභවතාවයන් සහතික කිරීමයි. සැබෑ සමතුලිතතාවයට පෙර එක් විශේෂිත යෝජනාවක් වටා සිරවී සිටීමට විරුද්ධයි

එකතු කිරීම / පැහැදිලි කිරීම සඳහා සංස්කරණය කරන ලදි: උණුසුම් / සීතල ප්‍රතිසමයෙන් අපි පැහැදිලි කරන්නේ ළමා ක්‍රීඩාවේදී නායකයා කාමරය තුළ ඉලක්කගත වස්තුවක් / ප්‍රදේශයක් තෝරා ගන්නා අතර ක්‍රීඩකයන් ඔවුන්ගේ වර්තමාන ස්ථාවරයට / ස්ථානයට සාපේක්ෂව කුමන දිශාවට ගමන් කළ යුතු දැයි අනුමාන කරයි. නායකයා ඔවුන්ට පවසන්නේ ඔවුන්ගේ ස්ථාවරය වෙනස් කිරීමට / එය උණුසුම් අනුමාන කිරීමක් නම් පියවරක් ගන්නා ලෙසයි. ඒ හා සමානව, අපගේ මෘදුකාංගය තුළ, ගෙනයාමේ / පිළිගැනීමේ තීරණය රඳා පවතින්නේ දැනට පවතින තනතුරේ සම්භාවිතාවට සාපේක්ෂව යෝජනාවේ සම්භාවිතාව මත පමණි ... කෙසේ වෙතත්, ඉලක්කය ළමා ක්‍රීඩාවේ නායකයා විසින් කලින් නිර්වචනය කර / දන්නා නමුත් අපගේ මෘදුකාංගය තුළ ඉලක්කය කලින් නිර්වචනය කර නැත - එය සම්පූර්ණයෙන්ම නොදන්නා කරුණකි (එය එසේ වන්නේ ඇයි '

මා කීවාක් මෙන්, සුපිරි සුපිරි මූලික සහ අවබෝධය වැඩි දියුණු කිරීම සඳහා තාක්ෂණික තොරතුරු නොමැති වීම - අපි මධ්‍යම පාසල් මට්ටමේ අධ්‍යාපනයක් පිළිබඳව පැහැදිලි කිරීමට උත්සාහ කරමු. යෝජනා කිරීමට නිදහස් වන්න. මම ඒවා ඒකාබද්ධ කරන්නම්.


1

මෙම ප්‍රශ්නය පුළුල් නමුත් පිළිතුරු බොහෝ විට අනියම් ය. විකල්පයක් ලෙස, ඔබ මේ බලන්න පුළුවන් කඩදාසි ගිබ්ස් නියැදීම් කීර්තිමත්ම නගරය-තුළ-ගිබ්ස් හා සහායක විචල්ය ක්රම, පෙත්තක් නියැදීම් ආවර්තනික යෝජනා, දිශාව නියැදීම් Langevin, කීර්තිමත්ම නගරය-හේස්ටින්ග්ස් ගණිත ක්රමයක් ඇතුළු MCMC දක්නට නොමැත්තේ පුළුල් පන්තියේ සංක්ෂිප්ත ගණිතමය නිරූපණය ලබා දෙන සහ කතුවරුන් සාකච්ඡා කළ පරිදි හැමිල්ටෝනියානු මොන්ටේ කාලෝ, එන්යූටීඑස් නියැදීම, ව්‍යාජ ආන්තික මෙට්‍රොපොලිස්-හේස්ටිං ඇල්ගොරිතම සහ ව්‍යාජ ආන්තික හැමිල්ටෝනියානු මොන්ටේ කාලෝ.

විශ්වසනීය සමාලෝචනයක් මෙහි දක්වා ඇත

එහි අන්තර්ගතය stackexchange ආකෘතියෙන් විස්තාරනය කිරීමට මම වැඩි කාලයක් සොයා ගන්නෙමි.


0

f(x,y)=z=x2+2xy(x,y)f(x,y)f(x,y)

f(x,y,z,t,s,...,zzz)

මෙම වීඩියෝව (5:50 සිට ඇරඹේ) ඉතා හොඳ ප්‍රතිභාව ප්‍රකාශයක් ඇත.

මෙම පින්තූරයේ ඇති හරිත (බහු-මාන) ශාඛා මත ඇති ලකුණු නියැදි කිරීමට ඔබට අවශ්‍ය යැයි සිතන්න. ඔබ කළු සුපිරි අවකාශය පුරා ලකුණු විසි කර ඒවායේ වටිනාකම පරීක්ෂා කරන්නේ නම්, ඔබ නියැදි (සෙවුම්) ශක්තියක් නාස්ති කරයි. එබැවින් හරිත අතු වලට (එය වැදගත් වන තැනට) සමීප ස්ථාන තෝරා ගැනීම සඳහා ඔබේ නියැදි ක්‍රමෝපාය (ස්වයංක්‍රීය කළ හැකි) පාලනය කිරීම වඩාත් අර්ථවත් වනු ඇත. අහම්බෙන් (හෝ පාලනය කිරීමෙන්) පහර දීමෙන් හරිත අතු සොයා ගත හැකි අතර, ඉතිරි නියැදි උත්සාහය (රතු ලකුණු) පසුව ජනනය වේ. රතු පැහැය හරිත රේඛාවට ආකර්ෂණය වීමට හේතුව ඔබේ නියැදි එන්ජිම ලෙස ක්‍රියා කරන මාකෝව් දාම සංක්‍රාන්ති අනුකෘතියයි.

එබැවින් ගිහියන්ගේ අර්ථයෙන් ගත් කල, MCMC යනු බලශක්ති ඉතිරිකිරීමේ (අඩු වියදම්) නියැදි ක්‍රමයක් වන අතර, විශේෂයෙන් දැවැන්ත හා අඳුරු (බහු-මාන) අවකාශයක වැඩ කරන විට.

රූප විස්තරය මෙහි ඇතුළත් කරන්න


2
මම හිතන්නේ අපට “ගිහියා” යන්නට වෙනස් අර්ථකථනයක් ඇත
නීල් මැක්ගුගන්

හහාහා. මට "ලේපර්සන්" සඳහා මොන්ටේ-කාලෝ ද එක් කළ හැකිය, නමුත් නියැදීම / මොන්ටේ-කාලෝ ප්‍රශ්නයක් නොවීය.
අමීර්
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.