බූට්ස්ට්‍රැපිං වැඩ කරන්නේ ඇයි කියා ගිහියන්ට පැහැදිලි කිරීම


340

ව්‍යාපෘතියක් සඳහා විශ්වාසනීය අන්තරයන් තක්සේරු කිරීමට මම මෑතකදී ඇරඹුම් පටි භාවිතා කළෙමි. සංඛ්‍යාලේඛන ගැන වැඩි යමක් නොදන්නා කෙනෙක් මෑතකදී මගෙන් ඉල්ලා සිටියේ බූට්ස්ට්‍රැපිං වැඩ කරන්නේ ඇයිද යන්න පැහැදිලි කරන්න , එනම් එකම නියැදිය නැවත නැවත සකස් කිරීම හොඳ ප්‍රති .ල ලබා දෙන්නේ ඇයි යන්නයි. මම එය භාවිතා කරන්නේ කෙසේද යන්න තේරුම් ගැනීමට බොහෝ කාලයක් ගත කළත්, බූට්ස්ට්‍රැපින් වැඩ කරන්නේ ඇයිදැයි මට නොතේරේ.

නිශ්චිතවම: අපි අපගේ නියැදියෙන් නැවත සකස් කරන්නේ නම්, නියැදිය ගැන පමණක් නොව ජනගහනය ගැන යමක් ඉගෙන ගන්නේ කෙසේද? එහි තරමක් ප්‍රති-බුද්ධිමත් පිම්මක් ඇති බව පෙනේ.

මෙම ප්‍රශ්නයට පිළිතුරු කිහිපයක් මට හමු වී ඇත. විශේෂයෙන් මෙය . මම සංඛ්‍යාලේඛන "පාරිභෝගිකයෙක්" මිස සංඛ්‍යාලේඛන ian යෙක් නොවෙමි, මට වඩා සංඛ්‍යාලේඛන ගැන අඩු දැනුමක් ඇති අය සමඟ මම වැඩ කරමි. එබැවින්, ප්‍රමේයයන් යනාදිය පිළිබඳ අවම සඳහනක් සහිතව, බූට්ස්ට්‍රැප් පිටුපස ඇති මූලික තර්කය යමෙකුට පැහැදිලි කළ හැකිද? එනම්, ඔබට එය ඔබේ අසල්වැසියාට පැහැදිලි කළ යුතු නම්, ඔබ කියන්නේ කුමක්ද?


13
(+1) ඔබ බැලූ ප්‍රශ්න කෙටියෙන් සඳහන් කළ හැකි නමුත් එය ඔබව සෑහීමකට පත් නොකරයි. ඇත ගොඩක් මෙතන, bootstrap මත ප්රශ්න. :)
කාදිනල්

ard කාර්ඩිනල් ස්තූතියි, මම මුල් ලිපිය යාවත්කාලීන කළෙමි. එය වඩාත් පැහැදිලි වනු ඇතැයි අපේක්ෂා කරමු. :)
ඇලන් එච්.

5
සැලකිල්ලට ගත යුතු එක් දෙයක් - බහු මට්ටමේ ආකෘති සහ බහු-අදියර නියැදි සැලසුම් වැනි ධූරාවලි ව්‍යුහගත දත්ත සඳහා බූට්ස්ට්‍රැපිං පහසුවෙන් ක්‍රියා නොකරයි. ඔබ භාවිතා කළ යුතු "කුමන බූට්ස්ට්‍රැප්" දැන ගැනීම ඉතා ව්‍යාකූල ය.
probisislogic

2
මූලික වශයෙන්, බූට්ස්ට්‍රැප් ක්‍රියා කරන්නේ එය අසමමිතික උපරිම සම්භාවිතාව නිසාය. එබැවින්, උපරිම සම්භාවිතාව පිළිබඳ ගැටළු ඇති විට, ඔබට ඇරඹුම් පටි සමඟ ගැටළු අපේක්ෂා කළ හැකිය.
kjetil b halvorsen

3
ජේක් වැන්ඩර් ප්ලාස් විසින් පයිකොන් 16 හි බූට්ස්ට්‍රැපිං සහ වෙනත් ආශ්‍රිත ශිල්පීය ක්‍රම පිළිබඳව විශාල කතාවක් පවත්වන ලදී. බලන්න විනිවිදක විනිවිදක 71 සහ දී ආරම්භ වීඩියෝ පටිගත .
thm

Answers:


206

මම සාමාන්‍යයෙන් දෙන මධ්‍යම දිග අනුවාදය මේ ආකාරයට ය:

ඔබට ජනගහනයක් පිළිබඳ ප්‍රශ්නයක් ඇසීමට අවශ්‍ය නමුත් ඔබට එය කළ නොහැක. එබැවින් ඔබ නියැදියක් ගෙන ඒ වෙනුවට ප්‍රශ්නය අසන්න. දැන්, නියැදි පිළිතුර ජනගහන පිළිතුරට ආසන්න බව ඔබ කෙතරම් විශ්වාස කළ යුතුද යන්න පැහැදිලිවම ජනගහනයේ ව්‍යුහය මත රඳා පවතී. මේ පිළිබඳව ඔබට ඉගෙන ගත හැකි එක් ක්‍රමයක් නම්, ජනගහනයෙන් නැවත නැවතත් සාම්පල ලබා ගැනීම, ඔවුන්ගෙන් ප්‍රශ්නය අසන්න, සහ නියැදි පිළිතුරු කෙතරම් විචල්‍යද යන්න බලන්න. මෙය කළ නොහැකි බැවින් ඔබට ජනගහනයේ හැඩය ගැන යම් උපකල්පනයක් කළ හැකිය, නැතහොත් ඔබට ඇත්ත වශයෙන්ම ඇති නියැදියේ තොරතුරු භාවිතා කළ හැකිය .

ඔබ උපකල්පන කිරීමට තීරණය කර ඇතැයි සිතන්න, උදා: එය සාමාන්‍ය හෝ බර්නූලි හෝ වෙනත් පහසු ප්‍රබන්ධයකි. පෙර උපායමාර්ගය අනුගමනය කිරීමෙන් නියැදියක් ඉල්ලූ විට ඔබේ ප්‍රශ්නයට පිළිතුර කොතරම් වෙනස් විය හැකිද යන්න පිළිබඳව ඔබට නැවත දැනගත හැකිය, ඔබ සතුව ඇති එකම නියැදිය මත පදනම්ව ඔබ සතුව ඇති ප්‍රමාණයට සමාන සාම්පල නැවත නැවත උත්පාදනය කිරීමෙන් සහ ඒවා එකම ලෙස විමසීමෙන්. ප්‍රශ්නය. ඔබ පරිගණකමය වශයෙන් පහසු උපකල්පන තෝරාගත් ප්‍රමාණයට එය සරල ය. (ඇත්ත වශයෙන්ම විශේෂයෙන් පහසු උපකල්පන සහ සුළු නොවන ගණිතය මඟින් නියැදි කොටස මුළුමනින්ම මග හැරීමට ඔබට ඉඩ සලසයි, නමුත් අපි එය හිතාමතාම මෙහි නොසලකා හරිමු.)

උපකල්පන කිරීමට ඔබ සතුටු වන්නේ නම් මෙය හොඳ අදහසක් සේ පෙනේ. ඔබ එසේ නොවේ යැයි සිතන්න. විකල්පයක් නම් ඔබ සතුව ඇති නියැදිය ගෙන ඒ වෙනුවට නියැදිය ලබා ගැනීමයි. ඔබට මෙය කළ හැක්කේ ඔබ සතුව ඇති නියැදිය ද ජනගහනයක් වන අතර එය ඉතා කුඩා විවික්ත එකක් පමණි; එය ඔබගේ දත්තවල හිස්ටෝග්‍රැම් මෙන් පෙනේ. 'ප්‍රතිස්ථාපනය සමඟ' නියැදීම නියැදිය ජනගහනයක් සේ සැලකීමට සහ එහි හැඩය පිළිබිඹු වන පරිදි නියැදි කිරීමට පහසු ක්‍රමයකි.

මෙය කළ හැකි සාධාරණ දෙයකි, මන්ද ඔබ සතුව ඇති හොඳම නියැදිය පමණක් නොව, ඇත්ත වශයෙන්ම ජනගහනය ඇත්ත වශයෙන්ම පෙනෙන්නේ කෙසේද යන්න පිළිබඳ ඔබ සතුව ඇති එකම තොරතුරු පමණක් නොව, බොහෝ සාම්පල අහඹු ලෙස තෝරාගෙන තිබේ නම්, ඔවුන් පැමිණියේ ජනගහනය. එහි ප්‍රති your ලයක් වශයෙන් ඔබත් එසේ කරයි.

ප්‍රතිභානය සඳහා විවිධ ආකාරවලින් සහ විවිධ උපකල්පන මත ජනනය කරන ලද නියැදි තොරතුරු එක්රැස් කිරීමෙන් විචල්‍යතාවය පිළිබඳව ඔබට ඉගෙන ගත හැකි ආකාරය ගැන සිතීම වැදගත්ය. සංවෘත ආකෘති ගණිතමය විසඳුම් ලබා ගැනීමේ හැකියාව සම්පූර්ණයෙන්ම නොසලකා හැරීම මේ පිළිබඳව පැහැදිලි කර ගැනීම සඳහා වැදගත් වේ.


6
හොඳ පිළිතුරක්. අවසාන ඡේදයට මම විශේෂයෙන් කැමතියි.
පීටර් ෆ්ලොම්

19
(+1) මෙය හොඳ පිළිතුරකි. මම හිතන්නේ ඉතා වැදගත් කරුණක් තව දුරටත් උකහා ගැනීමට ක්‍රමයක් තිබිය හැකිය. බූට්ස්ට්රැප් සාමාන්යයෙන් සිදු කරන ආකාරය අනුව, සිදුවෙමින් පවතින බලපෑම් දෙකක් තිබේ. පළමුව, අප ලබාගෙන ඇති නියැදිය අපගේ ජනගහනය සඳහා ප්‍රොක්සියක් බව මවාපාමින් සිටින්නෙමු. අපගේ නියැදි ප්‍රමාණය සාධාරණ ලෙස විශාල නම් මෙය නාමිකව කළ යුතු සාධාරණ දෙයකි. කෙසේ වෙතත්, සාමාන්‍යයෙන් එම මවාපෑමේ බෙදාහැරීමෙන් ලැබෙන පොලී ප්‍රමාණය ගණනය කිරීමට අපට අපහසු වේ. ඉතින් , අපි ඒවා තක්සේරු කළ යුතු අතර, මේ නිසා අපි බූට්ස්ට්‍රැප් සාම්පල ගොඩක් අඳින්නෙමු. අපට හැකි නම් ... / ...
කාදිනල්

11
... / ... අපගේ මවාපෑමේ ව්‍යාප්තිය සඳහා පොළී ප්‍රමාණය කෙලින්ම ගණනය කරන්න, අපි එය කිරීමට කැමැත්තෙමු. සහ නියමිත බවද සැබෑ bootstrap. නමුත්, සාමාන්‍යයෙන් අපට බැහැ, ඒ නිසා නැවත සකස් කිරීමකට අපි සීමා වී සිටිමු.
කාර්දිනල්

8
ough naught101: “සාධාරණ ලෙස විශාල” යන්න ඩී.කේ.ඩබ්ලිව් අසමානතාවයෙන් මැනිය හැකිය (ඔබට අවශ්‍ය නම්, OP හි ප්‍රශ්නයේ සබැඳියෙන් ඔබට මගේ පිළිතුර බැලීමට හැකිය) සහ කැබලි අක්ෂර සම්බන්ධයෙන් , එය පොළී නියැදි සංඛ්‍යාලේඛන මත රඳා පවතී. නමුත් අපි නම් , bootstrap සාම්පල, පසුව සරල මොන්ටි කාලෝ සමග අපි සම්මත දෝෂයක් සඳහා දළ වශයෙන් වන බව දැන සාමාන්ය ( බී - 1 / 2 ) . බීO(B-1/2)
කාර්දිනල්

4
ard කාර්ඩිනල්: හොඳ අදහස් දැක්වීමක්. බොහෝ අය සිතන්නේ බූට්ස්ට්‍රැප් සහ නැවත සකස් කිරීම එකම දෙය වන අතර ඇත්ත වශයෙන්ම දෙවැන්න කලින් භාවිතා කළ මෙවලමකි. ඒ හා සමාන වැරදි මතයක් නම් සංඛ්‍යාලේඛන භාවිතා කරන්නන් බොහෝ දෙනෙක් MCMC සහ බේසියානු විශ්ලේෂණයන් ව්‍යාකූල කිරීමට පෙළඹෙති.
MånsT

127

+1 සිට j කොන්ජුට්ප්‍රියර් දක්වා, මට අවශ්‍ය වන්නේ ඔහුගේ පිළිතුරෙන් ගම්‍ය වන එක් කරුණක් ගෙන ඒමටයි. ප්රශ්නය අසයි, "අපි අපගේ නියැදියෙන් නැවත සකස් කරන්නේ නම්, නියැදිය ගැන පමණක් නොව ජනගහනය ගැන යමක් ඉගෙන ගන්නේ කෙසේද?" Resampling ඇත නොහැකි ජනගහනය ව්යාප්තිය සඳහා ඇස්තමේන්තුවක් ලබා ගැනීමට සිදු කළ - අපි ජනගහනයෙන් ආදර්ශයක් ලෙස අපගේ ආදර්ශ ම ගන්න. ඒ වෙනුවට, නැවත සකස් කිරීම සිදු කරනු ලබන්නේ නියැදි සංඛ්‍යාලේඛන නියැදි ව්‍යාප්තිය පිළිබඳ ඇස්තමේන්තුවක් සැපයීම සඳහා ය .


11
(+1) ඔබ එය වඩාත් සංක්ෂිප්තව හා පැහැදිලිව ප්‍රකාශ කර තිබුණද, මම කොන්ජියුටේට්ප්‍රියර්ගේ පිළිතුරට අදහස් දැක්වීමට උත්සාහ කළ කාරණයට සමීප වේ. සමහර විශේෂ අවස්ථා වලදී, නියැදියෙන් ලබාගත් ආනුභවික බෙදාහැරීම යටතේ පරීක්ෂණ සංඛ්‍යාලේඛන නියැදි බෙදා හැරීම අපට ගණනය කළ හැකිය . නමුත්, සාමාන්‍යයෙන්, අපට නොහැකි නිසා අපට අනුකරණය කිරීමට බල කෙරෙයි. :)
කාදිනල්

7
මම දකිමි, එබැවින් මම ඔබව තේරුම් ගන්නේ නම්, මෙම තාක්ෂණය උපකල්පනය කරන්නේ නියැදිය ජනගහනයේ ප්‍රමාණවත් ආකෘතියක් වන අතර එම නිසා එම නියැදිය විශාල ප්‍රමාණයේ නැවත සකස් කිරීමෙන් ජනගහනය පිළිබඳ යමක් අනාවරණය වනු ඇත, නමුත් එම ප්‍රමාණයට පමණි මුල් නියැදිය හොඳ එකකි. දැන් මම එය එසේ තැබූ විට එය පැහැදිලිව පෙනේ ...
ඇලන් එච්.

4
Lan ඇලන්., මට වෙනස් කිරීමට අවශ්‍යයි "... ජනගහනය ගැන යමක් " වෙත "හෙළි කරයි" ... නියැදි බෙදා හැරීම ගැන යමක් හෙළි කරනු ඇත "(නිකුත් කරන ලද සංඛ්‍යාලේඛන, උදා. එහෙත්, ඔව්, ඔබ සතුව එය තිබේ
ගුං - මොනිකා නැවත

ඇත්තෙන්ම ඔබ සියල්ල නිවැරදිය. පුද්ගලිකව සහ තනිකරම අධ්‍යාපනික හේතූන් මත, මම මෙම කරුණ මගේ 'දිගු අනුවාදය' සඳහා ඉතිරි කරමි, මන්ද මගේ විශේෂිත ප්‍රේක්ෂකයින් තුළ මෙම කරුණ ඉක්මණින් යොමුවුවහොත් ඔවුන්ගේ තරුණ හා තවමත් අස්ථිර බුද්ධිය සමතුලිතතාවයට තල්ලු කිරීමට නැඹුරු වේ.
conjugateprior

3
Ro ඊරෝස්රාම්, බූට්ස්ට්‍රැපිං යනු යම් දෙයක් නියැදි බෙදා හැරීම තීරණය කිරීමයි. නියැදි සංඛ්‍යාලේඛන (උදා: 56 වන ප්‍රතිශතය) හෝ පරීක්ෂණ සංඛ්‍යාලේඛන (ටී) යනාදිය සඳහා ඔබට එය කළ හැකිය. මගේ ද්විමය හිටපු දී, නියැදි බෙදා හැරීම පැහැදිලිවම හිස් 0 ක් වනු ඇත - 25%; 1 හිස - 50%; හිස් 2 - 25%; මෙය නැවත සකස් කිරීම පැහැදිලිය. කාදිනල්තුමාට කොහේ හෝ තැනක මෙය පැහැදිලි කරන අදහසක් ඇත (වෙබ් අඩවියේ ඇති හොඳම පිළිතුරු බොහෝමයක් කාදිනල්තුමාගේ අදහස් වේ), නමුත් b / c සොයා ගැනීම දුෂ්කර ය.
gung - මොනිකා නැවත

45

සමහර සංඛ්‍යාලේඛන සහ ගණිතය (කැල්කියුලස්, අවම වශයෙන්) තේරුම් ගන්නා පුද්ගලයින් ඉලක්ක කර ගත් මෙය වඩාත් තාක්ෂණික පැහැදිලි කිරීමක් විය හැකිය. මීට ටික කලකට පෙර මා ඉගැන්වූ සමීක්ෂණ ඇරඹුම් පටි පිළිබඳ පා course මාලාවක විනිවිදකයක් මෙන්න:

bootstrap මූලධර්මය

ඇත්ත වශයෙන්ම සමහර පැහැදිලි කිරීම් අවශ්ය වේ. යනු පවත්නා දත්ත වලින් සංඛ්‍යාලේඛන ලබා ගැනීමේ ක්‍රියා පටිපාටියයි (හෝ, තාක්ෂණික වශයෙන් නිවැරදිව කිවහොත්, බෙදා හැරීමේ ශ්‍රිතයේ සිට තාත්වික සංඛ්‍යා දක්වා ක්‍රියාකාරී වේ; උදා: මධ්‍යන්‍යය E [ X ] = x වේ. දැන් අපි a නියැදිය (ඉහළ පළමු ඊතලය), සහ ආනුභවික බෙදාහැරීමේ ශ්‍රිතය F n ( ) ඇත - ඇස්තමේන්තුව ලබා ගැනීම සඳහා අපි එයට ටී යොදන්නෙමු.T , එහිදී නියැදි බෙදා හැරීම සඳහා F n ( ) ශ්‍රිතය, d F නියැදි ලක්ෂ්‍යයක ලක්ෂ්‍ය ස්කන්ධයක් ලෙස වටහා ගනී). මගින් වන ජනගහනය, දී එෆ් ( ) , වන ඉල්ලුම් ටී පොලී පරාමිතිය දෙන θE[X]=xdFFn()dFF()TθFn()T. Fromසිට එය කොතරම් දුරද? අහඹු ප්රමාණය බව බෙදාහැරීමේ කුමක්ද θ nපමණ තිබිය හැකθ? රූප සටහනේ පහළ වම්පස ඇති ප්‍රශ්නාර්ථ ලකුණ මෙය වන අතර, බූට්ස්ට්‍රැප් පිළිතුරු දීමට උත්සාහ කරන ප්‍රශ්නය මෙයයි. ගුංගේ කරුණ නැවත ප්‍රකාශ කිරීම සඳහා මෙය ජනගහනය පිළිබඳ ප්‍රශ්නය නොව නිශ්චිත සංඛ්‍යාලේඛනයක් සහ එහි ව්‍යාප්තිය පිළිබඳ ප්‍රශ්නයයි.θ^nθθ^nθ

අපගේ නියැදි ක්‍රියාපටිපාටිය නැවත කිරීමට අපට හැකි නම්, අපට එම බෙදා හැරීම ලබාගෙන වැඩිදුර ඉගෙන ගත හැකිය. හොඳයි, එය සාමාන්‍යයෙන් අපගේ හැකියාවන් ඉක්මවා යයි. කෙසේ වෙතත්, එසේ නම්

  1. FnF
  2. TF()θ

Fn()F()nnn5θ^nθ^nθ^nθ

θ^n to θ^n is like θ^n to θ

θ^nθ^n

TFnFθ^nθ^nθ^nθඑෆ්

nnθ^nθθ^n(*r)θ^n*θ^n


9
ගිහි ප්‍රේක්ෂකයන්ට ප්‍රවේශ වීමට උත්සාහ කිරීමේ කාරණය මෙම පිළිතුර සම්පූර්ණයෙන්ම මග හැරේ.
ත්‍රෛපාර්ශවීය

20

මම මෙම ප්‍රශ්නයට පිළිතුරු සපයන්නේ මෙය කිරීමට අපහසු දෙයක් බවත් බොහෝ වැරදි වැටහීම් ඇති බවත් මා එකඟ වන බැවිනි. එෆ්රොන් සහ ඩයකොනිස් ඔවුන්ගේ 1983 විද්‍යාත්මක ඇමරිකානු ලිපියෙන් එය කිරීමට උත්සාහ කළ අතර මගේ මතය අනුව ඒවා අසාර්ථක විය. හොඳ කාර්යයක් කරන බූට්ස්ට්‍රැප් සඳහා වෙන් කර ඇති පොත් කිහිපයක් දැන් තිබේ. 1986 දී සංඛ්‍යාලේඛන විද්‍යාව පිළිබඳ ඔවුන්ගේ ලිපියේ එෆ්‍රොන් සහ ටිබ්ෂිරානි විශාල කාර්යයක් ඉටු කළහ. මගේ බූට්ස්ට්‍රැප් ක්‍රම පොතේ වෘත්තිකයන්ට බූට්ස්ට්‍රැප් වෙත ප්‍රවේශ විය හැකි ලෙස මම විශේෂයෙන් උත්සාහ කළෙමි. ආර්. . ටිම් හෙස්ටර්බර්ග් ඩේවිඩ් මුවර්ගේ හඳුන්වාදීමේ සංඛ්‍යාලේඛන ග්‍රන්ථයකට විශිෂ්ට අතිරේක පරිච්ඡේදයක් ලියා තිබේ. අභාවප්‍රාප්ත ක්ලිෆර්ඩ් ලුන්නෙබර්ග් සතුව ලස්සන පොතක් තිබුණි. චිහාරා සහ හෙස්ටර්බර්ග් මෑතකදී අතරමැදි මට්ටමේ ගණිතමය සංඛ්‍යාන පොතක් එළිදැක්වූ අතර එය බූට්ස්ට්‍රැප් සහ වෙනත් නැවත සකස් කිරීමේ ක්‍රම ආවරණය කරයි. ලහිරිගේ හෝ ෂාවෝ සහ ටූ වැනි උසස් පොත් පවා හොඳ සංකල්පීය පැහැදිලි කිරීම් ලබා දෙයි. මෑන්ලි සිය පොත සමඟ ප්‍රේරණයන් සහ බූට්ස්ට්‍රැප් ආවරණය කරයි. බූට්ස්ට්‍රැප් ගැන තවදුරටත් ප්‍රහේලිකාවක් වීමට හේතුවක් නැත. බූට්ස්ට්‍රැප් බූට්ස්ට්‍රැප් මූලධර්මය මත රඳා පවතින බව මතක තබා ගැනීම වැදගත්ය "ආදේශනය සමඟ නියැදීම ජනගහනයක මුල් නියැදිය හැසිරෙන ආකාරයට මුල් නියැදිය මත හැසිරේ. මෙම මූලධර්මය අසමත් වන උදාහරණ ඇත. බූට්ස්ට්‍රැප් බව දැන ගැනීම වැදගත්ය සෑම සංඛ්‍යානමය ගැටලුවකටම පිළිතුර නොවේ. s හොඳ සංකල්පීය පැහැදිලි කිරීම් ලබා දෙයි. මෑන්ලි සිය පොත සමඟ ප්‍රේරණයන් සහ බූට්ස්ට්‍රැප් ආවරණය කරයි. බූට්ස්ට්‍රැප් ගැන තවදුරටත් ප්‍රහේලිකාවක් වීමට හේතුවක් නැත. බූට්ස්ට්‍රැප් බූට්ස්ට්‍රැප් මූලධර්මය මත රඳා පවතින බව මතක තබා ගැනීම වැදගත්ය "ආදේශනය සමඟ නියැදීම ජනගහනයක මුල් නියැදිය හැසිරෙන ආකාරයට මුල් නියැදිය මත හැසිරේ. මෙම මූලධර්මය අසමත් වන උදාහරණ ඇත. බූට්ස්ට්‍රැප් බව දැන ගැනීම වැදගත්ය සෑම සංඛ්‍යානමය ගැටලුවකටම පිළිතුර නොවේ. s හොඳ සංකල්පීය පැහැදිලි කිරීම් ලබා දෙයි. මෑන්ලි සිය පොත සමඟ ප්‍රේරණයන් සහ බූට්ස්ට්‍රැප් ආවරණය කරයි. බූට්ස්ට්‍රැප් ගැන තවදුරටත් ප්‍රහේලිකාවක් වීමට හේතුවක් නැත. බූට්ස්ට්‍රැප් බූට්ස්ට්‍රැප් මූලධර්මය මත රඳා පවතින බව මතක තබා ගැනීම වැදගත්ය "ආදේශනය සමඟ නියැදීම ජනගහනයක මුල් නියැදිය හැසිරෙන ආකාරයට මුල් නියැදිය මත හැසිරේ. මෙම මූලධර්මය අසමත් වන උදාහරණ ඇත. බූට්ස්ට්‍රැප් බව දැන ගැනීම වැදගත්ය සෑම සංඛ්‍යානමය ගැටලුවකටම පිළිතුර නොවේ. ආදේශනය සමඟ නියැදීම මුල් නියැදිය ජනගහනයක් මත හැසිරෙන ආකාරයට හැසිරේ. මෙම මූලධර්මය අසමත් වන උදාහරණ තිබේ. සෑම සංඛ්‍යානමය ගැටලුවකටම බූට්ස්ට්‍රැප් පිළිතුර නොවන බව දැන ගැනීම වැදගත්ය. ආදේශනය සමඟ නියැදීම මුල් නියැදිය ජනගහනයක් මත හැසිරෙන ආකාරයට හැසිරේ. මෙම මූලධර්මය අසමත් වන උදාහරණ තිබේ. සෑම සංඛ්‍යානමය ගැටලුවකටම බූට්ස්ට්‍රැප් පිළිතුර නොවන බව දැන ගැනීම වැදගත්ය.

මෙන්න මම සඳහන් කළ සියලුම පොත් වලට ඇමසන් සබැඳි සහ තවත් දේ.

නැවත සකස් කිරීම හා ආර් සමඟ ගණිතමය සංඛ්‍යාලේඛන

බූට්ස්ට්‍රැප් ක්‍රම සහ ඒවායේ යෙදුම

බූට්ස්ට්‍රැප් ක්‍රම: වෘත්තිකයන් සහ පර්යේෂකයන් සඳහා මාර්ගෝපදේශයක්

ආර් සඳහා වන යෙදුම් සමඟ බූට්ස්ට්‍රැප් ක්‍රම පිළිබඳ හැඳින්වීමක්

යැපෙන දත්ත සඳහා නැවත සකස් කිරීමේ ක්‍රම

සසම්භාවීකරණය, බූට්ස්ට්‍රැප් සහ ජීව විද්‍යාවේ මොන්ටේ කාලෝ ක්‍රම

බූට්ස්ට්‍රැප් හැඳින්වීමක්

ව්‍යාපාර සංඛ්‍යාලේඛන සහචරයාගේ පරිචය 18 වන පරිච්ඡේදය: බූට්ස්ට්‍රැප් ක්‍රම සහ ප්‍රේරණ පරීක්ෂණ

නැවත සකස් කිරීමෙන් දත්ත විශ්ලේෂණය: සංකල්ප සහ යෙදුම්

ජැක්නයිෆ්, බූට්ස්ට්‍රැප් සහ වෙනත් නැවත සකස් කිරීමේ සැලසුම්

ජැක්නයිෆ් සහ බූට්ස්ට්‍රැප්

උපකල්පන වල ප්‍රේරණය, පරාමිතික සහ බූට්ස්ට්‍රැප් පරීක්ෂණ

බූට්ස්ට්‍රැප් සහ එඩ්ජ්වර්ත් පුළුල් කිරීම


2
Ro ප්‍රොක්‍රස්ටිනේටර්. මම එය බොහෝ විට කරනවා. සමහර අවස්ථාවල මගේ පිළිතුර පළ කිරීමට ඉක්මන් වී පසුව එය පිරිසිදු කිරීමට නැවත එන්න. මාතෘකාව අනුව සබැඳි ලිපින සබැඳි බවට පරිවර්තනය කිරීමේ එල්ලීම මට ලැබී නැති අතර ඒ සියල්ල අවශ්‍ය යැයි මට විශ්වාස නැත. එය එක් ආකාරයකින් ක්ලික් කිරීමකි, නමුත් ඔබට ඒ සඳහා බලා සිටිය නොහැකි නම්, ඔබ සංස්කරණයන් කිරීම මට ප්‍රශ්නයක් නොවේ. ඇත්ත වශයෙන්ම මම එය අගය කරමි.
මයිකල් ආර්. චර්නික්

1
මම මගේ අදහස "ඔබ සංස්කරණයන් කිරීම මට ප්‍රශ්නයක් නොවේ" ලෙස වෙනස් කිරීමට යන්නේ "නමුත් ඔබට බලා සිටිය නොහැකි නම්" පිටතට ගැනීමෙනි. ඔබ කළ දෙය පිළිවෙලට හා පහසු වන්නේ කෙසේදැයි මම දකිමි, නමුත් බොහෝ විට අඩු කාලයක් ගතවනු ඇත, නමුත් මම තවම එය ඉගෙන ගෙන නැති අතර සමහර උපපරිපාලක වරු සහ අනෙකුත් සාමාජිකයන් කරන ආකාරයට මෙය එතරම් විශාල ගනුදෙනුවක් ලෙස මා දකින්නේ නැත.
මයිකල් ආර්. චර්නික්

1
10,000

කල් දැමීමේ ස්තූතියි. මම අපේක්ෂා කළේ අද එම එකතුවට ළඟා විය හැකි බවයි.
මයිකල් ආර්. චර්නික්

10

බූට්ස්ට්රැපිං හරහා ඔබ මුළු ජනගහනයම (සැබෑ ලෝකයේ ඇත්ත වශයෙන්ම ඇත්තේ කුමක්ද) පිළිබඳ ඔබේ ඇස්තමේන්තු කෙතරම් නිවැරදිද යන්න තක්සේරු කිරීම සඳහා එකම දත්ත සමූහයකින් (ඔබේ නියැදි දත්ත) නැවත නැවතත් සාම්පල ලබා ගනී.

ඔබ එක් නියැදියක් ගෙන සැබෑ ජනගහනය පිළිබඳව ඇස්තමේන්තු කළහොත්, ඔබේ ඇස්තමේන්තු කෙතරම් නිවැරදිදැයි තක්සේරු කිරීමට ඔබට නොහැකි වනු ඇත - අපට ඇත්තේ එක් ඇස්තමේන්තුවක් පමණක් වන අතර අපට හමු වූ විවිධ සාම්පල සමඟ මෙම ඇස්තමේන්තුව වෙනස් වන්නේ කෙසේදැයි හඳුනාගෙන නොමැත.

බූට්ස්ට්රැපිං සමඟ, අපි මෙම ප්රධාන නියැදිය බහු සාම්පල ජනනය කිරීමට භාවිතා කරමු. උදාහරණයක් ලෙස, අපි දින 1000 කට වඩා දිනපතා ලාභය මැන බැලුවහොත් අපට මෙම කට්ටලයෙන් අහඹු සාම්පල ලබා ගත හැකිය. අපට එක් අහඹු දිනයකින් ලැබෙන ලාභය, එය පටිගත කිරීම, තවත් අහඹු දිනයකින් ලාභය ලබා ගැනීම (එය පෙර දින මෙන් විය හැකිය - ප්‍රතිස්ථාපනය සමඟ නියැදීම), එය පටිගත කිරීම සහ යනාදී වශයෙන් අපට “නව” එකක් ලැබෙන තුරු දින 1000 ක නියැදිය (මුල් නියැදියෙන්).

මෙම "නව" නියැදිය මුල් සාම්පලයට සමාන නොවේ - ඇත්ත වශයෙන්ම අපි ඉහත පරිදි "නව" සාම්පල කිහිපයක් ජනනය කළ හැකිය. මාධ්යයන් හා ඇස්තමේන්තු වල වෙනස්කම් දෙස බලන විට, මුල් ඇස්තමේන්තු කෙතරම් නිවැරදිද යන්න පිළිබඳ කියවීමක් ලබා ගැනීමට අපට හැකි වේ.

සංස්කරණය කරන්න - අදහස් දැක්වීමට ප්‍රතිචාර වශයෙන්

"නව" සාම්පල පළමු එකට සමාන නොවන අතර මේවා මත පදනම් වූ නව ඇස්තමේන්තු වෙනස් වේ. මෙය ජනගහනයේ නැවත නැවත සාම්පල අනුකරණය කරයි. බූට්ස්ට්‍රැප් මඟින් ජනනය කරන ලද “නව” සාම්පලවල ඇස්තමේන්තු වල වෙනස්කම් ජනගහනයෙන් වෙනස් සාම්පල ලබා දී නියැදි ඇස්තමේන්තු වෙනස් වන්නේ කෙසේද යන්න පිළිබඳ අවබෝධයක් ලබා දෙනු ඇත. මුල් ඇස්තමේන්තු වල නිරවද්‍යතාවය මැනීමට අපට උත්සාහ කළ හැකි ආකාරය මෙයයි.

ඇත්ත වශයෙන්ම, බූට්ස්ට්‍රැප් කිරීම වෙනුවට ඔබට ජනගහනයෙන් නව සාම්පල කිහිපයක් ගත හැකි නමුත් මෙය කළ නොහැකි විය හැකිය.


5
ස්තූතියි! මේක මට ගොඩක් තේරෙනවා. මම විශේෂයෙන් කල්පනා කරන්නේ ජනගහනයේ නියැදියකින් නැවත සකස් කිරීම යටින් පවතින ජනගහනය තේරුම් ගැනීමට උපකාරී වන්නේ කෙසේද යන්නයි. අප නියැදියකින් නැවත සකස් කරන්නේ නම්, නියැදිය ගැන පමණක් නොව ජනගහනය ගැන යමක් ඉගෙන ගන්නේ කෙසේද? එහි තරමක් ප්‍රති-බුද්ධිමත් පිම්මක් ඇති බව පෙනේ.
ඇලන් එච්.

4

මෙය පිළිගත් පිළිතුරක් සහිත පැරණි ප්‍රශ්නයක් බව මට වැටහී ඇත, නමුත් මම ඇරඹුම් ක්‍රමය පිළිබඳ මගේ දැක්ම ලබා දීමට කැමැත්තෙමි. මම කිසිසේත් විශේෂ expert යෙක් නොවේ (සංඛ්‍යාලේඛන භාවිතා කරන්නෙකු, OP ලෙස) සහ නිවැරදි කිරීම් හෝ අදහස් පිළිගනිමි.

ජැක්නයිෆ් ක්‍රමයේ සාමාන්‍යකරණය කිරීමක් ලෙස බූට්ස්ට්‍රැප් බැලීමට මම කැමතියි. එබැවින්, ඔබට 100 ප්‍රමාණයේ S නියැදියක් ඇති බව කියමු. සංඛ්‍යානමය T (S) භාවිතා කරමින් යම් පරාමිතියක් තක්සේරු කරන්න. දැන්, මෙම ලක්ෂ්‍ය ඇස්තමේන්තුව සඳහා විශ්වාසනීය පරතරයක් දැන ගැනීමට ඔබ කැමතියි. සම්මත දෝෂයක් සඳහා ඔබට ආකෘතියක් සහ විශ්ලේෂණාත්මක ප්‍රකාශනයක් නොමැති නම්, ඔබට ඉදිරියට ගොස් නියැදියෙන් එක් අංගයක් මකා දැමිය හැකිය.එස්මමමූලද්‍රව්‍යය සමඟ මම මකා දැමුවෙමි. දැන් ඔබට ගණනය කළ හැකියටී(එස්මම)ඔබට සම්මත දෝෂයක් ගණනය කළ හැකි පරාමිතිය පිළිබඳ නව ඇස්තමේන්තු 100 ක් ලබාගෙන විශ්වාසනීය පරතරයක් සාදන්න. මෙය ජැක්නයිෆ් ක්‍රමය JK-1 වේ.

ඔබට ඒ වෙනුවට 98 ප්‍රමාණයේ සියලුම අනු කොටස් සලකා බලා JK-2 (මූලද්‍රව්‍ය 2 මකා දමා ඇත) හෝ JK-3 යනාදිය ලබා ගත හැකිය.

දැන්, බූට්ස්ට්‍රැප් යනු අහඹු ලෙස මෙහි අනුවාදයකි. ප්‍රතිස්ථාපන සමඟ තේරීම හරහා නැවත සකස් කිරීම මඟින් ඔබ අහඹු ලෙස මූලද්‍රව්‍ය සංඛ්‍යාවක් "මකා දැමිය හැකිය" (සමහරවිට කිසිවක් නැත) සහ ඒවා එක් (හෝ වැඩි) අනුරූපයකින් "ප්‍රතිස්ථාපනය" කරනු ඇත.

අනුරූ සමඟ ප්‍රතිස්ථාපනය කිරීමෙන් නැවත සකස් කරන ලද දත්ත කට්ටලය සෑම විටම එකම ප්‍රමාණයක් ඇත. ජැක්නයිෆ් සඳහා, 100 වෙනුවට 99 ප්‍රමාණයේ සාම්පල මත කොස් ගැසීමේ බලපෑම කුමක්දැයි ඔබට ඇසිය හැකිය, නමුත් නියැදි ප්‍රමාණය “ප්‍රමාණවත් තරම් විශාල” නම් මෙය ගැටළුවක් නොවන බව පෙනේ.

කොස් ඇට ඇස්තමේන්තු එකම ප්‍රමාණයේ සාම්පල වලින් ලබාගෙන ඇති බව තහවුරු කර ගැනීම සඳහා, ඔබ කිසි විටෙකත් මකන්න -1 සහ මකන්න -2 යනාදිය මිශ්‍ර නොකරයි.

100 ප්‍රමාණයේ නියැදිය 10 ප්‍රමාණයේ සාම්පල 10 කට බෙදීමටද ඔබට සලකා බැලිය හැකිය. මෙය සමහර න්‍යායාත්මක අංශවල වඩා පිරිසිදු (ස්වාධීන උප කුලක) වනු ඇති නමුත් නියැදි ප්‍රමාණය (100 සිට 10 දක්වා) ප්‍රායෝගික නොවන තරමට අඩු කරයි (බොහෝ විට නඩු).

යම් ප්‍රමාණයක අර්ධ වශයෙන් අතිච්ඡාදනය වන උප කුලකද ඔබට සලකා බැලිය හැකිය. මේ සියල්ල ස්වයංක්‍රීයව හා ඒකාකාරව හා අහඹු ලෙස හසුරුවනු ලබන්නේ බූට්ස්ට්‍රැප් ක්‍රමයෙනි.

තවද, මුල් සාම්පලයේ ආනුභවික ව්‍යාප්තියෙන් ඔබේ සංඛ්‍යාලේඛන නියැදි බෙදා හැරීම පිළිබඳ ඇස්තමේන්තුවක් බූට්ස්ට්‍රැප් ක්‍රමය මඟින් ලබා දෙයි, එබැවින් සම්මත දෝෂයට අමතරව සංඛ්‍යාලේඛනවල තවත් ගුණාංග විශ්ලේෂණය කළ හැකිය.


1

Paraphrasing ෆොක්ස් , මම නැවත නැවතත් ඔබේ නිරීක්ෂිත නියැදියකින් resampling ක්රියාවලිය මුළු ජනගහනයෙන් මුල් නියැදීම් ක්රියාවලිය සමාන වන බව පෙන්වා දී ඇති බව පවසමින් ආරම්භ වනු ඇත.


ඉහත සබැඳිය අක්‍රීය බැවින් ෆොක්ස් පැවසූ දේ මම නොදනිමි. නමුත් බූට්ස්ට්‍රැප් කිරීම දෝෂයක් ඇති කරයි යන මගේ කනස්සල්ලට කිසිදු ලිපියක් යොමු නොකරයි. පෘථිවියේ භාෂාවන්ගේ සාපේක්ෂ සංඛ්‍යාතය ගැන දැන ගැනීමට ඔබට අවශ්‍ය යැයි සිතමු. ඔබ ඔබේ නියැදිය අන්තර්ජාලයෙන් ගෙන එම නියැදිය නැවත සකස් කළහොත්, ඔබට ජාලයේ නොමැති සියලුම භාෂා මග හැරෙනු ඇත.
aquagremlin

1

ජනගහනයේ සීමිත නියැදියක් මගින් හිස්ටෝග්‍රැම් එකක් ආසන්න වශයෙන් බෙදාහැරීම ආසන්න කරයි. නැවත නියැදීමෙන්, එක් එක් බඳුන් ගණන වෙනස් වන අතර ඔබට නව දළ විශ්ලේෂණයක් ලැබේ. විශාල ගණන් අගයන් මුල් ජනගහනයේ සහ නියැදි කට්ටලයේ කුඩා ගණන් අගයන්ට වඩා අඩු උච්චාවචනය වේ. ඔබ මෙය ලේපර්සන්ට පැහැදිලි කරන බැවින්, විශාල බින් ගණන් සඳහා මෙය අවස්ථා දෙකෙහිම දළ වශයෙන් බින් ගණන්වල වර්ග මූලය යැයි ඔබට තර්ක කළ හැකිය .

මම හොයා ගත්තොත් 20 යි රතු හිස් සහ 80 යි අනෙක් අය නියැදියකින් 100 යි, නැවත නියැදීමෙන් රතු හිසෙහි උච්චාවචනය තක්සේරු කෙරේ (0.2×0.8)×100 යි, එය හරියට මුල් ජනගහනය සැබවින්ම බෙදා හරින ලදැයි උපකල්පනය කිරීම හා සමානය 1:4. එබැවින් නියැදි නියැදිය ලෙස සත්‍ය සම්භාවිතාව දළ වශයෙන් ගණනය කළ හොත්, මෙම අගය “අවට” නියැදි දෝෂයක් පිළිබඳ තක්සේරුවක් ලබා ගත හැකිය.

බූට්ස්ට්‍රැප් මගින් “නව” දත්ත අනාවරණය නොවන බව අවධාරණය කිරීම වැදගත් යැයි මම සිතමි, නියැදිය නියැදි නියැදිය මගින් සත්‍ය සම්භාවිතාව ලබා දෙන්නේ නම් නියැදි උච්චාවචනයන් සඳහා නියැදිය ආසන්න වශයෙන් තීරණය කිරීම පහසු සහ පරාමිතික නොවන ක්‍රමයකි .


මම ඔබේ පිළිතුරෙහි සුළු හැඩතල ගැන්වීම් වෙනස්කම් සිදු කළෙමි - ඒවා නුසුදුසු යැයි ඔබ සිතන්නේ නම් ඒවා ආපසු හැරවීමට නිදහස් වන්න. තවත් පැහැදිලි කිරීමක් අවශ්‍ය වන්නේ වර්ග මූලයක් ඇත්තේ මන්ද යන්නයි.
ටිම්

1

සම්භාව්‍ය අනුමාන සංඛ්‍යාලේඛනවල ජනගහනයේ හොඳ තක්සේරුකරුවෙකු ලෙස නියැදියක් ජනගහනයට සම්බන්ධ කරන න්‍යායාත්මක ආයතනය නියැදි ව්‍යාප්තිය (ජනගහනයෙන් ලබා ගත හැකි සියලු සාම්පල) බව සලකන්න. බූට්ස්ට්‍රැප් ක්‍රමය යනු එක්තරා ආකාරයක නියැදි බෙදාහැරීමක් (බහු සාම්පල මත පදනම් වූ බෙදාහැරීමක්) නිර්මාණය කිරීමයි. ඇත්ත වශයෙන්ම, එය උපරිම සම්භාවිතා ක්‍රමයක් වන නමුත් මූලික තර්කනය සම්භාව්‍ය සාමාන්‍ය බෙදාහැරීම් පදනම් කරගත් සංඛ්‍යාලේඛන පිටුපස ඇති සාම්ප්‍රදායික සම්භාවිතා න්‍යායට වඩා වෙනස් නොවේ.


0

මගේ අදහස ඉතා කුඩා එකක්.

බූට්ස්ට්‍රැප් ක්‍රියාත්මක වන්නේ එය අපගේ පර්යේෂණ න්‍යාය පත්‍රයේ ප්‍රධාන පරිශ්‍රය පරිගණකමය වශයෙන් දැඩි ලෙස ගසාකන බැවිනි.

වඩාත් නිශ්චිතව කිවහොත්, සංඛ්‍යාලේඛන හෝ ජීව විද්‍යාව හෝ බොහෝ න්‍යායාත්මක නොවන විද්‍යාවන්හි දී අපි පුද්ගලයන් අධ්‍යයනය කර සාම්පල රැස් කරමු.

එහෙත්, එවැනි සාම්පල වලින්, අනාගතයේදී හෝ විවිධ සාම්පල මගින් අපට ඉදිරිපත් කරමින්, වෙනත් පුද්ගලයින් පිළිබඳව ඇඟවීම් කිරීමට අපට අවශ්‍යය.

බූට්ස්ට්‍රැප් සමඟ, අපගේ නියැදියේ එක් එක් සංරචක මත අපගේ ආකෘති නිර්මාණය පැහැදිලිව සොයා ගැනීමෙන්, අපි වඩා හොඳ (අඩු උපකල්පන සහිතව, සාමාන්‍යයෙන්) අනුමාන කර අනෙක් පුද්ගලයින් සඳහා පුරෝකථනය කරමු.


1
අමු දත්ත වලින් ආරම්භ වන වෙනත් සංඛ්‍යානමය ක්‍රියා පටිපාටියකින් බූට්ස්ට්‍රැප් වෙන්කර හඳුනා ගැනීමට මෙය නොපෙනේ. සාරාංශ සංඛ්‍යා ලේඛන හෝ බින් කළ සංඛ්‍යාත මත පදනම් වූ ක්‍රියා පටිපාටිවලින් ඒවා වෙන්කර හඳුනා ගැනීම පමණක් පෙනේ.
whuber

0

ආරම්භකයින්ට පැහැදිලි කිරීමේදී එය නිශ්චිත උදාහරණයක් ගැනීමට උපකාරී වේ යැයි මම සිතමි ...

යම් ජනගහනයකින් ඔබට මිනුම් 9 ක අහඹු නියැදියක් ඇතැයි සිතන්න. නියැදියේ මධ්‍යන්‍යය 60 යි. මුළු ජනගහනයේ සාමාන්‍යය ද 60 ක් බව අපට සහතික විය හැකිද? නිසැකවම කුඩා සාම්පල වෙනස් වන නිසා නොවේ, එබැවින් 60 ඇස්තමේන්තුව සාවද්‍ය වනු ඇත. මෙවැනි සාම්පල කොපමණ ප්‍රමාණයක් වෙනස් වේදැයි සොයා ගැනීමට, අපට අත්හදා බැලීම් කිහිපයක් ක්‍රියාත්මක කළ හැකිය - බූට්ස්ට්‍රැපින් නම් ක්‍රමයක් භාවිතා කරමින්.

නියැදියේ පළමු අංකය 74 වන අතර දෙවැන්න 65 වේ, එබැවින් නවවන 74, නවවන 65, සහ යනාදී විශාල "මවාපෑමක්" ජනගහනයක් ගැන සිතමු. මෙම ජනගහනයෙන් අහඹු නියැදියක් ගැනීමට ඇති පහසුම ක්‍රමය නම් නවයේ නියැදියෙන් අහඹු ලෙස අංකයක් ගැනීම, පසුව එය ප්‍රතිස්ථාපනය කරන්න එවිට ඔබට මුල් සාම්පල නවය නැවත ඇති අතර අහඹු ලෙස තවත් එකක් තෝරාගන්න. 9 හි "නැවත සකස් කිරීම" මම මෙය කරන විට 74 ක් කිසිසේත් නොපෙන්වූ අතර අනෙක් සමහර සංඛ්‍යා දෙවරක් දර්ශනය වූ අතර මධ්‍යන්‍යය 54.4 ක් විය. (මෙය පැතුරුම්පතෙහි http://woodm.myweb.port.ac.uk/SL/resample.xlsx හි සකසා ඇත - තිරයේ පතුලේ ඇති ඇරඹුම් පටිත්ත ක්ලික් කරන්න.)

මම මේ ආකාරයෙන් නැවත සාම්පල 1000 ක් ගත් විට ඒවායේ මාධ්‍යයන් 44 සිට 80 දක්වා වෙනස් වූ අතර 95% ක් 48 ත් 72 ත් අතර විය. එයින් ඇඟවෙන්නේ ඒකක 16-20 දක්වා දෝෂයක් ඇති බවයි (44 මවාපෑමේ ජනගහනයේ මධ්‍යන්‍ය 60 ට වඩා 16 ට වඩා අඩුය, 80 යනු ඒකක 20 ට ඉහළින්) ජනගහනයේ මධ්‍යන්‍යය තක්සේරු කිරීම සඳහා 9 ප්‍රමාණයේ සාම්පල භාවිතා කිරීමේදී. දෝෂය 12 ක් හෝ ඊට අඩු වනු ඇතැයි අපට 95% ක් විශ්වාස කළ හැකිය. එබැවින් ජනගහනයේ අර්ථය 48 ත් 72 ත් අතර වනු ඇතැයි අපට 95% ක් විශ්වාස කළ හැකිය.

මෙහි උපකල්පන ගණනාවක් ඇත, පැහැදිලිවම එක නියැදිය ජනගහනය පිළිබඳ ප්‍රයෝජනවත් චිත්‍රයක් ලබා දෙයි යන උපකල්පනයයි - අත්දැකීම් වලින් පෙනී යන්නේ නියැදිය සාධාරණ ලෙස විශාල වුවහොත් මෙය සාමාන්‍යයෙන් හොඳින් ක්‍රියාත්මක වන බවයි (9 ටිකක් කුඩා නමුත් එය පහසු කරයි සිදුවන්නේ කුමක්දැයි බලන්න). Http://woodm.myweb.port.ac.uk/SL/resample.xlsx හි ඇති පැතුරුම්පත මඟින් ඔබට තනි නැවත සකස් කිරීම්, නැවත සාම්පල 1000 ක කුමන්ත්‍රණ රූප සටහන්, විශාල සාම්පල අත්හදා බැලීම යනාදිය දැකගත හැකිය. ලිපියේ වඩාත් සවිස්තරාත්මක පැහැදිලි කිරීමක් ඇත දී https://arxiv.org/abs/1803.06214 .


මෙය මූලික හා සමහර විට බුද්ධිමත් නමුත් බූට්ස්ට්‍රැප් ක්‍රියා කරන හේතුව නිසා එය ලැබෙනු ඇතැයි මම නොසිතමි.
මයිකල් ආර්. චර්නික්
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.