මධ්‍යම සීමාව ප්‍රමේයයට ඇති අවබෝධාත්මක පැහැදිලි කිරීම කුමක්ද?


155

විවිධ සන්දර්භයන් කිහිපයකදී, අප විසින් අනුගමනය කිරීමට අවශ්‍ය ඕනෑම සංඛ්‍යානමය ක්‍රමයක් සාධාරණීකරණය කිරීම සඳහා අපි මධ්‍යම සීමාවන් ප්‍රමේයයෙන් ඉල්ලා සිටිමු (උදා: සාමාන්‍ය බෙදාහැරීමකින් ද්විමාන ව්‍යාප්තිය ආසන්න වශයෙන්). ප්‍රමේයය සත්‍ය වන්නේ මන්ද යන්න පිළිබඳ තාක්‍ෂණික තොරතුරු මට වැටහී ඇති නමුත් දැන් මට සිදුවී ඇත්තේ මධ්‍යම සීමාව ප්‍රමේයය පිටුපස ඇති ප්‍රතිභානය මට නොතේරීමයි.

ඉතින්, මධ්‍යම සීමාව ප්‍රමේයය පිටුපස ඇති ප්‍රතිභානය කුමක්ද?

ලේමන් පැහැදිලි කිරීම් වඩාත් සුදුසු වනු ඇත. යම් තාක්ෂණික විස්තරයක් අවශ්‍ය නම් කරුණාකර මම පීඩීඑෆ්, සීඩීඑෆ්, සසම්භාවී විචල්‍ය යනාදිය පිළිබඳ සංකල්ප තේරුම් ගෙන ඇති නමුත් අභිසාරී සංකල්ප, ලාක්ෂණික කාර්යයන් හෝ මිනුම් න්‍යාය සමඟ කළ හැකි කිසිවක් පිළිබඳ දැනුමක් නොමැති බව උපකල්පනය කරන්න.


8
හොඳ ප්‍රශ්නයක් නම්, මගේ ක්ෂණික ප්‍රතිචාරය, මෙය ඉගැන්වීමේ මගේ සීමිත අත්දැකීම්වල පිටුබලය ඇතිව වුවද, සීඑල්ටී මුලදී බොහෝ මිනිසුන්ට අවබෝධයක් නොමැති වීමයි. ඕනෑම දෙයක් නම්, එය ප්‍රති-බුද්ධිමත් ය!
onestop

2
@onestop AMEN! n වැඩි වන විට p = 1/2 සමඟ ද්විමාන ව්‍යාප්තිය දෙස බැලීමෙන් පෙනී යන්නේ සීඑල්ටී සැඟවී ඇති බවයි - නමුත් ඒ සඳහා වන ප්‍රතිභාව සෑම විටම මගෙන් ගැලවී ඇත.
රොනාෆ්

2
හොඳ අදහස් කිහිපයක් ඇති සමාන ප්‍රශ්නය: stats.stackexchange.com/questions/643/…

1
පැහැදිලි කිරීමක් නොව මෙම අනුකරණය එය තේරුම් ගැනීමට උපකාරී වේ.
ඩේවිඩ් ලේන්

වාව්, ඔබ මධ්‍යම සීමාව ප්‍රමේයය, අභිසාරීතාව, දිගු වලිග සහ කැබලි අක්ෂර පිළිබඳ අපූරු නිබන්ධනයකට අතීත අතීත බුද්ධිය යාත්‍රා කළා. නිසැකවම "ඩී" පැත්තේ "ඔබට විස්තර සහිතව විස්මයට පත් කළ නොහැකි නම්, ඒවා ගොන් $ පහරකින් අවහිර කරන්න .:
මයික් ඇන්ඩර්සන්

Answers:


130

මෙම තනතුරේ දිග ගැන මම කල්තියාම සමාව අයදිමි: එය කිසිසේත්ම ප්‍රසිද්ධියේ ප්‍රකාශයට පත් කිරීම යම්කිසි භීතියකින් යුතුව සිදු වේ, මන්ද එය කියවීමට යම් කාලයක් හා අවධානයක් අවශ්‍ය වන අතර නිසැකවම යතුරු ලියන දෝෂ සහ නිරාවරණ අඩුපාඩු ඇති බැවිනි. ඔබේම ප්‍රතිචාරයන් තවදුරටත් විස්තාරණය කිරීම සඳහා සීඑල්ටී හි බොහෝ කොටස් එකක් හෝ කිහිපයක් හඳුනා ගැනීමට එය ඔබව දිරිමත් කරනු ඇතැයි යන බලාපොරොත්තුව ඇතිව ඉදිරිපත් කරන සිත් ඇදගන්නා සුළු මාතෘකාව කෙරෙහි උනන්දුවක් දක්වන අය සඳහා මෙන්න.


සීඑල්ටී "පැහැදිලි කිරීමට" බොහෝ උත්සාහයන් නිදර්ශන හෝ එය සත්‍ය බව තහවුරු කරන නැවත සකස් කිරීම් ය. සැබවින්ම විනිවිද යන, නිවැරදි පැහැදිලි කිරීමකට බොහෝ දේ පැහැදිලි කිරීමට සිදුවනු ඇත.

මෙය තවදුරටත් සොයා බැලීමට පෙර, සීඑල්ටී පවසන දේ පිළිබඳව පැහැදිලි වෙමු. ඔබ කවුරුත් දන්නා පරිදි, ඒවායේ සාමාන්‍යභාවයට වෙනස් වන අනුවාද ඇත. පොදු සන්දර්භය යනු අහඹු විචල්‍යයන්ගේ අනුක්‍රමයකි, ඒවා පොදු සම්භාවිතා අවකාශයක ඇතැම් කාර්යයන් වේ. විචක්ෂණ වස්තූන් සහිත කොටුවක් ලෙස සම්භාවිතා අවකාශයක් ගැන සිතීම ප්‍රයෝජනවත් බව මට තදින්ම දැනෙන පැහැදිලි කිරීම් සඳහා උපකාරී වේ. එම වස්තූන් කුමක් වුවත් කමක් නැත, නමුත් මම ඒවා "ටිකට්පත්" ලෙස හඳුන්වන්නෙමි. අපි පෙට්ටියක එක් “නිරීක්ෂණයක්” කරන්නේ ටිකට්පත් තරයේ මිශ්‍ර කර එකක් එළියට ගැනීමෙනි; එම ටිකට්පත නිරීක්‍ෂණයෙන් සමන්විත වේ. පසුකාලීන විශ්ලේෂණය සඳහා එය පටිගත කිරීමෙන් පසුව අපි ටිකට් පත කොටුව වෙත ආපසු යවන අතර එහි අන්තර්ගතය නොවෙනස්ව පවතී. “අහඹු විචල්‍යයක්” යනු එක් එක් ටිකට් පතේ ලියා ඇති අංකයකි.

1733 දී, ඒබ්‍රහම් ඩි මොයිව්රේ සලකා බැලුවේ ටිකට් පත් වල ඇති සංඛ්‍යා ශුන්‍ය හා ඒවා පමණක් වන ("බර්නූලි අත්හදා බැලීම්") තනි පෙට්ටියක ඇති අතර, එක් එක් අංකවලින් සමහරක් තිබේ. ඔහු කරමින් පරිකල්පනය n ශාරීරිකව ස්වාධීන වටිනාකම් අනුක්රමයක් උපයාගන්නා, නිරීක්ෂණ x1,x2,,xn , සියලු වන ශුන්ය හෝ එක් කෙනෙක් ම ය. මෙම මුදල අය වටිනාකම්, yn=x1+x2++xn, අහඹු වන්නේ එකතුවෙහි පද වන බැවිනි. එමනිසා, අපට මෙම ක්‍රියා පටිපාටිය බොහෝ වාරයක් පුනරාවර්තනය කළ හැකි නම්, විවිධ සංඛ්‍යාත (විවිධ සංඛ්‍යා 0 සිට n දක්වා පරාසයක ) විවිධ සංඛ්‍යාත සමඟ දිස් වේ - සමස්තයේ සමානුපාතිකයන්. (පහත රූප සටහන් බලන්න.)

දැන් යමෙක් අපේක්ෂා කරනු ඇත - සහ එය සත්‍යයකි - n හි ඉතා විශාල අගයන් සඳහා , සියලු සංඛ්‍යාත තරමක් කුඩා වනු ඇත. අප එසේ නිර්භීත (හෝ මෝඩ) "සීමාවක් ගැනීමට" හෝ "ඉඩ උත්සාහ ලෙස විය යුතු බව නම් n යන්න ", අප සියලු වාර අඩු බව නිවැරදිව නිගමනය කරන 0 . නමුත් අපි සංඛ්‍යාතවල හිස්ටෝග්‍රැම් එකක් අඳින්නේ නම්, එහි අක්ෂ ලේබල් කර ඇති ආකාරය පිළිබඳව කිසිදු අවධානයක් යොමු නොකර, විශාල n සඳහා වන හිස්ටෝග්‍රැම් සියල්ලම එක හා සමාන ලෙස පෙනෙන්නට පටන් ගන්නා බව අපට පෙනේ : යම් අර්ථයකින්, මෙම සංඛ්‍යා ලේඛන සංඛ්‍යාත වුවද සීමාවකට ළඟා වේ ඔවුන් සියල්ලම ශුන්‍යයට යයි.

හිස්ටෝග්‍රෑම්

මෙම සංඛ්‍යා ලේඛන මඟින් yn ලබා ගැනීමේ ක්‍රියා පටිපාටිය බොහෝ වාරයක් පුනරාවර්තනය කිරීමේ ප්‍රති results ල නිරූපණය කෙරේ . n යනු මාතෘකා වල ඇති “අත්හදා බැලීම් ගණන” වේ.

මෙහි තීක්ෂ්ණ බුද්ධිය නම් පළමුව හිස්ටෝග්‍රැම් ඇඳීම සහ පසුව එහි අක්ෂ ලේබල් කිරීමයි . විශාල n සමඟ හිස්ටෝග්‍රැම් විශාල අගයන් n/2 වටා (තිරස් අක්ෂය මත) සහ අතුරුදහන් වන පරිදි කුඩා අගයන් (සිරස් අක්ෂය මත) ආවරණය කරයි, මන්ද තනි සංඛ්‍යාත තරමක් කුඩා වන බැවිනි. සැළසුම් කරමින් කලාපය මෙම වක්රය සරිලන එහෙයින් දෙකම අවශ්ය වී යාමත් සමගිනි හා rescaling මෙම histogram ය. මෙම ගණිතමය නිරූපණය එක් එක් සඳහා බව ය n අපි සමහර මධ්යම අගය තෝරා ගත හැකිය mn මෙම histogram සහ සමහර පරිමාණ අගය ස්ථානගත කිරීම (අවශ්යයෙන්ම අනන්ය නොවන!) sn(අවශ්‍යයෙන්ම අද්විතීය නොවේ!) එය අක්ෂය තුළට ගැලපෙන පරිදි සකස් කිරීම. මෙම වෙනස් කිරීම මගින් ගණිතමය සිදු කළ හැක yn සඳහා zn=(ynmn)/sn .

හිස්ටෝග්‍රැම් එකක් සහ තිරස් අක්ෂය අතර ප්‍රදේශ අනුව සංඛ්‍යාත නිරූපණය කරන බව මතක තබා ගන්න . එබැවින් n හි විශාල අගයන් සඳහා මෙම හිස්ටෝග්‍රැම් වල ස්ථායිතාව ප්‍රදේශය අනුව ප්‍රකාශ කළ යුතුය. n ඒ නිසා, සිට කියන්නේ, මෙන් ඔබ වටිනාකම් ඕනෑම පරතරය ගන්න a කිරීමට b>a පරිදි, n වැඩි, එම histogram පැත්තෙන් ප්රදේශය නිරීක්ෂණය zn තිරස් අතට අන්තරය පුරා විහිදුන (a,b] . මෙම CLT කිහිපයක් තරයේ ප්රකාශ දේවල්:

  1. a සහ b කුමක් වුවත් , අපි mn සහ sn අනුපිළිවෙල සුදුසු පරිදි තෝරා ගන්නේ නම් ( a හෝ b මත කිසිසේත් රඳා නොපවතින ආකාරයට ), n විශාල වන විට මෙම ප්‍රදේශය සීමාවකට ළඟා වේ.

  2. මෙම අනුක්රමය mn හා sn පමණක් මත රඳා පවතින බව ආකාරයෙන් තෝරා හැක n ඇති කොටුව තුල අගයන් සාමාන්ය,, සහ එම අගයන් ව්යාප්ත යම් - එසේ බව නොතකා ය දේ - ඒත් වෙන කිසිම දෙයක් මත කොටුව, සීමාව සෑම විටම සමාන වේ. (මෙම විශ්වීය දේපල විශ්මයජනකයි.)

  3. විශේෂයෙන්, සීමා ප්රදේශයේ වක්රය යටතේ ප්රදේශයක් බව y=exp(z2/2)/2πaසහbඅතර 2 :: මෙය විශ්වීය සීමිත හිස්ටෝග්‍රැම් හි සූත්‍රයයි.

    සීඑල්ටී හි පළමු සාමාන්‍යකරණය එකතු කරයි,

  4. කොටුවට ශුන්‍ය හා ඒවාට අමතරව සංඛ්‍යා අඩංගු විය හැකි විට, හරියටම එකම නිගමනවලට එළඹේ (කොටුවේ ඇති අතිශය විශාල හෝ කුඩා සංඛ්‍යා වල අනුපාතය “ඉතා විශාල නොවේ” නම්, නිරවද්‍ය හා සරල ප්‍රමාණාත්මක ප්‍රකාශයක් ඇති නිර්ණායකයකි) .

    මීළඟ සාමාන්‍යකරණය, සහ සමහර විට වඩාත්ම විශ්මය ජනක එක, මෙම තනි ටිකට් පෙට්ටිය වෙනුවට ඇණවුම් කළ දින නියමයක් නැති දිගු පෙට්ටි ටිකට් පත් සමඟ ආදේශ කරයි. සෑම පෙට්ටියකටම එහි ටිකට් පත් වල විවිධ අනුපාතයන් තිබිය හැකිය. නිරීක්ෂණ x1 සෑදී ඇත්තේ පළමු කොටුවෙන් ටිකට් පතක් ඇඳීමෙනි, x2 දෙවන කොටුවෙන් පැමිණේ, සහ යනාදිය.

  5. පෙට්ටිවල අන්තර්ගතය “එතරම් වෙනස් නොවේ” යන්න හරියටම එකම නිගමනවල පවතී (“වඩා වෙනස් නොවන” යන්නෙහි අර්ථය නිරවද්‍ය, නමුත් වෙනස්, ප්‍රමාණාත්මක ලක්ෂණ කිහිපයක් ඇත; ඒවා විශ්මය ජනක අක්ෂාංශ ප්‍රමාණයකට ඉඩ දෙයි).

මෙම ප්‍රකාශ පහට අවම වශයෙන් පැහැදිලි කිරීම අවශ්‍ය වේ. තවත් බොහෝ දේ ඇත. සැකසුමෙහි කුතුහලය දනවන කරුණු කිහිපයක් සියලු ප්‍රකාශයන්හි ගම්‍ය වේ. උදාහරණයක් වශයෙන්,

  • මුදලේ විශේෂත්වය කුමක්ද? ඒවායේ ගණිතය හෝ ඒවායේ උපරිමය වැනි වෙනත් ගණිතමය සංයෝජනයන් සඳහා අපට මධ්‍යම සීමිත ප්‍රමේයයන් නැත්තේ ඇයි? (එය අපි හැරෙනවා, නමුත් ඔවුන් ඉතා එසේ සාමාන්ය නොවේ හෝ ඔවුන් හැම විටම ඔවුන් CLT දක්වා අඩු කර ගැනීමට හැකි නම් එවැනි පිරිසිදු, සරල නිගමනයකට ඇති කියලා.) වල අනුක්රමය mn හා sn අනන්ය නොවන නමුත් ඔවුන් ඉන්නේ පාහේ අවසානයේ ඔවුන් එකතුව අපේක්ෂාවන් ආසන්න කිරීමට ඇති බව අර්ථයෙන් සුවිශේෂී n ප්රවේශ පත්ර හා සම්මත අපගමනය පිළිවෙලින්, එම මුදලින් (මෙම CLT පළමු ප්රකාශ දෙකක්, හා සමාන, n කොටුවේ සම්මත අපගමනය මෙන් දෙගුණයක්).

    සම්මත අපගමනය යනු සාරධර්ම ව්‍යාප්ත වීමේ එක් මිනුමකි, නමුත් එය කිසිසේත්ම එකම එකක් නොවේ. එය histor තිහාසිකව හෝ බොහෝ යෙදුම් සඳහා වඩාත්ම “ස්වාභාවික” නොවේ. ( උදාහරණයක් ලෙස බොහෝ අය මධ්‍යන්‍යයෙන් නිරපේක්ෂ අපගමනය වැනි දෙයක් තෝරා ගනු ඇත .)

  • SD එතරම් අත්‍යවශ්‍ය ආකාරයකින් දිස්වන්නේ ඇයි?

  • සීමිත හිස්ටෝග්‍රැම් සඳහා සූත්‍රය සලකා බලන්න: එය එවැනි ස්වරූපයක් ගනු ඇතැයි අපේක්ෂා කළේ කවුද? සම්භාවිතා ity නත්වයේar ු ගණකය චතුරස්රාකාර ශ්‍රිතයක් බව එය පවසයි . මන්ද? මේ සඳහා යම් අවබෝධාත්මක හෝ පැහැදිලි, බලගතු පැහැදිලි කිරීමක් තිබේද?


ශ්‍රීකාන්ත්ගේ බුද්ධිමය හා සරල බව සඳහා වන අභියෝගාත්මක නිර්ණායක සපුරාලීමට තරම් සරල පිළිතුරු සැපයීමේ අවසාන ඉලක්කය කරා ළඟා වීමට මට නොහැකි බව මම පිළිගනිමි, නමුත් මම මෙම පසුබිම සකස් කර ඇත්තේ බොහෝ හිඩැස් පිරවීමට අන් අය පෙළඹෙනු ඇතැයි යන බලාපොරොත්තුවෙනි. මම අවසානයේ හොඳ උද්ඝෝෂණය ආකාරය වටිනාකම් අතර ක මූලික විශ්ලේෂණය කිරීම මත රඳා ඇත හිතන්නේ αn=asn+mn හා βn=bsn+mn එකතුව පිහිටුවා ඇති විය හැකි x1+x2++xn. සීඑල්ටී හි තනි කොටු අනුවාදය වෙත ආපසු යාම, සමමිතික ව්‍යාප්තියක් හැසිරවීමට වඩා සරල ය: එහි මධ්‍යන්‍යය එහි මධ්‍යන්‍යයට සමාන වේ, එබැවින් xi කොටුවේ මධ්‍යන්‍යයට වඩා අඩු වීමට 50% ක අවස්ථාවක් සහ 50% අවස්ථාවක් තිබේ බව xi එහි මධ්යන්ය වඩා වැඩි වනු ඇත. එපමණක් නොව, n ප්‍රමාණවත් තරම් විශාල වූ විට, මධ්යන්යයේ ධනාත්මක අපගමනය මධ්යන්යයේ negative ණාත්මක අපගමනයන්ට වන්දි ගෙවිය යුතුය. (මේ සඳහා අත් සේදීම පමණක් නොව, ප්‍රවේශමෙන් යුක්ති සහගත කිරීමක් අවශ්‍ය වේ.) මේ අනුව අප මූලික වශයෙන් සැලකිලිමත් විය යුත්තේ ධනාත්මක හා negative ණාත්මක අපගමනයන් ගණනය කිරීම හා ඒවායේ ප්‍රමාණයන් පිළිබඳ ද්විතියික සැලකිල්ලක් පමණි . (මා මෙහි ලියා ඇති සෑම දෙයකින්ම, සීඑල්ටී ක්‍රියා කරන්නේ ඇයිද යන්න පිළිබඳ යම් අවබෝධයක් ලබා දීමට මෙය වඩාත් ප්‍රයෝජනවත් විය හැකිය. ඇත්ත වශයෙන්ම, සීඑල්ටී හි සාමාන්‍යකරණයන් සත්‍ය බවට පත්කිරීමට අවශ්‍ය තාක්‍ෂණික උපකල්පනයන් අත්‍යවශ්‍යයෙන්ම විවිධ හැකියාවන් බැහැර කිරීමේ ක්‍රම වේ. දුර්ලභ දැවැන්ත අපගමනය මඟින් සීමිත හිස්ටෝග්‍රැම් පැන නැගීම වැළැක්වීමට ප්‍රමාණවත් ශේෂය අවුල් කරනු ඇත.)

කෙසේ වෙතත්, සීඑල්ටී හි පළමු සාමාන්‍යකරණය ඩි මොයිව්රේගේ මුල් බර්නූලි අත්හදා බැලීමේ අනුවාදයේ නොතිබූ කිසිවක් සැබවින්ම අනාවරණය නොවන්නේ මන්දැයි මෙයින් පෙන්නුම් කෙරේ.

මේ මොහොතේ දී එය කුඩා ගණිත කරන්න ඒ සඳහා කිසිවක් නැත වගේ නමුත්: අපි ගණන් කිරීමට අවශ්ය මධ්යන්යයේ සිට ධනාත්මක අපගමනය සංඛ්යාව ඕනෑම කලින් තීරණය අගය ඍණ අපගමනය සංඛ්යාව වෙනස් කළ හැකි පැහැදිලි ක්රම සංඛ්යාව k , පැහැදිලිවම k යනු n,n+2,,n2,n වලින් එකකි . නමුත් අතුරුදහන් වන පරිදි කුඩා දෝෂ සීමාව තුළ අතුරුදහන් වනු ඇති බැවින්, අපට හරියටම ගණන් ගත යුතු නැත; අපට අවශ්‍ය වන්නේ ගණන් කිරීම පමණයි. මේ සඳහා එය දැන ගැනීම ප්‍රමාණවත් වේ

The number of ways to obtain k positive and nk negative values out of n

equals nk+1k

times the number of ways to get k1 positive and nk+1 negative values.

(එය පරිපූර්ණ මූලික ප්‍රති result ලයකි, එබැවින් සාධාරණීකරණය ලිවීමට මම කරදර නොවෙමි.) දැන් අපි තොග වශයෙන් දළ වශයෙන් ගනිමු. k හැකි තරම් n/2 ආසන්න වන විට උපරිම සංඛ්‍යාතය සිදු වේ (මූලික ද වේ). m=n/2 ලියමු . එවිට, උපරිම සංඛ්‍යාතයට සාපේක්ෂව, m+j+1 ධනාත්මක අපගමනයන්ගේ සංඛ්‍යාතය ( j0 ) නිෂ්පාදිතය මගින් තක්සේරු කෙරේ

m+1m+1mm+2mj+1m+j+1

=11/(m+1)1+1/(m+1)12/(m+1)1+2/(m+1)1j/(m+1)1+j/(m+1).

ඩි මොයිව්රේ ලිවීමට වසර 135 කට පෙර, ජෝන් නේපියර් ගුණ කිරීම සරල කිරීම සඳහා ල ar ු ගණකය නිර්මාණය කළේය, එබැවින් අපි මෙයින් ප්‍රයෝජන ගනිමු. ආසන්න වශයෙන් භාවිතා කිරීම

log(1x1+x)=2x2x33+O(x5),

සාපේක්ෂ සංඛ්‍යාතයේ ලොගය දළ වශයෙන් බව අපට පෙනී යයි

2m+1(1+2++j)2(m+1)3(13+23++j3)=j2m+O(j4m3).

මෙම මුදලක් ශූන්යයක් සන්නිකර්ෂණය සඳහා දෝෂයක් විසින් නිසා j2/m ගණයේ j4/m3 , එම ආසන්න හොඳින් ලබා වෙහෙස විය යුතුයි j4 කුඩා ඥාතියෙකු වන m3 . එය අවශ්‍ය ප්‍රමාණයට වඩා j හි අගයන් විශාල ප්‍රමාණයක් ආවරණය කරයි . (එය ආසන්න සඳහා වැඩ කිරීම සඳහා ප්රමාණවත් j පමණක් අනුපිළිවෙල මත m asymptotically වඩා කුඩා වනm3/4 .)

එහි ප්‍රති z ලයක් ලෙස z = writing ලිවීම

z=2jm=j/n1/4n
සඳහාසම්මත අපගමනය,විසින් ලබා දී ප්රමාණයේ අපගමනය සාපේක්ෂ සංඛ්යාතයzසමානුපාතික විය යුතුයexp(z2/2)විශාල සඳහාm. මේ අනුව ඉහත # 3 හි ගෝස්සියානු නීතිය පෙනේ.


සීඑල්ටී හි අනෙක් ප්‍රකාශයන් යුක්ති සහගත කිරීම සඳහා මේ ආකාරයේ තවත් විශ්ලේෂණයක් ඉදිරිපත් කළ යුතු නමුත්, මට කාලය, අවකාශය සහ ශක්තිය ඉවර වී ඇති අතර මෙය කෙසේ හෝ කියවීමට පටන් ගත් පුද්ගලයින්ගෙන් 90% ක් මට අහිමි වී ඇත. මෙය ඉතා සරල ආසන්න, නමුත්, ආකාරය යෝජනා ද Moivre මුලින් එහි ලඝු ගණකය වූ quadratic කාර්යය වන අතර, නිසි පරිමාණ සාධකයක් බව, විශ්ව සීමා බෙදා ඇති බව සැක ඇති විය sn සමානුපාතික විය යුතුය n (පෙර සූත්‍රයේ හරය පෙන්වා ඇති පරිදි). කිසියම් ගණිතමය තොරතුරක් සහ තර්කනයක් ඉදිරිපත් නොකර මෙම වැදගත් ප්‍රමාණාත්මක සම්බන්ධතාවය පැහැදිලි කරන්නේ කෙසේදැයි සිතීම දුෂ්කර ය; ඊට වඩා අඩු යමක් සීමිත වක්‍රයේ හැඩය සම්පූර්ණ අභිරහසක් වනු ඇත.


7
+1 ඔබේ පිළිතුර ජීර්ණය කිරීමට මට යම් කාලයක් ගතවනු ඇත. මා විසින් පනවා ඇති සීමාවන් තුළ සීඑල්ටී සඳහා බුද්ධියක් ඉල්ලා සිටීම කළ නොහැකි දෙයක් බව මම පිළිගනිමි.

2
මෙය ලිවීමට කාලය ගැනීම ගැන ඔබට ස්තූතියි, එය මා දුටු සීඑල්ටී හි වඩාත්ම ප්‍රයෝජනවත් ප්‍රදර්ශනය වන අතර එය ගණිතමය වශයෙන් ද ප්‍රවේශ විය හැකිය.
ජෙරමි රැඩ්ක්ලිෆ්

1
ඔව්, තරමක් ense නයි .... බොහෝ ප්‍රශ්න. පළමු හිස්ටෝග්‍රැම් හි බාර් 2 ක් ඇත්තේ කෙසේද (අත්හදා බැලීම් 1 ක් පමණි!); මට එය නොසලකා හැරිය හැකිද? හා සමුළුව හරි, යම් histogram බාර් අතර තිරස් හිඩැස් වළක්වා ගැනීමට සාමාන්යයෙන්? (මන්ද, ඔබ පවසන පරිදි, ප්‍රදේශය වැදගත් වන අතර, ප්‍රදේශය අඛණ්ඩ (එනම් හිඩැස් නැත) වසමක් හරහා ගණනය කරනු ලැබේ)? ඉතින් මමත් හිඩැස් නොසලකා හරිනවා ...? මම එය තේරුම් ගැනීමට උත්සාහ කළ විට පවා මට හිඩැස් තිබුනි :)
රතු කව්පි

1
R TheRed ඔබගේ ප්‍රශ්න වලට ස්තූතියි. මෙම කරුණු ටිකක් පැහැදිලි කිරීම සඳහා මම මෙම ලිපියේ පළමු කොටස සංස්කරණය කර ඇත්තෙමි.
whuber

4
අහ්, ඔව්, මම "අත්හදා බැලීම් ගණන = =" නිරීක්ෂණ "" "වාර ගණනක් (මෙම සම්පූර්ණ ක්‍රියා පටිපාටියම) නැවත නැවතත්" සමඟ පටලවා ගතිමි . එබැවින් ටිකට් පතකට 0 හෝ 1 යන අගයන් දෙකේ වටිනාකම පමණක් තිබිය හැකි අතර ඔබ එක් ටිකට් පතක් පමණක් නිරීක්ෂණය කරන්නේ නම් , එම ටිකට් පත් වල අගයන් එකතුව විය හැක්කේ කරුණු දෙකෙන් එකක් පමණි : 0, හෝ 1 . එබැවින් ඔබේ පළමු හිස්ටෝග්‍රැම් බාර් දෙකක් ඇත. එපමණක් නොව, මෙම බාර්වල උස දළ වශයෙන් සමාන වේ 0 සහ 1 සමාන අනුපාතයකින් සිදුවනු ඇතැයි අපි අපේක්ෂා කරමු. n
රතු කව්පි

29

මා දන්නා ලස්සනම සජීවිකරණය: http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html

සමාන්තර පරතරයකින් යුත් තිරස් ස්ථර 8 ක්, සෑම ස්ථරයක්ම එකතැන පල්වෙමින්, මෙම පයින් හරහා බෝල වැටීම සඳහා "පැචින්කෝ / පින්බෝල්" විලාසිතාවේ බාධාවක් ඇති කරයි.  සෑම බෝලයක්ම පතුලේ වැටෙන අතර, බෝල ගොඩගැසෙන විට ඒවායේ උස ගවුසියානු වක්‍රයේ දළ සටහනකට ළඟා වේ.  මෙයින් පැහැදිලි වන්නේ බොහෝ ස්වාධීන අහඹු සිදුවීම්වල (ස්ථර) එකතුව, ප්‍රති aus ල ගෝස්සියානු ව්‍යාප්තියකට (ගොඩගැසී ඇති බෝල උස) හේතු වනු ඇති බවයි.

මා කියවා ඇති සරලම වචන: http://elonen.iki.fi/articles/centrallimit/index.en.html

ඔබ මෙම විසි දහයේ ප්‍රති results ල සාරාංශ කළහොත්, ඔබට ලැබෙන දෙය උපරිමයට වඩා 30-40, 60 (සියලුම හයේ) හෝ අනෙක් අතට, අවම, 10 (සියල්ලම) ට වඩා සමීප විය හැකිය.

මෙයට හේතුව වන්නේ අන්තයට වඩා විවිධාකාරයෙන් ඔබට මධ්‍යම අගයන් ලබා ගත හැකි වීමයි. උදාහරණය: ඩයිස් දෙකක් විසි කරන විට: 1 + 6 = 2 + 5 = 3 + 4 = 7, නමුත් 1 + 1 = 2 සහ 6 + 6 = 12 පමණි.

එනම්: එක් මරණයක් විසි කිරීමේදී ඔබට සංඛ්‍යා හයෙන් එක සමානව ලැබිය හැකි වුවද, අන්තයන් ඩයිස් කිහිපයක එකතුවක මැද අගයන්ට වඩා අඩු සම්භාවිතාවක් ඇත.


20

ප්‍රතිභානය යනු ව්‍යාකූල දෙයකි. අපේ අතේ ඇති න්‍යාය අපගේ පිටුපසට බැඳ තිබීම ඊටත් වඩා උපක්‍රමශීලී ය.

සීඑල්ටී යනු කුඩා, ස්වාධීන කැළඹීම්වල එකතුවකි. නියැදියේ අර්ථයෙන් “සාරාංශ” යන්නෙන් අදහස් වන්නේ සීමිත විචල්‍යතාවයේ (ජනගහනයේ) අර්ථයෙන් “ඉතා කුඩා” සහ මධ්‍යම (ජනගහන) අගයක් වටා ප්ලස් / us ණ යන අර්ථයෙන් “බාධා” යන්නයි.

මට නම්, ප්‍රතිභාවට වඩාත් කෙලින්ම ආයාචනා කරන උපකරණය වන්නේ ක්වින්කන්ක්ස් නොහොත් 'ගැල්ටන් පෙට්ටිය', විකිපීඩියාව බලන්න ('බෝංචි මැෂින්' සඳහා?) අදහස නම් දැලිසකින් සරසා ඇති පුවරුවක මුහුණට පහළින් කුඩා කුඩා බෝලයක් පෙරළීමයි. සමාන පරතරයකින් යුත් අල්ෙපෙනති. පන්දුව පහළට යන විට දකුණට සහ වමට හරවා (... අහඹු ලෙස, ස්වාධීනව) පතුලේ එකතු වේ. කාලයාගේ ඇවෑමෙන්, අපේ ඇස් ඉදිරිපිටම ලස්සන සීනුව හැඩැති පස් කන්දක් අපට පෙනේ.

සීඑල්ටී කියන්නේ එකම දෙයයි. එය මෙම සංසිද්ධිය පිළිබඳ ගණිතමය විස්තරයකි (වඩාත් නිවැරදිව කිවහොත්, quincunx යනු ද්විමය ව්‍යාප්තියට සාමාන්‍ය ආසන්න කිරීම සඳහා භෞතික සාක්ෂි වේ). ලිහිල් ලෙස කිවහොත්, සීඑල්ටී පවසන්නේ අපේ ජනගහනය ඕනෑවට වඩා වැරදි ලෙස හැසිරෙන්නේ නැති තාක් කල් (එනම්, පී.ඩී.එෆ් හි වලිග ප්‍රමාණවත් තරම් සිහින් නම්), එවිට නියැදි මධ්යන්යය (නිසි ලෙස පරිමාණයෙන්) හැසිරෙන්නේ එම කුඩා බෝලය මුහුණට පහළට පනින ආකාරයට ය quincunx: සමහර විට එය වමට වැටේ, සමහර විට එය දකුණට වැටේ, නමුත් බොහෝ විට එය මැද වටේට ගොඩබසිනු ඇත, ලස්සන සීනුවක හැඩයෙන්.

සීඑල්ටී හි මහිමය (මට) යටින් පවතින ජනගහනයේ හැඩය අදාල නොවේ. හැඩය භූමිකාවක් ඉටු කරන්නේ අප බලා සිටිය යුතු කාලය (නියැදි ප්‍රමාණය අනුව) නියම කරන බැවිනි.


19

සීඑල්ටී පිළිබඳ නිරීක්ෂණයක් පහත දැක්වේ. ඔබට අහඹු සංරචක විශාල ප්‍රමාණයක් ඇති විට, එකක් “වෙනදාට වඩා කුඩා” නම්, මෙය බොහෝ විට වන්දි ගෙවනු ලබන්නේ වෙනත් සමහර සංරචක “වෙනදාට වඩා විශාල” වීමෙනි. . වෙනත් වචන වලින් කිවහොත්, negative ණාත්මක අපගමනයන් සහ සං from ටකයෙන් ධනාත්මක අපගමනයන් යනු සාරාංශයේ දී එකිනෙකා අවලංගු කිරීමයි. පුද්ගලිකව, ඉතිරිව ඇති අපගමනයන් ඔබ සතුව ඇති පද වැඩි වැඩියෙන් සාමාන්‍ය ලෙස පෙනෙන බෙදාහැරීමක් සාදන්නේ මන්දැයි මට පැහැදිලි අවබෝධයක් නොමැත.

S=X1+X2++Xn

සීඑල්ටී හි බොහෝ අනුවාදයන් ඇත, සමහර ඒවා අනෙක් ඒවාට වඩා ශක්තිමත් ය, සමහරක් කොන්දේසි අතර මධ්‍යස්ථ යැපීමක් සහ / හෝ කොන්දේසි සඳහා සමාන නොවන බෙදාහැරීම් වැනි ලිහිල් කොන්දේසි සහිත ය. සීඑල්ටී හි සරලම-ඔප්පු කළ හැකි අනුවාද වලදී, සාධනය සාමාන්‍යයෙන් පදනම් වන්නේ එකතුවෙහි මොහොත උත්පාදනය කරන ශ්‍රිතය (හෝ ලැප්ලේස්-ස්ටීල්ට්ජෙස් පරිණාමනය හෝ වෙනත් සුදුසු the නත්වයේ වෙනත් පරිවර්තනයක්) මත ය . මෙය ටේලර් ව්‍යාප්තියක් ලෙස ලිවීම සහ වඩාත්ම ප්‍රමුඛ යෙදුම පමණක් තබා ගැනීම සාමාන්‍ය බෙදාහැරීමේ මොහොත උත්පාදනය කිරීමේ කාර්යය ඔබට ලබා දෙයි. එබැවින් මට පෞද්ගලිකව, සාමාන්‍යය යනු සමීකරණ සමූහයකින් එන දෙයක් වන අතර ඊට වඩා වැඩි අවබෝධයක් මට ලබා දිය නොහැක.S

එය මුදලක් ශ්රී ලංකා බෙදාහැරීමේ බව කෙසේ වෙතත් විශේෂයෙන් සඳහන් කළ යුතුය, කවදාවත් ඇත්තටම වේ සාමාන්යයෙන් බෙදා වත්, CLT එය කළ කියා නැත. නම් පරිමිත වන අතර, එහි සාමාන්ය බෙදාහැරීමේ හා නම් සමහර දුර තවමත් n = මධ්යන්ය සහ විචලතාව මෙන්ම අනන්ත ය යන දෙකම. අවසාන අවස්ථාවේ දී ඔබට අසීමිත මුදලෙහි මධ්‍යන්‍යය ගත හැකි නමුත් කිසිදු විචල්‍යතාවයකින් තොරව ඔබට නිශ්චිත සංඛ්‍යාවක් ලැබෙනු ඇත, එය “සාමාන්‍යයෙන් බෙදා හරින ලද” ලෙස ලේබල් කළ නොහැකි ය.nn=

මෙය සීඑල්ටී හි ප්‍රායෝගික යෙදීම් සමඟ ගැටලු ඇති කළ හැකිය. සාමාන්‍යයෙන්, ඔබ එහි මධ්‍යස්ථානයට ආසන්නව බෙදා හැරීමට කැමති නම් , CLT හොඳින් ක්‍රියා කරයි. කෙසේ වෙතත්, සාමාන්‍යයට අභිසාරී වීම සෑම තැනකම ඒකාකාරී නොවන අතර ඔබ තව දුරටත් කේන්ද්‍රයෙන් get ත් වන තරමට, ඔබට සාධාරණ ඇස්තමේන්තුවක් තිබිය යුතුය.S/n

සංඛ්‍යාලේඛනවල මධ්‍යම සීමාවන් ප්‍රමේයයේ සියලුම “පරිශුද්ධභාවය” සමඟින්, එහි සීමාවන් බොහෝ විට නොසලකා හරිනු ලැබේ. පහත දැක්වෙන්නේ මම මගේ පා ​​course මාලාවෙන් විනිවිදක දෙකක් ලබා දෙන අතර ඕනෑම ප්‍රායෝගික භාවිත අවස්ථාවක දී සීඑල්ටී වලිගය තුළ සම්පූර්ණයෙන්ම අසමත් වන බව පෙන්වා දෙයි. අවාසනාවකට මෙන්, දැනුවත්ව හෝ වෙනත් ආකාරයකින් වලිග සම්භාවිතාව තක්සේරු කිරීමට බොහෝ අය විශේෂයෙන් CLT භාවිතා කරති.

රූප විස්තරය මෙහි ඇතුළත් කරන්න රූප විස්තරය මෙහි ඇතුළත් කරන්න


6
මෙය විශිෂ්ට ද්‍රව්‍යමය හා wise ානවන්ත උපදෙස් වේ. අවාසනාවකට මෙන්, මට එය ඉහළ නැංවිය නොහැක, මන්ද “මෙම සාමාන්‍යය ගණිතමය කෞතුක වස්තුවක් වන අතර එය පිටුපස ඇති ගැඹුරු සත්‍යයක් හෝ බුද්ධියක් සෙවීම ප්‍රයෝජනවත් නොවේ යැයි මම සිතමි”. (1) න්‍යායාත්මකව අපට උපකාර කිරීම සඳහා අප ගණිතය මත විශ්වාසය නොතැබිය යුතු බවත් (2) ගණිතය මුලින් තේරුම් ගැනීමට කිසිදු තේරුමක් නැති බවත් ඔවුන් යෝජනා කරන බව පෙනේ. මෙම ත්‍රෙඩ් එකේ අනෙක් ලිපි දැනටමත් දෙවන ප්‍රකාශය සනාථ කිරීම සඳහා බොහෝ දුරක් යා හැකි යැයි මම බලාපොරොත්තු වෙමි. පළමුවැන්න එතරම්ම ස්වයං-නොගැලපීම නිසා එය තවදුරටත් විශ්ලේෂණය කිරීමක් සිදු නොවේ.
whuber

4
huhuber. ඔබ හරි, මම සමහර විට මගේ ලීගයෙන් ඉවත් වී සිටිමි. මම සංස්කරණය කරන්නම්.
StijnDeVuyst

5
ගැටළු සහගත කොටස නැවත සලකා බැලීමට ස්තූතියි, ඉතිරිය සඳහා විශාල +1.
whuber

9

මෙම පිළිතුර සරල කැල්කියුලස් ශිල්පීය ක්‍රම උපයෝගී කරගනිමින් මධ්‍යම සීමාව ප්‍රමේයයේ අර්ථවත් අර්ථයක් ලබා දීමට අපේක්ෂා කරයි (ටේලර් 3 වන අනුපිළිවෙල පුළුල් කිරීම). දළ සටහන මෙන්න:

  1. සීඑල්ටී කියන දේ
  2. සරල ගණනය කිරීම් භාවිතා කරමින් සීඑල්ටී පිළිබඳ අවබෝධාත්මක සාක්ෂියක්
  3. සාමාන්‍ය බෙදාහැරීම ඇයි?

සාමාන්‍ය බෙදා හැරීම අපි අවසානයේ සඳහන් කරන්නෙමු; මක්නිසාද යත්, සාමාන්‍ය ව්‍යාප්තිය අවසානයේදී ඉහළට එන්නේ එතරම් බුද්ධියක් නොදක්වන බැවිනි.

1. මධ්‍යම සීමාව ප්‍රමේයයෙන් කියැවෙන්නේ කුමක්ද? සීඑල්ටී හි අනුවාද කිහිපයක්

සීඑල්ටී හි විචිත්‍ර අනුවාද කිහිපයක් තිබේ. සීඑල්ටී හි පෙළපොත් ප්‍රකාශයේ දැක්වෙන්නේ ඕනෑම තාත්වික x සහ ස්වාධීන සසම්භාවී විචල්‍යයන් වන X1,,Xn ශුන්‍ය මධ්යන්ය හා විචල්‍යතාව 1, යනු කුමක් ද යන්න සම්බන්ධයෙන් වටහා ගැනීමටවිශ්වසහඉවෙන්මෙම CLT ගැන, අපි මොහොතකට සීමාව අමතක කරමු. ඉහත ප්‍රකාශයෙන් කියවෙන්නේX1නම්. ,,

P(X1++Xnnx)n+xet2/22πdt.
X1.,,Xn හාZ1,,Zn ස්වාධීන සසම්භාවී විචල්යයන් අනුපිළිවෙලවල්, දෙකක් ශුන්ය-පහත් සහ විචලතාව 1 එක් එක්, එවිට ය සෑම දර්ශකයක් උත්සවය සඳහාfආකෘති, සමහර ස්ථාවර සැබෑ සඳහාx, f(t)={1 නම් ටී<x
E[f(X1++Xnn)]E[f(Z1++Znn)]n+0
fx
f(t)={1 if t<x0 if tx.
X1,,XnසහZ1,,Zn හි නිශ්චිත බෙදාහැරීම් නොසලකා සීමාව සමාන බව පෙර සංදර්ශනයෙන් නිරූපණය වේ.Z1,,Zn, සසම්භාවී විචල්යයන් මධ්යන්ය ශුන්ය, විචල්යතාව සමඟ ස්වාධීන වන බව සපයා ඇත.

සීඑල්ටී හි තවත් සමහර අනුවාදවල ලිප්ස්චිටිස් ශ්‍රිත 1 ක් මායිම් කර ඇත. සීඑල්ටී හි තවත් සමහර අනුවාදයන් k හි අනුපිළිවෙලින් සීමිත ව්‍යුත්පන්නයක් සහිත සුමට ශ්‍රිතවල පන්තිය ගැන සඳහන් කරයිk . අනුක්රමය දෙකක් සලකා බලන්න X1,,Xn හා Z1,,Zn ඉහත සඳහන් ලෙස, සමහර උත්සවය සඳහා f , එම ශ්රේණිය අභිසාරී ප්රතිඵලයක් (CONV)

(CONV)E[f(X1++Xnn)]E[f(Z1++Znn)]n+0

පහත දැක්වෙන ප්‍රකාශ අතර සමානතාව ("නම් සහ පමණක් නම්") ස්ථාපිත කළ හැකිය:

  1. (CONV) ඉහත සෑම දර්ශකයක් කාර්යයන් සඳහා පවත්වයි f ආකෘති f(t)=1 සඳහා t<x හා f(t)=0 සඳහා tx සමහර ස්ථාවර සැබෑ සඳහා x .
  2. (CONV) සෑම මායිම් ලිප්ස්චිට්ස් ශ්‍රිතයක් සඳහාම f:RR .
  3. (CONV) සෑම සුමට (එනම්, සත්ය C සංයුක්ත ආධාරයෙන් ) කාර්යයන් .
  4. (CONV) සෑම කාර්යයක් සඳහාම දරයි f සමඟ දිගින් දිගටම අවකල්ය තුනක්supxR|f(x)|1 .

ඉහත සඳහන් කරුණු 4 න් එක් එක් අභිසාරීතාව විශාල පන්තියේ ශ්‍රිතයක් සඳහා පවතින බව පවසයි. තාක්‍ෂණික දළ විශ්ලේෂණයකින් කෙනෙකුට ඉහත කරුණු හතර සමාන බව පෙන්විය හැකිය, අපි ඩේවිඩ් පොලාර්ඩ්ගේ පොතේ 7 වන පරිච්ඡේදයේ 77 වන පිටුවට යොමු කරමු. සෛද්ධාන්තික බඹලොව මැනීමට ඒ පරිශීලක මාර්ගෝපදේශය මෙම පිළිතුර ඉතා දේවානුභාවයෙන් වන සිට.

මෙම පිළිතුරේ ඉතිරි කොටස සඳහා අපගේ උපකල්පනය ...

අපි උපකල්පනය කරමු supxR|f(x)|Cනියත C>0 සඳහා C , එය ඉහත ලක්ෂ්‍යයට අනුරූප වේ. සසම්භාවී විචල්‍යයන්ට සීමිත, සීමිත තුන්වන මොහොතක් ඇතැයි අපි උපකල්පනය කරමු: E[|Xi|3] සහ E[|Zi|3] සීමිතයි.

2. E[f(X1++Xnn)] විශ්ව: එය බෙදාහැරීම මත පදනම් නොවී,X1,...,Xn

මෙම ප්‍රමාණය විශ්වීය බව (කුඩා දෝෂ පදයක් දක්වා) පෙන්වමු, එය ස්වාධීන අහඹු විචල්‍යයන්ගේ එකතුවක් මත රඳා නොපවතින අර්ථයෙන්. ගන්න X1,,Xn හාZ1,,Zn ස්වාධීන සසම්භාවී විචල්යයන්, අදහස් 0 සහ විචලතාව 1 එක් එක්, හා සීමිත තෙවන මොහොතේ අනුපිළිවෙලවල්, දෙකක්.

අදහස iteratively ප්රතිස්ථාපනය කිරීමයි Xi විසින් Zi (අදහස, මම විශ්වාස කරනවා, Lindeberg නියමිත) ප්රමාණය එක් හා මූලික කලනයේ විසින් වෙනස පාලනය කරයි. ටේලර් ප්‍රසාරණයකින්, W=Z1++Zn1 , සහ h(x)=f(x/n)ඉන්පසු

h(Z1++Zn1+Xn)=h(W)+Xnh(W)+Xn2h(W)2+Xn3/h(Mn)6h(Z1++Zn1+Zn)=h(W)+Znh(W)+Zn2h(W)2+Zn3h(Mn)6
මෙහිMnසහMnයනු මධ්‍යන්‍ය අගය ප්‍රමේයයෙන් ලබා දෙන මධ්‍ය ලක්ෂ්‍ය වේ. රේඛා දෙකෙහිම අපේක්ෂාව සැලකිල්ලට ගනිමින්, ශුන්‍ය අනුපිළිවෙල පදය සමාන වේ, පළමු ඇණවුම් පද අපේක්ෂාවෙන් සමාන වේ, මන්දXnසහWස්වාධීන වීමෙන්,E[Xnh(W)]=E[Xn]E[h(W)]=0ඒ හා සමානව දෙවන පේළිය සඳහා. නැවතත් නිදහස අනුව, දෙවන අනුපිළිවෙල අපේක්ෂාවෙන් සමාන වේ. ඉතිරිව ඇති එකම පද තෙවන අනුපිළිවෙල වන අතර අපේක්ෂාවෙන් පේළි දෙක අතර වෙනස උපරිම වශයෙන් මෙහිCතුන්වන ව්යුත්පන්න මත ඉහළ බැඳී ඇත. මෙම හරය(

(C/6)E[|Xn|3+|Zn|3](n)3.
Cf(n)3නිසා දර්ශණයh(t)=f(t/n)/(n)3. ස්වාධීනත්වය අනුව,ඉහත සංදර්ශනයට වඩා විශාල දෝෂයක් ඇති නොවී Z n මගින් එය ප්‍රතිස්ථාපනය කළ හැකි බැවින් එකතුවෙහිXn හිදායකත්වයඅර්ථ විරහිත ය!Zn

අපි දැන් වෙනුවට යළිත් අවධාරණය Xn1 විසින් Zn1 . නම් W~=Z1+Z2++Zn2+Xn එසේ නම්

h(Z1++Zn2+Xn1+Xn)=h(W~)+Xn1h(W~)+Xn12h(W~)2+Xn13/h(M~n)6h(Z1++Zn2+Zn1+Xn)=h(W~)+Zn1h(W~)+Zn12h(W~)2+Zn13/h(M~n)6.
ස්වාධීනත්වය විසින්Zn1හාW~, සහ ස්වාධීනත්වය විසින්Xn1හාW~, නැවත ශුන්යාදී, පළමු හා දෙවන නියෝගයක් අනුව මාර්ග දෙකම සඳහා අපේක්ෂාවෙන් සමාන වේ. පේළි දෙක අතර අපේක්ෂාවේ වෙනස නැවතත් උපරිම වශයෙන් අපි ඒ වෙනුවට දක්වා එල්ලාවල මහතා තබාZi'සමග sXis' '. එක් එක් දී කරන ලද වැරදි එකතු කිරීම මඟින්nපියවර, අපි ලබා | E[f(X1++Xn

(C/6)E[|Xn1|3+|Zn1|3](n)3.
ZiXin ලෙසnවැඩි තෙවන අවස්ථාවලදී හෝ සසම්භාවී විචල්යයන් (ඒක නඩුව උපකල්පනය කරමු) පරිමිත නම්., දකුණු අත පැත්තේ අත්තනෝමතික කුඩා බවට පත් මෙයින් අදහස් කරන්නේ වම් පැත්තේ අපේක්ෂාවන් අත්තනෝමතික ලෙස එකිනෙකට සමීප වන බවයි,X1,,Xnහි ව්‍යාප්තියZ1,,Znට වඩා බොහෝ දුරට වෙනස් වුවද. ස්වාධීනත්වය අනුව, එක් එක්Xiහි එකතුවෙහි අර්ථය අර්ථ විරහිත වන්නේ එයOට වඩා විශාල දෝෂයක් නොමැතිවZiමගින් ප්‍රතිස්ථාපනය කළ හැකි බැවිනි.
|E[f(X1++Xnn)]E[f(Z1++Znn)]|n(C/6)maxi=1,,nE[|Xi|3+|Zi|3](n)3.
nX1,,XnZ1,,ZnXiZiO(1/(n)3). සියලු වෙනුවටXi'විසින් sZiහි වඩා විසින් ප්රමාණය වෙනස් නොවේ'O(1/n) .

අපේක්ෂාව E[f(X1++Xnn)]මේ අනුව විශ්වීය වේ, එයX1,,Xnබෙදා හැරීම මත රඳා නොපවතී. අනෙක් අතට, ස්වාධීනත්වය සහE[Xi]=E[Zi]=0,E[Zi2]=E[Xi2]=1 ඉහත සීමාවන් සඳහා අතිශයින්ම වැදගත් විය.

3. සාමාන්‍ය ව්‍යාප්තිය ඇයි?

අපේක්ෂාව E [ f ( X 1 + + X n) බව අපි දැක ඇත්තෙමුE[f(X1++Xnn)]Xiහි ව්‍යාප්තිය කුමක් වුවත්, කුඩා අනුපිළිවෙලක් දක්වා සමාන වේO(1/n) .

නමුත් යෙදුම් සඳහා, එවැනි ප්රමාණයක් ගණනය කිරීම ප්රයෝජනවත් වනු ඇත. එය ද මෙම ප්රමාණය සඳහා සරල ප්රකාශනය ලබා ගැනීමට ප්රයෝජනවත් වනු ඇත E[f(X1++Xnn)].

X1,,Xn ඕනෑම එකතුවකට මෙම ප්‍රමාණය සමාන බැවින් බෙදා හැරීම ( X 1 + +) වැනි එක් විශේෂිත එකතුවක් අපට තෝරා ගත හැකිය.(X1++Xn)/n ගණනය කිරීම පහසුය හෝ මතක තබා ගැනීම පහසුය.

සාමාන්‍ය බෙදාහැරීම N(0,1) , මෙම ප්‍රමාණය සැබවින්ම සරල වන බව පෙනේ. ඇත්ත වශයෙන්ම, Z1,,Zn iid N(0,1) නම් Z1++Znn හිN(0,1)ව්‍යාප්තිය ද ඇති අතර එයnමත රඳා නොපවතී! එබැවින්ZN(0,1)නම්, සහ ඉහත තර්කය අනුව,X1,,XnසමඟE[Xi]=0,E[X2i]=1, එවිට

E[f(Z1++Znn)]=E[f(Z)],
X1,,XnE[Xi]=0,E[Xi2]=1

|E[f(X1++Xnn)]E[f(Z)|supxR|f(x)|maxi=1,,nE[|Xi|3+|Z|3]6n.

ඔබ සීඑල්ටී වලට වඩා විශාල සංඛ්‍යාවක් පිළිබඳ නීතියක් තහවුරු කරන බවක් පෙනේ .
whuber

2
ඔබ මෙය කියන්නේ ඇයිදැයි මට විශ්වාස නැත. ඉහත බේදය සාක්ෂියක් ලබා වෙත අභිසාරී[f(Z)]එහිදීZ~N(0,1)කාර්යයන් විශාල පන්තිය සඳහාf. මෙය සීඑල්ටී ය. E[f((X1+...+Xn)/n)]E[f(Z)]ZN(0,1)f
jlewk

2
ඔබ අදහස් කරන දෙය මට වැටහෙනවා. මට විරාමයක් ලබා දෙන්නේ ඔබේ ප්‍රකාශය ගැන සැලකිලිමත් වන්නේ අපේක්ෂාවන් මිස බෙදාහැරීම් නොවන අතර සීඑල්ටී විසින් සීමිත බෙදාහැරීමක් පිළිබඳ නිගමනවලට එළඹීමයි. මේ දෙක අතර සමානතාවය බොහෝ දෙනෙකුට ක්ෂණිකව නොපෙනේ. එසේ නම්, බෙදාහැරීම් සීමා කිරීම සම්බන්ධයෙන් ඔබේ ප්‍රකාශය සහ සීඑල්ටී හි සුපුරුදු ප්‍රකාශ අතර පැහැදිලි සම්බන්ධතාවයක් ලබා දෙන ලෙස මම යෝජනා කළ හැකිද? (මාර්ගය විසින් +1: මෙම තර්කය විස්තාරනය කරමින් ඔබට ස්තුතියි.)
whuber

1
ඇත්තෙන්ම විශිෂ්ට පිළිතුරකි. මම මෙය කුං-ෆු හි ලාක්ෂණික ශ්‍රිතයට වඩා බොහෝ බුද්ධිමත් බව පෙනේ.
එරික් ඕල්ඩ්

3

ඇයි n වෙනුවටn? සාමාන්‍යයෙන් මෙම අමුතු අනුවාදය කුමක්ද?

x1,,xnx1++xnn.n

ස්වාධීන අහඹු විචල්‍යයන් සහ විකලාංග දෛශික අතර ගැඹුරු සම්බන්ධතාවයක් ඇත. සසම්භාවී විචල්‍යයන් ස්වාධීන වන විට, එයින් මූලික වශයෙන් අදහස් වන්නේ ඒවා ශ්‍රිතයේ දෛශික අවකාශයක විකලාංග දෛශික බවයි.

(එම උත්සවයට අවකාශය මම උධෘත වේ L2 , සහ සසම්භාවී විචල්යයක් විචලතාව X වන්නේ හුදෙක් XμL22 .. පුදුමයක් විචලතාව ස්වාධීන අහඹු විචල්ය ආකලන වේ ඒ නිසා වගේ යන්තම්x+y2=x2+y2xy

සාමාන්‍ය බෙදාහැරීම ඇයි?

ටික වේලාවක් මාව ව්‍යාකූල කළ, කාරණයේ හදවතේ ඇතැයි මා සිතන එක් දෙයක් නම් පහත සඳහන් ප්‍රශ්නයයි.

එකතුව වන්නේ ඇයි?X1++XnnnXi

මෙය විශාල සංඛ්‍යා සංසිද්ධියේ නීතියට සමානය:

X1++Xnnn විශාල) 1 වන මොහොත ගැන පමණක් සැලකිලිමත් වේ (මධ්‍යන්‍ය).

Xi ස්වාධීන .)

මෙම සංසිද්ධිය ප්‍රකාශ කිරීම සඳහා වඩාත් පැහැදිලි ක්‍රමයක් නම්: එකතුවෙන්X1++XnnXinමේ මොහොතේ සාපේක්ෂව විශාල වන .

එය සත්‍ය වන්නේ මන්දැයි අප තේරුම් ගන්නේ නම්, අපි මධ්‍යම සීමාව ප්‍රමේයය තේරුම් ගනිමු . මොකද අපි X i ගන්නත් පුළුවන්Xi පළමු හා දෙවන මොහොත සමඟ සාමාන්‍ය තත්වයට ගෙන යා හැකි අතර, එම අවස්ථාවේ දී අපි දනිමුX1++Xnnnn . සාමාන්‍ය බෙදාහැරීම තුළ මෙම විශේෂ දේපල ("ස්ථායිතාව") ඇති බැවින් ඔබට ස්වාධීන සාමාන්‍ය දෙකක් එකතු කර තවත් සාමාන්‍යයක් ලබා ගත හැකිය. වොයිලා.

පළමු හා දෙවන මොහොතේ සංසිද්ධි පැහැදිලි කිරීම අවසානයේ යම් ගණිතයක් පමණි. මෙම ගණිතය බැලීමට වරෙක තෝරා ගත හැකි කාච කිහිපයක් තිබේ. මිනිසුන් භාවිතා කරන වඩාත් සුලභ වන්නේ ෆූරියේ ට්‍රාන්ස්ෆෝමරය (AKA ලාක්ෂණික ශ්‍රිතය) වන අතර එය "මම පියවර අනුගමනය කරමි, නමුත් කිසිවෙකු ඒ ගැන සිතන්නේ කෙසේද සහ ඇයි?" ඒ හා සමානව සමුච්චිතයන්, සාමාන්‍ය බෙදාහැරීම අද්විතීය වන අතර එහි ඉහළ සමුච්චිත සියල්ලම අතුරුදහන් වේ.

මම මෙහි වඩාත් මූලික ප්‍රවේශයක් පෙන්වන්නම්. එකතුව ලෙසZn=(def)X1++XnnZnVar(Xi)EXiZnZnnZnEXiVarXiE((ZnEZn)k)EXiVarXi . කාල්මන් අඛණ්ඩතා ප්‍රමේයයෙන් එය ප්‍රමාණවත් වේ.

Xiσ2Xi

k

E[(X1++Xnn)k]
nσ2

N(0,σ2)k|σ|kk!(k/2)!2k/2k

සාධනය: සලකා බලන්නE[(X1++Xnn)k]nk/2

nk/2|α|=k(kα1,,αn)i=1nE(Xiαi)
α1++αn=k
(αi0)

E(XaYb)=E(Xa)E(Yb)

Now if ever I have as one of my factors a plain old E(Xi), with exponent αi=1, then that whole term is zero, because E(Xi)=0 by assumption. So I need all the exponents αi1 in order for that term to survive. That pushes me toward using fewer of the Xi in each term, because each term has αi=k, and I have to have each αi>1 if it is >0. In fact, some simple arithmetic shows that at most k/2 of the αi can be nonzero, and that's only when k is even, and when I use only twos and zeros as my αi.

This pattern where I use only twos and zeros turns out to be very important...in fact, any term where I don't do that will vanish as the sum grows larger.

Lemma: The sum

nk/2|α|=k(kα1,,αn)i=1nE(Xiαi)
breaks up like
nk/2((terms where some αi=1)These are zero because EXi=0+(terms where αi's are twos andzeros)This part is O(nk/2) if k is even, otherwise no suchterms+(rest of terms)o(nk/2))

In other words, in the limit, all terms become irrelevant except

(1)nk/2(nk/2)(k2,,2)k/2 twosj=1k/2E(Xij2)

Proof: The main points are to split up the sum by which (strong) composition of k is represented by the multinomial α. There are only 2k1 possibilities for strong compositions of k, so the number of those can't explode as n. Then there is the choice of which of the X1,,Xn will receive the positive exponents, and the number of such choices is (n# positive terms in α)=O(n# positive terms in α). (Remember the number of positive terms in α can't be bigger than k/2 without killing the term.) That's basically it. You can find a more thorough description here on my website, or in section 2.2.3 of Tao's Topics in Random Matrix Theory, where I first read this argument.

And that concludes the whole proof. We’ve shown that all moments of X1++Xnn forget everything but EXi and E(Xi2) as n. And therefore swapping out the Xi with any variables with the same first and second moments wouldn't have made any difference in the limit. And so we may as well have taken them to be N(μ,σ2) to begin with; it wouldn't have made any difference.


**(If one wants to pursue more deeply the question of why n1/2 is the magic number here for vectors and for functions, and why the variance (square L2 norm) is the important statistic, one might read about why L2 is the only Lp space that can be an inner product space. Because 2 is the only number that is its own Holder conjugate.)

Another valid view is that n1/2 is not the only denominator can appear. There are different "basins of attraction" for random variables, and so there are infinitely many central limit theorems. There are random variables for which X1++XnnX, and for which X1++Xn1X! But these random variables necessarily have infinite variance. These are called "stable laws".

It's also enlightening to look at the normal distribution from a calculus of variations standpoint: the normal distribution N(μ,σ2) maximizes the Shannon entropy among distributions with a given mean and variance, and which are absolutely continuous with respect to the Lebesgue measure on R (or Rd, for the multivariate case). This is proven here, for example.


3
+1 I like this for its insight and elementary nature. In spirit it looks the same as the answer by jlewk.
whuber

1

මම බුද්ධිමත් අනුවාදයක් ඉදිරිපත් කිරීමට උත්සාහ කිරීම අත්හැර දමා අනුකරණයන් කිහිපයක් ඉදිරිපත් කළෙමි. ඔබ සතුව එක් විෂයක් සඳහා ප්‍රමාණවත් තරම් RT එකතු කළ හොත්, ක්වින්කන්ක්ස් සහ තවත් සමහරක් අනුකරණය කරන ඉදිරිපත් කිරීමක් මා සතුව ඇත. මම හිතන්නේ ඔවුන් උදව් කරන නමුත් ඔවුන් මේ වසරේ මගේ පන්තියට අලුත් වන අතර මම තවමත් පළමු පරීක්ෂණය ශ්‍රේණිගත කර නැත.

මම හොඳ යැයි සිතූ එක් දෙයක් නම් විශාල සංඛ්‍යාවක නීතිය පෙන්වීමට හැකිවීමයි. කුඩා සාම්පල ප්‍රමාණවලින් විචල්‍ය දේ ඇති ආකාරය මට පෙන්විය හැකි අතර පසුව ඒවා විශාල ඒවා සමඟ ස්ථාවර වන ආකාරය පෙන්විය හැකිය. මම තවත් විශාල සංඛ්‍යා නිරූපණ රාශියක් කරන්නෙමි. අහඹු ක්‍රියාවලි ගණන සහ සාම්පල සංඛ්‍යා අතර Quincunx හි අන්තර්ක්‍රියා මට පෙන්විය හැකිය.

(මගේ පන්තියේ හුණු හෝ සුදු ලෑල්ලක් භාවිතා කිරීමට නොහැකි වීම ආශීර්වාදයක් විය හැකිය)


හායි ජෝන්: අවුරුදු නවයකට ආසන්න කාලයකට පසු ඔබව මෙම තනතුර සමඟ නැවත දැකීම සතුටක්! සීඑල්ටී සහ එල්එල්එන් පිළිබඳ අදහස ඉගැන්වීම සඳහා ඔබ අනුකරණයන් භාවිතා කිරීම සමඟ මේ අතරතුර ඔබ ලැබූ අත්දැකීම් කියවීම සිත්ගන්නා සුළු වනු ඇත.
whuber

අවුරුද්දකට පසු මම එම පංතිය ඉගැන්වීම නැවැත්වූ නමුත් පසුව උපදේශකවරයා අනුකරණ අදහස ලබා ගත්තේය. ඇත්ත වශයෙන්ම, ඔහු එය බොහෝ දුරට ගෙන යන අතර දිලිසෙන යෙදුම් මාලාවක් නිපදවා ඇති අතර 250 පුද්ගල පන්තියේ දේවල් රාශියක් සඳහා සිසුන්ට සෙල්ලම් කිරීමට අවස්ථාව ලබා දී ඇත. ඉහළ පංතියට ඉගැන්වීමෙන් මට කිව හැකි තරම් ආසන්න වශයෙන් සිසුන් එයින් බොහෝ දේ ලබා ගන්නා බව පෙනේ. ඔහුගේ සිසුන් හා සමාන පෝෂක පන්තිවල අය අතර වෙනස කැපී පෙනේ. (නමුත්, ඇත්ත වශයෙන්ම, එහි පාලනය කළ නොහැකි විචල්‍යයන් රාශියක් ඇත)
ජෝන්

ස්තූතියි, ජෝන්. පංතියක් අවසන් වූ පසු කල්පවත්නා ශිෂ්‍ය ක්‍රියාකාරිත්වය පිළිබඳ පූර්ව ප්‍රතිපෝෂණයක් ලබා ගැනීම කොතරම් අසාමාන්‍යද යත්, මෙම සීමිත උනන්දුව පිළිබඳ තොරතුරු පවා මට හමු විය.
whuber

-8

ඔබ අහඹු බෙදාහැරීම් රාශියක් එකතු කරන විට සාමාන්‍ය බෙදාහැරීමේ හැඩය පවත්වා ගන්නේ එක් එක් හිස්ටෝග්‍රැම් සියල්ලටම දැනටමත් එම හැඩය ඇති නිසා හෝ ඔබට එම හැඩය ලැබෙන්නේ තනි හිස්ටෝග්‍රැම් වල උච්චාවචනයන් එකිනෙක අවලංගු වීමට හේතුව ඔබ විශාල ප්‍රමාණයක් එකතු කළහොත් ය. හිස්ටෝග්‍රෑම් ගණන. එක් විචල්‍යයක අහඹු ලෙස බෙදා හැරීමේ හිස්ටෝග්‍රැම් එකක් දැනටමත් දළ වශයෙන් බෙදා හැර ඇති අතර එය සාමාන්‍ය බෙදාහැරීම ඇමතීමට පටන් ගෙන ඇති නිසා එය සාමාන්‍ය දෙයක් වන අතර එය මධ්‍යම සීමාව ප්‍රමේයයේ අන්වීක්ෂයකි.

This is not the whole story but I think it's as intuitive as it gets.


2
“සාමාන්‍ය බෙදාහැරීමක්” පිළිබඳ ඔබේ විස්තරය ද්විත්ව on ාතීය විවික්ත අනුවාදයක් මෙන් පෙනේ, එය දුරස්ථව ගෝස්සියානු සාමාන්‍ය බෙදාහැරීමක් මෙන් නොවේ (හැරෙන්නට දෙකම ඒකාකාරී හා සමමිතික වේ). කාසි පෙරළීමේ හිස්ටෝග්‍රැම් හි සාධක මගින් අඩු වන බාර් නොමැත2එක් එක් පියවර සමඟ! එයින් ඇඟවෙන්නේ මෙම පැහැදිලි කිරීම තුළ යම් යම් දුෂ්කරතා ඇතිවිය හැකි බවයි.
whuber

5
This answer is mostly nonsense. No number of flips of a fair coin will result in a distribution of number of heads that has probabilities 18,14,12,14,18; indeed that is not even a probability mass function! Nor does the number of heads in a row have anything to do with the question.
Dilip Sarwate
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.