මධ්‍යම සීමාව ප්‍රමේයයට ඇති අවබෝධාත්මක පැහැදිලි කිරීම කුමක්ද?


155

විවිධ සන්දර්භයන් කිහිපයකදී, අප විසින් අනුගමනය කිරීමට අවශ්‍ය ඕනෑම සංඛ්‍යානමය ක්‍රමයක් සාධාරණීකරණය කිරීම සඳහා අපි මධ්‍යම සීමාවන් ප්‍රමේයයෙන් ඉල්ලා සිටිමු (උදා: සාමාන්‍ය බෙදාහැරීමකින් ද්විමාන ව්‍යාප්තිය ආසන්න වශයෙන්). ප්‍රමේයය සත්‍ය වන්නේ මන්ද යන්න පිළිබඳ තාක්‍ෂණික තොරතුරු මට වැටහී ඇති නමුත් දැන් මට සිදුවී ඇත්තේ මධ්‍යම සීමාව ප්‍රමේයය පිටුපස ඇති ප්‍රතිභානය මට නොතේරීමයි.

ඉතින්, මධ්‍යම සීමාව ප්‍රමේයය පිටුපස ඇති ප්‍රතිභානය කුමක්ද?

ලේමන් පැහැදිලි කිරීම් වඩාත් සුදුසු වනු ඇත. යම් තාක්ෂණික විස්තරයක් අවශ්‍ය නම් කරුණාකර මම පීඩීඑෆ්, සීඩීඑෆ්, සසම්භාවී විචල්‍ය යනාදිය පිළිබඳ සංකල්ප තේරුම් ගෙන ඇති නමුත් අභිසාරී සංකල්ප, ලාක්ෂණික කාර්යයන් හෝ මිනුම් න්‍යාය සමඟ කළ හැකි කිසිවක් පිළිබඳ දැනුමක් නොමැති බව උපකල්පනය කරන්න.


8
හොඳ ප්‍රශ්නයක් නම්, මගේ ක්ෂණික ප්‍රතිචාරය, මෙය ඉගැන්වීමේ මගේ සීමිත අත්දැකීම්වල පිටුබලය ඇතිව වුවද, සීඑල්ටී මුලදී බොහෝ මිනිසුන්ට අවබෝධයක් නොමැති වීමයි. ඕනෑම දෙයක් නම්, එය ප්‍රති-බුද්ධිමත් ය!
onestop

2
@onestop AMEN! n වැඩි වන විට p = 1/2 සමඟ ද්විමාන ව්‍යාප්තිය දෙස බැලීමෙන් පෙනී යන්නේ සීඑල්ටී සැඟවී ඇති බවයි - නමුත් ඒ සඳහා වන ප්‍රතිභාව සෑම විටම මගෙන් ගැලවී ඇත.
රොනාෆ්

2
හොඳ අදහස් කිහිපයක් ඇති සමාන ප්‍රශ්නය: stats.stackexchange.com/questions/643/…

1
පැහැදිලි කිරීමක් නොව මෙම අනුකරණය එය තේරුම් ගැනීමට උපකාරී වේ.
ඩේවිඩ් ලේන්

වාව්, ඔබ මධ්‍යම සීමාව ප්‍රමේයය, අභිසාරීතාව, දිගු වලිග සහ කැබලි අක්ෂර පිළිබඳ අපූරු නිබන්ධනයකට අතීත අතීත බුද්ධිය යාත්‍රා කළා. නිසැකවම "ඩී" පැත්තේ "ඔබට විස්තර සහිතව විස්මයට පත් කළ නොහැකි නම්, ඒවා ගොන් $ පහරකින් අවහිර කරන්න .:
මයික් ඇන්ඩර්සන්

Answers:


130

මෙම තනතුරේ දිග ගැන මම කල්තියාම සමාව අයදිමි: එය කිසිසේත්ම ප්‍රසිද්ධියේ ප්‍රකාශයට පත් කිරීම යම්කිසි භීතියකින් යුතුව සිදු වේ, මන්ද එය කියවීමට යම් කාලයක් හා අවධානයක් අවශ්‍ය වන අතර නිසැකවම යතුරු ලියන දෝෂ සහ නිරාවරණ අඩුපාඩු ඇති බැවිනි. ඔබේම ප්‍රතිචාරයන් තවදුරටත් විස්තාරණය කිරීම සඳහා සීඑල්ටී හි බොහෝ කොටස් එකක් හෝ කිහිපයක් හඳුනා ගැනීමට එය ඔබව දිරිමත් කරනු ඇතැයි යන බලාපොරොත්තුව ඇතිව ඉදිරිපත් කරන සිත් ඇදගන්නා සුළු මාතෘකාව කෙරෙහි උනන්දුවක් දක්වන අය සඳහා මෙන්න.


සීඑල්ටී "පැහැදිලි කිරීමට" බොහෝ උත්සාහයන් නිදර්ශන හෝ එය සත්‍ය බව තහවුරු කරන නැවත සකස් කිරීම් ය. සැබවින්ම විනිවිද යන, නිවැරදි පැහැදිලි කිරීමකට බොහෝ දේ පැහැදිලි කිරීමට සිදුවනු ඇත.

මෙය තවදුරටත් සොයා බැලීමට පෙර, සීඑල්ටී පවසන දේ පිළිබඳව පැහැදිලි වෙමු. ඔබ කවුරුත් දන්නා පරිදි, ඒවායේ සාමාන්‍යභාවයට වෙනස් වන අනුවාද ඇත. පොදු සන්දර්භය යනු අහඹු විචල්‍යයන්ගේ අනුක්‍රමයකි, ඒවා පොදු සම්භාවිතා අවකාශයක ඇතැම් කාර්යයන් වේ. විචක්ෂණ වස්තූන් සහිත කොටුවක් ලෙස සම්භාවිතා අවකාශයක් ගැන සිතීම ප්‍රයෝජනවත් බව මට තදින්ම දැනෙන පැහැදිලි කිරීම් සඳහා උපකාරී වේ. එම වස්තූන් කුමක් වුවත් කමක් නැත, නමුත් මම ඒවා "ටිකට්පත්" ලෙස හඳුන්වන්නෙමි. අපි පෙට්ටියක එක් “නිරීක්ෂණයක්” කරන්නේ ටිකට්පත් තරයේ මිශ්‍ර කර එකක් එළියට ගැනීමෙනි; එම ටිකට්පත නිරීක්‍ෂණයෙන් සමන්විත වේ. පසුකාලීන විශ්ලේෂණය සඳහා එය පටිගත කිරීමෙන් පසුව අපි ටිකට් පත කොටුව වෙත ආපසු යවන අතර එහි අන්තර්ගතය නොවෙනස්ව පවතී. “අහඹු විචල්‍යයක්” යනු එක් එක් ටිකට් පතේ ලියා ඇති අංකයකි.

1733 දී, ඒබ්‍රහම් ඩි මොයිව්රේ සලකා බැලුවේ ටිකට් පත් වල ඇති සංඛ්‍යා ශුන්‍ය හා ඒවා පමණක් වන ("බර්නූලි අත්හදා බැලීම්") තනි පෙට්ටියක ඇති අතර, එක් එක් අංකවලින් සමහරක් තිබේ. ඔහු කරමින් පරිකල්පනය n ශාරීරිකව ස්වාධීන වටිනාකම් අනුක්රමයක් උපයාගන්නා, නිරීක්ෂණ x1,x2,,xn , සියලු වන ශුන්ය හෝ එක් කෙනෙක් ම ය. මෙම මුදල අය වටිනාකම්, yn=x1+x2++xn, අහඹු වන්නේ එකතුවෙහි පද වන බැවිනි. එමනිසා, අපට මෙම ක්‍රියා පටිපාටිය බොහෝ වාරයක් පුනරාවර්තනය කළ හැකි නම්, විවිධ සංඛ්‍යාත (විවිධ සංඛ්‍යා 0 සිට n දක්වා පරාසයක ) විවිධ සංඛ්‍යාත සමඟ දිස් වේ - සමස්තයේ සමානුපාතිකයන්. (පහත රූප සටහන් බලන්න.)

දැන් යමෙක් අපේක්ෂා කරනු ඇත - සහ එය සත්‍යයකි - n හි ඉතා විශාල අගයන් සඳහා , සියලු සංඛ්‍යාත තරමක් කුඩා වනු ඇත. අප එසේ නිර්භීත (හෝ මෝඩ) "සීමාවක් ගැනීමට" හෝ "ඉඩ උත්සාහ ලෙස විය යුතු බව නම් n යන්න ", අප සියලු වාර අඩු බව නිවැරදිව නිගමනය කරන 0 . නමුත් අපි සංඛ්‍යාතවල හිස්ටෝග්‍රැම් එකක් අඳින්නේ නම්, එහි අක්ෂ ලේබල් කර ඇති ආකාරය පිළිබඳව කිසිදු අවධානයක් යොමු නොකර, විශාල n සඳහා වන හිස්ටෝග්‍රැම් සියල්ලම එක හා සමාන ලෙස පෙනෙන්නට පටන් ගන්නා බව අපට පෙනේ : යම් අර්ථයකින්, මෙම සංඛ්‍යා ලේඛන සංඛ්‍යාත වුවද සීමාවකට ළඟා වේ ඔවුන් සියල්ලම ශුන්‍යයට යයි.

හිස්ටෝග්‍රෑම්

මෙම සංඛ්‍යා ලේඛන මඟින් yn ලබා ගැනීමේ ක්‍රියා පටිපාටිය බොහෝ වාරයක් පුනරාවර්තනය කිරීමේ ප්‍රති results ල නිරූපණය කෙරේ . n යනු මාතෘකා වල ඇති “අත්හදා බැලීම් ගණන” වේ.

මෙහි තීක්ෂ්ණ බුද්ධිය නම් පළමුව හිස්ටෝග්‍රැම් ඇඳීම සහ පසුව එහි අක්ෂ ලේබල් කිරීමයි . විශාල n සමඟ හිස්ටෝග්‍රැම් විශාල අගයන් n/2 වටා (තිරස් අක්ෂය මත) සහ අතුරුදහන් වන පරිදි කුඩා අගයන් (සිරස් අක්ෂය මත) ආවරණය කරයි, මන්ද තනි සංඛ්‍යාත තරමක් කුඩා වන බැවිනි. සැළසුම් කරමින් කලාපය මෙම වක්රය සරිලන එහෙයින් දෙකම අවශ්ය වී යාමත් සමගිනි හා rescaling මෙම histogram ය. මෙම ගණිතමය නිරූපණය එක් එක් සඳහා බව ය n අපි සමහර මධ්යම අගය තෝරා ගත හැකිය mn මෙම histogram සහ සමහර පරිමාණ අගය ස්ථානගත කිරීම (අවශ්යයෙන්ම අනන්ය නොවන!) sn(අවශ්‍යයෙන්ම අද්විතීය නොවේ!) එය අක්ෂය තුළට ගැලපෙන පරිදි සකස් කිරීම. මෙම වෙනස් කිරීම මගින් ගණිතමය සිදු කළ හැක yn සඳහා zn=(ynmn)/sn .

හිස්ටෝග්‍රැම් එකක් සහ තිරස් අක්ෂය අතර ප්‍රදේශ අනුව සංඛ්‍යාත නිරූපණය කරන බව මතක තබා ගන්න . එබැවින් n හි විශාල අගයන් සඳහා මෙම හිස්ටෝග්‍රැම් වල ස්ථායිතාව ප්‍රදේශය අනුව ප්‍රකාශ කළ යුතුය. n ඒ නිසා, සිට කියන්නේ, මෙන් ඔබ වටිනාකම් ඕනෑම පරතරය ගන්න a කිරීමට b>a පරිදි, n වැඩි, එම histogram පැත්තෙන් ප්රදේශය නිරීක්ෂණය zn තිරස් අතට අන්තරය පුරා විහිදුන (a,b] . මෙම CLT කිහිපයක් තරයේ ප්රකාශ දේවල්:

  1. a සහ b කුමක් වුවත් , අපි mn සහ sn අනුපිළිවෙල සුදුසු පරිදි තෝරා ගන්නේ නම් ( a හෝ b මත කිසිසේත් රඳා නොපවතින ආකාරයට ), n විශාල වන විට මෙම ප්‍රදේශය සීමාවකට ළඟා වේ.

  2. මෙම අනුක්රමය mn හා sn පමණක් මත රඳා පවතින බව ආකාරයෙන් තෝරා හැක n ඇති කොටුව තුල අගයන් සාමාන්ය,, සහ එම අගයන් ව්යාප්ත යම් - එසේ බව නොතකා ය දේ - ඒත් වෙන කිසිම දෙයක් මත කොටුව, සීමාව සෑම විටම සමාන වේ. (මෙම විශ්වීය දේපල විශ්මයජනකයි.)

  3. විශේෂයෙන්, සීමා ප්රදේශයේ වක්රය යටතේ ප්රදේශයක් බව y=exp(z2/2)/2πaසහbඅතර 2 :: මෙය විශ්වීය සීමිත හිස්ටෝග්‍රැම් හි සූත්‍රයයි.

    සීඑල්ටී හි පළමු සාමාන්‍යකරණය එකතු කරයි,

  4. කොටුවට ශුන්‍ය හා ඒවාට අමතරව සංඛ්‍යා අඩංගු විය හැකි විට, හරියටම එකම නිගමනවලට එළඹේ (කොටුවේ ඇති අතිශය විශාල හෝ කුඩා සංඛ්‍යා වල අනුපාතය “ඉතා විශාල නොවේ” නම්, නිරවද්‍ය හා සරල ප්‍රමාණාත්මක ප්‍රකාශයක් ඇති නිර්ණායකයකි) .

    මීළඟ සාමාන්‍යකරණය, සහ සමහර විට වඩාත්ම විශ්මය ජනක එක, මෙම තනි ටිකට් පෙට්ටිය වෙනුවට ඇණවුම් කළ දින නියමයක් නැති දිගු පෙට්ටි ටිකට් පත් සමඟ ආදේශ කරයි. සෑම පෙට්ටියකටම එහි ටිකට් පත් වල විවිධ අනුපාතයන් තිබිය හැකිය. නිරීක්ෂණ x1 සෑදී ඇත්තේ පළමු කොටුවෙන් ටිකට් පතක් ඇඳීමෙනි, x2 දෙවන කොටුවෙන් පැමිණේ, සහ යනාදිය.

  5. පෙට්ටිවල අන්තර්ගතය “එතරම් වෙනස් නොවේ” යන්න හරියටම එකම නිගමනවල පවතී (“වඩා වෙනස් නොවන” යන්නෙහි අර්ථය නිරවද්‍ය, නමුත් වෙනස්, ප්‍රමාණාත්මක ලක්ෂණ කිහිපයක් ඇත; ඒවා විශ්මය ජනක අක්ෂාංශ ප්‍රමාණයකට ඉඩ දෙයි).

මෙම ප්‍රකාශ පහට අවම වශයෙන් පැහැදිලි කිරීම අවශ්‍ය වේ. තවත් බොහෝ දේ ඇත. සැකසුමෙහි කුතුහලය දනවන කරුණු කිහිපයක් සියලු ප්‍රකාශයන්හි ගම්‍ය වේ. උදාහරණයක් වශයෙන්,

  • මුදලේ විශේෂත්වය කුමක්ද? ඒවායේ ගණිතය හෝ ඒවායේ උපරිමය වැනි වෙනත් ගණිතමය සංයෝජනයන් සඳහා අපට මධ්‍යම සීමිත ප්‍රමේයයන් නැත්තේ ඇයි? (එය අපි හැරෙනවා, නමුත් ඔවුන් ඉතා එසේ සාමාන්ය නොවේ හෝ ඔවුන් හැම විටම ඔවුන් CLT දක්වා අඩු කර ගැනීමට හැකි නම් එවැනි පිරිසිදු, සරල නිගමනයකට ඇති කියලා.) වල අනුක්රමය mn හා sn අනන්ය නොවන නමුත් ඔවුන් ඉන්නේ පාහේ අවසානයේ ඔවුන් එකතුව අපේක්ෂාවන් ආසන්න කිරීමට ඇති බව අර්ථයෙන් සුවිශේෂී n ප්රවේශ පත්ර හා සම්මත අපගමනය පිළිවෙලින්, එම මුදලින් (මෙම CLT පළමු ප්රකාශ දෙකක්, හා සමාන, n කොටුවේ සම්මත අපගමනය මෙන් දෙගුණයක්).

    සම්මත අපගමනය යනු සාරධර්ම ව්‍යාප්ත වීමේ එක් මිනුමකි, නමුත් එය කිසිසේත්ම එකම එකක් නොවේ. එය histor තිහාසිකව හෝ බොහෝ යෙදුම් සඳහා වඩාත්ම “ස්වාභාවික” නොවේ. ( උදාහරණයක් ලෙස බොහෝ අය මධ්‍යන්‍යයෙන් නිරපේක්ෂ අපගමනය වැනි දෙයක් තෝරා ගනු ඇත .)

  • SD එතරම් අත්‍යවශ්‍ය ආකාරයකින් දිස්වන්නේ ඇයි?

  • සීමිත හිස්ටෝග්‍රැම් සඳහා සූත්‍රය සලකා බලන්න: එය එවැනි ස්වරූපයක් ගනු ඇතැයි අපේක්ෂා කළේ කවුද? සම්භාවිතා ity නත්වයේar ු ගණකය චතුරස්රාකාර ශ්‍රිතයක් බව එය පවසයි . මන්ද? මේ සඳහා යම් අවබෝධාත්මක හෝ පැහැදිලි, බලගතු පැහැදිලි කිරීමක් තිබේද?


ශ්‍රීකාන්ත්ගේ බුද්ධිමය හා සරල බව සඳහා වන අභියෝගාත්මක නිර්ණායක සපුරාලීමට තරම් සරල පිළිතුරු සැපයීමේ අවසාන ඉලක්කය කරා ළඟා වීමට මට නොහැකි බව මම පිළිගනිමි, නමුත් මම මෙම පසුබිම සකස් කර ඇත්තේ බොහෝ හිඩැස් පිරවීමට අන් අය පෙළඹෙනු ඇතැයි යන බලාපොරොත්තුවෙනි. මම අවසානයේ හොඳ උද්ඝෝෂණය ආකාරය වටිනාකම් අතර ක මූලික විශ්ලේෂණය කිරීම මත රඳා ඇත හිතන්නේ αn=asn+mn හා βn=bsn+mn එකතුව පිහිටුවා ඇති විය හැකි x1+x2++xn. සීඑල්ටී හි තනි කොටු අනුවාදය වෙත ආපසු යාම, සමමිතික ව්‍යාප්තියක් හැසිරවීමට වඩා සරල ය: එහි මධ්‍යන්‍යය එහි මධ්‍යන්‍යයට සමාන වේ, එබැවින් xi කොටුවේ මධ්‍යන්‍යයට වඩා අඩු වීමට 50% ක අවස්ථාවක් සහ 50% අවස්ථාවක් තිබේ බව xi එහි මධ්යන්ය වඩා වැඩි වනු ඇත. එපමණක් නොව, n ප්‍රමාණවත් තරම් විශාල වූ විට, මධ්යන්යයේ ධනාත්මක අපගමනය මධ්යන්යයේ negative ණාත්මක අපගමනයන්ට වන්දි ගෙවිය යුතුය. (මේ සඳහා අත් සේදීම පමණක් නොව, ප්‍රවේශමෙන් යුක්ති සහගත කිරීමක් අවශ්‍ය වේ.) මේ අනුව අප මූලික වශයෙන් සැලකිලිමත් විය යුත්තේ ධනාත්මක හා negative ණාත්මක අපගමනයන් ගණනය කිරීම හා ඒවායේ ප්‍රමාණයන් පිළිබඳ ද්විතියික සැලකිල්ලක් පමණි . (මා මෙහි ලියා ඇති සෑම දෙයකින්ම, සීඑල්ටී ක්‍රියා කරන්නේ ඇයිද යන්න පිළිබඳ යම් අවබෝධයක් ලබා දීමට මෙය වඩාත් ප්‍රයෝජනවත් විය හැකිය. ඇත්ත වශයෙන්ම, සීඑල්ටී හි සාමාන්‍යකරණයන් සත්‍ය බවට පත්කිරීමට අවශ්‍ය තාක්‍ෂණික උපකල්පනයන් අත්‍යවශ්‍යයෙන්ම විවිධ හැකියාවන් බැහැර කිරීමේ ක්‍රම වේ. දුර්ලභ දැවැන්ත අපගමනය මඟින් සීමිත හිස්ටෝග්‍රැම් පැන නැගීම වැළැක්වීමට ප්‍රමාණවත් ශේෂය අවුල් කරනු ඇත.)

කෙසේ වෙතත්, සීඑල්ටී හි පළමු සාමාන්‍යකරණය ඩි මොයිව්රේගේ මුල් බර්නූලි අත්හදා බැලීමේ අනුවාදයේ නොතිබූ කිසිවක් සැබවින්ම අනාවරණය නොවන්නේ මන්දැයි මෙයින් පෙන්නුම් කෙරේ.

මේ මොහොතේ දී එය කුඩා ගණිත කරන්න ඒ සඳහා කිසිවක් නැත වගේ නමුත්: අපි ගණන් කිරීමට අවශ්ය මධ්යන්යයේ සිට ධනාත්මක අපගමනය සංඛ්යාව ඕනෑම කලින් තීරණය අගය ඍණ අපගමනය සංඛ්යාව වෙනස් කළ හැකි පැහැදිලි ක්රම සංඛ්යාව k , පැහැදිලිවම k යනු n,n+2,,n2,n වලින් එකකි . නමුත් අතුරුදහන් වන පරිදි කුඩා දෝෂ සීමාව තුළ අතුරුදහන් වනු ඇති බැවින්, අපට හරියටම ගණන් ගත යුතු නැත; අපට අවශ්‍ය වන්නේ ගණන් කිරීම පමණයි. මේ සඳහා එය දැන ගැනීම ප්‍රමාණවත් වේ

The number of ways to obtain k positive and nk negative values out of n

equals nk+1k

times the number of ways to get k1 positive and nk+1 negative values.

(එය පරිපූර්ණ මූලික ප්‍රති result ලයකි, එබැවින් සාධාරණීකරණය ලිවීමට මම කරදර නොවෙමි.) දැන් අපි තොග වශයෙන් දළ වශයෙන් ගනිමු. k හැකි තරම් n/2 ආසන්න වන විට උපරිම සංඛ්‍යාතය සිදු වේ (මූලික ද වේ). m=n/2 ලියමු . එවිට, උපරිම සංඛ්‍යාතයට සාපේක්ෂව, m+j+1 ධනාත්මක අපගමනයන්ගේ සංඛ්‍යාතය ( j0 ) නිෂ්පාදිතය මගින් තක්සේරු කෙරේ

m+1m+1mm+2mj+1m+j+1

=11/(m+1)1+1/(m+1)12/(m+1)1+2/(m+1)1j/(m+1)1+j/(m+1).

ඩි මොයිව්රේ ලිවීමට වසර 135 කට පෙර, ජෝන් නේපියර් ගුණ කිරීම සරල කිරීම සඳහා ල ar ු ගණකය නිර්මාණය කළේය, එබැවින් අපි මෙයින් ප්‍රයෝජන ගනිමු. ආසන්න වශයෙන් භාවිතා කිරීම

log(1x1+x)=2x2x33+O(x5),

සාපේක්ෂ සංඛ්‍යාතයේ ලොගය දළ වශයෙන් බව අපට පෙනී යයි

2m+1(1+2++j)2(m+1)3(13+23++j3)=j2m+O(j4m3).

මෙම මුදලක් ශූන්යයක් සන්නිකර්ෂණය සඳහා දෝෂයක් විසින් නිසා j2/m ගණයේ j4/m3 , එම ආසන්න හොඳින් ලබා වෙහෙස විය යුතුයි j4 කුඩා ඥාතියෙකු වන m3 . එය අවශ්‍ය ප්‍රමාණයට වඩා j හි අගයන් විශාල ප්‍රමාණයක් ආවරණය කරයි . (එය ආසන්න සඳහා වැඩ කිරීම සඳහා ප්රමාණවත් j පමණක් අනුපිළිවෙල මත m asymptotically වඩා කුඩා වනm3/4 .)

එහි ප්‍රති z ලයක් ලෙස z = writing ලිවීම

z=2jm=j/n1/4n
සඳහාසම්මත අපගමනය,විසින් ලබා දී ප්රමාණයේ අපගමනය සාපේක්ෂ සංඛ්යාතයzසමානුපාතික විය යුතුයexp(z2/2)විශාල සඳහාm. මේ අනුව ඉහත # 3 හි ගෝස්සියානු නීතිය පෙනේ.


සීඑල්ටී හි අනෙක් ප්‍රකාශයන් යුක්ති සහගත කිරීම සඳහා මේ ආකාරයේ තවත් විශ්ලේෂණයක් ඉදිරිපත් කළ යුතු නමුත්, මට කාලය, අවකාශය සහ ශක්තිය ඉවර වී ඇති අතර මෙය කෙසේ හෝ කියවීමට පටන් ගත් පුද්ගලයින්ගෙන් 90% ක් මට අහිමි වී ඇත. මෙය ඉතා සරල ආසන්න, නමුත්, ආකාරය යෝජනා ද Moivre මුලින් එහි ලඝු ගණකය වූ quadratic කාර්යය වන අතර, නිසි පරිමාණ සාධකයක් බව, විශ්ව සීමා බෙදා ඇති බව සැක ඇති විය sn සමානුපාතික විය යුතුය n (පෙර සූත්‍රයේ හරය පෙන්වා ඇති පරිදි). කිසියම් ගණිතමය තොරතුරක් සහ තර්කනයක් ඉදිරිපත් නොකර මෙම වැදගත් ප්‍රමාණාත්මක සම්බන්ධතාවය පැහැදිලි කරන්නේ කෙසේදැයි සිතීම දුෂ්කර ය; ඊට වඩා අඩු යමක් සීමිත වක්‍රයේ හැඩය සම්පූර්ණ අභිරහසක් වනු ඇත.


7
+1 ඔබේ පිළිතුර ජීර්ණය කිරීමට මට යම් කාලයක් ගතවනු ඇත. මා විසින් පනවා ඇති සීමාවන් තුළ සීඑල්ටී සඳහා බුද්ධියක් ඉල්ලා සිටීම කළ නොහැකි දෙයක් බව මම පිළිගනිමි.

2
මෙය ලිවීමට කාලය ගැනීම ගැන ඔබට ස්තූතියි, එය මා දුටු සීඑල්ටී හි වඩාත්ම ප්‍රයෝජනවත් ප්‍රදර්ශනය වන අතර එය ගණිතමය වශයෙන් ද ප්‍රවේශ විය හැකිය.
ජෙරමි රැඩ්ක්ලිෆ්

1
ඔව්, තරමක් ense නයි .... බොහෝ ප්‍රශ්න. පළමු හිස්ටෝග්‍රැම් හි බාර් 2 ක් ඇත්තේ කෙසේද (අත්හදා බැලීම් 1 ක් පමණි!); මට එය නොසලකා හැරිය හැකිද? හා සමුළුව හරි, යම් histogram බාර් අතර තිරස් හිඩැස් වළක්වා ගැනීමට සාමාන්යයෙන්? (මන්ද, ඔබ පවසන පරිදි, ප්‍රදේශය වැදගත් වන අතර, ප්‍රදේශය අඛණ්ඩ (එනම් හිඩැස් නැත) වසමක් හරහා ගණනය කරනු ලැබේ)? ඉතින් මමත් හිඩැස් නොසලකා හරිනවා ...? මම එය තේරුම් ගැනීමට උත්සාහ කළ විට පවා මට හිඩැස් තිබුනි :)
රතු කව්පි

1
R TheRed ඔබගේ ප්‍රශ්න වලට ස්තූතියි. මෙම කරුණු ටිකක් පැහැදිලි කිරීම සඳහා මම මෙම ලිපියේ පළමු කොටස සංස්කරණය කර ඇත්තෙමි.
whuber

4
අහ්, ඔව්, මම "අත්හදා බැලීම් ගණන = =" නිරීක්ෂණ "" "වාර ගණනක් (මෙම සම්පූර්ණ ක්‍රියා පටිපාටියම) නැවත නැවතත්" සමඟ පටලවා ගතිමි . එබැවින් ටිකට් පතකට 0 හෝ 1 යන අගයන් දෙකේ වටිනාකම පමණක් තිබිය හැකි අතර ඔබ එක් ටිකට් පතක් පමණක් නිරීක්ෂණය කරන්නේ නම් , එම ටිකට් පත් වල අගයන් එකතුව විය හැක්කේ කරුණු දෙකෙන් එකක් පමණි : 0, හෝ 1 . එබැවින් ඔබේ පළමු හිස්ටෝග්‍රැම් බාර් දෙකක් ඇත. එපමණක් නොව, මෙම බාර්වල උස දළ වශයෙන් සමාන වේ 0 සහ 1 සමාන අනුපාතයකින් සිදුවනු ඇතැයි අපි අපේක්ෂා කරමු. n
රතු කව්පි

29

මා දන්නා ලස්සනම සජීවිකරණය: http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html

සමාන්තර පරතරයකින් යුත් තිරස් ස්ථර 8 ක්, සෑම ස්ථරයක්ම එකතැන පල්වෙමින්, මෙම පයින් හරහා බෝල වැටීම සඳහා "පැචින්කෝ / පින්බෝල්" විලාසිතාවේ බාධාවක් ඇති කරයි.  සෑම බෝලයක්ම පතුලේ වැටෙන අතර, බෝල ගොඩගැසෙන විට ඒවායේ උස ගවුසියානු වක්‍රයේ දළ සටහනකට ළඟා වේ.  මෙයින් පැහැදිලි වන්නේ බොහෝ ස්වාධීන අහඹු සිදුවීම්වල (ස්ථර) එකතුව, ප්‍රති aus ල ගෝස්සියානු ව්‍යාප්තියකට (ගොඩගැසී ඇති බෝල උස) හේතු වනු ඇති බවයි.

මා කියවා ඇති සරලම වචන: http://elonen.iki.fi/articles/centrallimit/index.en.html

ඔබ මෙම විසි දහයේ ප්‍රති results ල සාරාංශ කළහොත්, ඔබට ලැබෙන දෙය උපරිමයට වඩා 30-40, 60 (සියලුම හයේ) හෝ අනෙක් අතට, අවම, 10 (සියල්ලම) ට වඩා සමීප විය හැකිය.

මෙයට හේතුව වන්නේ අන්තයට වඩා විවිධාකාරයෙන් ඔබට මධ්‍යම අගයන් ලබා ගත හැකි වීමයි. උදාහරණය: ඩයිස් දෙකක් විසි කරන විට: 1 + 6 = 2 + 5 = 3 + 4 = 7, නමුත් 1 + 1 = 2 සහ 6 + 6 = 12 පමණි.

එනම්: එක් මරණයක් විසි කිරීමේදී ඔබට සංඛ්‍යා හයෙන් එක සමානව ලැබිය හැකි වුවද, අන්තයන් ඩයිස් කිහිපයක එකතුවක මැද අගයන්ට වඩා අඩු සම්භාවිතාවක් ඇත.


20

ප්‍රතිභානය යනු ව්‍යාකූල දෙයකි. අපේ අතේ ඇති න්‍යාය අපගේ පිටුපසට බැඳ තිබීම ඊටත් වඩා උපක්‍රමශීලී ය.

සීඑල්ටී යනු කුඩා, ස්වාධීන කැළඹීම්වල එකතුවකි. නියැදියේ අර්ථයෙන් “සාරාංශ” යන්නෙන් අදහස් වන්නේ සීමිත විචල්‍යතාවයේ (ජනගහනයේ) අර්ථයෙන් “ඉතා කුඩා” සහ මධ්‍යම (ජනගහන) අගයක් වටා ප්ලස් / us ණ යන අර්ථයෙන් “බාධා” යන්නයි.

මට නම්, ප්‍රතිභාවට වඩාත් කෙලින්ම ආයාචනා කරන උපකරණය වන්නේ ක්වින්කන්ක්ස් නොහොත් 'ගැල්ටන් පෙට්ටිය', විකිපීඩියාව බලන්න ('බෝංචි මැෂින්' සඳහා?) අදහස නම් දැලිසකින් සරසා ඇති පුවරුවක මුහුණට පහළින් කුඩා කුඩා බෝලයක් පෙරළීමයි. සමාන පරතරයකින් යුත් අල්ෙපෙනති. පන්දුව පහළට යන විට දකුණට සහ වමට හරවා (... අහඹු ලෙස, ස්වාධීනව) පතුලේ එකතු වේ. කාලයාගේ ඇවෑමෙන්, අපේ ඇස් ඉදිරිපිටම ලස්සන සීනුව හැඩැති පස් කන්දක් අපට පෙනේ.

සීඑල්ටී කියන්නේ එකම දෙයයි. එය මෙම සංසිද්ධිය පිළිබඳ ගණිතමය විස්තරයකි (වඩාත් නිවැරදිව කිවහොත්, quincunx යනු ද්විමය ව්‍යාප්තියට සාමාන්‍ය ආසන්න කිරීම සඳහා භෞතික සාක්ෂි වේ). ලිහිල් ලෙස කිවහොත්, සීඑල්ටී පවසන්නේ අපේ ජනගහනය ඕනෑවට වඩා වැරදි ලෙස හැසිරෙන්නේ නැති තාක් කල් (එනම්, පී.ඩී.එෆ් හි වලිග ප්‍රමාණවත් තරම් සිහින් නම්), එවිට නියැදි මධ්යන්යය (නිසි ලෙස පරිමාණයෙන්) හැසිරෙන්නේ එම කුඩා බෝලය මුහුණට පහළට පනින ආකාරයට ය quincunx: සමහර විට එය වමට වැටේ, සමහර විට එය දකුණට වැටේ, නමුත් බොහෝ විට එය මැද වටේට ගොඩබසිනු ඇත, ලස්සන සීනුවක හැඩයෙන්.

සීඑල්ටී හි මහිමය (මට) යටින් පවතින ජනගහනයේ හැඩය අදාල නොවේ. හැඩය භූමිකාවක් ඉටු කරන්නේ අප බලා සිටිය යුතු කාලය (නියැදි ප්‍රමාණය අනුව) නියම කරන බැවිනි.


19

සීඑල්ටී පිළිබඳ නිරීක්ෂණයක් පහත දැක්වේ. ඔබට අහඹු සංරචක විශාල ප්‍රමාණයක් ඇති විට, එකක් “වෙනදාට වඩා කුඩා” නම්, මෙය බොහෝ විට වන්දි ගෙවනු ලබන්නේ වෙනත් සමහර සංරචක “වෙනදාට වඩා විශාල” වීමෙනි. . වෙනත් වචන වලින් කිවහොත්, negative ණාත්මක අපගමනයන් සහ සං from ටකයෙන් ධනාත්මක අපගමනයන් යනු සාරාංශයේ දී එකිනෙකා අවලංගු කිරීමයි. පුද්ගලිකව, ඉතිරිව ඇති අපගමනයන් ඔබ සතුව ඇති පද වැඩි වැඩියෙන් සාමාන්‍ය ලෙස පෙනෙන බෙදාහැරීමක් සාදන්නේ මන්දැයි මට පැහැදිලි අවබෝධයක් නොමැත.

S=X1+X2++Xn

සීඑල්ටී හි බොහෝ අනුවාදයන් ඇත, සමහර ඒවා අනෙක් ඒවාට වඩා ශක්තිමත් ය, සමහරක් කොන්දේසි අතර මධ්‍යස්ථ යැපීමක් සහ / හෝ කොන්දේසි සඳහා සමාන නොවන බෙදාහැරීම් වැනි ලිහිල් කොන්දේසි සහිත ය. සීඑල්ටී හි සරලම-ඔප්පු කළ හැකි අනුවාද වලදී, සාධනය සාමාන්‍යයෙන් පදනම් වන්නේ එකතුවෙහි මොහොත උත්පාදනය කරන ශ්‍රිතය (හෝ ලැප්ලේස්-ස්ටීල්ට්ජෙස් පරිණාමනය හෝ වෙනත් සුදුසු the නත්වයේ වෙනත් පරිවර්තනයක්) මත ය . මෙය ටේලර් ව්‍යාප්තියක් ලෙස ලිවීම සහ වඩාත්ම ප්‍රමුඛ යෙදුම පමණක් තබා ගැනීම සාමාන්‍ය බෙදාහැරීමේ මොහොත උත්පාදනය කිරීමේ කාර්යය ඔබට ලබා දෙයි. එබැවින් මට පෞද්ගලිකව, සාමාන්‍යය යනු සමීකරණ සමූහයකින් එන දෙයක් වන අතර ඊට වඩා වැඩි අවබෝධයක් මට ලබා දිය නොහැක.S

එය මුදලක් ශ්රී ලංකා බෙදාහැරීමේ බව කෙසේ වෙතත් විශේෂයෙන් සඳහන් කළ යුතුය, කවදාවත් ඇත්තටම වේ සාමාන්යයෙන් බෙදා වත්, CLT එය කළ කියා නැත. නම් පරිමිත වන අතර, එහි සාමාන්ය බෙදාහැරීමේ හා නම් සමහර දුර තවමත් n = මධ්යන්ය සහ විචලතාව මෙන්ම අනන්ත ය යන දෙකම. අවසාන අවස්ථාවේ දී ඔබට අසීමිත මුදලෙහි මධ්‍යන්‍යය ගත හැකි නමුත් කිසිදු විචල්‍යතාවයකින් තොරව ඔබට නිශ්චිත සංඛ්‍යාවක් ලැබෙනු ඇත, එය “සාමාන්‍යයෙන් බෙදා හරින ලද” ලෙස ලේබල් කළ නොහැකි ය.nn=

මෙය සීඑල්ටී හි ප්‍රායෝගික යෙදීම් සමඟ ගැටලු ඇති කළ හැකිය. සාමාන්‍යයෙන්, ඔබ එහි මධ්‍යස්ථානයට ආසන්නව බෙදා හැරීමට කැමති නම් , CLT හොඳින් ක්‍රියා කරයි. කෙසේ වෙතත්, සාමාන්‍යයට අභිසාරී වීම සෑම තැනකම ඒකාකාරී නොවන අතර ඔබ තව දුරටත් කේන්ද්‍රයෙන් get ත් වන තරමට, ඔබට සාධාරණ ඇස්තමේන්තුවක් තිබිය යුතුය.S/n

සංඛ්‍යාලේඛනවල මධ්‍යම සීමාවන් ප්‍රමේයයේ සියලුම “පරිශුද්ධභාවය” සමඟින්, එහි සීමාවන් බොහෝ විට නොසලකා හරිනු ලැබේ. පහත දැක්වෙන්නේ මම මගේ පා ​​course මාලාවෙන් විනිවිදක දෙකක් ලබා දෙන අතර ඕනෑම ප්‍රායෝගික භාවිත අවස්ථාවක දී සීඑල්ටී වලිගය තුළ සම්පූර්ණයෙන්ම අසමත් වන බව පෙන්වා දෙයි. අවාසනාවකට මෙන්, දැනුවත්ව හෝ වෙනත් ආකාරයකින් වලිග සම්භාවිතාව තක්සේරු කිරීමට බොහෝ අය විශේෂයෙන් CLT භාවිතා කරති.

රූප විස්තරය මෙහි ඇතුළත් කරන්න රූප විස්තරය මෙහි ඇතුළත් කරන්න


6
මෙය විශිෂ්ට ද්‍රව්‍යමය හා wise ානවන්ත උපදෙස් වේ. අවාසනාවකට මෙන්, මට එය ඉහළ නැංවිය නොහැක, මන්ද “මෙම සාමාන්‍යය ගණිතමය කෞතුක වස්තුවක් වන අතර එය පිටුපස ඇති ගැඹුරු සත්‍යයක් හෝ බුද්ධියක් සෙවීම ප්‍රයෝජනවත් නොවේ යැයි මම සිතමි”. (1) න්‍යායාත්මකව අපට උපකාර කිරීම සඳහා අප ගණිතය මත විශ්වාසය නොතැබිය යුතු බවත් (2) ගණිතය මුලින් තේරුම් ගැනීමට කිසිදු තේරුමක් නැති බවත් ඔවුන් යෝජනා කරන බව පෙනේ. මෙම ත්‍රෙඩ් එකේ අනෙක් ලිපි දැනටමත් දෙවන ප්‍රකාශය සනාථ කිරීම සඳහා බොහෝ දුරක් යා හැකි යැයි මම බලාපොරොත්තු වෙමි. පළමුවැන්න එතරම්ම ස්වයං-නොගැලපීම නිසා එය තවදුරටත් විශ්ලේෂණය කිරීමක් සිදු නොවේ.
whuber

4
huhuber. ඔබ හරි, මම සමහර විට මගේ ලීගයෙන් ඉවත් වී සිටිමි. මම සංස්කරණය කරන්නම්.
StijnDeVuyst

5
ගැටළු සහගත කොටස නැවත සලකා බැලීමට ස්තූතියි, ඉතිරිය සඳහා විශාල +1.
whuber

9

මෙම පිළිතුර සරල කැල්කියුලස් ශිල්පීය ක්‍රම උපයෝගී කරගනිමින් මධ්‍යම සීමාව ප්‍රමේයයේ අර්ථවත් අර්ථයක් ලබා දීමට අපේක්ෂා කරයි (ටේලර් 3 වන අනුපිළිවෙල පුළුල් කිරීම). දළ සටහන මෙන්න:

  1. සීඑල්ටී කියන දේ
  2. සරල ගණනය කිරීම් භාවිතා කරමින් සීඑල්ටී පිළිබඳ අවබෝධාත්මක සාක්ෂියක්
  3. සාමාන්‍ය බෙදාහැරීම ඇයි?

සාමාන්‍ය බෙදා හැරීම අපි අවසානයේ සඳහන් කරන්නෙමු; මක්නිසාද යත්, සාමාන්‍ය ව්‍යාප්තිය අවසානයේදී ඉහළට එන්නේ එතරම් බුද්ධියක් නොදක්වන බැවිනි.

1. මධ්‍යම සීමාව ප්‍රමේයයෙන් කියැවෙන්නේ කුමක්ද? සීඑල්ටී හි අනුවාද කිහිපයක්

සීඑල්ටී හි විචිත්‍ර අනුවාද කිහිපයක් තිබේ. සීඑල්ටී හි පෙළපොත් ප්‍රකාශයේ දැක්වෙන්නේ ඕනෑම තාත්වික x සහ ස්වාධීන සසම්භාවී විචල්‍යයන් වන X1,,Xn ශුන්‍ය මධ්යන්ය හා විචල්‍යතාව 1, යනු කුමක් ද යන්න සම්බන්ධයෙන් වටහා ගැනීමටවිශ්වසහඉවෙන්මෙම CLT ගැන, අපි මොහොතකට සීමාව අමතක කරමු. ඉහත ප්‍රකාශයෙන් කියවෙන්නේX1නම්. ,,

P(X1++Xnnx)n+xet2/22πdt.
X1.,,Xn හාZ1,,Zn ස්වාධීන සසම්භාවී විචල්යයන් අනුපිළිවෙලවල්, දෙකක් ශුන්ය-පහත් සහ විචලතාව 1 එක් එක්, එවිට ය සෑම දර්ශකයක් උත්සවය සඳහාfආකෘති, සමහර ස්ථාවර සැබෑ සඳහාx, f(t)={1 නම් ටී<x
E[f(X1++Xnn)]E[f(Z1++Znn)]n+0
fx
f(t)={1 if t<x0 if tx.
X1,,XnසහZ1,,Zn හි නිශ්චිත බෙදාහැරීම් නොසලකා සීමාව සමාන බව පෙර සංදර්ශනයෙන් නිරූපණය වේ.Z1,,Zn, සසම්භාවී විචල්යයන් මධ්යන්ය ශුන්ය, විචල්යතාව සමඟ ස්වාධීන වන බව සපයා ඇත.

සීඑල්ටී හි තවත් සමහර අනුවාදවල ලිප්ස්චිටිස් ශ්‍රිත 1 ක් මායිම් කර ඇත. සීඑල්ටී හි තවත් සමහර අනුවාදයන් k හි අනුපිළිවෙලින් සීමිත ව්‍යුත්පන්නයක් සහිත සුමට ශ්‍රිතවල පන්තිය ගැන සඳහන් කරයිk . අනුක්රමය දෙකක් සලකා බලන්න X1,,Xn හා Z1,,Zn ඉහත සඳහන් ලෙස, සමහර උත්සවය සඳහා f , එම ශ්රේණිය අභිසාරී ප්රතිඵලයක් (CONV)

(CONV)E[f(X1++Xnn)]E[f(Z1++Znn)]n+0

පහත දැක්වෙන ප්‍රකාශ අතර සමානතාව ("නම් සහ පමණක් නම්") ස්ථාපිත කළ හැකිය:

  1. (CONV) ඉහත සෑම දර්ශකයක් කාර්යයන් සඳහා පවත්වයි f ආකෘති f(t)=1 සඳහා t<x හා f(t)=0 සඳහා tx සමහර ස්ථාවර සැබෑ සඳහා x .
  2. (CONV) සෑම මායිම් ලිප්ස්චිට්ස් ශ්‍රිතයක් සඳහාම f:RR .
  3. (CONV) සෑම සුමට (එනම්, සත්ය C සංයුක්ත ආධාරයෙන් ) කාර්යයන් .
  4. (CONV) සෑම කාර්යයක් සඳහාම දරයි f සමඟ දිගින් දිගටම අවකල්ය තුනක්supxR|f(x)|1 .

ඉහත සඳහන් කරුණු 4 න් එක් එක් අභිසාරීතාව විශාල පන්තියේ ශ්‍රිතයක් සඳහා පවතින බව පවසයි. තාක්‍ෂණික දළ විශ්ලේෂණයකින් කෙනෙකුට ඉහත කරුණු හතර සමාන බව පෙන්විය හැකිය, අපි ඩේවිඩ් පොලාර්ඩ්ගේ පොතේ 7 වන පරිච්ඡේදයේ 77 වන පිටුවට යොමු කරමු. සෛද්ධාන්තික බඹලොව මැනීමට ඒ පරිශීලක මාර්ගෝපදේශය මෙම පිළිතුර ඉතා දේවානුභාවයෙන් වන සිට.

මෙම පිළිතුරේ ඉතිරි කොටස සඳහා අපගේ උපකල්පනය ...

අපි උපකල්පනය කරමු supxR|f(x)|Cනියත C>0 සඳහා C , එය ඉහත ලක්ෂ්‍යයට අනුරූප වේ. සසම්භාවී විචල්‍යයන්ට සීමිත, සීමිත තුන්වන මොහොතක් ඇතැයි අපි උපකල්පනය කරමු: E[|Xi|3] සහ E[|Zi|3] සීමිතයි.

2. E[f(X1++Xnn)] විශ්ව: එය බෙදාහැරීම මත පදනම් නොවී,X1,...,Xn

මෙම ප්‍රමාණය විශ්වීය බව (කුඩා දෝෂ පදයක් දක්වා) පෙන්වමු, එය ස්වාධීන අහඹු විචල්‍යයන්ගේ එකතුවක් මත රඳා නොපවතින අර්ථයෙන්. ගන්න X1,,Xn හාZ1,,Zn ස්වාධීන සසම්භාවී විචල්යයන්, අදහස් 0 සහ විචලතාව 1 එක් එක්, හා සීමිත තෙවන මොහොතේ අනුපිළිවෙලවල්, දෙකක්.

අදහස iteratively ප්රතිස්ථාපනය කිරීමයි Xi විසින් Zi (අදහස, මම විශ්වාස කරනවා, Lindeberg නියමිත) ප්රමාණය එක් හා මූලික කලනයේ විසින් වෙනස පාලනය කරයි. ටේලර් ප්‍රසාරණයකින්, W=Z1++Zn1 , සහ h(x)=f(x/n)ඉන්පසු

h(Z1++Zn1+Xn)=h(W)+Xnh(W)+Xn2h(W)2+Xn3/h(Mn)6h(Z1++Zn1+Zn)=h(W)+Znh(W)+Zn2h(W)2+Zn3h(Mn)6
මෙහිMnසහMnයනු මධ්‍යන්‍ය අගය ප්‍රමේයයෙන් ලබා දෙන මධ්‍ය ලක්ෂ්‍ය වේ. රේඛා දෙකෙහිම අපේක්ෂාව සැලකිල්ලට ගනිමින්, ශුන්‍ය අනුපිළිවෙල පදය සමාන වේ, පළමු ඇණවුම් පද අපේක්ෂාවෙන් සමාන වේ, මන්දXnසහWස්වාධීන වීමෙන්,E[Xnh(W)]=E[Xn]E[h(W)]=0ඒ හා සමානව දෙවන පේළිය සඳහා. නැවතත් නිදහස අනුව, දෙවන අනුපිළිවෙල අපේක්ෂාවෙන් සමාන වේ. ඉතිරිව ඇති එකම පද තෙවන අනුපිළිවෙල වන අතර අපේක්ෂාවෙන් පේළි දෙක අතර වෙනස උපරිම වශයෙන් මෙහිCතුන්වන ව්යුත්පන්න මත ඉහළ බැඳී ඇත. මෙම හරය(

(C/6)E[|Xn|3+|Zn|3](n)3.
Cf(n)3නිසා දර්ශණයh(t)=f(t/n)/(n)3. ස්වාධීනත්වය අනුව,ඉහත සංදර්ශනයට වඩා විශාල දෝෂයක් ඇති නොවී Z n මගින් එය ප්‍රතිස්ථාපනය කළ හැකි බැවින් එකතුවෙහිXn හිදායකත්වයඅර්ථ විරහිත ය!Zn

අපි දැන් වෙනුවට යළිත් අවධාරණය Xn1 විසින් Zn1 . නම් W~=Z1+Z2++Zn2+Xn එසේ නම්

h(Z1++Zn2+Xn1+Xn)=h(W~)+Xn1h(W~)+Xn12h(W~)2+Xn13/h(M~n)6h(Z1++Zn2+Zn1+Xn)=h(W~)+Zn1h(W~)+Zn12h(W~)2+Zn13/h(M~n)6.
ස්වාධීනත්වය විසින්Zn1හාW~, සහ ස්වාධීනත්වය විසින්Xn1හාW~, නැවත ශුන්යාදී, පළමු හා දෙවන නියෝගයක් අනුව මාර්ග දෙකම සඳහා අපේක්ෂාවෙන් සමාන වේ. පේළි දෙක අතර අපේක්ෂාවේ වෙනස නැවතත් උපරිම වශයෙන් අපි ඒ වෙනුවට දක්වා එල්ලාවල මහතා තබාZi'සමග sXis' '. එක් එක් දී කරන ලද වැරදි එකතු කිරීම මඟින්nපියවර, අපි ලබා | E[f(X1++Xn

(C/6)E[|Xn1|3+|Zn1|3](n)3.
ZiXin ලෙසnවැඩි තෙවන අවස්ථාවලදී හෝ සසම්භාවී විචල්යයන් (ඒක නඩුව උපකල්පනය කරමු) පරිමිත නම්., දකුණු අත පැත්තේ අත්තනෝමතික කුඩා බවට පත් මෙයින් අදහස් කරන්නේ වම් පැත්තේ අපේක්ෂාවන් අත්තනෝමතික ලෙස එකිනෙකට සමීප වන බවයි,X1,,Xnහි ව්‍යාප්තියZ1,,Znට වඩා බොහෝ දුරට වෙනස් වුවද. ස්වාධීනත්වය අනුව, එක් එක්Xiහි එකතුවෙහි අර්ථය අර්ථ විරහිත වන්නේ එයOට වඩා විශාල දෝෂයක් නොමැතිවZiමගින් ප්‍රතිස්ථාපනය කළ හැකි බැවිනි.
|E[f(X1++Xnn)]E[f(Z1++Znn)]|n(C/6)maxi=1,,nE[|Xi|3+|Zi|3](n)3.
nX1,,XnZ1,,ZnXiZiO(1/(n)3). සියලු වෙනුවටXi'විසින් sZiහි වඩා විසින් ප්රමාණය වෙනස් නොවේ'O(1/n) .

අපේක්ෂාව E[f(X1++Xnn)]මේ අනුව විශ්වීය වේ, එයX1,,Xnබෙදා හැරීම මත රඳා නොපවතී. අනෙක් අතට, ස්වාධීනත්වය සහE[Xi]=E[Zi]=0,E[Zi2]=E[Xi2]=1 ඉහත සීමාවන් සඳහා අතිශයින්ම වැදගත් විය.

3. සාමාන්‍ය ව්‍යාප්තිය ඇයි?

අපේක්ෂාව E [ f ( X 1 + + X n) බව අපි දැක ඇත්තෙමුE[f(X1++Xnn)]Xiහි ව්‍යාප්තිය කුමක් වුවත්, කුඩා අනුපිළිවෙලක් දක්වා සමාන වේO(1/n) .

නමුත් යෙදුම් සඳහා, එවැනි ප්රමාණයක් ගණනය කිරීම ප්රයෝජනවත් වනු ඇත. එය ද මෙම ප්රමාණය සඳහා සරල ප්රකාශනය ලබා ගැනීමට ප්රයෝජනවත් වනු ඇත E[f(X1++Xnn)].

X1,,Xn ඕනෑම එකතුවකට මෙම ප්‍රමාණය සමාන බැවින් බෙදා හැරීම ( X 1 + +) වැනි එක් විශේෂිත එකතුවක් අපට තෝරා ගත හැකිය.(X1++Xn)/n ගණනය කිරීම පහසුය හෝ මතක තබා ගැනීම පහසුය.

සාමාන්‍ය බෙදාහැරීම N(0,1) , මෙම ප්‍රමාණය සැබවින්ම සරල වන බව පෙනේ. ඇත්ත වශයෙන්ම, Z1,,Zn iid N(0,1) නම් Z1++Znn හිN(0,1)ව්‍යාප්තිය ද ඇති අතර එයnමත රඳා නොපවතී! එබැවින්ZN(0,1)නම්, සහ ඉහත තර්කය අනුව,X1,,XnසමඟE[Xi]=0,E[X2i]=1, එවිට

E[f(Z1++Znn)]=E[f(Z)],
X1,,XnE[Xi]=0,E[Xi2]=1

|E[f(X1++Xnn)]E[f(Z)|supxR|f(x)|maxi=1,,nE[|Xi|3+|Z|3]6n.

ඔබ සීඑල්ටී වලට වඩා විශාල සංඛ්‍යාවක් පිළිබඳ නීතියක් තහවුරු කරන බවක් පෙනේ .
whuber

2
ඔබ මෙය කියන්නේ ඇයිදැයි මට විශ්වාස නැත. ඉහත බේදය සාක්ෂියක් ලබා වෙත අභිසාරී[f(Z)]එහිදීZ~N(0,1)කාර්යයන් විශාල පන්තිය සඳහාf. මෙය සීඑල්ටී ය. E[f((X1+...+Xn)/n)]E[f(Z)]ZN(0,1)f
jlewk

2
ඔබ අදහස් කරන දෙය මට වැටහෙනවා. මට විරාමයක් ලබා දෙන්නේ ඔබේ ප්‍රකාශය ගැන සැලකිලිමත් වන්නේ අපේක්ෂාවන් මිස බෙදාහැරීම් නොවන අතර සීඑල්ටී විසින් සීමිත බෙදාහැරීමක් පිළිබඳ නිගමනවලට එළඹීමයි. මේ දෙක අතර සමානතාවය බොහෝ දෙනෙකුට ක්ෂණිකව නොපෙනේ. එසේ නම්, බෙදාහැරීම් සීමා කිරීම සම්බන්ධයෙන් ඔබේ ප්‍රකාශය සහ සීඑල්ටී හි සුපුරුදු ප්‍රකාශ අතර පැහැදිලි සම්බන්ධතාවයක් ලබා දෙන ලෙස මම යෝජනා කළ හැකිද? (මාර්ගය විසින් +1: මෙම තර්කය විස්තාරනය කරමින් ඔබට ස්තුතියි.)
whuber

1
ඇත්තෙන්ම විශිෂ්ට පිළිතුරකි. මම මෙය කුං-ෆු හි ලාක්ෂණික ශ්‍රිතයට වඩා බොහෝ බුද්ධිමත් බව පෙනේ.
එරික් ඕල්ඩ්

3

ඇයි n වෙනුවටn? සාමාන්‍යයෙන් මෙම අමුතු අනුවාදය කුමක්ද?

x1,,xnx1++xnn.n

ස්වාධීන අහඹු විචල්‍යයන් සහ විකලාංග දෛශික අතර ගැඹුරු සම්බන්ධතාවයක් ඇත. සසම්භාවී විචල්‍යයන් ස්වාධීන වන විට, එයින් මූලික වශයෙන් අදහස් වන්නේ ඒවා ශ්‍රිතයේ දෛශික අවකාශයක විකලාංග දෛශික බවයි.

(එම උත්සවයට අවකාශය මම උධෘත වේ L2 , සහ සසම්භාවී විචල්යයක් විචලතාව X වන්නේ හුදෙක් XμL22 .. පුදුමයක් විචලතාව ස්වාධීන අහඹු විචල්ය ආකලන වේ ඒ නිසා වගේ යන්තම්x+y2=x2+y2xy

සාමාන්‍ය බෙදාහැරීම ඇයි?

ටික වේලාවක් මාව ව්‍යාකූල කළ, කාරණයේ හදවතේ ඇතැයි මා සිතන එක් දෙයක් නම් පහත සඳහන් ප්‍රශ්නයයි.

එකතුව වන්නේ ඇයි?X1++XnnnXi

මෙය විශාල සංඛ්‍යා සංසිද්ධියේ නීතියට සමානය:

X1++Xnnn විශාල) 1 වන මොහොත ගැන පමණක් සැලකිලිමත් වේ (මධ්‍යන්‍ය).

Xi ස්වාධීන .)

මෙම සංසිද්ධිය ප්‍රකාශ කිරීම සඳහා වඩාත් පැහැදිලි ක්‍රමයක් නම්: එකතුවෙන්X1++XnnXinමේ මොහොතේ සාපේක්ෂව විශාල වන .

එය සත්‍ය වන්නේ මන්දැයි අප තේරුම් ගන්නේ නම්, අපි මධ්‍යම සීමාව ප්‍රමේයය තේරුම් ගනිමු . මොකද අපි X i ගන්නත් පුළුවන්Xi පළමු හා දෙවන මොහොත සමඟ සාමාන්‍ය තත්වයට ගෙන යා හැකි අතර, එම අවස්ථාවේ දී අපි දනිමුX1++Xnnnn . සාමාන්‍ය බෙදාහැරීම තුළ මෙම විශේෂ දේපල ("ස්ථායිතාව") ඇති බැවින් ඔබට ස්වාධීන සාමාන්‍ය දෙකක් එකතු කර තවත් සාමාන්‍යයක් ලබා ගත හැකිය. වොයිලා.

පළමු හා දෙවන මොහොතේ සංසිද්ධි පැහැදිලි කිරීම අවසානයේ යම් ගණිතයක් පමණි. මෙම ගණිතය බැලීමට වරෙක තෝරා ගත හැකි කාච කිහිපයක් තිබේ. මිනිසුන් භාවිතා කරන වඩාත් සුලභ වන්නේ ෆූරියේ ට්‍රාන්ස්ෆෝමරය (AKA ලාක්ෂණික ශ්‍රිතය) වන අතර එය "මම පියවර අනුගමනය කරමි, නමුත් කිසිවෙකු ඒ ගැන සිතන්නේ කෙසේද සහ ඇයි?" ඒ හා සමානව සමුච්චිතයන්, සාමාන්‍ය බෙදාහැරීම අද්විතීය වන අතර එහි ඉහළ සමුච්චිත සියල්ලම අතුරුදහන් වේ.

මම මෙහි වඩාත් මූලික ප්‍රවේශයක් පෙන්වන්නම්. එකතුව ලෙසZn=(def)X1++XnnZnVar(Xi)EXiZnZnnZnEXiVarXiE((ZnEZn)k)EXiVarXi . කාල්මන් අඛණ්ඩතා ප්‍රමේයයෙන් එය ප්‍රමාණවත් වේ.

Xiσ2Xi

k

E[(X1++Xnn)k]
nσ2

N(0,σ2)k|σ|kk!(k/2)!2k/2k

සාධනය: සලකා බලන්නE[(X1++Xnn)k]nk/2

nk/2|α|=k(kα1,,αn)i=1nE(Xiαi)
α1++αn=k
(αi0)

E(XaYb)=E(Xa)E(Yb)

Now if ever I have as one of my factors a plain old E(Xi), with exponent αi=1, then that whole term is zero, because E(Xi)=0 by assumption. So I need all the exponents αi1 in order for that term to survive. That pushes me toward using fewer of the Xi in each term, because each term has αi=k, and I have to have each αi>1 if it is >0. In fact, some simple arithmetic shows that at most k/2 of the αi can be nonzero, and that's only when k is even, and when I use only twos and zeros as my αi.

This pattern where I use only twos and zeros turns out to be very important...in fact, any term where I don't do that will vanish as the sum grows larger.

Lemma: The sum

nk/2|α|=k(kα1,,αn)i=1nE(Xiαi)
breaks up like