155

විවිධ සන්දර්භයන් කිහිපයකදී, අප විසින් අනුගමනය කිරීමට අවශ්‍ය ඕනෑම සංඛ්‍යානමය ක්‍රමයක් සාධාරණීකරණය කිරීම සඳහා අපි මධ්‍යම සීමාවන් ප්‍රමේයයෙන් ඉල්ලා සිටිමු (උදා: සාමාන්‍ය බෙදාහැරීමකින් ද්විමාන ව්‍යාප්තිය ආසන්න වශයෙන්). ප්‍රමේයය සත්‍ය වන්නේ මන්ද යන්න පිළිබඳ තාක්‍ෂණික තොරතුරු මට වැටහී ඇති නමුත් දැන් මට සිදුවී ඇත්තේ මධ්‍යම සීමාව ප්‍රමේයය පිටුපස ඇති ප්‍රතිභානය මට නොතේරීමයි.

ඉතින්, මධ්‍යම සීමාව ප්‍රමේයය පිටුපස ඇති ප්‍රතිභානය කුමක්ද?

ලේමන් පැහැදිලි කිරීම් වඩාත් සුදුසු වනු ඇත. යම් තාක්ෂණික විස්තරයක් අවශ්‍ය නම් කරුණාකර මම පීඩීඑෆ්, සීඩීඑෆ්, සසම්භාවී විචල්‍ය යනාදිය පිළිබඳ සංකල්ප තේරුම් ගෙන ඇති නමුත් අභිසාරී සංකල්ප, ලාක්ෂණික කාර්යයන් හෝ මිනුම් න්‍යාය සමඟ කළ හැකි කිසිවක් පිළිබඳ දැනුමක් නොමැති බව උපකල්පනය කරන්න.

intuition central-limit-theorem

8

හොඳ ප්‍රශ්නයක් නම්, මගේ ක්ෂණික ප්‍රතිචාරය, මෙය ඉගැන්වීමේ මගේ සීමිත අත්දැකීම්වල පිටුබලය ඇතිව වුවද, සීඑල්ටී මුලදී බොහෝ මිනිසුන්ට අවබෝධයක් නොමැති වීමයි. ඕනෑම දෙයක් නම්, එය ප්‍රති-බුද්ධිමත් ය!

— onestop

2

@onestop AMEN! n වැඩි වන විට p = 1/2 සමඟ ද්විමාන ව්‍යාප්තිය දෙස බැලීමෙන් පෙනී යන්නේ සීඑල්ටී සැඟවී ඇති බවයි - නමුත් ඒ සඳහා වන ප්‍රතිභාව සෑම විටම මගෙන් ගැලවී ඇත.

— රොනාෆ්

2

හොඳ අදහස් කිහිපයක් ඇති සමාන ප්‍රශ්නය: stats.stackexchange.com/questions/643/…

1

පැහැදිලි කිරීමක් නොව මෙම අනුකරණය එය තේරුම් ගැනීමට උපකාරී වේ.

— ඩේවිඩ් ලේන්

වාව්, ඔබ මධ්‍යම සීමාව ප්‍රමේයය, අභිසාරීතාව, දිගු වලිග සහ කැබලි අක්ෂර පිළිබඳ අපූරු නිබන්ධනයකට අතීත අතීත බුද්ධිය යාත්‍රා කළා. නිසැකවම "ඩී" පැත්තේ "ඔබට විස්තර සහිතව විස්මයට පත් කළ නොහැකි නම්, ඒවා ගොන් $ පහරකින් අවහිර කරන්න .:

— මයික් ඇන්ඩර්සන්

130

මෙම තනතුරේ දිග ගැන මම කල්තියාම සමාව අයදිමි: එය කිසිසේත්ම ප්‍රසිද්ධියේ ප්‍රකාශයට පත් කිරීම යම්කිසි භීතියකින් යුතුව සිදු වේ, මන්ද එය කියවීමට යම් කාලයක් හා අවධානයක් අවශ්‍ය වන අතර නිසැකවම යතුරු ලියන දෝෂ සහ නිරාවරණ අඩුපාඩු ඇති බැවිනි. ඔබේම ප්‍රතිචාරයන් තවදුරටත් විස්තාරණය කිරීම සඳහා සීඑල්ටී හි බොහෝ කොටස් එකක් හෝ කිහිපයක් හඳුනා ගැනීමට එය ඔබව දිරිමත් කරනු ඇතැයි යන බලාපොරොත්තුව ඇතිව ඉදිරිපත් කරන සිත් ඇදගන්නා සුළු මාතෘකාව කෙරෙහි උනන්දුවක් දක්වන අය සඳහා මෙන්න.

සීඑල්ටී "පැහැදිලි කිරීමට" බොහෝ උත්සාහයන් නිදර්ශන හෝ එය සත්‍ය බව තහවුරු කරන නැවත සකස් කිරීම් ය. සැබවින්ම විනිවිද යන, නිවැරදි පැහැදිලි කිරීමකට බොහෝ දේ පැහැදිලි කිරීමට සිදුවනු ඇත.

මෙය තවදුරටත් සොයා බැලීමට පෙර, සීඑල්ටී පවසන දේ පිළිබඳව පැහැදිලි වෙමු. ඔබ කවුරුත් දන්නා පරිදි, ඒවායේ සාමාන්‍යභාවයට වෙනස් වන අනුවාද ඇත. පොදු සන්දර්භය යනු අහඹු විචල්‍යයන්ගේ අනුක්‍රමයකි, ඒවා පොදු සම්භාවිතා අවකාශයක ඇතැම් කාර්යයන් වේ. විචක්ෂණ වස්තූන් සහිත කොටුවක් ලෙස සම්භාවිතා අවකාශයක් ගැන සිතීම ප්‍රයෝජනවත් බව මට තදින්ම දැනෙන පැහැදිලි කිරීම් සඳහා උපකාරී වේ. එම වස්තූන් කුමක් වුවත් කමක් නැත, නමුත් මම ඒවා "ටිකට්පත්" ලෙස හඳුන්වන්නෙමි. අපි පෙට්ටියක එක් “නිරීක්ෂණයක්” කරන්නේ ටිකට්පත් තරයේ මිශ්‍ර කර එකක් එළියට ගැනීමෙනි; එම ටිකට්පත නිරීක්‍ෂණයෙන් සමන්විත වේ. පසුකාලීන විශ්ලේෂණය සඳහා එය පටිගත කිරීමෙන් පසුව අපි ටිකට් පත කොටුව වෙත ආපසු යවන අතර එහි අන්තර්ගතය නොවෙනස්ව පවතී. “අහඹු විචල්‍යයක්” යනු එක් එක් ටිකට් පතේ ලියා ඇති අංකයකි.

1733 දී, ඒබ්‍රහම් ඩි මොයිව්රේ සලකා බැලුවේ ටිකට් පත් වල ඇති සංඛ්‍යා ශුන්‍ය හා ඒවා පමණක් වන ("බර්නූලි අත්හදා බැලීම්") තනි පෙට්ටියක ඇති අතර, එක් එක් අංකවලින් සමහරක් තිබේ. ඔහු කරමින් පරිකල්පනය $n$ ශාරීරිකව ස්වාධීන වටිනාකම් අනුක්රමයක් උපයාගන්නා, නිරීක්ෂණ $x_1, x_2, \ldots, x_n$ , සියලු වන ශුන්ය හෝ එක් කෙනෙක් ම ය. මෙම මුදල අය වටිනාකම්, $y_n = x_1 + x_2 + \ldots + x_n$ , අහඹු වන්නේ එකතුවෙහි පද වන බැවිනි. එමනිසා, අපට මෙම ක්‍රියා පටිපාටිය බොහෝ වාරයක් පුනරාවර්තනය කළ හැකි නම්, විවිධ සංඛ්‍යාත (විවිධ සංඛ්‍යා $0$ සිට $n$ දක්වා පරාසයක ) විවිධ සංඛ්‍යාත සමඟ දිස් වේ - සමස්තයේ සමානුපාතිකයන්. (පහත රූප සටහන් බලන්න.)

දැන් යමෙක් අපේක්ෂා කරනු ඇත - සහ එය සත්‍යයකි - $n$ හි ඉතා විශාල අගයන් සඳහා , සියලු සංඛ්‍යාත තරමක් කුඩා වනු ඇත. අප එසේ නිර්භීත (හෝ මෝඩ) "සීමාවක් ගැනීමට" හෝ "ඉඩ උත්සාහ ලෙස විය යුතු බව නම් $n$ යන්න $\infty$ ", අප සියලු වාර අඩු බව නිවැරදිව නිගමනය කරන $0$ . නමුත් අපි සංඛ්‍යාතවල හිස්ටෝග්‍රැම් එකක් අඳින්නේ නම්, එහි අක්ෂ ලේබල් කර ඇති ආකාරය පිළිබඳව කිසිදු අවධානයක් යොමු නොකර, විශාල $n$ සඳහා වන හිස්ටෝග්‍රැම් සියල්ලම එක හා සමාන ලෙස පෙනෙන්නට පටන් ගන්නා බව අපට පෙනේ : යම් අර්ථයකින්, මෙම සංඛ්‍යා ලේඛන සංඛ්‍යාත වුවද සීමාවකට ළඟා වේ ඔවුන් සියල්ලම ශුන්‍යයට යයි.

හිස්ටෝග්‍රෑම්

මෙම සංඛ්‍යා ලේඛන මඟින් $y_n$ ලබා ගැනීමේ ක්‍රියා පටිපාටිය බොහෝ වාරයක් පුනරාවර්තනය කිරීමේ ප්‍රති results ල නිරූපණය කෙරේ . $n$ යනු මාතෘකා වල ඇති “අත්හදා බැලීම් ගණන” වේ.

මෙහි තීක්ෂ්ණ බුද්ධිය නම් පළමුව හිස්ටෝග්‍රැම් ඇඳීම සහ පසුව එහි අක්ෂ ලේබල් කිරීමයි . විශාල $n$ සමඟ හිස්ටෝග්‍රැම් විශාල අගයන් $n/2$ වටා (තිරස් අක්ෂය මත) සහ අතුරුදහන් වන පරිදි කුඩා අගයන් (සිරස් අක්ෂය මත) ආවරණය කරයි, මන්ද තනි සංඛ්‍යාත තරමක් කුඩා වන බැවිනි. සැළසුම් කරමින් කලාපය මෙම වක්රය සරිලන එහෙයින් දෙකම අවශ්ය වී යාමත් සමගිනි හා rescaling මෙම histogram ය. මෙම ගණිතමය නිරූපණය එක් එක් සඳහා බව ය $n$ අපි සමහර මධ්යම අගය තෝරා ගත හැකිය $m_n$ මෙම histogram සහ සමහර පරිමාණ අගය ස්ථානගත කිරීම (අවශ්යයෙන්ම අනන්ය නොවන!) $s_n$ (අවශ්‍යයෙන්ම අද්විතීය නොවේ!) එය අක්ෂය තුළට ගැලපෙන පරිදි සකස් කිරීම. මෙම වෙනස් කිරීම මගින් ගණිතමය සිදු කළ හැක $y_n$ සඳහා $z_n = (y_n - m_n) / s_n$ .

හිස්ටෝග්‍රැම් එකක් සහ තිරස් අක්ෂය අතර ප්‍රදේශ අනුව සංඛ්‍යාත නිරූපණය කරන බව මතක තබා ගන්න . එබැවින් විශාල අගයන් සඳහා මෙම හිස්ටෝග්‍රැම් වල ස්ථායිතාව ප්‍රදේශය අනුව ප්‍රකාශ කළ යුතුය. $n$ ඒ නිසා, සිට කියන්නේ, මෙන් ඔබ වටිනාකම් ඕනෑම පරතරය ගන්න $a$ කිරීමට $b \gt a$ පරිදි, $n$ වැඩි, එම histogram පැත්තෙන් ප්රදේශය නිරීක්ෂණය $z_n$ තිරස් අතට අන්තරය පුරා විහිදුන $(a, b]$ . මෙම CLT කිහිපයක් තරයේ ප්රකාශ දේවල්:

$a$ සහ $b$ කුමක් වුවත් , අපි $m_n$ සහ $s_n$ අනුපිළිවෙල සුදුසු පරිදි තෝරා ගන්නේ නම් ( $a$ හෝ $b$ මත කිසිසේත් රඳා නොපවතින ආකාරයට ), $n$ විශාල වන විට මෙම ප්‍රදේශය සීමාවකට ළඟා වේ.
මෙම අනුක්රමය $m_n$ හා $s_n$ පමණක් මත රඳා පවතින බව ආකාරයෙන් තෝරා හැක $n$ ඇති කොටුව තුල අගයන් සාමාන්ය,, සහ එම අගයන් ව්යාප්ත යම් - එසේ බව නොතකා ය දේ - ඒත් වෙන කිසිම දෙයක් මත කොටුව, සීමාව සෑම විටම සමාන වේ. (මෙම විශ්වීය දේපල විශ්මයජනකයි.)
විශේෂයෙන්, සීමා ප්රදේශයේ වක්රය යටතේ ප්රදේශයක් බව $y = \exp(-z^2/2) / \sqrt{2 \pi}$ $a$ සහ $b$ අතර මෙය විශ්වීය සීමිත හිස්ටෝග්‍රැම් හි සූත්‍රයයි.

සීඑල්ටී හි පළමු සාමාන්‍යකරණය එකතු කරයි,
කොටුවට ශුන්‍ය හා ඒවාට අමතරව සංඛ්‍යා අඩංගු විය හැකි විට, හරියටම එකම නිගමනවලට එළඹේ (කොටුවේ ඇති අතිශය විශාල හෝ කුඩා සංඛ්‍යා වල අනුපාතය “ඉතා විශාල නොවේ” නම්, නිරවද්‍ය හා සරල ප්‍රමාණාත්මක ප්‍රකාශයක් ඇති නිර්ණායකයකි) .

මීළඟ සාමාන්‍යකරණය, සහ සමහර විට වඩාත්ම විශ්මය ජනක එක, මෙම තනි ටිකට් පෙට්ටිය වෙනුවට ඇණවුම් කළ දින නියමයක් නැති දිගු පෙට්ටි ටිකට් පත් සමඟ ආදේශ කරයි. සෑම පෙට්ටියකටම එහි ටිකට් පත් වල විවිධ අනුපාතයන් තිබිය හැකිය. නිරීක්ෂණ $x_1$ සෑදී ඇත්තේ පළමු කොටුවෙන් ටිකට් පතක් ඇඳීමෙනි, $x_2$ දෙවන කොටුවෙන් පැමිණේ, සහ යනාදිය.
පෙට්ටිවල අන්තර්ගතය “එතරම් වෙනස් නොවේ” යන්න හරියටම එකම නිගමනවල පවතී (“වඩා වෙනස් නොවන” යන්නෙහි අර්ථය නිරවද්‍ය, නමුත් වෙනස්, ප්‍රමාණාත්මක ලක්ෂණ කිහිපයක් ඇත; ඒවා විශ්මය ජනක අක්ෂාංශ ප්‍රමාණයකට ඉඩ දෙයි).

මෙම ප්‍රකාශ පහට අවම වශයෙන් පැහැදිලි කිරීම අවශ්‍ය වේ. තවත් බොහෝ දේ ඇත. සැකසුමෙහි කුතුහලය දනවන කරුණු කිහිපයක් සියලු ප්‍රකාශයන්හි ගම්‍ය වේ. උදාහරණයක් වශයෙන්,

මුදලේ විශේෂත්වය කුමක්ද? ඒවායේ ගණිතය හෝ ඒවායේ උපරිමය වැනි වෙනත් ගණිතමය සංයෝජනයන් සඳහා අපට මධ්‍යම සීමිත ප්‍රමේයයන් නැත්තේ ඇයි? (එය අපි හැරෙනවා, නමුත් ඔවුන් ඉතා එසේ සාමාන්ය නොවේ හෝ ඔවුන් හැම විටම ඔවුන් CLT දක්වා අඩු කර ගැනීමට හැකි නම් එවැනි පිරිසිදු, සරල නිගමනයකට ඇති කියලා.) වල අනුක්රමය $m_n$ හා $s_n$ අනන්ය නොවන නමුත් ඔවුන් ඉන්නේ පාහේ අවසානයේ ඔවුන් එකතුව අපේක්ෂාවන් ආසන්න කිරීමට ඇති බව අර්ථයෙන් සුවිශේෂී $n$ ප්රවේශ පත්ර හා සම්මත අපගමනය පිළිවෙලින්, එම මුදලින් (මෙම CLT පළමු ප්රකාශ දෙකක්, හා සමාන, $\sqrt{n}$ කොටුවේ සම්මත අපගමනය මෙන් දෙගුණයක්).

සම්මත අපගමනය යනු සාරධර්ම ව්‍යාප්ත වීමේ එක් මිනුමකි, නමුත් එය කිසිසේත්ම එකම එකක් නොවේ. එය histor තිහාසිකව හෝ බොහෝ යෙදුම් සඳහා වඩාත්ම “ස්වාභාවික” නොවේ. ( උදාහරණයක් ලෙස බොහෝ අය මධ්‍යන්‍යයෙන් නිරපේක්ෂ අපගමනය වැනි දෙයක් තෝරා ගනු ඇත .)
SD එතරම් අත්‍යවශ්‍ය ආකාරයකින් දිස්වන්නේ ඇයි?
සීමිත හිස්ටෝග්‍රැම් සඳහා සූත්‍රය සලකා බලන්න: එය එවැනි ස්වරූපයක් ගනු ඇතැයි අපේක්ෂා කළේ කවුද? සම්භාවිතා ity නත්වයේ ල ar ු ගණකය චතුරස්රාකාර ශ්‍රිතයක් බව එය පවසයි . මන්ද? මේ සඳහා යම් අවබෝධාත්මක හෝ පැහැදිලි, බලගතු පැහැදිලි කිරීමක් තිබේද?

ශ්‍රීකාන්ත්ගේ බුද්ධිමය හා සරල බව සඳහා වන අභියෝගාත්මක නිර්ණායක සපුරාලීමට තරම් සරල පිළිතුරු සැපයීමේ අවසාන ඉලක්කය කරා ළඟා වීමට මට නොහැකි බව මම පිළිගනිමි, නමුත් මම මෙම පසුබිම සකස් කර ඇත්තේ බොහෝ හිඩැස් පිරවීමට අන් අය පෙළඹෙනු ඇතැයි යන බලාපොරොත්තුවෙනි. මම අවසානයේ හොඳ උද්ඝෝෂණය ආකාරය වටිනාකම් අතර ක මූලික විශ්ලේෂණය කිරීම මත රඳා ඇත හිතන්නේ $\alpha_n = a s_n + m_n$ හා $\beta_n = b s_n + m_n$ එකතුව පිහිටුවා ඇති විය හැකි $x_1 + x_2 + \ldots + x_n$ . සීඑල්ටී හි තනි කොටු අනුවාදය වෙත ආපසු යාම, සමමිතික ව්‍යාප්තියක් හැසිරවීමට වඩා සරල ය: එහි මධ්‍යන්‍යය එහි මධ්‍යන්‍යයට සමාන වේ, එබැවින් $x_i$ කොටුවේ මධ්‍යන්‍යයට වඩා අඩු වීමට 50% ක අවස්ථාවක් සහ 50% අවස්ථාවක් තිබේ බව $x_i$ එහි මධ්යන්ය වඩා වැඩි වනු ඇත. එපමණක් නොව, $n$ ප්‍රමාණවත් තරම් විශාල වූ විට, මධ්යන්යයේ ධනාත්මක අපගමනය මධ්යන්යයේ negative ණාත්මක අපගමනයන්ට වන්දි ගෙවිය යුතුය. (මේ සඳහා අත් සේදීම පමණක් නොව, ප්‍රවේශමෙන් යුක්ති සහගත කිරීමක් අවශ්‍ය වේ.) මේ අනුව අප මූලික වශයෙන් සැලකිලිමත් විය යුත්තේ ධනාත්මක හා negative ණාත්මක අපගමනයන් ගණනය කිරීම හා ඒවායේ ප්‍රමාණයන් පිළිබඳ ද්විතියික සැලකිල්ලක් පමණි . (මා මෙහි ලියා ඇති සෑම දෙයකින්ම, සීඑල්ටී ක්‍රියා කරන්නේ ඇයිද යන්න පිළිබඳ යම් අවබෝධයක් ලබා දීමට මෙය වඩාත් ප්‍රයෝජනවත් විය හැකිය. ඇත්ත වශයෙන්ම, සීඑල්ටී හි සාමාන්‍යකරණයන් සත්‍ය බවට පත්කිරීමට අවශ්‍ය තාක්‍ෂණික උපකල්පනයන් අත්‍යවශ්‍යයෙන්ම විවිධ හැකියාවන් බැහැර කිරීමේ ක්‍රම වේ. දුර්ලභ දැවැන්ත අපගමනය මඟින් සීමිත හිස්ටෝග්‍රැම් පැන නැගීම වැළැක්වීමට ප්‍රමාණවත් ශේෂය අවුල් කරනු ඇත.)

කෙසේ වෙතත්, සීඑල්ටී හි පළමු සාමාන්‍යකරණය ඩි මොයිව්රේගේ මුල් බර්නූලි අත්හදා බැලීමේ අනුවාදයේ නොතිබූ කිසිවක් සැබවින්ම අනාවරණය නොවන්නේ මන්දැයි මෙයින් පෙන්නුම් කෙරේ.

මේ මොහොතේ දී එය කුඩා ගණිත කරන්න ඒ සඳහා කිසිවක් නැත වගේ නමුත්: අපි ගණන් කිරීමට අවශ්ය මධ්යන්යයේ සිට ධනාත්මක අපගමනය සංඛ්යාව ඕනෑම කලින් තීරණය අගය ඍණ අපගමනය සංඛ්යාව වෙනස් කළ හැකි පැහැදිලි ක්රම සංඛ්යාව $k$ , පැහැදිලිවම $k$ යනු $-n, -n+2, \ldots, n-2, n$ වලින් එකකි . නමුත් අතුරුදහන් වන පරිදි කුඩා දෝෂ සීමාව තුළ අතුරුදහන් වනු ඇති බැවින්, අපට හරියටම ගණන් ගත යුතු නැත; අපට අවශ්‍ය වන්නේ ගණන් කිරීම පමණයි. මේ සඳහා එය දැන ගැනීම ප්‍රමාණවත් වේ

The number of ways to obtain k positive and n - k negative values out of n

$\text{The number of ways to obtain } k \text{ positive and } n-k \text{ negative values out of } n$

equals \frac{n - k + 1}{k}

$\text{equals } \frac{n-k+1}{k}$

times the number of ways to get k - 1 positive and n - k + 1 negative values.

$\text{times the number of ways to get } k-1 \text{ positive and } n-k+1 \text { negative values.}$

(එය පරිපූර්ණ මූලික ප්‍රති result ලයකි, එබැවින් සාධාරණීකරණය ලිවීමට මම කරදර නොවෙමි.) දැන් අපි තොග වශයෙන් දළ වශයෙන් ගනිමු. $k$ හැකි තරම් $n/2$ ආසන්න වන විට උපරිම සංඛ්‍යාතය සිදු වේ (මූලික ද වේ). $m = n/2$ ලියමු . එවිට, උපරිම සංඛ්‍යාතයට සාපේක්ෂව, $m+j+1$ ධනාත්මක අපගමනයන්ගේ සංඛ්‍යාතය ( $j \ge 0$ ) නිෂ්පාදිතය මගින් තක්සේරු කෙරේ

\frac{m + 1}{m + 1} \frac{m}{m + 2} \dots \frac{m - j + 1}{m + j + 1}

$\frac{m+1}{m+1} \frac{m}{m+2} \cdots \frac{m-j+1}{m+j+1}$

= \frac{1 - 1 / (m + 1)}{1 + 1 / (m + 1)} \frac{1 - 2 / (m + 1)}{1 + 2 / (m + 1)} \dots \frac{1 - j / (m + 1)}{1 + j / (m + 1)} .

$=\frac{1 - 1/(m+1)}{1 + 1/(m+1)} \frac{1-2/(m+1)}{1+2/(m+1)} \cdots \frac{1-j/(m+1)}{1+j/(m+1)}.$

ඩි මොයිව්රේ ලිවීමට වසර 135 කට පෙර, ජෝන් නේපියර් ගුණ කිරීම සරල කිරීම සඳහා ල ar ු ගණකය නිර්මාණය කළේය, එබැවින් අපි මෙයින් ප්‍රයෝජන ගනිමු. ආසන්න වශයෙන් භාවිතා කිරීම

\log (\frac{1 - x}{1 + x}) = - 2 x - \frac{2 x^{3}}{3} + O (x^{5}),

$\log\left(\frac{1-x}{1+x}\right) = -2x - \frac{2x^3}{3} + O(x^5),$

සාපේක්ෂ සංඛ්‍යාතයේ ලොගය දළ වශයෙන් බව අපට පෙනී යයි

- \frac{2}{m + 1} (1 + 2 + \dots + j) - \frac{2}{(m + 1)^{3}} (1^{3} + 2^{3} + \dots + j^{3}) = - \frac{j^{2}}{m} + O (\frac{j^{4}}{m^{3}}) .

$-\frac{2}{m+1}\left(1 + 2 + \cdots + j\right) - \frac{2}{(m+1)^3}\left(1^3+2^3+\cdots+j^3\right) = -\frac{j^2}{m} + O\left(\frac{j^4}{m^3}\right).$

මෙම මුදලක් ශූන්යයක් සන්නිකර්ෂණය සඳහා දෝෂයක් විසින් නිසා $-j^2/m$ ගණයේ $j^4/m^3$ , එම ආසන්න හොඳින් ලබා වෙහෙස විය යුතුයි $j^4$ කුඩා ඥාතියෙකු වන $m^3$ . එය අවශ්‍ය ප්‍රමාණයට වඩා $j$ හි අගයන් විශාල ප්‍රමාණයක් ආවරණය කරයි . (එය ආසන්න සඳහා වැඩ කිරීම සඳහා ප්රමාණවත් $j$ පමණක් අනුපිළිවෙල මත $\sqrt{m}$ asymptotically වඩා කුඩා වන $m^{3/4}$ .)

එහි writing ලිවීම

z = \sqrt{2} \frac{j}{\sqrt{m}} = \frac{j / n}{1 / \sqrt{4 n}}

$z = \sqrt{2}\,\frac{j}{\sqrt{m}} = \frac{j/n}{1 / \sqrt{4n}}$ සඳහාසම්මත අපගමනය,විසින් ලබා දී ප්රමාණයේ අපගමනය සාපේක්ෂ සංඛ්යාතය

z

$z$ සමානුපාතික විය යුතුය

\exp (- z^{2} / 2)

$\exp(-z^2/2)$ විශාල සඳහා

m .

$m.$ මේ අනුව ඉහත # 3 හි ගෝස්සියානු නීතිය පෙනේ.

සීඑල්ටී හි අනෙක් ප්‍රකාශයන් යුක්ති සහගත කිරීම සඳහා මේ ආකාරයේ තවත් විශ්ලේෂණයක් ඉදිරිපත් කළ යුතු නමුත්, මට කාලය, අවකාශය සහ ශක්තිය ඉවර වී ඇති අතර මෙය කෙසේ හෝ කියවීමට පටන් ගත් පුද්ගලයින්ගෙන් 90% ක් මට අහිමි වී ඇත. මෙය ඉතා සරල ආසන්න, නමුත්, ආකාරය යෝජනා ද Moivre මුලින් එහි ලඝු ගණකය වූ quadratic කාර්යය වන අතර, නිසි පරිමාණ සාධකයක් බව, විශ්ව සීමා බෙදා ඇති බව සැක ඇති විය $s_n$ සමානුපාතික විය යුතුය $\sqrt{n}$ (පෙර සූත්‍රයේ හරය පෙන්වා ඇති පරිදි). කිසියම් ගණිතමය තොරතුරක් සහ තර්කනයක් ඉදිරිපත් නොකර මෙම වැදගත් ප්‍රමාණාත්මක සම්බන්ධතාවය පැහැදිලි කරන්නේ කෙසේදැයි සිතීම දුෂ්කර ය; ඊට වඩා අඩු යමක් සීමිත වක්‍රයේ හැඩය සම්පූර්ණ අභිරහසක් වනු ඇත.

— whuber
source

7

+1 ඔබේ පිළිතුර ජීර්ණය කිරීමට මට යම් කාලයක් ගතවනු ඇත. මා විසින් පනවා ඇති සීමාවන් තුළ සීඑල්ටී සඳහා බුද්ධියක් ඉල්ලා සිටීම කළ නොහැකි දෙයක් බව මම පිළිගනිමි.

2

මෙය ලිවීමට කාලය ගැනීම ගැන ඔබට ස්තූතියි, එය මා දුටු සීඑල්ටී හි වඩාත්ම ප්‍රයෝජනවත් ප්‍රදර්ශනය වන අතර එය ගණිතමය වශයෙන් ද ප්‍රවේශ විය හැකිය.

— ජෙරමි රැඩ්ක්ලිෆ්

1

ඔව්, තරමක් ense නයි .... බොහෝ ප්‍රශ්න. පළමු හිස්ටෝග්‍රැම් හි බාර් 2 ක් ඇත්තේ කෙසේද (අත්හදා බැලීම් 1 ක් පමණි!); මට එය නොසලකා හැරිය හැකිද? හා සමුළුව හරි, යම් histogram බාර් අතර තිරස් හිඩැස් වළක්වා ගැනීමට සාමාන්යයෙන්? (මන්ද, ඔබ පවසන පරිදි, ප්‍රදේශය වැදගත් වන අතර, ප්‍රදේශය අඛණ්ඩ (එනම් හිඩැස් නැත) වසමක් හරහා ගණනය කරනු ලැබේ)? ඉතින් මමත් හිඩැස් නොසලකා හරිනවා ...? මම එය තේරුම් ගැනීමට උත්සාහ කළ විට පවා මට හිඩැස් තිබුනි :)

— රතු කව්පි

1

R TheRed ඔබගේ ප්‍රශ්න වලට ස්තූතියි. මෙම කරුණු ටිකක් පැහැදිලි කිරීම සඳහා මම මෙම ලිපියේ පළමු කොටස සංස්කරණය කර ඇත්තෙමි.

— whuber

4

අහ්, ඔව්, මම "අත්හදා බැලීම් ගණන =

=" නිරීක්ෂණ "" "වාර ගණනක් (මෙම සම්පූර්ණ ක්‍රියා පටිපාටියම) නැවත නැවතත්" සමඟ පටලවා ගතිමි . එබැවින් ටිකට් පතකට 0 හෝ 1 යන අගයන් දෙකේ වටිනාකම පමණක් තිබිය හැකි අතර ඔබ එක් ටිකට් පතක් පමණක් නිරීක්ෂණය කරන්නේ නම් , එම ටිකට් පත් වල අගයන් එකතුව විය හැක්කේ කරුණු දෙකෙන් එකක් පමණි : 0, හෝ 1 . එබැවින් ඔබේ පළමු හිස්ටෝග්‍රැම් බාර් දෙකක් ඇත. එපමණක් නොව, මෙම බාර්වල උස දළ වශයෙන් සමාන වේ 0 සහ 1 සමාන අනුපාතයකින් සිදුවනු ඇතැයි අපි අපේක්ෂා කරමු.

n

$n$

— රතු කව්පි

29

මා දන්නා ලස්සනම සජීවිකරණය: http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html

මා කියවා ඇති සරලම වචන: http://elonen.iki.fi/articles/centrallimit/index.en.html

ඔබ මෙම විසි දහයේ ප්‍රති results ල සාරාංශ කළහොත්, ඔබට ලැබෙන දෙය උපරිමයට වඩා 30-40, 60 (සියලුම හයේ) හෝ අනෙක් අතට, අවම, 10 (සියල්ලම) ට වඩා සමීප විය හැකිය.

මෙයට හේතුව වන්නේ අන්තයට වඩා විවිධාකාරයෙන් ඔබට මධ්‍යම අගයන් ලබා ගත හැකි වීමයි. උදාහරණය: ඩයිස් දෙකක් විසි කරන විට: 1 + 6 = 2 + 5 = 3 + 4 = 7, නමුත් 1 + 1 = 2 සහ 6 + 6 = 12 පමණි.

එනම්: එක් මරණයක් විසි කිරීමේදී ඔබට සංඛ්‍යා හයෙන් එක සමානව ලැබිය හැකි වුවද, අන්තයන් ඩයිස් කිහිපයක එකතුවක මැද අගයන්ට වඩා අඩු සම්භාවිතාවක් ඇත.

— වීදුරු
source

20

ප්‍රතිභානය යනු ව්‍යාකූල දෙයකි. අපේ අතේ ඇති න්‍යාය අපගේ පිටුපසට බැඳ තිබීම ඊටත් වඩා උපක්‍රමශීලී ය.

සීඑල්ටී යනු කුඩා, ස්වාධීන කැළඹීම්වල එකතුවකි. නියැදියේ අර්ථයෙන් “සාරාංශ” යන්නෙන් අදහස් වන්නේ සීමිත විචල්‍යතාවයේ (ජනගහනයේ) අර්ථයෙන් “ඉතා කුඩා” සහ මධ්‍යම (ජනගහන) අගයක් වටා ප්ලස් / us ණ යන අර්ථයෙන් “බාධා” යන්නයි.

මට නම්, ප්‍රතිභාවට වඩාත් කෙලින්ම ආයාචනා කරන උපකරණය වන්නේ ක්වින්කන්ක්ස් නොහොත් 'ගැල්ටන් පෙට්ටිය', විකිපීඩියාව බලන්න ('බෝංචි මැෂින්' සඳහා?) අදහස නම් දැලිසකින් සරසා ඇති පුවරුවක මුහුණට පහළින් කුඩා කුඩා බෝලයක් පෙරළීමයි. සමාන පරතරයකින් යුත් අල්ෙපෙනති. පන්දුව පහළට යන විට දකුණට සහ වමට හරවා (... අහඹු ලෙස, ස්වාධීනව) පතුලේ එකතු වේ. කාලයාගේ ඇවෑමෙන්, අපේ ඇස් ඉදිරිපිටම ලස්සන සීනුව හැඩැති පස් කන්දක් අපට පෙනේ.

සීඑල්ටී කියන්නේ එකම දෙයයි. එය මෙම සංසිද්ධිය පිළිබඳ ගණිතමය විස්තරයකි (වඩාත් නිවැරදිව කිවහොත්, quincunx යනු ද්විමය ව්‍යාප්තියට සාමාන්‍ය ආසන්න කිරීම සඳහා භෞතික සාක්ෂි වේ). ලිහිල් ලෙස කිවහොත්, සීඑල්ටී පවසන්නේ අපේ ජනගහනය ඕනෑවට වඩා වැරදි ලෙස හැසිරෙන්නේ නැති තාක් කල් (එනම්, පී.ඩී.එෆ් හි වලිග ප්‍රමාණවත් තරම් සිහින් නම්), එවිට නියැදි මධ්යන්යය (නිසි ලෙස පරිමාණයෙන්) හැසිරෙන්නේ එම කුඩා බෝලය මුහුණට පහළට පනින ආකාරයට ය quincunx: සමහර විට එය වමට වැටේ, සමහර විට එය දකුණට වැටේ, නමුත් බොහෝ විට එය මැද වටේට ගොඩබසිනු ඇත, ලස්සන සීනුවක හැඩයෙන්.

සීඑල්ටී හි මහිමය (මට) යටින් පවතින ජනගහනයේ හැඩය අදාල නොවේ. හැඩය භූමිකාවක් ඉටු කරන්නේ අප බලා සිටිය යුතු කාලය (නියැදි ප්‍රමාණය අනුව) නියම කරන බැවිනි.

19

සීඑල්ටී පිළිබඳ නිරීක්ෂණයක් පහත දැක්වේ. ඔබට අහඹු සංරචක විශාල ප්‍රමාණයක් ඇති විට, එකක් “වෙනදාට වඩා කුඩා” නම්, මෙය බොහෝ විට වන්දි ගෙවනු ලබන්නේ වෙනත් සමහර සංරචක “වෙනදාට වඩා විශාල” වීමෙනි. . වෙනත් වචන වලින් කිවහොත්, negative ණාත්මක අපගමනයන් සහ සං from ටකයෙන් ධනාත්මක අපගමනයන් යනු සාරාංශයේ දී එකිනෙකා අවලංගු කිරීමයි. පුද්ගලිකව, ඉතිරිව ඇති අපගමනයන් ඔබ සතුව ඇති පද වැඩි වැඩියෙන් සාමාන්‍ය ලෙස පෙනෙන බෙදාහැරීමක් සාදන්නේ මන්දැයි මට පැහැදිලි අවබෝධයක් නොමැත.

S = X_{1} + X_{2} + \dots + X_{n}

$S = X_1 + X_2 + \ldots + X_n$

සීඑල්ටී හි බොහෝ අනුවාදයන් ඇත, සමහර ඒවා අනෙක් ඒවාට වඩා ශක්තිමත් ය, සමහරක් කොන්දේසි අතර මධ්‍යස්ථ යැපීමක් සහ / හෝ කොන්දේසි සඳහා සමාන නොවන බෙදාහැරීම් වැනි ලිහිල් කොන්දේසි සහිත ය. සීඑල්ටී හි සරලම-ඔප්පු කළ හැකි අනුවාද වලදී, සාධනය සාමාන්‍යයෙන් පදනම් වන්නේ එකතුවෙහි මොහොත උත්පාදනය කරන ශ්‍රිතය (හෝ ලැප්ලේස්-ස්ටීල්ට්ජෙස් පරිණාමනය හෝ වෙනත් සුදුසු the නත්වයේ වෙනත් පරිවර්තනයක්) මත ය . මෙය ටේලර් ව්‍යාප්තියක් ලෙස ලිවීම සහ වඩාත්ම ප්‍රමුඛ යෙදුම පමණක් තබා ගැනීම සාමාන්‍ය බෙදාහැරීමේ මොහොත උත්පාදනය කිරීමේ කාර්යය ඔබට ලබා දෙයි. එබැවින් මට පෞද්ගලිකව, සාමාන්‍යය යනු සමීකරණ සමූහයකින් එන දෙයක් වන අතර ඊට වඩා වැඩි අවබෝධයක් මට ලබා දිය නොහැක. $S$

එය මුදලක් ශ්රී ලංකා බෙදාහැරීමේ බව කෙසේ වෙතත් විශේෂයෙන් සඳහන් කළ යුතුය, කවදාවත් ඇත්තටම වේ සාමාන්යයෙන් බෙදා වත්, CLT එය කළ කියා නැත. නම් පරිමිත වන අතර, එහි සාමාන්ය බෙදාහැරීමේ හා නම් සමහර දුර තවමත් මධ්යන්ය සහ විචලතාව මෙන්ම අනන්ත ය යන දෙකම. අවසාන අවස්ථාවේ දී ඔබට අසීමිත මුදලෙහි මධ්‍යන්‍යය ගත හැකි නමුත් කිසිදු විචල්‍යතාවයකින් තොරව ඔබට නිශ්චිත සංඛ්‍යාවක් ලැබෙනු ඇත, එය “සාමාන්‍යයෙන් බෙදා හරින ලද” ලෙස ලේබල් කළ නොහැකි ය. $n$ $n=\infty$

මෙය සීඑල්ටී හි ප්‍රායෝගික යෙදීම් සමඟ ගැටලු ඇති කළ හැකිය. සාමාන්‍යයෙන්, ඔබ එහි මධ්‍යස්ථානයට ආසන්නව බෙදා හැරීමට කැමති නම් , CLT හොඳින් ක්‍රියා කරයි. කෙසේ වෙතත්, සාමාන්‍යයට අභිසාරී වීම සෑම තැනකම ඒකාකාරී නොවන අතර ඔබ තව දුරටත් කේන්ද්‍රයෙන් get ත් වන තරමට, ඔබට සාධාරණ ඇස්තමේන්තුවක් තිබිය යුතුය. $S/n$

සංඛ්‍යාලේඛනවල මධ්‍යම සීමාවන් ප්‍රමේයයේ සියලුම “පරිශුද්ධභාවය” සමඟින්, එහි සීමාවන් බොහෝ විට නොසලකා හරිනු ලැබේ. පහත දැක්වෙන්නේ මම මගේ පා course මාලාවෙන් විනිවිදක දෙකක් ලබා දෙන අතර ඕනෑම ප්‍රායෝගික භාවිත අවස්ථාවක දී සීඑල්ටී වලිගය තුළ සම්පූර්ණයෙන්ම අසමත් වන බව පෙන්වා දෙයි. අවාසනාවකට මෙන්, දැනුවත්ව හෝ වෙනත් ආකාරයකින් වලිග සම්භාවිතාව තක්සේරු කිරීමට බොහෝ අය විශේෂයෙන් CLT භාවිතා කරති.

රූප විස්තරය මෙහි ඇතුළත් කරන්න

— StijnDeVuyst
source

6

මෙය විශිෂ්ට ද්‍රව්‍යමය හා wise ානවන්ත උපදෙස් වේ. අවාසනාවකට මෙන්, මට එය ඉහළ නැංවිය නොහැක, මන්ද “මෙම සාමාන්‍යය ගණිතමය කෞතුක වස්තුවක් වන අතර එය පිටුපස ඇති ගැඹුරු සත්‍යයක් හෝ බුද්ධියක් සෙවීම ප්‍රයෝජනවත් නොවේ යැයි මම සිතමි”. (1) න්‍යායාත්මකව අපට උපකාර කිරීම සඳහා අප ගණිතය මත විශ්වාසය නොතැබිය යුතු බවත් (2) ගණිතය මුලින් තේරුම් ගැනීමට කිසිදු තේරුමක් නැති බවත් ඔවුන් යෝජනා කරන බව පෙනේ. මෙම ත්‍රෙඩ් එකේ අනෙක් ලිපි දැනටමත් දෙවන ප්‍රකාශය සනාථ කිරීම සඳහා බොහෝ දුරක් යා හැකි යැයි මම බලාපොරොත්තු වෙමි. පළමුවැන්න එතරම්ම ස්වයං-නොගැලපීම නිසා එය තවදුරටත් විශ්ලේෂණය කිරීමක් සිදු නොවේ.

— whuber

4

huhuber. ඔබ හරි, මම සමහර විට මගේ ලීගයෙන් ඉවත් වී සිටිමි. මම සංස්කරණය කරන්නම්.

— StijnDeVuyst

5

ගැටළු සහගත කොටස නැවත සලකා බැලීමට ස්තූතියි, ඉතිරිය සඳහා විශාල +1.

— whuber

9

මෙම පිළිතුර සරල කැල්කියුලස් ශිල්පීය ක්‍රම උපයෝගී කරගනිමින් මධ්‍යම සීමාව ප්‍රමේයයේ අර්ථවත් අර්ථයක් ලබා දීමට අපේක්ෂා කරයි (ටේලර් 3 වන අනුපිළිවෙල පුළුල් කිරීම). දළ සටහන මෙන්න:

සීඑල්ටී කියන දේ
සරල ගණනය කිරීම් භාවිතා කරමින් සීඑල්ටී පිළිබඳ අවබෝධාත්මක සාක්ෂියක්
සාමාන්‍ය බෙදාහැරීම ඇයි?

සාමාන්‍ය බෙදා හැරීම අපි අවසානයේ සඳහන් කරන්නෙමු; මක්නිසාද යත්, සාමාන්‍ය ව්‍යාප්තිය අවසානයේදී ඉහළට එන්නේ එතරම් බුද්ධියක් නොදක්වන බැවිනි.

1. මධ්‍යම සීමාව ප්‍රමේයයෙන් කියැවෙන්නේ කුමක්ද? සීඑල්ටී හි අනුවාද කිහිපයක්

සීඑල්ටී හි විචිත්‍ර අනුවාද කිහිපයක් තිබේ. සීඑල්ටී හි පෙළපොත් ප්‍රකාශයේ දැක්වෙන්නේ ඕනෑම තාත්වික $x$ සහ ස්වාධීන සසම්භාවී විචල්‍යයන් වන $X_1,\cdots,X_n$ ශුන්‍ය මධ්යන්ය හා විචල්‍යතාව 1, යනු කුමක් ද යන්න සම්බන්ධයෙන් වටහා ගැනීමටවිශ්වසහඉවෙන්මෙම CLT ගැන, අපි මොහොතකට සීමාව අමතක කරමු. ඉහත ප්‍රකාශයෙන් කියවෙන්නේනම්

P (\frac{X_{1} + \dots + X_{n}}{\sqrt{n}} \leq x) \to_{n \to + \infty} \int_{- \infty}^{x} \frac{e^{- t^{2} / 2}}{\sqrt{2 π}} d t .

$P\left(\frac{X_1+\cdots+X_n}{\sqrt n} \le x\right) \to_{n\to+\infty} \int_{-\infty}^x \frac{e^{-t^2/2}}{\sqrt{2\pi}} dt.$

X_{1} ., \dots, X_{n}

$X_1.,\ldots,X_n$ හා

Z_{1}, \dots, Z_{n}

$Z_1,\ldots,Z_n$ ස්වාධීන සසම්භාවී විචල්යයන් අනුපිළිවෙලවල්, දෙකක් ශුන්ය-පහත් සහ විචලතාව 1 එක් එක්, එවිට ය

සෑම දර්ශකයක් උත්සවය සඳහා

ආකෘති, සමහර ස්ථාවර සැබෑ සඳහා

,

E [f (\frac{X_{1} + \dots + X_{n}}{\sqrt{n}})] - E [f (\frac{Z_{1} + \dots + Z_{n}}{\sqrt{n}})] \to_{n \to + \infty} 0

$E \left[ f\left(\tfrac{X_1+\cdots+X_n}{\sqrt n}\right) \right] - E \left[ f\left(\tfrac{Z_1+\cdots+Z_n}{\sqrt n}\right) \right] \to_{n\to+\infty} 0$

f

$f$

x

$x$

f (t) = {\begin{cases} 1 if t < x \\ 0 if t \geq x . \end{cases}

$\begin{equation} f(t) = \begin{cases} 1 \text{ if } t < x \\ 0 \text{ if } t\ge x.\end{cases} \end{equation}$

X_{1}, \dots, X_{n}

$X_1,\ldots,X_n$ සහ

හි නිශ්චිත බෙදාහැරීම් නොසලකා සීමාව සමාන බව පෙර සංදර්ශනයෙන් නිරූපණය වේ.

Z_{1}, \dots, Z_{n}

$Z_1,\ldots,Z_n$ , සසම්භාවී විචල්යයන් මධ්යන්ය ශුන්ය, විචල්යතාව සමඟ ස්වාධීන වන බව සපයා ඇත.

සීඑල්ටී හි තවත් සමහර අනුවාදවල ලිප්ස්චිටිස් ශ්‍රිත 1 ක් මායිම් කර ඇත. සීඑල්ටී හි තවත් සමහර අනුවාදයන් හි අනුපිළිවෙලින් සීමිත ව්‍යුත්පන්නයක් සහිත සුමට ශ්‍රිතවල පන්තිය ගැන සඳහන් කරයි $k$ . අනුක්රමය දෙකක් සලකා බලන්න $X_1,\ldots,X_n$ හා $Z_1,\ldots,Z_n$ ඉහත සඳහන් ලෙස, සමහර උත්සවය සඳහා $f$ , එම ශ්රේණිය අභිසාරී ප්රතිඵලයක් (CONV)

\begin{matrix} (CONV) & E [f (\frac{X_{1} + \dots + X_{n}}{\sqrt{n}})] - E [f (\frac{Z_{1} + \dots + Z_{n}}{\sqrt{n}})] \to_{n \to + \infty} 0 \end{matrix}

$E \left[ f\left(\tfrac{X_1+\cdots+X_n}{\sqrt n}\right) \right] - E \left[ f\left(\tfrac{Z_1+\cdots+Z_n}{\sqrt n}\right) \right] \to_{n\to+\infty} 0 \tag{CONV}$

පහත දැක්වෙන ප්‍රකාශ අතර සමානතාව ("නම් සහ පමණක් නම්") ස්ථාපිත කළ හැකිය:

(CONV) ඉහත සෑම දර්ශකයක් කාර්යයන් සඳහා පවත්වයි $f$ ආකෘති $f(t)=1$ සඳහා $t < x$ හා $f(t)=0$ සඳහා $t\ge x$ සමහර ස්ථාවර සැබෑ සඳහා $x$ .
(CONV) සෑම මායිම් ලිප්ස්චිට්ස් ශ්‍රිතයක් සඳහාම $f:R\to R$ .
(CONV) සෑම සුමට (එනම්, සත්ය $C^{\infty}$ සංයුක්ත ආධාරයෙන් ) කාර්යයන් .
(CONV) සෑම කාර්යයක් සඳහාම දරයි $f$ සමඟ දිගින් දිගටම අවකල්ය තුනක් $\sup_{x\in R} |f'''(x)| \le 1$ .

ඉහත සඳහන් කරුණු 4 න් එක් එක් අභිසාරීතාව විශාල පන්තියේ ශ්‍රිතයක් සඳහා පවතින බව පවසයි. තාක්‍ෂණික දළ විශ්ලේෂණයකින් කෙනෙකුට ඉහත කරුණු හතර සමාන බව පෙන්විය හැකිය, අපි ඩේවිඩ් පොලාර්ඩ්ගේ පොතේ 7 වන පරිච්ඡේදයේ 77 වන පිටුවට යොමු කරමු. සෛද්ධාන්තික බඹලොව මැනීමට ඒ පරිශීලක මාර්ගෝපදේශය මෙම පිළිතුර ඉතා දේවානුභාවයෙන් වන සිට.

මෙම පිළිතුරේ ඉතිරි කොටස සඳහා අපගේ උපකල්පනය ...

අපි උපකල්පනය කරමු $\sup_{x\in R} |f'''(x)| \le C$ නියත $C>0$ සඳහා , එය ඉහත ලක්ෂ්‍යයට අනුරූප වේ. සසම්භාවී විචල්‍යයන්ට සීමිත, සීමිත තුන්වන මොහොතක් ඇතැයි අපි උපකල්පනය කරමු: $E[|X_i|^3]$ සහ $E[|Z_i|^3]$ සීමිතයි.

2. $E\left[ f\left( \tfrac{X_1+\cdots+X_n}{\sqrt n} \right) \right]$ විශ්ව: එය බෙදාහැරීම මත පදනම් නොවී, $X_1,...,X_n$

මෙම ප්‍රමාණය විශ්වීය බව (කුඩා දෝෂ පදයක් දක්වා) පෙන්වමු, එය ස්වාධීන අහඹු විචල්‍යයන්ගේ එකතුවක් මත රඳා නොපවතින අර්ථයෙන්. ගන්න $X_1,\ldots,X_n$ හා $Z_1,\ldots,Z_n$ ස්වාධීන සසම්භාවී විචල්යයන්, අදහස් 0 සහ විචලතාව 1 එක් එක්, හා සීමිත තෙවන මොහොතේ අනුපිළිවෙලවල්, දෙකක්.

අදහස iteratively ප්රතිස්ථාපනය කිරීමයි $X_i$ විසින් $Z_i$ (අදහස, මම විශ්වාස කරනවා, Lindeberg නියමිත) ප්රමාණය එක් හා මූලික කලනයේ විසින් වෙනස පාලනය කරයි. ටේලර් ප්‍රසාරණයකින්, $W = Z_1+\cdots+Z_{n-1}$ , සහ $h(x)=f(x/\sqrt n)$ ඉන්පසු

\begin{aligned} h (Z_{1} + \dots + Z_{n - 1} + X_{n}) & = h (W) + X_{n} h^{'} (W) + \frac{X_{n}^{2} h^{″} (W)}{2} + \frac{X_{n}^{3} / h^{‴} (M_{n})}{6} \\ h (Z_{1} + \dots + Z_{n - 1} + Z_{n}) & = h (W) + Z_{n} h^{'} (W) + \frac{Z_{n}^{2} h^{″} (W)}{2} + \frac{Z_{n}^{3} h^{‴} (M_{n}^{'})}{6} \end{aligned}

$\begin{align} h(Z_1+\cdots+Z_{n-1}+X_n) &= h(W) + X_n h'(W) + \frac{X_n^2 h''(W)}{2} + \frac{X_n^3/h'''(M_n)}{6} \\ h(Z_1+\cdots+Z_{n-1}+Z_n) &= h(W) + Z_n h'(W) + \frac{Z_n^2 h''(W)}{2} + \frac{Z_n^3 h'''(M_n')}{6} \\ \end{align}$ මෙහි

M_{n}

$M_n$ සහ

M_{n}^{'}

$M_n'$ යනු මධ්‍යන්‍ය අගය ප්‍රමේයයෙන් ලබා දෙන මධ්‍ය ලක්ෂ්‍ය වේ. රේඛා දෙකෙහිම අපේක්ෂාව සැලකිල්ලට ගනිමින්, ශුන්‍ය අනුපිළිවෙල පදය සමාන වේ, පළමු ඇණවුම් පද අපේක්ෂාවෙන් සමාන වේ, මන්ද

X_{n}

$X_n$ සහ

W

$W$ ස්වාධීන වීමෙන්,

E [X_{n} h^{'} (W)] = E [X_{n}] E [h^{'} (W)] = 0

$E[X_n h'(W)]= E[X_n] E[h'(W)] =0$ ඒ හා සමානව දෙවන පේළිය සඳහා. නැවතත් නිදහස අනුව, දෙවන අනුපිළිවෙල අපේක්ෂාවෙන් සමාන වේ. ඉතිරිව ඇති එකම පද තෙවන අනුපිළිවෙල වන අතර අපේක්ෂාවෙන් පේළි දෙක අතර වෙනස උපරිම වශයෙන්

මෙහි

තුන්වන ව්යුත්පන්න මත ඉහළ බැඳී ඇත

. මෙම හරය

\frac{(C / 6) E [| X_{n} |^{3} + | Z_{n} |^{3}]}{(\sqrt{n})^{3}} .

$\frac{(C/6)E[ |X_n|^3 + |Z_n|^3 ]}{(\sqrt n)^3}.$

C

$C$

f^{‴}

$f'''$

(\sqrt{n})^{3}

$(\sqrt{n})^3$ නිසා දර්ශණය

h^{‴} (t) = f^{‴} (t / \sqrt{n}) / (\sqrt{n})^{3}

$h'''(t) = f'''(t/\sqrt n)/(\sqrt n)^3$ . ස්වාධීනත්වය අනුව,ඉහත සංදර්ශනයට වඩා විශාල දෝෂයක් ඇති නොවී මගින් එය ප්‍රතිස්ථාපනය කළ හැකි බැවින් එකතුවෙහි $X_n$ හිදායකත්වයඅර්ථ විරහිත ය! $Z_n$

අපි දැන් වෙනුවට යළිත් අවධාරණය $X_{n-1}$ විසින් $Z_{n-1}$ . නම් $\tilde W= Z_1+Z_2+\cdots+Z_{n-2} + X_n$ එසේ නම්

\begin{aligned} h (Z_{1} + \dots + Z_{n - 2} + X_{n - 1} + X_{n}) & = h (\tilde{W}) + X_{n - 1} h^{'} (\tilde{W}) + \frac{X_{n - 1}^{2} h^{″} (\tilde{W})}{2} + \frac{X_{n - 1}^{3} / h^{‴} ({\tilde{M}}_{n})}{6} \\ h (Z_{1} + \dots + Z_{n - 2} + Z_{n - 1} + X_{n}) & = h (\tilde{W}) + Z_{n - 1} h^{'} (\tilde{W}) + \frac{Z_{n - 1}^{2} h^{″} (\tilde{W})}{2} + \frac{Z_{n - 1}^{3} / h^{‴} ({\tilde{M}}_{n})}{6} . \end{aligned}

$\begin{align} h(Z_1+\cdots+Z_{n-2}+X_{n-1}+X_n) &= h(\tilde W) + X_{n-1} h'(\tilde W) + \frac{X_{n-1}^2 h''(\tilde W)}{2} + \frac{X_{n-1}^3/h'''(\tilde M_n)}{6}\\ h(Z_1+\cdots+Z_{n-2}+Z_{n-1}+X_n) &= h(\tilde W) + Z_{n-1} h'(\tilde W) + \frac{Z_{n-1}^2 h''(\tilde W)}{2} + \frac{Z_{n-1}^3/h'''(\tilde M_n)}{6}. \end{align}$ ස්වාධීනත්වය විසින්

Z_{n - 1}

$Z_{n-1}$ හා

\tilde{W}

$\tilde W$ , සහ ස්වාධීනත්වය විසින්

X_{n - 1}

$X_{n-1}$ හා

\tilde{W}

$\tilde W$ , නැවත ශුන්යාදී, පළමු හා දෙවන නියෝගයක් අනුව මාර්ග දෙකම සඳහා අපේක්ෂාවෙන් සමාන වේ. පේළි දෙක අතර අපේක්ෂාවේ වෙනස නැවතත් උපරිම වශයෙන්

අපි ඒ වෙනුවට දක්වා එල්ලාවල මහතා තබා

'සමග s

s' '. එක් එක් දී කරන ලද වැරදි එකතු කිරීම මඟින්

පියවර, අපි ලබා

\frac{(C / 6) E [| X_{n - 1} |^{3} + | Z_{n - 1} |^{3}]}{(\sqrt{n})^{3}} .

$\frac{(C/6)E[ |X_{n-1}|^3 + |Z_{n-1}|^3 ]}{(\sqrt n)^3}.$

Z_{i}

$Z_i$

X_{i}

$X_i$

n

$n$

ලෙස

වැඩි තෙවන අවස්ථාවලදී හෝ සසම්භාවී විචල්යයන් (ඒක නඩුව උපකල්පනය කරමු) පරිමිත නම්., දකුණු අත පැත්තේ අත්තනෝමතික කුඩා බවට පත් මෙයින් අදහස් කරන්නේ වම් පැත්තේ අපේක්ෂාවන් අත්තනෝමතික ලෙස එකිනෙකට සමීප වන බවයි,

හි ව්‍යාප්තිය

ට වඩා බොහෝ දුරට වෙනස් වුවද. ස්වාධීනත්වය අනුව, එක් එක්හි එකතුවෙහි අර්ථය අර්ථ විරහිත වන්නේ එයට වඩා විශාල දෝෂයක් නොමැතිවමගින් ප්‍රතිස්ථාපනය කළ හැකි බැවිනි.

| E [f (\frac{X_{1} + \dots + X_{n}}{\sqrt{n}})] - E [f (\frac{Z_{1} + \dots + Z_{n}}{\sqrt{n}})] | \leq n \frac{(C / 6) max_{i = 1, \dots, n} E [| X_{i} |^{3} + | Z_{i} |^{3}]}{(\sqrt{n})^{3}} .

$\Big| E\left[ f\left( \tfrac{X_1+\cdots+X_n}{\sqrt n} \right) \right]-E\left[ f\left( \tfrac{Z_1+\cdots+Z_n}{\sqrt n} \right) \right] \Big| \le n \frac{(C/6)\max_{i=1,\ldots,n} E[ |X_i|^3 + |Z_i|^3 ]}{(\sqrt n)^3}.$

n

$n$

X_{1}, \dots, X_{n}

$X_1,\ldots,X_n$

Z_{1}, \dots, Z_{n}

$Z_1,\ldots,Z_n$ $X_i$ $Z_i$ $O(1/(\sqrt n)^3)$ . සියලු වෙනුවට

X_{i}

$X_i$ 'විසින් s

Z_{i}

$Z_i$ හි වඩා විසින් ප්රමාණය වෙනස් නොවේ'

O (1 / \sqrt{n})

$O(1/\sqrt n)$ .

අපේක්ෂාව $E\left[ f\left( \frac{X_1+\cdots+X_n}{\sqrt n} \right) \right]$ මේ අනුව විශ්වීය වේ, එය $X_1,\ldots,X_n$ බෙදා හැරීම මත රඳා නොපවතී. අනෙක් අතට, ස්වාධීනත්වය සහ $E[X_i]=E[Z_i]=0,E[Z_i^2]=E[X_i^2]=1$ ඉහත සීමාවන් සඳහා අතිශයින්ම වැදගත් විය.

3. සාමාන්‍ය ව්‍යාප්තිය ඇයි?

අපේක්ෂාව බව අපි දැක ඇත්තෙමු $E\left[ f\left( \frac{X_1+\cdots+X_n}{\sqrt n} \right) \right]$ $X_i$ හි ව්‍යාප්තිය කුමක් වුවත්, කුඩා අනුපිළිවෙලක් දක්වා සමාන වේ $O(1/\sqrt n)$ .

නමුත් යෙදුම් සඳහා, එවැනි ප්රමාණයක් ගණනය කිරීම ප්රයෝජනවත් වනු ඇත. එය ද මෙම ප්රමාණය සඳහා සරල ප්රකාශනය ලබා ගැනීමට ප්රයෝජනවත් වනු ඇත $E\left[ f\left( \frac{X_1+\cdots+X_n}{\sqrt n} \right) \right]$ .

$X_1,\ldots,X_n$ ඕනෑම එකතුවකට මෙම ප්‍රමාණය සමාන බැවින් බෙදා හැරීම වැනි එක් විශේෂිත එකතුවක් අපට තෝරා ගත හැකිය. $(X_1+\cdots+X_n)/\sqrt n$ ගණනය කිරීම පහසුය හෝ මතක තබා ගැනීම පහසුය.

සාමාන්‍ය බෙදාහැරීම $N(0,1)$ , මෙම ප්‍රමාණය සැබවින්ම සරල වන බව පෙනේ. ඇත්ත වශයෙන්ම, $Z_1,\ldots,Z_n$ iid $N(0,1)$ නම් $\frac{Z_1+\cdots+Z_n}{\sqrt n}$ හි $N(0,1)$ ව්‍යාප්තිය ද ඇති අතර එය $n$ මත රඳා නොපවතී! එබැවින් $Z\sim N(0,1)$ නම්, සහ ඉහත තර්කය අනුව,සමඟ, එවිට

E [f (\frac{Z_{1} + \dots + Z_{n}}{\sqrt{n}})] = E [f (Z)],

$E\left[ f\left( \frac{Z_1+\cdots+Z_n}{\sqrt n} \right) \right] = E[ f(Z)],$

X_{1}, \dots, X_{n}

$X_1,\ldots,X_n$

E [X_{i}] = 0, E [X_{i}^{2}] = 1

$E[X_i]=0,E[X_i^2]=1$

| E [f (\frac{X_{1} + \dots + X_{n}}{\sqrt{n}})] - E [f (Z) | \leq \frac{sup_{x \in R} | f^{‴} (x) | max_{i = 1, \dots, n} E [| X_{i} |^{3} + | Z |^{3}]}{6 \sqrt{n}} .

$\left| E\left[ f\left( \frac{X_1+\cdots+X_n}{\sqrt n} \right) \right] -E[f(Z) \right| \le \frac{\sup_{x\in R} |f'''(x)| \max_{i=1,\ldots,n} E[|X_i|^3 + |Z|^3]}{6\sqrt n}.$

— jlewk
source

ඔබ සීඑල්ටී වලට වඩා විශාල සංඛ්‍යාවක් පිළිබඳ නීතියක් තහවුරු කරන බවක් පෙනේ .

— whuber

2

ඔබ මෙය කියන්නේ ඇයිදැයි මට විශ්වාස නැත. ඉහත බේදය සාක්ෂියක් ලබා

වෙත අභිසාරී

එහිදී

කාර්යයන් විශාල පන්තිය සඳහා

. මෙය සීඑල්ටී ය.

E [f ((X_{1} + . . . + X_{n}) / \sqrt{n})]

$E[f((X_1+...+X_n)/\sqrt n)]$

E [f (Z)]

$E[f(Z)]$

Z \sim N (0, 1)

$Z\sim N(0,1)$

f

$f$

— jlewk

2

ඔබ අදහස් කරන දෙය මට වැටහෙනවා. මට විරාමයක් ලබා දෙන්නේ ඔබේ ප්‍රකාශය ගැන සැලකිලිමත් වන්නේ අපේක්ෂාවන් මිස බෙදාහැරීම් නොවන අතර සීඑල්ටී විසින් සීමිත බෙදාහැරීමක් පිළිබඳ නිගමනවලට එළඹීමයි. මේ දෙක අතර සමානතාවය බොහෝ දෙනෙකුට ක්ෂණිකව නොපෙනේ. එසේ නම්, බෙදාහැරීම් සීමා කිරීම සම්බන්ධයෙන් ඔබේ ප්‍රකාශය සහ සීඑල්ටී හි සුපුරුදු ප්‍රකාශ අතර පැහැදිලි සම්බන්ධතාවයක් ලබා දෙන ලෙස මම යෝජනා කළ හැකිද? (මාර්ගය විසින් +1: මෙම තර්කය විස්තාරනය කරමින් ඔබට ස්තුතියි.)

— whuber

1

ඇත්තෙන්ම විශිෂ්ට පිළිතුරකි. මම මෙය කුං-ෆු හි ලාක්ෂණික ශ්‍රිතයට වඩා බොහෝ බුද්ධිමත් බව පෙනේ.

— එරික් ඕල්ඩ්

3

ඇයි $\sqrt{n}$ වෙනුවට $n$ ? සාමාන්‍යයෙන් මෙම අමුතු අනුවාදය කුමක්ද?

$x_1, \dotsc, x_n$ $\ell$ $\frac{x_1 + \dotsb + x_n}{\sqrt{n}}$ $\ell.$ $\sqrt{n}$

ස්වාධීන අහඹු විචල්‍යයන් සහ විකලාංග දෛශික අතර ගැඹුරු සම්බන්ධතාවයක් ඇත. සසම්භාවී විචල්‍යයන් ස්වාධීන වන විට, එයින් මූලික වශයෙන් අදහස් වන්නේ ඒවා ශ්‍රිතයේ දෛශික අවකාශයක විකලාංග දෛශික බවයි.

(එම උත්සවයට අවකාශය මම උධෘත වේ $L^2$ , සහ සසම්භාවී විචල්යයක් විචලතාව $X$ වන්නේ හුදෙක් $\|X - \mu\|_{L^2}^2$ .. පුදුමයක් විචලතාව ස්වාධීන අහඹු විචල්ය ආකලන වේ ඒ නිසා වගේ යන්තම් $\|x + y\|^2 = \|x\|^2 + \|y\|^2$ $x \perp y$

සාමාන්‍ය බෙදාහැරීම ඇයි?

ටික වේලාවක් මාව ව්‍යාකූල කළ, කාරණයේ හදවතේ ඇතැයි මා සිතන එක් දෙයක් නම් පහත සඳහන් ප්‍රශ්නයයි.

එකතුව වන්නේ ඇයි? $\frac{X_1 + \dotsb + X_n} {\sqrt{n}}$ $n$ $X_i$

මෙය විශාල සංඛ්‍යා සංසිද්ධියේ නීතියට සමානය:

$\frac{X_1 + \dotsb + X_n} {n}$ $n$ විශාල) 1 වන මොහොත ගැන පමණක් සැලකිලිමත් වේ (මධ්‍යන්‍ය).

$X_i$ ස්වාධීන .)

මෙම සංසිද්ධිය ප්‍රකාශ කිරීම සඳහා වඩාත් පැහැදිලි ක්‍රමයක් නම්: එකතුවෙන් $\frac{X_1 + \dotsb + X_n}{\sqrt{n}}$ $X_i$ $n$ මේ මොහොතේ සාපේක්ෂව විශාල වන .

එය සත්‍ය වන්නේ මන්දැයි අප තේරුම් ගන්නේ නම්, අපි මධ්‍යම සීමාව ප්‍රමේයය තේරුම් ගනිමු . මොකද අපි ගන්නත් පුළුවන් $X_i$ පළමු හා දෙවන මොහොත සමඟ සාමාන්‍ය තත්වයට ගෙන යා හැකි අතර, එම අවස්ථාවේ දී අපි දනිමු $\frac{X_1 + \dotsb + X_n}{\sqrt{n}}$ $n$ $n$ . සාමාන්‍ය බෙදාහැරීම තුළ මෙම විශේෂ දේපල ("ස්ථායිතාව") ඇති බැවින් ඔබට ස්වාධීන සාමාන්‍ය දෙකක් එකතු කර තවත් සාමාන්‍යයක් ලබා ගත හැකිය. වොයිලා.

පළමු හා දෙවන මොහොතේ සංසිද්ධි පැහැදිලි කිරීම අවසානයේ යම් ගණිතයක් පමණි. මෙම ගණිතය බැලීමට වරෙක තෝරා ගත හැකි කාච කිහිපයක් තිබේ. මිනිසුන් භාවිතා කරන වඩාත් සුලභ වන්නේ ෆූරියේ ට්‍රාන්ස්ෆෝමරය (AKA ලාක්ෂණික ශ්‍රිතය) වන අතර එය "මම පියවර අනුගමනය කරමි, නමුත් කිසිවෙකු ඒ ගැන සිතන්නේ කෙසේද සහ ඇයි?" ඒ හා සමානව සමුච්චිතයන්, සාමාන්‍ය බෙදාහැරීම අද්විතීය වන අතර එහි ඉහළ සමුච්චිත සියල්ලම අතුරුදහන් වේ.

මම මෙහි වඩාත් මූලික ප්‍රවේශයක් පෙන්වන්නම්. එකතුව ලෙස $Z_n \overset{\text{(def)}}{=} \frac{X_1 + \dotsb + X_n}{\sqrt{n}}$ $Z_n$ $\operatorname{Var}(X_i)$ $\mathbb{E}X_i$ $Z_n$ $Z_n$ $n$ $Z_n$ $\mathbb{E}X_i$ $\operatorname{Var}X_i$ $\mathbb{E}((Z_n - \mathbb{E}Z_n)^k)$ $\mathbb{E}X_i$ $\operatorname{Var}X_i$ . කාල්මන් අඛණ්ඩතා ප්‍රමේයයෙන් එය ප්‍රමාණවත් වේ.

$X_i$ $\sigma^2$ $X_i$

$k$
$E [{(\frac{X_{1} + \dots + X_{n}}{\sqrt{n}})}^{k}]$ $\mathbb{E} \left[ \left(\frac{X_1 + \dotsb + X_n}{\sqrt{n}}\right)^k \right]$ $n \to \infty$ $\sigma^2$

$\mathcal{N}(0, \sigma^2)$ $k$ $|\sigma|^k \frac{k!}{(k/2)!2^{k/2}}$ $k$

සාධනය: සලකා බලන්න $\mathbb{E} \left[ \left(\frac{X_1 + \dotsb + X_n}{\sqrt{n}}\right)^k \right]$ $n^{-k/2}$

n^{- k / 2} \sum_{| α | = k} (\binom{k}{α_{1}, \dots, α_{n}}) \prod_{i = 1}^{n} E (X_{i}^{α_{i}})

$n^{-k/2} \sum_{|\boldsymbol{\alpha}| = k} \binom{k}{\alpha_1, \dotsc, \alpha_n}\prod_{i=1}^n \mathbb{E}(X_i^{\alpha_i})$

α_{1} + \dots + α_{n} = k

$\alpha_1 + \dotsb + \alpha_n = k$

(α_{i} \geq 0)

$(\alpha_i \geq 0)$

$\mathbb{E}(X^a Y^b) = \mathbb{E}(X^a)\mathbb{E}(Y^b)$

Now if ever I have as one of my factors a plain old $\mathbb{E}(X_i)$ , with exponent $\alpha_i =1$ , then that whole term is zero, because $\mathbb{E}(X_i) = 0$ by assumption. So I need all the exponents $\alpha_i \neq 1$ in order for that term to survive. That pushes me toward using fewer of the $X_i$ in each term, because each term has $\sum \alpha_i = k$ , and I have to have each $\alpha_i >1$ if it is $>0$ . In fact, some simple arithmetic shows that at most $k/2$ of the $\alpha_i$ can be nonzero, and that's only when $k$ is even, and when I use only twos and zeros as my $\alpha_i$ .

This pattern where I use only twos and zeros turns out to be very important...in fact, any term where I don't do that will vanish as the sum grows larger.

Lemma: The sum
$n^{- k / 2} \sum_{| α | = k} (\binom{k}{α_{1}, \dots, α_{n}}) \prod_{i = 1}^{n} E (X_{i}^{α_{i}})$ $n^{-k/2} \sum_{|\boldsymbol{\alpha}| = k}\binom{k}{\alpha_1, \dotsc, \alpha_n}\prod_{i=1}^n \mathbb{E}(X_i^{\alpha_i})$ breaks up like $n^{- k / 2} (\underset{These are zero because E X_{i} = 0}{\underset{⏟}{(terms where some α_{i} = 1)}} + \underset{This part is O (n^{k / 2}) if k is even, otherwise no suchterms}{\underset{⏟}{(terms where α_{i}'s are twos andzeros)}} + \underset{o (n^{k / 2})}{\underset{⏟}{(rest of terms)}})$ $n^{-k/2} \left( \underbrace{\left( \text{terms where some } \alpha_i = 1 \right)}_{\text{These are zero because $\mathbb{E}X_i = 0$}} + \underbrace{\left( \text{terms where }\alpha_i\text{'s are twos and zeros}\right)}_{\text{This part is } O(n^{k/2}) \text{ if $k$ is even, otherwise no such terms}} + \underbrace{\left( \text{rest of terms}\right)}_{o(n^{k/2})} \right)$

In other words, in the limit, all terms become irrelevant except

\begin{matrix} (1) & n^{- k / 2} \sum_{(\binom{n}{k / 2})} \underset{k / 2 twos}{\underset{⏟}{(\binom{k}{2, \dots, 2})}} \prod_{j = 1}^{k / 2} E (X_{i_{j}}^{2}) \end{matrix}

$n^{-k/2}\sum\limits_{\binom{n}{k/2}} \underbrace{\binom{k}{2,\dotsc, 2}}_{k/2 \text{ twos}} \prod\limits_{j=1}^{k/2}\mathbb{E}(X_{i_j}^2) \tag{1}$

Proof: The main points are to split up the sum by which (strong) composition of $k$ is represented by the multinomial $\boldsymbol{\alpha}$ . There are only $2^{k-1}$ possibilities for strong compositions of $k$ , so the number of those can't explode as $n \to \infty$ . Then there is the choice of which of the $X_1, \dotsc, X_n$ will receive the positive exponents, and the number of such choices is $\binom{n}{\text{# positive terms in }\boldsymbol{\alpha}} = O(n^{\text{# positive terms in }\boldsymbol{\alpha}})$ . (Remember the number of positive terms in $\boldsymbol{\alpha}$ can't be bigger than $k/2$ without killing the term.) That's basically it. You can find a more thorough description here on my website, or in section 2.2.3 of Tao's Topics in Random Matrix Theory, where I first read this argument.

And that concludes the whole proof. We’ve shown that all moments of $\frac{X_1 + … + X_n}{\sqrt{n}}$ forget everything but $\mathbb{E}X_i$ and $\mathbb{E}(X_i^2)$ as $n \to \infty$ . And therefore swapping out the $X_i$ with any variables with the same first and second moments wouldn't have made any difference in the limit. And so we may as well have taken them to be $\sim \mathcal{N}(\mu, \sigma^2)$ to begin with; it wouldn't have made any difference.

**(If one wants to pursue more deeply the question of why $n^{1/2}$ is the magic number here for vectors and for functions, and why the variance (square $L^2$ norm) is the important statistic, one might read about why $L^2$ is the only $L^p$ space that can be an inner product space. Because $2$ is the only number that is its own Holder conjugate.)

Another valid view is that $n^{1/2}$ is not the only denominator can appear. There are different "basins of attraction" for random variables, and so there are infinitely many central limit theorems. There are random variables for which $\frac{X_1 + \dotsb + X_n}{n} \Rightarrow X$ , and for which $\frac{X_1 + \dotsb + X_n}{1} \Rightarrow X$ ! But these random variables necessarily have infinite variance. These are called "stable laws".

It's also enlightening to look at the normal distribution from a calculus of variations standpoint: the normal distribution $\mathcal{N}(\mu, \sigma^2)$ maximizes the Shannon entropy among distributions with a given mean and variance, and which are absolutely continuous with respect to the Lebesgue measure on $\mathbb{R}$ (or $\mathbb{R}^d$ , for the multivariate case). This is proven here, for example.

— Eric Auld
source

3

+1 I like this for its insight and elementary nature. In spirit it looks the same as the answer by jlewk.

— whuber

1

මම බුද්ධිමත් අනුවාදයක් ඉදිරිපත් කිරීමට උත්සාහ කිරීම අත්හැර දමා අනුකරණයන් කිහිපයක් ඉදිරිපත් කළෙමි. ඔබ සතුව එක් විෂයක් සඳහා ප්‍රමාණවත් තරම් RT එකතු කළ හොත්, ක්වින්කන්ක්ස් සහ තවත් සමහරක් අනුකරණය කරන ඉදිරිපත් කිරීමක් මා සතුව ඇත. මම හිතන්නේ ඔවුන් උදව් කරන නමුත් ඔවුන් මේ වසරේ මගේ පන්තියට අලුත් වන අතර මම තවමත් පළමු පරීක්ෂණය ශ්‍රේණිගත කර නැත.

මම හොඳ යැයි සිතූ එක් දෙයක් නම් විශාල සංඛ්‍යාවක නීතිය පෙන්වීමට හැකිවීමයි. කුඩා සාම්පල ප්‍රමාණවලින් විචල්‍ය දේ ඇති ආකාරය මට පෙන්විය හැකි අතර පසුව ඒවා විශාල ඒවා සමඟ ස්ථාවර වන ආකාරය පෙන්විය හැකිය. මම තවත් විශාල සංඛ්‍යා නිරූපණ රාශියක් කරන්නෙමි. අහඹු ක්‍රියාවලි ගණන සහ සාම්පල සංඛ්‍යා අතර Quincunx හි අන්තර්ක්‍රියා මට පෙන්විය හැකිය.

(මගේ පන්තියේ හුණු හෝ සුදු ලෑල්ලක් භාවිතා කිරීමට නොහැකි වීම ආශීර්වාදයක් විය හැකිය)

— ජෝන්
source

හායි ජෝන්: අවුරුදු නවයකට ආසන්න කාලයකට පසු ඔබව මෙම තනතුර සමඟ නැවත දැකීම සතුටක්! සීඑල්ටී සහ එල්එල්එන් පිළිබඳ අදහස ඉගැන්වීම සඳහා ඔබ අනුකරණයන් භාවිතා කිරීම සමඟ මේ අතරතුර ඔබ ලැබූ අත්දැකීම් කියවීම සිත්ගන්නා සුළු වනු ඇත.

— whuber

අවුරුද්දකට පසු මම එම පංතිය ඉගැන්වීම නැවැත්වූ නමුත් පසුව උපදේශකවරයා අනුකරණ අදහස ලබා ගත්තේය. ඇත්ත වශයෙන්ම, ඔහු එය බොහෝ දුරට ගෙන යන අතර දිලිසෙන යෙදුම් මාලාවක් නිපදවා ඇති අතර 250 පුද්ගල පන්තියේ දේවල් රාශියක් සඳහා සිසුන්ට සෙල්ලම් කිරීමට අවස්ථාව ලබා දී ඇත. ඉහළ පංතියට ඉගැන්වීමෙන් මට කිව හැකි තරම් ආසන්න වශයෙන් සිසුන් එයින් බොහෝ දේ ලබා ගන්නා බව පෙනේ. ඔහුගේ සිසුන් හා සමාන පෝෂක පන්තිවල අය අතර වෙනස කැපී පෙනේ. (නමුත්, ඇත්ත වශයෙන්ම, එහි පාලනය කළ නොහැකි විචල්‍යයන් රාශියක් ඇත)

— ජෝන්

ස්තූතියි, ජෝන්. පංතියක් අවසන් වූ පසු කල්පවත්නා ශිෂ්‍ය ක්‍රියාකාරිත්වය පිළිබඳ පූර්ව ප්‍රතිපෝෂණයක් ලබා ගැනීම කොතරම් අසාමාන්‍යද යත්, මෙම සීමිත උනන්දුව පිළිබඳ තොරතුරු පවා මට හමු විය.

— whuber

-8

ඔබ අහඹු බෙදාහැරීම් රාශියක් එකතු කරන විට සාමාන්‍ය බෙදාහැරීමේ හැඩය පවත්වා ගන්නේ එක් එක් හිස්ටෝග්‍රැම් සියල්ලටම දැනටමත් එම හැඩය ඇති නිසා හෝ ඔබට එම හැඩය ලැබෙන්නේ තනි හිස්ටෝග්‍රැම් වල උච්චාවචනයන් එකිනෙක අවලංගු වීමට හේතුව ඔබ විශාල ප්‍රමාණයක් එකතු කළහොත් ය. හිස්ටෝග්‍රෑම් ගණන. එක් විචල්‍යයක අහඹු ලෙස බෙදා හැරීමේ හිස්ටෝග්‍රැම් එකක් දැනටමත් දළ වශයෙන් බෙදා හැර ඇති අතර එය සාමාන්‍ය බෙදාහැරීම ඇමතීමට පටන් ගෙන ඇති නිසා එය සාමාන්‍ය දෙයක් වන අතර එය මධ්‍යම සීමාව ප්‍රමේයයේ අන්වීක්ෂයකි.

This is not the whole story but I think it's as intuitive as it gets.

— Poelmo
source

2

“සාමාන්‍ය බෙදාහැරීමක්” පිළිබඳ ඔබේ විස්තරය ද්විත්ව on ාතීය විවික්ත අනුවාදයක් මෙන් පෙනේ, එය දුරස්ථව ගෝස්සියානු සාමාන්‍ය බෙදාහැරීමක් මෙන් නොවේ (හැරෙන්නට දෙකම ඒකාකාරී හා සමමිතික වේ). කාසි පෙරළීමේ හිස්ටෝග්‍රැම් හි සාධක මගින් අඩු වන බාර් නොමැත

2

$2$ එක් එක් පියවර සමඟ! එයින් ඇඟවෙන්නේ මෙම පැහැදිලි කිරීම තුළ යම් යම් දුෂ්කරතා ඇතිවිය හැකි බවයි.

— whuber

5

This answer is mostly nonsense. No number of flips of a fair coin will result in a distribution of number of heads that has probabilities

\frac{1}{8}, \frac{1}{4}, \frac{1}{2}, \frac{1}{4}, \frac{1}{8}

$\frac 18, \frac 14, \frac 12, \frac 14, \frac 18$ ; indeed that is not even a probability mass function! Nor does the number of heads in a row have anything to do with the question.

— Dilip Sarwate

මධ්‍යම සීමාව ප්‍රමේයයට ඇති අවබෝධාත්මක පැහැදිලි කිරීම කුමක්ද?

1. මධ්‍යම සීමාව ප්‍රමේයයෙන් කියැවෙන්නේ කුමක්ද? සීඑල්ටී හි අනුවාද කිහිපයක්

මෙම පිළිතුරේ ඉතිරි කොටස සඳහා අපගේ උපකල්පනය ...

2. E[f(X1+⋯+Xnn√)]E[f(X1+⋯+Xnn)]E\left[ f\left( \tfrac{X_1+\cdots+X_n}{\sqrt n} \right) \right] විශ්ව: එය බෙදාහැරීම මත පදනම් නොවී,X1,...,XnX1,...,XnX_1,...,X_n

3. සාමාන්‍ය ව්‍යාප්තිය ඇයි?

ඇයි n−−√n\sqrt{n} වෙනුවටnnn? සාමාන්‍යයෙන් මෙම අමුතු අනුවාදය කුමක්ද?

සාමාන්‍ය බෙදාහැරීම ඇයි?

2. $E\left[ f\left( \tfrac{X_1+\cdots+X_n}{\sqrt n} \right) \right]$ විශ්ව: එය බෙදාහැරීම මත පදනම් නොවී, $X_1,...,X_n$

ඇයි $\sqrt{n}$ වෙනුවට $n$ ? සාමාන්‍යයෙන් මෙම අමුතු අනුවාදය කුමක්ද?