AIC හෝ BIC අනෙකට වඩා කැමති වීමට හේතුවක් තිබේද?


229

AIC සහ BIC යන දෙකම ඇස්තමේන්තුගත පරාමිතීන් ගණනට ද penal ුවම් කරන ලද ආකෘති සුදුසුකම් තක්සේරු කිරීමේ ක්‍රම වේ. මා තේරුම් ගත් පරිදි, BIC විසින් AIC වලට වඩා නිදහස් පරාමිතීන් සඳහා ආකෘති වලට ද penal ුවම් කරයි. නිර්ණායකවල දැඩිභාවය මත පදනම් වූ මනාපයකින් ඔබ්බට, BIC වලට වඩා AIC ට වැඩි කැමැත්තක් දැක්වීමට වෙනත් හේතු තිබේද?


1
මෙම සාකච්ඡාව "විශේෂාංග" තේරීම හෝ "කෝවරියට්" තේරීම ලෙස හැඳින්වීම වඩාත් සුදුසු යැයි මම සිතමි. මට නම්, ආකෘති තෝරාගැනීම දෝෂ බෙදා හැරීම, සම්බන්ධක ක්‍රියාකාරිත්වයේ ස්වරූපය සහ සහකාරියන්ගේ ස්වරූපය ඇතුළත් වේ. අපි AIC / BIC ගැන කතා කරන විට, අපි සාමාන්‍යයෙන් ආදර්ශ ගොඩනැඟීමේ සියලු අංගයන් සවි කර ඇති අතර, කෝවරියට් තෝරා ගැනීම හැර.

6
ආකෘතියකට ඇතුළත් කිරීමට නිශ්චිත කෝවරියන්ස් තීරණය කිරීම සාමාන්‍යයෙන් ආදර්ශ තේරීම යන යෙදුම අනුව සිදු වන අතර මාතෘකාව තුළ ආදර්ශ තේරීම සහිත පොත් ගණනාවක් ඇත.
මයිකල් ආර්. චර්නික්

ඔබේ ප්‍රශ්නය විශේෂයෙන් phylogeny (bioinformatics) ට අදාළ වේදැයි
tlorin

ඒකාබද්ධ කරන ලද ප්‍රශ්නය KIC ගැන ද අසයි , කරුණාකර ප්‍රශ්න පෙළ යාවත්කාලීන කර KIC හි අර්ථ දැක්වීමක් සඳහන් කරන්න.
smci

1
@smci මම කැමති නම් KIC හා සම්බන්ධ ප්‍රශ්න හාරා බැලීමට මිනිසුන්ට ඉඩ දීම සඳහා මම stats.stackexchange.com/questions/383923/… එකතු කර ඇත්තෙමි .
රුසෙල්පියර්ස්

Answers:


184

ඔබේ ප්‍රශ්නයට අනුව AIC සහ BIC එකම ප්‍රශ්නයට පිළිතුරු දීමට උත්සාහ කරන අතර එය සත්‍ය නොවේ. නොදන්නා, ඉහළ මානයන්හි යථාර්ථය වඩාත් ප්‍රමාණවත් ලෙස විස්තර කරන ආකෘතිය තෝරා ගැනීමට AIC උත්සාහ කරයි. මෙයින් අදහස් කරන්නේ යථාර්ථය කිසි විටෙකත් සලකා බලනු ලබන අපේක්ෂක ආකෘති සමූහයේ නොමැති බවයි. ඊට පටහැනිව, BIC අපේක්ෂකයින් සමූහය අතර සත්‍ය ආකෘතිය සොයා ගැනීමට උත්සාහ කරයි. පර්යේෂකයන් විසින් ගොඩනඟන ලද එක් මාදිලියක යථාර්ථය ක්ෂණික යැයි උපකල්පනය කිරීම තරමක් අමුතු දෙයක් ලෙස මට පෙනේ. මෙය BIC සඳහා සැබෑ ගැටළුවක්.

එසේ වුවද, ආදර්ශ ප්‍රතිසාධන අනුකරණයන් තර්කයක් ලෙස භාවිතා කරමින් AIC වලට වඩා BIC වඩා හොඳ යැයි පවසන පර්යේෂකයන් බොහෝය. මෙම සමාකරණ වලින් සමන්විත වන්නේ A සහ ​​B ආකෘති වලින් දත්ත ජනනය කිරීම සහ පසුව දත්ත කට්ටල දෙකම ආකෘති දෙක සමඟ ගැලපීමයි. වැරදි ආකෘතියක් ජනනය කිරීමට වඩා දත්ත වලට ගැලපෙන විට අධික ලෙස ගැලපීම සිදු වේ. මෙම අනුකරණවල කාරණය වන්නේ AIC සහ BIC මෙම අතිරික්තයන් කෙතරම් නිවැරදි කරනවාද යන්නයි. සාමාන්‍යයෙන්, ප්‍රති results ල මඟින් පෙන්වා දෙන්නේ AIC ඉතා ලිබරල් වන අතර සරල හා සත්‍ය ආකෘතියකට වඩා සංකීර්ණ, වැරදි ආකෘතියකට නිතරම කැමති බවයි. බැලූ බැල්මට මෙම අනුකරණ සැබවින්ම හොඳ තර්ක ලෙස පෙනේ, නමුත් ඒවා සමඟ ඇති ගැටළුව වන්නේ ඒවා AIC සඳහා අර්ථ විරහිත වීමයි. මා කලින් කී පරිදි, පරීක්‍ෂා කරනු ලබන අපේක්ෂක ආකෘති කිසිවක් සත්‍ය බව AIC සලකන්නේ නැත. AIC ට අනුව, සියලුම මාදිලි යථාර්ථයට ආසන්න වේ, යථාර්ථයට කිසි විටෙකත් අඩු මානයක් නොතිබිය යුතුය. සමහර අපේක්ෂක ආකෘති වලට වඩා අවම වශයෙන් අඩුය.

මගේ නිර්දේශය වන්නේ AIC සහ BIC යන දෙකම භාවිතා කිරීමයි. බොහෝ විට ඔවුන් කැමති ආකෘතියට එකඟ වනු ඇත, ඔවුන් එසේ නොකරන විට, එය වාර්තා කරන්න.

ඔබ AIC සහ BIC යන දෙඅංශයෙන්ම නොසතුටින් සිටී නම් සහ ආයෝජනය කිරීමට නිදහස් කාලයක් තිබේ නම්, අවම විස්තර දිග (MDL) බලන්න, AIC සහ BIC හි සීමාවන් ඉක්මවා යන සම්පූර්ණයෙන්ම වෙනස් ප්‍රවේශයකි. සාමාන්‍යකරණය කළ උපරිම සම්භාවිතාව හෝ ධීවර තොරතුරු ආසන්න කිරීම වැනි පියවර කිහිපයක් එම්ඩීඑල් වෙතින් පැන නගී. එම්ඩීඑල් හි ඇති ගැටළුව නම් එහි ගණිතමය ඉල්ලුම සහ / හෝ පරිගණකමය වශයෙන් තීව්‍ර වීමයි.

කෙසේ වෙතත්, ඔබට සරල විසඳුම් වලට ඇලී සිටීමට අවශ්‍ය නම්, ආකෘති නම්යශීලීභාවය තක්සේරු කිරීම සඳහා හොඳ ක්‍රමයක් (විශේෂයෙන් පරාමිති ගණන සමාන වන විට, AIC සහ BIC නිෂ් less ල ලෙස පෙන්වීම) පරාමිතික බූට්ස්ට්‍රැප් කිරීම සිදු කරයි, එය ක්‍රියාත්මක කිරීම තරමක් පහසුය. මෙන්න එය මත ඇති කඩදාසියකට සබැඳියක් .

මෙහි සමහර අය හරස් වලංගුකරණය සඳහා පෙනී සිටිති. මම පෞද්ගලිකව එය භාවිතා කර ඇති අතර එයට එරෙහිව කිසිවක් නැත, නමුත් එයට ඇති ගැටළුව නම් නියැදි කැපීමේ රීතිය අතර තේරීම (නිවාඩු-එක්-පිටත, කේ-ගුණය, ආදිය) ප්‍රතිපත්ති විරහිත එකක් වීමයි.


7
වෙනස ගණිතමය ආස්ථානයෙන් තනිකරම දැකිය හැකිය - BIC පෙර අතුරුදහන් කොහේවත් අත්තනෝමතික අනුව සැබෑ ආකෘතිය පරාමිතීන් කාලා කොහෙද ලඝු-සටහන P (දත්ත) ක asymptotic පුළුල් ලෙස ව්යුත්පන්න විය, එම පළාතේ සමානව සැබෑ පරාමිතීන් හා සමග ව්යුත්පන්න විය ස්ථාවර පැවැත්විණි
Yaroslav Bulatov

4
ආකෘති ප්‍රතිසාධන සමාකරණ තර්කයක් ලෙස භාවිතා කරමින් AIC වලට වඩා BIC වඩා හොඳ යැයි පවසන බොහෝ පර්යේෂකයන් සිටිති. මෙම අනුකරණයන්ගෙන් සමන්විත වන්නේ A සහ ​​B ආකෘති වලින් දත්ත උත්පාදනය කිරීම සහ දත්ත කට්ටල දෙකම ආකෘති දෙක සමඟ ගැලපීම ය. සමහර යොමු දැක්වීමට ඔබ කාරුණිකද? මට ඔවුන් ගැන කුතුහලයක් තිබේ! :)
deps_stats

3
මෙම ලිපියේ ප්‍රකාශ මම විශ්වාස නොකරමි.
user9352

17
(-1) විශිෂ්ට පැහැදිලි කිරීමක්, නමුත් මම ප්‍රකාශයකට අභියෝග කිරීමට කැමතියි. Ave ඩේව් කෙලන් සත්‍ය ආකෘතිය BIC සඳහා වන කට්ටලය තුළ තිබිය යුතුය යන අදහස ගැන ඔබට සඳහනක් කළ හැකිද? මෙම පොතේ කතුවරුන් මෙය එසේ නොවන බවට ඒත්තු ගැන්වෙන සාක්ෂියක් සපයන බැවින් මම මේ පිළිබඳව විමර්ශනය කිරීමට කැමැත්තෙමි .
gui11aume

2
විශිෂ්ට පිළිතුරක් නමුත් “යථාර්ථය කිසි විටෙකත් පහත් මානයක් නොතිබිය යුතුය” යන ප්‍රකාශයට මම තදින්ම එකඟ නොවෙමි. මෙය රඳා පවතින්නේ ඔබ යොරු ආකෘති භාවිතා කරන "විද්‍යාව" මතයි
ඩේවිඩ්

81

AIC සහ BIC යන දෙකම උපරිම යෝග්‍යතා ඇස්තමේන්තු කර ඇති නමුත් අධික ලෙස ආහාර ගැනීම වැළැක්වීම සඳහා නිදහස් පරාමිතීන් සඳහා ද penal ුවම් කරනු ලැබේ. පොදුවේ ඉදිරිපත් කරන ලද එක් ක්‍රමවේදයක් දෙස බලමු (එහි ප්‍රති results ල සාමාන්‍යයෙන් බෙදා හරින ලද දෝෂ සහ වෙනත් හොඳින් හැසිරෙන උපකල්පන නියම කරයි):

  • AIC = -2 * ln (සම්භාවිතාව) + 2 * k,

හා

  • BIC = -2 * ln (සම්භාවිතාව) + ln (N) * k,

කොහේද:

  • k = ආදර්ශ නිදහස
  • N = නිරීක්ෂණ ගණන

සැසඳීමේදී කණ්ඩායමේ හොඳම ආකෘතිය වන්නේ අවස්ථා දෙකේදීම මෙම ලකුණු අවම කිරීමයි. පැහැදිලිවම, AIC නියැදි ප්‍රමාණය මත කෙලින්ම රඳා නොපවතී. එපමණක් නොව, පොදුවේ ගත් කල, AIC විසින් එය අධික ලෙස ව්‍යාප්ත විය හැකි අන්තරාය ඉදිරිපත් කරන අතර, BIC විසින් එය පරාමිතීන්ට ද penal ුවම් කරන ආකාරය අනුව සරලවම (AIC හි 2 * k; දත්ත හඳුන්වා දුන් විට සහ ලකුණු නැවත ගණනය කරන විට, සාපේක්ෂව අඩු N (7 සහ ඊට අඩු) BIC, AIC වලට වඩා නිදහස් පරාමිතීන් ඉවසා දරා සිටින නමුත් ඉහළ N හි අඩු ඉවසීමක් ඇත (N හි ස්වාභාවික ලොගය 2 ඉක්මවා යන පරිදි).

මීට අමතරව, නොදන්නා දත්ත උත්පාදනය කිරීමේ ක්‍රියාවලියට (ආසන්න වශයෙන් අපේක්ෂිත ඇස්තමේන්තුගත KL අපසරනය අවම කිරීම හරහා ) හොඳම ආසන්න ආකෘතිය සොයා ගැනීම AIC හි අරමුණයි . එනිසා, එය සත්‍ය ආකෘතියට සම්භාවිතාවයෙන් අභිසාරී වීමට අසමත් වේ (ඇගයීමට ලක් කළ කණ්ඩායමේ එක් අයෙකු සිටී යැයි උපකල්පනය කරයි), නමුත් B අනන්‍යතාවයට නැඹුරු වන විට BIC අභිසාරී වේ.

එබැවින්, බොහෝ ක්‍රමෝපායික ප්‍රශ්න වලදී මෙන්, වඩාත් සුදුසු වන්නේ ඔබ කිරීමට උත්සාහ කරන දේ, වෙනත් ක්‍රම මොනවාද, සහ දක්වා ඇති කිසියම් අංගයක් (අභිසාරීතාව, නිදහස් පරාමිතීන් සඳහා සාපේක්ෂ ඉවසීම, අපේක්ෂිත KL අපසරනය අවම කිරීම) මත රඳා පවතී. ), ඔබේ ඉලක්ක සමඟ කතා කරන්න.


8
|t|>2|t|>log(n)

2
නියම පිළිතුර, +1. තක්සේරු කරන ලද කණ්ඩායමේ සත්‍ය ආකෘතිය ඇත්ත වශයෙන්ම තිබේද යන්න පිළිබඳ අවවාදයට මම විශේෂයෙන් කැමතියි. "සැබෑ ආකෘතිය" කිසි විටෙකත් නොපවතින බව මම තර්ක කරමි . (බොක්ස් ඇන්ඩ් ඩ්‍රැපර් පැවසුවේ “සියලු මාදිලි අසත්‍යය, නමුත් සමහර ඒවා ප්‍රයෝජනවත්” බවයි. බර්න්හැම් සහ ඇන්ඩර්සන් මෙම “හීලෑ කිරීමේ ප්‍රති s ල ප්‍රමාණ” ලෙස හඳුන්වයි. අප සැබවින්ම බලන ආකෘති අතර හොඳම දළ වශයෙන්.
ස්ටෙෆාන් කොලස්ස

72

මගේ ඉක්මන් පැහැදිලි කිරීම

  • AIC අනාවැකි සඳහා වඩාත් සුදුසු වන්නේ එය හරස් වලංගුතාවයට අසමමිතික ලෙස සමාන වන බැවිනි.
  • BIC පැහැදිලි කිරීම සඳහා වඩාත් සුදුසු වන්නේ එය යටින් පවතින දත්ත උත්පාදනය කිරීමේ ක්‍රියාවලිය නිරන්තරයෙන් තක්සේරු කිරීමට ඉඩ සලසන බැවිනි.

AIC යනු K- ගුණයක හරස් වලංගුකරණයට සමාන වේ, BIC යනු සමතලා කිරීමේ හරස් වලංගුකරණයට සමාන වේ. තවමත්, ප්රමේයයන් දෙකම පැවැත්වීමට පමණක් රේඛීය අවගමනය වූ අවස්ථාවක.

5
mbq, එය AIC / LOO (LKO හෝ K- ගුණයකින් නොවේ) වන අතර 1977 ස්ටෝන් හි සාධනය රේඛීය මාදිලි මත රඳා පවතින බව මම නොසිතමි. BIC ප්‍රති .ලයේ විස්තර මම නොදනිමි.
ars

11
ars නිවැරදි ය. එය AIC = LOO සහ BIC = K- ගුණයකි, එහිදී K යනු නියැදි ප්‍රමාණයේ සංකීර්ණ කාර්යයකි.
රොබ් හින්ඩ්මන්

සුභ පැතුම්, ඔබ මාව ලබා ගත්තා; මම එය ලිවීමට ඉක්මන් වූ අතර ඒ නිසා මම මෙම දෝෂය සිදු කළෙමි, පැහැදිලිවම එය රොබ් එය ලිවූ ආකාරයයි. එය කිසිසේත්ම ෂාවෝ 1995 සිට නොවේ, එහිදී ආකෘතිය රේඛීය යැයි උපකල්පනය කරන ලදී. මම ස්ටෝන් විශ්ලේෂණය කරමි, තවමත් මම සිතන්නේ ඔබ, ආර්ස්, මගේ ක්ෂේත්‍රයේ LOO විවිධ * IC වලට සමානව නරක නමක් ඇති බැවින් එය නිවැරදි විය හැකිය.

විකිපීඩියාවේ ( en.wikipedia.org/wiki/… ) විස්තරය මඟින් K- ගුණයකින් හරස් වලංගු කිරීම පරාමිතීන්ගේ ස්ථායිතාව තක්සේරු කිරීම සඳහා නැවත නැවත අනුකරණය කිරීමක් සේ පෙනේ. AIC LOO සමඟ ස්ථායී වනු ඇතැයි අපේක්ෂා කරන්නේ මන්දැයි මට පෙනේ (LOO ඉතා වෙහෙස මහන්සි වී සිදු කළ හැකි බැවින්), නමුත් K ද පරිපූර්ණ නොවන්නේ නම් BIC K- ගුණයකින් ස්ථාවර වන්නේ මන්දැයි මට නොතේරේ. K සඳහා වටිනාකමට යටින් පවතින සංකීර්ණ සූත්‍රය එය පරිපූර්ණ කරයිද? නැත්නම් වෙන දෙයක් සිදුවෙමින් තිබේද?
රුසෙල්පියර්ස්

16

මගේ අත්දැකීම් අනුව, BIC ප්‍රති results ල බැරෑරුම් ලෙස අඩපණ වන අතර AIC සාමාන්‍යයෙන් හොඳින් ක්‍රියා කරයි, ඉලක්කය වන්නේ පුරෝකථන වෙනස්කම් කිරීම උපරිම කිරීමයි.


1
සුපිරි ප්‍රමාදයි, නමුත් මෙය තවමත් ගූගල්හි ඉහළ මට්ටමක පවතින බැවින් ඔබ වැඩ කරන්නේ කුමන ප්‍රදේශයකද යන්න විග්‍රහ කිරීමට ඔබට අවශ්‍යද? අප සොයා බැලිය යුතු වසමේ යම් බලපෑමක් තිබේ නම් මට කුතුහලයක් ඇත.
verybadatthis

@verybadatthis: සායනික ජෛව විද්‍යාව (ගූගල් "ෆ්‍රෑන්ක් හැරල්", ඔහුට වෙබ් අඩවි තිබේ)
බෙන් බොල්කර්

13

බ්‍රයන් රිප්ලි විසින් AIC සහ BIC හි තොරතුරු සහ ප්‍රවේශ විය හැකි “ව්‍යුත්පන්නයක්” මෙහි සොයාගත හැකිය: http://www.stats.ox.ac.uk/~ripley/Nelder80.pdf

ගණිතමය ප්‍රති .ල පිටුපස ඇති උපකල්පන පිළිබඳව රිප්ලි යම් ප්‍රකාශයක් සපයයි. වෙනත් සමහර පිළිතුරු වලට පටහැනිව, රිප්ලි අවධාරණය කරන්නේ AIC පදනම් වී ඇත්තේ ආකෘතිය සත්‍ය යැයි උපකල්පනය කිරීම මත බවයි. ආකෘතිය සත්‍ය නොවේ නම්, සාමාන්‍ය ගණනය කිරීමකින් හෙළි වනු ඇත්තේ “පරාමිති ගණන” වඩාත් සංකීර්ණ ප්‍රමාණයකින් ප්‍රතිස්ථාපනය කළ යුතු බවයි. සමහර යොමු කිරීම් රිප්ලයිස් විනිවිදකවල දක්වා ඇත. කෙසේ වෙතත්, රේඛීය ප්‍රතිවර්තනය සඳහා (දන්නා විචල්‍යතාවයකින් තදින් කථා කිරීම), පොදුවේ ගත් කල, වඩාත් සංකීර්ණ ප්‍රමාණය පරාමිති සංඛ්‍යාවට සමාන වන බව සරල කරයි.


3
(+1) කෙසේ වෙතත්, ආකෘති කූඩු කළ යුතු යැයි රිප්ලි පවසන තැන වැරදිය. කුල්බැක්-ලීබ්ලර් අපසරනය තක්සේරු කරන්නෙකු ලෙස AIC භාවිතා කරමින් ව්‍යුත්පන්නය සඳහා අකායික්ගේ මුල් ව්‍යුත්පන්නයට හෝ වඩාත් පැහැදිලිව පැවසීමට එවැනි බාධාවක් නොමැත. ඇත්ත වශයෙන්ම, මා වැඩ කරන පුවත්පතක, මම තරමක් “ආනුභවික” ලෙස පෙන්වන්නේ, සහසංයුජ ව්‍යුහයන් (විවිධ පරාමිතීන් ගණන, පැහැදිලිවම කැදැලි රහිත ආකෘති) ආකෘති තෝරා ගැනීම සඳහා පවා AIC භාවිතා කළ හැකි බවයි. විවිධ සහසංයුජ ව්‍යුහයන් සමඟ මා ධාවනය කළ කාල ශ්‍රේණියේ දහස් ගණනක අනුකම්පාවලින්, ඒ කිසිවක් තුළ AIC වැරදියට
වටහා නොගනී

... "නිවැරදි" ආකෘතිය ඇත්ත වශයෙන්ම ආකෘති කට්ටලය මත තිබේ නම් (කෙසේ වෙතත්, මෙය මා අදහස් කරන්නේ මා වැඩ කරන ආකෘති සඳහා, තක්සේරුකරුගේ විචලනය ඉතා කුඩා බවයි ... නමුත් එය තාක්ෂණයක් පමණි විස්තර).
Néstor

1
@ නෙස්ටර්, මම එකඟයි. ආකෘති කැදැල්ල පිළිබඳ කාරණය අමුතුයි.
එන්ආර්එච්

3
කල්පවත්නා දත්ත (මිශ්‍ර බලපෑම් ආකෘති හෝ සාමාන්‍යකරණය කරන ලද අවම වර්ග) සඳහා සහසංයුජ ව්‍යුහයන් තෝරාගැනීමේදී අපේක්ෂක ව්‍යුහ 3 කට වඩා තිබේ නම් AIC හට වැරදි ව්‍යුහයක් පහසුවෙන් සොයාගත හැකිය. 3 ට වඩා තිබේ නම්, ව්‍යුහය තෝරා ගැනීම සඳහා AIC භාවිතා කිරීමෙන් ඇති වන ආකෘති අවිනිශ්චිතතාවයන් සඳහා හැඩගැසීමට ඔබට බූට්ස්ට්‍රැප් හෝ වෙනත් ක්‍රම භාවිතා කිරීමට සිදුවේ.
ෆ්‍රෑන්ක් හැරල්

8

ඇත්ත වශයෙන්ම එකම වෙනස වන්නේ වස්තු ගණන (සාම්පල) සැලකිල්ලට ගැනීම සඳහා BIC AIC දීර් extended කිරීමයි. දෙකම තරමක් දුර්වල වුවත් (නිදසුනක් ලෙස හරස් වලංගුකරණයට සාපේක්ෂව) AIC භාවිතා කිරීම වඩා හොඳ යැයි මම කියමි, කෙටි යෙදුම් ගැන වැඩි පිරිසක් හුරුපුරුදු වනු ඇත - ඇත්ත වශයෙන්ම මම කිසි විටෙක කඩදාසි හෝ වැඩසටහනක් දැක නැත. භාවිතා කළ යුතුය (එවැනි නිර්ණායකයන් ක්‍රියාත්මක නොවන ගැටලුවලට මා පක්ෂග්‍රාහී බව තවමත් පිළිගනිමි).

සංස්කරණය කරන්න: AIC සහ BIC වැදගත් උපකල්පන දෙකක් සපයා ඇති හරස් වලංගුකරණයට සමාන වේ - ඒවා නිර්වචනය කර ඇති විට, එබැවින් ආකෘතිය උපරිම සම්භාවිතාවක් වන විට සහ පුහුණු දත්තයක ආදර්ශ ක්‍රියාකාරිත්වය කෙරෙහි පමණක් ඔබ උනන්දු වන විට. යම් දත්ත සම්මුතියකට කඩා වැටුණහොත් ඒවා හොඳින් ගැලපේ.
කිසියම් තාත්වික ලෝක ගැටලුවක් සඳහා පුරෝකථන යන්ත්‍රයක් සෑදීමේදී පළමුවැන්න අසත්‍යය, මන්ද ඔබේ පුහුණු කට්ටලය නියෝජනය කරන්නේ ඔබ සමඟ කටයුතු කරන ගැටලුව පිළිබඳ තොරතුරු සීරීමක් පමණි, එබැවින් ඔබට ඔබේ ආකෘතිය ප්‍රශස්ත කළ නොහැක; දෙවැන්න අසත්‍යය, මන්ද ඔබේ ආකෘතිය නව දත්ත හසුරුවනු ඇතැයි ඔබ අපේක්ෂා කරන අතර ඒ සඳහා පුහුණු කට්ටලය නියෝජිතයෙකු වනු ඇතැයි අපේක්ෂා කළ නොහැක. මේ සඳහා සීවී සොයා ගන්නා ලදී; ස්වාධීන දත්තයකට මුහුණ දෙන විට ආකෘතියේ හැසිරීම අනුකරණය කිරීමට. ආකෘති තෝරාගැනීමේදී, සීවී මඟින් ඔබට ගුණාත්මකභාවය ආසන්න වශයෙන් පමණක් නොව ගුණාත්මක ඇස්තමේන්තු බෙදාහැරීමක් ද ලබා දෙයි, එබැවින් එයට මෙම විශාල වාසියක් ඇත "එය මම නොදනිමි, නව දත්ත කුමක් පැමිණියත්, ඒවායින් එකක් හෝ විය හැකිය වඩා හොඳ."


එයින් අදහස් කරන්නේ ඇතැම් නියැදි ප්‍රමාණ සඳහා BIC AIC ට වඩා අඩු දැඩි විය හැකි බව ද?
රුසෙල්පියර්ස්

1
දැඩි වචන මෙහි හොඳම වචනයක් නොවේ, පරාමිතීන් සඳහා වඩා ඉවසිලිවන්ත ය; තවමත්, ඔව්, පොදු අර්ථ දැක්වීම් සඳහා (ස්වාභාවික ලොගය සමඟ) එය සිදුවන්නේ 7 සහ ඊට අඩු වස්තු සඳහා ය.

AIC අසමමිතික ලෙස හරස් වලංගුකරණයට සමාන වේ.
රොබ් හින්ඩ්මන්

5
@mbq - හරස් වලංගුකරණය “නියෝජනය නොකිරීමේ” ගැටලුව ජය ගන්නේ කෙසේදැයි මම නොදනිමි. ඔබගේ පුහුණු දත්ත අනාගතයේ දී ඔබට ලැබෙන දත්ත නියෝජනය නොකරන්නේ නම්, ඔබට අවශ්‍ය සියල්ල හරස්-වලංගු කළ හැකිය, නමුත් එය ඔබ සැබවින්ම මුහුණ දීමට යන “සාමාන්‍යකරණ දෝෂය” නියෝජනය නොකරයි (ලෙස " සත්‍ය "නව දත්ත පුහුණු දත්තවල ආකෘතිගත නොකළ කොටස මගින් නිරූපණය නොවේ). ඔබ හොඳ අනාවැකි පළ කිරීමට නම් නියෝජිත දත්ත කට්ටලයක් ලබා ගැනීම අත්‍යවශ්‍ය වේ.
සම්භාවිතාවය

1
@mbq - මගේ අදහස නම්, ගැටළුව විසඳන්නේ නැති විකල්පයක් මත පදනම්ව ඔබ IC පදනම් කරගත් තේරීම “මෘදු ලෙස ප්‍රතික්ෂේප කරන” බව පෙනේ. හරස් වලංගුකරණය හොඳයි (ගණනය කිරීම වටී ද?), නමුත් නියෝජිත නොවන දත්ත දත්ත පදනම් කරගත් ක්‍රියාවලියක් භාවිතා කිරීම සමඟ කටයුතු කළ නොහැක. අවම වශයෙන් විශ්වසනීය නොවේ. ඔබට පූර්ව තොරතුරු තිබිය යුතුය, එය නියෝජනය නොකරන ආකාරය ඔබට කියයි (හෝ වඩාත් සාමාන්‍යයෙන්, “ඔබ නියෝජනය නොකරන” දත්ත ඔබ නිරීක්ෂණය කරනු ලබන සැබෑ අනාගත දත්ත සමඟ ඇති තාර්කික සම්බන්ධතා මොනවාද).
සම්භාවිතාවය

5

ඔබ සඳහන් කළ පරිදි, AIC සහ BIC යනු වඩාත් ප්‍රතිගාමී විචල්‍යයන් සඳහා ආකෘතිවලට ද penal ුවම් කිරීමේ ක්‍රම වේ. මෙම ක්‍රම වලදී ද penalty ුවම් ශ්‍රිතයක් භාවිතා කරනු ලැබේ, එය ආකෘතියේ පරාමිති ගණනක ශ්‍රිතයකි.

  • AIC අයදුම් කිරීමේදී ද penalty ුවම් ශ්‍රිතය z (p) = 2 p වේ.

  • BIC අයදුම් කිරීමේදී ද penalty ුවම් ශ්‍රිතය z (p) = p ln ( n ) වන අතර එය ද penalty ුවම පූර්ව තොරතුරු වලින් උපුටා ගත් එකක් ලෙස අර්ථ දැක්වීම මත පදනම් වේ (එබැවින් නම බේසියානු තොරතුරු නිර්ණායකය).

විට n ආකෘති දෙකක් බෙහෙවින් වෙනස් ප්රතිඵල ඇති කරනවා විශාල වේ. එවිට BIC සංකීර්ණ ආකෘති සඳහා වඩා විශාල ද penalty ුවමක් අදාළ වන අතර එබැවින් AIC වලට වඩා සරල ආකෘති වලට මග පාදනු ඇත. කෙසේ වෙතත්, BIC හි විකිපීඩියාවේ සඳහන් පරිදි :

බොහෝ යෙදුම්වල ..., BIC හුදෙක් උපරිම සම්භාවිතා තේරීම දක්වා අඩු කරන බව සැලකිල්ලට ගත යුතුය.


4
මානය වෙනස් නොවන විට AIC ද ML ට සමාන බව සලකන්න. ඔබගේ පිළිතුර මෙය BIC සඳහා පමණක් බව පෙනේ.
සම්භාවිතාවය

5

මට කිව හැකි දෙයින්, AIC සහ BIC අතර වැඩි වෙනසක් නැත. ආකෘති කාර්යක්ෂමව සංසන්දනය කිරීම සඳහා කෙනෙකුට කළ හැකි ගණිතමය වශයෙන් පහසු ආසන්න අගයන් දෙකම වේ. ඔවුන් ඔබට වෙනස් "හොඳම" ආකෘති ලබා දෙන්නේ නම්, එයින් අදහස් කරන්නේ ඔබට ඉහළ ආකෘති අවිනිශ්චිතතාවයක් ඇති බවයි, එය ඔබ AIC හෝ BIC භාවිතා කළ යුතුද යන්න ගැන කරදර වීමට වඩා වැදගත් වේ. මා පෞද්ගලිකව BIC වඩා හොඳට කැමතියි, මන්ද යත්, එහි පරාමිතීන්ට සරිලන සේ වැඩි (අඩු) දත්ත තිබේ නම් එය ආකෘතියක් වැඩි (අඩු) ඉල්ලන බැවිනි - ගුරුවරයෙකු තම ශිෂ්‍යයාට වැඩි (අඩු) කාර්ය සාධනයක් තිබේ නම් ඉහළ (පහළ) කාර්ය සාධනයක් ඉල්ලා සිටී. ) විෂය ගැන ඉගෙන ගැනීමට කාලයයි. මට නම් මෙය කළ යුතු බුද්ධිමත් දෙයක් සේ පෙනේ. එහෙත් ඒ.අයි.සී. සඳහා එහි සරල ස්වරූපය අනුව සමානවම බුද්ධිමත් හා බලගතු තර්ක ද පවතින බව මට විශ්වාසයි.

දැන් ඔබ දළ විශ්ලේෂණයක් කරන ඕනෑම වේලාවක, එම ආසන්න කිරීම් කුණු වූ විට අනිවාර්යයෙන්ම යම් කොන්දේසි ඇති වේ. මුල් ඇස්තමේන්තුව නරක අතට හැරෙන ඇතැම් කොන්දේසි සඳහා ගණනය කිරීම සඳහා බොහෝ "ගැලපීම්" (AICc) පවතින AIC සඳහා මෙය නිසැකවම දැකිය හැකිය. මෙය BIC සඳහා ද පවතී, මන්දයත් සෙල්නර්ගේ ජී-ප්‍රියර්වල මිශ්‍රණයන් සඳහා පූර්ණ ලැප්ලේස් ආසන්න කිරීම් වැනි තවත් බොහෝ නිවැරදි (නමුත් තවමත් කාර්යක්ෂම) ක්‍රම පවතින බැවිනි (BIC යනු අනුකලනයන් සඳහා ලැප්ලේස් ඇස්තමේන්තු ක්‍රමයට ආසන්න කිරීමකි).

ඕනෑම ආකෘතියක් තුළ ඇති පරාමිතීන් පිළිබඳ සැලකිය යුතු පූර්ව තොරතුරු ඔබ සතුව ඇති විට, ඔවුන් දෙදෙනාම කපටි වන එක් ස්ථානයකි. දත්ත වලින් පරාමිතීන් තක්සේරු කිරීම අවශ්‍ය වන ආකෘති හා සසඳන විට පරාමිතීන් අර්ධ වශයෙන් දන්නා ආකෘතිවලට AIC සහ BIC අනවශ්‍ය ලෙස ද penal ුවම් කරයි.

P(D|M,A)P(M|D,A)MMA

Mi:the ith model is the best description of the dataA:out of the set of K models being considered, one of them is the best

ඉන්පසු එකම සම්භාවිතා ආකෘති (එකම පරාමිතීන්, එකම දත්ත, එකම ඇස්තමේන්තු ආදිය) පැවරීම දිගටම කරගෙන යන්න, මට එකම BIC අගයන් ලැබෙනු ඇත. “එම්” යන තාර්කික අකුරට යම් ආකාරයක අද්විතීය අරුතක් එක් කිරීමෙන් පමණක් “සැබෑ ආකෘතිය” (“සැබෑ ආගමේ” දෝංකාරය) පිළිබඳ අනවශ්‍ය ප්‍රශ්න වලට ඇදී යයි. එම් "නිර්වචනය" කරන එකම දෙය වන්නේ ඒවායේ ගණනය කිරීම් වලදී එය භාවිතා කරන ගණිතමය සමීකරණ පමණි - මෙය කිසිසේත්ම එක හා එකම අර්ථ දැක්වීමක් පමණක් නොවේ. මට එම් පිළිබඳ අනාවැකි යෝජනාවක් සමානව ඉදිරිපත් කළ හැකිය ("ith ආකෘතිය හොඳම අනාවැකි ලබා දෙනු ඇත"). මෙය කිසියම් සම්භාවිතාවක් වෙනස් කරන්නේ කෙසේදැයි මට පෞද්ගලිකව නොපෙනේ, එබැවින් BIC කොතරම් හොඳ හෝ නරක වනු ඇත්ද (ඒ සඳහා AIC ද - AIC වෙනස් ව්‍යුත්පන්නයක් මත පදනම් වුවද)

ඊට අමතරව, ප්‍රකාශයේ ඇති වැරැද්ද කුමක්ද? මා සලකා බලන කට්ටලයේ සත්‍ය ආකෘතිය තිබේ නම්, එය B ආකෘතිය බවට 57% ක සම්භාවිතාවක් ඇත. මට ප්‍රමාණවත් යැයි පෙනේ, නැතහොත් ඔබට වඩාත් “මෘදු” අනුවාදයට යා හැකිය 57% ක සම්භාවිතාවක් ඇත, B ආකෘතිය සලකා බලනු ලබන කට්ටලයෙන් හොඳම වේ

අන්තිම අදහස් දැක්වීම: AIC / BIC ගැන ඔවුන් දන්නා බොහෝ අය සිටින බැවින් ඔබ බොහෝ අදහස් සොයා ගනු ඇතැයි මම සිතමි.


4

AIC භාවිතා කරන්නේ කලාතුරකිනි, මන්ද එය වලංගු වන්නේ අසමමිතික ලෙස පමණි. AICc ( සීමිත නියැදි ප්‍රමාණය සඳහා සී විවරයක් සහිත AIC) භාවිතා කිරීම සෑම විටම පාහේ හොඳය . AIC අධික ලෙස පරාමිතිකරණය කිරීමට නැඹුරු වේ: AICc සමඟ එම ගැටළුව බෙහෙවින් අඩු වේ. AICc භාවිතා කිරීමේ ප්‍රධාන ව්‍යතිරේකය වන්නේ යටින් පවතින බෙදාහැරීම් දැඩි ලෙස ලෙප්ටොකුර්ටික් වන විටය. මේ පිළිබඳ වැඩි විස්තර සඳහා බර්න්හැම් සහ ඇන්ඩර්සන් විසින් රචිත ආදර්ශ තේරීම පොත බලන්න .


1
ඉතින්, ඔබ පවසන දෙය නම්, AIC විසින් පරාමිතීන් සඳහා ප්‍රමාණවත් ලෙස ද punish ුවම් නොකරන බැවින් එය නිර්ණායකයක් ලෙස භාවිතා කිරීම අධික ලෙස පරාමිතිකරණයට තුඩු දිය හැකිය. ඒ වෙනුවට AICc භාවිතා කිරීම ඔබ නිර්දේශ කරයි. මගේ ආරම්භක ප්‍රශ්නයේ සන්දර්භය තුළ මෙය නැවත තැබීමට නම්, BIC දැනටමත් AIC ට වඩා දැඩි බැවින් BIC වලට වඩා AICc භාවිතා කිරීමට හේතුවක් තිබේද?
රුසෙල්පියර්ස්

1
AIC විසින් ඔබ අදහස් කරන්නේ කුමක්ද යන්න අසමමිතික ලෙස වලංගු වේ. ජෝන් ටේලර් පෙන්වා දුන් පරිදි AIC නොගැලපේ. මම හිතන්නේ ඔහුගේ අදහස් AIC හා BIC හා සසඳන විට ලබා දී ඇති හොඳම ඒවාය. මේ දෙකම හරස් වලංගුකරණයට සමාන බව මට නොපෙනේ. ඔවුන් සියල්ලන්ටම හොඳ දේපලක් ඇති අතර ඔවුන් සාමාන්‍යයෙන් උපරිම විචල්‍යයන්ට වඩා අඩු ආකෘතියක් ලබා ගනී. නමුත් ඔවුන් සියල්ලන්ටම විවිධ මාදිලි තෝරා ගත හැකිය.
මයිකල් ආර්. චර්නික්

4

AIC සහ BIC යනු ආකෘති සංසන්දනය කිරීමේ තොරතුරු නිර්ණායක වේ. සෑම කෙනෙකුම ආකෘති යෝග්‍යතාවය සහ විග්‍රහය සමතුලිත කිරීමට උත්සාහ කරන අතර එක් එක් පරාමිති ගණනට වෙනස් ලෙස ද izes ුවම් කරයි.

AIC=2k2ln(L)
kL2ln(L)2k

BIC=kln(n)2ln(L)

මම කේ.අයි.සී. ගැන අසා නැත.


KIC ගැන අසා නැත, නමුත් AIC සහ BIC සඳහා සම්බන්ධිත ප්‍රශ්නය දෙස බලන්න, නැතහොත් AIC සොයන්න. stats.stackexchange.com/q/577/442
හෙන්රික්

1
(මෙම පිළිතුර "KIC" හි අර්ථ නිරූපණය ඉල්ලා සිටි අනුපිටපත් ප්‍රශ්නයකින් ඒකාබද්ධ කරන ලදි.)
whuber

3
AIC හෝ BIC සමඟ සංසන්දනය කිරීම සඳහා ආකෘති කැදැල්ලට අවශ්‍ය නොවේ.
මැක්‍රෝ

2

ඉතා කෙටියෙන්:

lambda=2lambda=log(n), එහිදී එක් පරමාර්ථයක් ප්‍රශස්තිකරණය කිරීම (LASSO හෝ ප්‍රත්‍යාස්ථතා ශුද්ධ ප්‍රතිගාමීත්වය) වෙනත් අරමුණු මත පදනම්ව නියාමනය කිරීමේ පරාමිතිය සුසර කිරීම (උදා: හරස් වලංගු කිරීමේ පුරෝකථන දෝෂය අවම කිරීම, AIC හෝ BIC).

n1n

හරස් වලංගු භාවයක් සිදු නොකර, LOOCV දෝෂය විශ්ලේෂණාත්මකව තොප්පි අනුකෘතියේ හා විකර්ණයෙන් ගණනය කළ හැකි බව සලකන්න . LOOCV දෝෂයේ අසමමිතික දළ විශ්ලේෂණයක් ලෙස මෙය සැමවිටම AIC සඳහා විකල්පයක් වනු ඇත.

යොමුව

ස්ටෝන් එම්. (1977) හරස් වලංගුකරණය සහ අකායික්ගේ නිර්ණායක අනුව ආකෘතිය තෝරා ගැනීමේ අසමමිතික සමානතාව. ජර්නල් ඔෆ් ද රෝයල් ස්ටැටිස්ටිකල් සොසයිටි සීරීස් බී. 39, 44–7.

ෂාවෝ ජේ. (1997) රේඛීය ආකෘති තෝරා ගැනීම සඳහා අසමමිතික න්‍යායක්. සංඛ්‍යාන සීනිකා 7, 221-242.


මෙහි ඇති අනෙක් තනතුරු රාශියකට වඩා හොඳ අවබෝධයක්. මිනිසුන් මේ ගැන වැඩි විස්තර කියවීමට කැමති නම් (සහ AIC / BIC ට වඩා උසස් විකල්පයක්) ඇන්ඩ rew
JoeTheShmoe

1
  • AIC සහ BIC යන දෙකම ද ized ුවම්-සම්භාවිතා නිර්ණායක වේ. ඒවා සාමාන්‍යයෙන් [-2logL + kp] ස්වරූපයෙන් ලියා ඇති අතර, L යනු සම්භාවිතා ශ්‍රිතය වන අතර, p යනු ආකෘතියේ පරාමිති ගණන වන අතර k යනු AIC සඳහා 2 ක් වන අතර BIC සඳහා ලොග් (n) වේ.
  • AIC යනු නියතයක් සහ දත්තවල නොදන්නා සත්‍ය සම්භාවිතා ශ්‍රිතය සහ ආකෘතියේ ගැලපෙන සම්භාවිතා ශ්‍රිතය අතර සාපේක්ෂ දුර ප්‍රමාණය පිළිබඳ තක්සේරුවකි, එවිට අඩු AIC යන්නෙන් අදහස් කරන්නේ ආකෘතියක් සත්‍යයට සමීප යැයි සැලකේ.
  • BIC යනු කිසියම් බේසියානු සැකසුමක් යටතේ ආකෘතියක් සත්‍ය බවට පත්වීමේ පශ්චාත් සම්භාවිතාවේ ශ්‍රිතයක් තක්සේරු කිරීමකි, එවිට පහළ BIC යන්නෙන් අදහස් කරන්නේ ආකෘතියක් සැබෑ ආකෘතියට වඩා වැඩි යැයි සැලකේ.
  • මෙම නිර්ණායක දෙකම විවිධ උපකල්පන සහ අසමමිතික ඇස්තමේන්තු මත පදනම් වේ.
  • N නොසලකා සෑම විටම විශාල ආකෘතියක් තෝරා ගැනීමට AIC හට අවස්ථාවක් තිබේ. N ප්‍රමාණවත් නම් විශාල ආකෘතියක් තෝරා ගැනීමට BIC හට ඇත්තේ ඉතා අල්ප අවස්ථාවකි, නමුත් එය ඕනෑම කුඩා n ආකෘතියක් තෝරා ගැනීමට AIC ට වඩා විශාල අවස්ථාවක් ඇත.

යොමුව:

  1. https://www.youtube.com/watch?v=75BOMuXBSPI
  2. https://www.methodology.psu.edu/resources/AIC-vs-BIC/
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.