මම හිතන්නේ මෙම ප්රවේශය වැරදියි, නමුත් සමහර විට මම එයට හේතුව පැහැදිලි කළහොත් එය වඩාත් ප්රයෝජනවත් වනු ඇත. විචල්යයන් විශාල සංඛ්යාවක් පිළිබඳ යම් තොරතුරු ලබා දී ඇති හොඳම ආකෘතිය දැන ගැනීමට අවශ්යය. එපමණක් නොව, එය මිනිසුන් නිතිපතා සොයා ගන්නා තත්වයකි. ඊට අමතරව, ප්රතිගාමීත්වය පිළිබඳ බොහෝ පෙළපොත් (සහ පා courses මාලා) පියවරෙන් පියවර තෝරා ගැනීමේ ක්රම ආවරණය කරයි, එයින් ගම්ය වන්නේ ඒවා නීත්යානුකූල විය යුතු බවයි. අවාසනාවකට මෙන්, ඒවා එසේ නොවන අතර, මෙම තත්වය හා ඉලක්කය යුගලනය කිරීම සාර්ථකව සැරිසැරීමට තරමක් අපහසුය. පහත දැක්වෙන්නේ ස්වයංක්රීය පියවරෙන් පියවර ආකෘති තෝරා ගැනීමේ ක්රියා පටිපාටිවල ගැටළු ලැයිස්තුවකි (ෆ්රෑන්ක් හැරල්ට ආරෝපණය කර ඇති අතර මෙතැනින් පිටපත් කර ඇත ):
- එය ඉහළ අගයට පක්ෂග්රාහී වන R- වර්ග අගයන් ලබා දෙයි.
- මුද්රිත පිටුවේ එක් එක් විචල්යයට යාබදව සඳහන් කර ඇති එෆ් සහ චි-වර්ගවල පරීක්ෂණ සඳහා හිමිකම් පෑමක් නොමැත.
- මෙම ක්රමය මඟින් වැරදි ලෙස පටු වන බලපෑම් සහ පුරෝකථනය කරන ලද අගයන් සඳහා විශ්වාසනීය අන්තරයන් ලබා දෙයි; ඇල්ට්මන් සහ ඇන්ඩර්සන් (1989) බලන්න.
- එය නිසි අර්ථයක් නොමැති p- අගයන් ලබා දෙන අතර ඒවා නිවැරදිව නිවැරදි කිරීම දුෂ්කර ගැටළුවකි.
- එය හැකිලීමට අවශ්ය පක්ෂග්රාහී ප්රතිගාමී සංගුණක ලබා දෙයි (ඉතිරි විචල්යයන් සඳහා වන සංගුණක ඉතා විශාලය; ටිබ්ෂිරානි [1996] බලන්න).
- කොලීනියරිටි ඉදිරියේ එය දැඩි ගැටළු ඇති කරයි.
- එය පදනම් වී ඇත්තේ පෙර සැකසූ උපකල්පන පරීක්ෂා කිරීම සඳහා භාවිතා කිරීමට අදහස් කළ ක්රම (උදා: කැදැලි ආකෘති සඳහා එෆ් පරීක්ෂණ) ය.
- නියැදි ප්රමාණය වැඩි කිරීම බොහෝ සෙයින් උපකාරී නොවේ; ඩර්ක්සන් සහ කෙසෙල්මන් (1992) බලන්න.
- ගැටලුව ගැන නොසිතීමට එය අපට ඉඩ දෙයි.
- එය කඩදාසි ගොඩක් භාවිතා කරයි.
ප්රශ්නය වන්නේ, මෙම ක්රියා පටිපාටිවල එතරම් නරක කුමක්ද / මෙම ගැටළු ඇතිවන්නේ ඇයි? මූලික ප්රතිගාමී පා course මාලාවක් හැදෑරූ බොහෝ දෙනෙකුට ප්රතිගාමී සංකල්පය මධ්යන්යයට හුරු වී ඇත , එබැවින් මෙම ගැටළු පැහැදිලි කිරීමට මා භාවිතා කරන්නේ මෙයයි. (මෙය මුලදී මාතෘකාවෙන් බැහැර බවක් පෙනෙන්නට තිබුණද, මා සමඟ ඉවසන්න, එය අදාළ යැයි මම පොරොන්දු වෙමි.)
අත්හදා බැලීම්වල පළමු දිනයේ උසස් පාසැල් ධාවන පුහුණුකරුවෙකු ගැන සිතන්න. ළමයින් තිහක් පෙන්වයි. මෙම ළමයින්ට පුහුණුකරුට හෝ වෙනත් කිසිවෙකුට direct ජු ප්රවේශයක් නොමැති අභ්යන්තර මට්ටමේ යම් මට්ටමක හැකියාවක් ඇත. එහි ප්රති As ලයක් ලෙස පුහුණුකරු තමාට කළ හැකි එකම දේ කරයි. කාලය අනුමාන වශයෙන් ඔවුන්ගේ සහජ හැකියාවේ මිනුමක් වන අතර ඒවා එසේ ගනු ලැබේ. කෙසේ වෙතත්, ඒවා සම්භාවිතා ය; යමෙකු කොතරම් හොඳින් කරනවාද යන්න ඔවුන්ගේ සමානුපාතික හැකියාව මත පදනම් වන අතර සමහර අනුපාතය අහඹු වේ. සැබෑ තත්වය පහත දැක්වේ යැයි සිතන්න:
set.seed(59)
intrinsic_ability = runif(30, min=9, max=10)
time = 31 - 2*intrinsic_ability + rnorm(30, mean=0, sd=.5)
පළමු තරඟයේ ප්රති results ල ළමයින්ට පහත දැක්වෙන පුහුණුකරුගේ අදහස් සමඟ පහත රූපයේ දැක්වේ.
ළමයින් ඔවුන්ගේ ධාවන වේලාවන් අනුව කොටස් කිරීම ඔවුන්ගේ සහජ හැකියාව මත අතිච්ඡාදනය වන බව සලකන්න - මෙම කරුණ ඉතා වැදගත්ය. සමහරුන්ට ප්රශංසා කිරීමෙන් පසුව සහ තවත් සමහරුන්ට කෑගැසීමෙන් පසු (පුහුණුකරුවන් නැඹුරු වන පරිදි), ඔහු ඔවුන්ව නැවත ධාවනය කරවීමට සලස්වයි. පුහුණුකරුගේ ප්රතික්රියා සමඟ දෙවන තරඟයේ ප්රති results ල මෙන්න (ඉහත එකම ආකෘතියෙන් අනුකරණය කර ඇත):
ඔවුන්ගේ සහජ හැකියාව සමාන බව සැලකිල්ලට ගන්න, නමුත් පළමු තරඟයට සාපේක්ෂව කාලය වැඩි විය. පුහුණුකරුගේ දෘෂ්ටි කෝණයෙන් බලන විට, ඔහු කෑගැසූ අය වැඩි දියුණු වීමට නැඹුරු වූ අතර ඔහු ප්රශංසා කළ අය වඩාත් නරක අතට හැරුණි. අර්ධ වශයෙන් අහඹු ලෙස මිනුමක් මත පදනම්ව පුහුණුකරු කණ්ඩායම සඳහා ක්රීඩක ක්රීඩිකාවන් තෝරා ගැනීම එහි ප්රති ence ලයයි.
දැන්, ස්වයංක්රීය (උදා: පියවරෙන් පියවර) ආකෘති තෝරා ගැනීමේ ක්රම සමඟ මෙය සම්බන්ධ වන්නේ කුමක් ද? එකම දත්ත කට්ටලය මත පදනම් වූ ආකෘතියක් සංවර්ධනය කිරීම සහ තහවුරු කිරීම සමහර විට දත්ත හෑරීම ලෙස හැඳින්වේ. විචල්යයන් අතර යම් යටින් පවතින සම්බන්ධතාවයක් පැවතුනද, ශක්තිමත් සබඳතා මගින් වඩා ශක්තිමත් ලකුණු ලබා දෙනු ඇතැයි අපේක්ෂා කෙරේ (උදා: ඉහළ ටී-සංඛ්යා ලේඛන), මේවා අහඹු විචල්යයන් වන අතර සාක්ෂාත් කරගත් අගයන් දෝෂ අඩංගු වේ. මේ අනුව, ඔබ වැඩි (හෝ පහළ) අවබෝධ කරගත් අගයන් මත පදනම්ව විචල්යයන් තෝරා ගන්නා විට, ඒවායේ සත්ය වටිනාකම, දෝෂය හෝ දෙකම නිසා ඒවා විය හැකිය. ඔබ මේ ආකාරයෙන් ඉදිරියට ගියහොත්, දෙවන තරඟයෙන් පසුව පුහුණුකරු මෙන් ඔබ පුදුමයට පත් වනු ඇත. ඔබ ඉහළ ටී සංඛ්යාලේඛන හෝ අඩු අන්තර් සම්බන්ධතා මත පදනම්ව විචල්යයන් තෝරා ගන්නේද යන්න සත්යයකි. ඇත්ත වශයෙන්ම, AIC භාවිතා කිරීම p- අගයන් භාවිතා කිරීමට වඩා හොඳය, මන්ද එය සංකීර්ණතාව සඳහා ආකෘතියට ද izes ුවම් කරයි, නමුත් AIC යනු අහඹු විචල්යයකි (ඔබ කිහිප වතාවක් අධ්යයනයක් පවත්වා එකම ආකෘතියට ගැලපෙන්නේ නම්, AIC එක මෙන් ඉහළට එනු ඇත අනෙක් සියල්ල). අවාසනාවට,
මෙය ප්රයෝජනවත් වේ යැයි මම බලාපොරොත්තු වෙමි.