විචල්යයන් පාලනය කිරීමට බොහෝ ක්රම තිබේ.
ඔබට පහසුම සහ ඔබ ඉදිරිපත් කළ එකක් නම්, ඔබේ දත්ත ස්ථරීකරණය කිරීමයි, එවිට ඔබට සමාන ලක්ෂණ සහිත උප කණ්ඩායම් ඇත - එක "පිළිතුරක්" ලබා ගැනීම සඳහා එම ප්රති results ල එකට එකතු කිරීමේ ක්රම තිබේ. ඔබට පාලනය කිරීමට අවශ්ය විචල්යයන් ඉතා කුඩා සංඛ්යාවක් තිබේ නම් මෙය ක්රියාත්මක වේ, නමුත් ඔබ නිවැරදිව සොයාගෙන ඇති පරිදි, ඔබ ඔබේ දත්ත කුඩා හා කුඩා කැබලිවලට බෙදූ විට මෙය වේගයෙන් කඩා වැටේ.
වඩාත් පොදු ප්රවේශයක් නම් ඔබට පාලනය කිරීමට අවශ්ය විචල්යයන් ප්රතිගාමී ආකෘතියකට ඇතුළත් කිරීමයි. උදාහරණයක් ලෙස, ඔබට ප්රතිගාමී ආකෘතියක් තිබේ නම් එය සංකල්පමය වශයෙන් විස්තර කළ හැකිය:
BMI = Impatience + Race + Gender + Socioeconomic Status + IQ
නොඉවසිලිමත්කම සඳහා ඔබ ලබා ගන්නා ඇස්තමේන්තුව අනෙක් කෝවරියන්ට් මට්ටම් තුළ නොඉවසිලිමත් වීමේ බලපෑම වනු ඇත - ප්රතිගාමීත්වය මඟින් ඔබට වැඩි දත්ත ප්රමාණයක් නොමැති ස්ථානවල (ස්තරීකරණ ප්රවේශයේ ගැටලුව) අවශ්යයෙන්ම සුමටව සිටීමට ඉඩ ලබා දේ. පරිස්සමින්.
වෙනත් විචල්යයන් පාලනය කිරීම සඳහා තවත් නවීන ක්රම තිබේ, නමුත් අවාසි වන්නේ යමෙකු “වෙනත් විචල්යයන් සඳහා පාලනය වේ” යැයි පැවසූ විට, එයින් අදහස් වන්නේ ඒවා ප්රතිගාමී ආකෘතියකට ඇතුළත් කර ඇති බවයි.
හරි, ඔබ මෙය කළ හැකි ආකාරය බැලීමට ඔබට වැඩ කළ හැකි උදාහරණයක් ඉල්ලා ඇත. පියවරෙන් පියවර මම ඔබව ඒ හරහා ගෙන යන්නෙමි. ඔබට අවශ්ය වන්නේ ස්ථාපනය කර ඇති R පිටපතක් පමණි.
පළමුව, අපට දත්ත කිහිපයක් අවශ්යයි. පහත දැක්වෙන කේත කැබලි R ට කපා අලවන්න. මතක තබා ගන්න මෙය මම තැනින් තැන සකස් කළ ව්යාකූල උදාහරණයකි, නමුත් එය ක්රියාවලිය පෙන්වයි.
covariate <- sample(0:1, 100, replace=TRUE)
exposure <- runif(100,0,1)+(0.3*covariate)
outcome <- 2.0+(0.5*exposure)+(0.25*covariate)
එය ඔබේ දත්ත ය. ප්රති come ලය, නිරාවරණය සහ කෝවරියට් අතර ඇති සම්බන්ධය අප දැනටමත් දන්නා බව සලකන්න - එය බොහෝ අනුකරණ අධ්යයනවල කාරණයයි (මෙය අතිශයින්ම මූලික උදාහරණයකි. ඔබ දන්නා ව්යුහයකින් ආරම්භ වන අතර ඔබේ ක්රමයට හැකි බව ඔබ සහතික කරයි ඔබට නිවැරදි පිළිතුර ලබා දෙන්න.
දැන්, ප්රතිගාමී ආකෘතියට. පහත සඳහන් දේ ටයිප් කරන්න:
lm(outcome~exposure)
ඔබට ඉන්ටර්සෙප්ට් = 2.0 සහ නිරාවරණයක් = 0.6766 ලැබුණාද? දත්තවල අහඹු විචල්යතාවයක් ඇති වුවහොත් එයට ආසන්න යමක් තිබේද? හොඳයි - මෙම පිළිතුර වැරදියි. අපි දන්නවා ඒක වැරදියි කියලා. එය වැරදි ඇයි? ප්රති come ලයට හා නිරාවරණයට බලපාන විචල්යයක් පාලනය කිරීමට අප අසමත් වී ඇත. එය ද්විමය විචල්යයකි, ඔබ කැමති ඕනෑම දෙයක් බවට පත් කරන්න - ස්ත්රී පුරුෂ භාවය, දුම් පානය කරන්නා / දුම් නොබොන්නන් යනාදිය.
දැන් මෙම ආකෘතිය ධාවනය කරන්න:
lm(outcome~exposure+covariate)
මෙවර ඔබ අන්තර්ග්රහණය = 2.00, නිරාවරණ = 0.50 සහ කෝවරියට් 0.25 යන සංගුණක ලබා ගත යුතුය. අප දන්නා පරිදි මෙය නිවැරදි පිළිතුරයි. ඔබ වෙනත් විචල්යයන් සඳහා පාලනය කර ඇත.
දැන්, අපට අවශ්ය සියලුම විචල්යයන් ගැන අපි සැලකිලිමත් වී ඇත්දැයි නොදන්නා විට කුමක් සිදුවේද (අපි කිසි විටෙකත් එසේ නොකරමු)? මෙය අවශේෂ ව්යාකූල කිරීම ලෙස හැඳින්වෙන අතර, බොහෝ නිරීක්ෂණ අධ්යයනයන්හි එය සැලකිලිමත් වන්නේ - අප අසම්පූර්ණ ලෙස පාලනය කර ඇති අතර, අපගේ පිළිතුර දකුණට ආසන්නව තිබියදීත් එය හරියටම නොවේ. එය තවත් ප්රයෝජනවත් වේද?