සංඛ්‍යාලේඛන සහ විශාල දත්ත

සංඛ්‍යාලේඛන, යන්ත්‍ර ඉගෙනීම, දත්ත විශ්ලේෂණය, දත්ත කැණීම සහ දත්ත දෘශ්‍යකරණය පිළිබඳ උනන්දුවක් දක්වන පුද්ගලයින් සඳහා ප්‍රශ්නෝත්තර

4
QQ කුමන්ත්‍රණයක් අර්ථ නිරූපණය කරන්නේ කෙසේද?
මම කුඩා දත්ත කට්ටලයක් සමඟ (නිරීක්ෂණ 21 ක්) වැඩ කරන අතර R හි පහත දැක්වෙන සාමාන්‍ය QQ බිම් කොටස ඇත: කුමන්ත්‍රණය සාමාන්‍ය තත්වයට සහාය නොදක්වන බව දුටු විට, යටින් පවතින ව්‍යාප්තිය ගැන මට කුමක් කිව හැකිද? මට පෙනෙන පරිදි බෙදා හැරීම දකුණට වඩා ඇලවීම වඩා හොඳ සුදුසුකමක් වනු ඇත, එය …

15
දත්ත විද්‍යා ist යෙක් යනු කුමක්ද?
සංඛ්‍යාලේඛන පිළිබඳ මගේ ආචාර්ය උපාධි පා program මාලාවෙන් මෑතකදී උපාධිය ලබා ඇති මම පසුගිය මාස කිහිපය තුළ සංඛ්‍යාලේඛන ක්ෂේත්‍රයේ රැකියාවක් සෙවීම ආරම්භ කළෙමි. මා සලකා බැලූ සෑම සමාගමකම පාහේ " දත්ත විද්‍යා ient යා " යන මාතෘකාව සහිත රැකියා පළ කිරීමක් තිබුණි . ඇත්ත වශයෙන්ම, සංඛ්‍යාන විද්‍යා ient යෙකුගේ හෝ …

3
මම ලැසෝ එදිරිව රිජ් භාවිතා කළ යුත්තේ කවදාද?
මට පරාමිති විශාල සංඛ්‍යාවක් තක්සේරු කිරීමට අවශ්‍ය යැයි පවසන්න, ඒවායින් සමහරක් ද ize ුවම් කිරීමට මට අවශ්‍ය වන්නේ ඒවා අනෙක් ඒවාට සාපේක්ෂව අඩු බලපෑමක් ඇති කළ යුතු යැයි මා විශ්වාස කරන බැවිනි. කුමන ද penal ුවම් ක්‍රමයක් භාවිතා කළ යුතුදැයි මා තීරණය කරන්නේ කෙසේද? රිජ් ප්‍රතිගාමීත්වය වඩාත් සුදුසු වන්නේ කවදාද? …

9
ලොජිස්ටික් රෙග්‍රේෂන් හි පරිපූර්ණ වෙන්වීමක් සමඟ කටයුතු කරන්නේ කෙසේද?
ඉලක්ක විචල්‍යයේ ශුන්‍යයන් සහ ඒවා පරිපූර්ණ ලෙස වෙන් කරන විචල්‍යයක් ඔබ සතුව ඇත්නම්, R විසින් පහත දැක්වෙන “පරිපූර්ණ හෝ අර්ධ පරිපූර්ණ වෙන් කිරීම” අනතුරු ඇඟවීමේ පණිවිඩය ලබා දෙනු ඇත: Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred අපට තවමත් ආකෘතිය ලැබුණද සංගුණක ඇස්තමේන්තු උද්ධමනය කර ඇත. ප්‍රායෝගිකව ඔබ …

9
හදිසියේ ආතන්ය කෙරෙහි ඇති ඇල්ම ඇයි?
බොහෝ අය බොහෝ ක්‍රමවල ආතති සමානාත්මතා වර්ධනය කරන බව මම මෑතකදී දුටුවෙමි (ආතති සාධකකරණය, ආතන්‍ය කර්නල්, මාතෘකා ආකෘති නිර්මාණය සඳහා ආතන්‍ය යනාදිය) මම කල්පනා කරමි, ලෝකය හදිසියේම ආතතීන් කෙරෙහි ඇල්මක් දක්වන්නේ ඇයි? විශේෂයෙන් පුදුමයට කරුණක් වන මෑත කාලීන පත්‍රිකා / සම්මත ප්‍රති results ල තිබේද? එය කලින් සැක කළ ප්‍රමාණයට …

4
ROC එදිරිව නිරවද්‍යතාව සහ නැවත කැඳවීමේ වක්‍ර
ඔවුන් අතර ඇති විධිමත් වෙනස්කම් මට වැටහී ඇත, මට දැන ගැනීමට අවශ්‍ය වන්නේ එකක් එදිරිව එදිරිව භාවිතා කිරීම වඩාත් අදාළ වන විටය. දී ඇති වර්ගීකරණ / හඳුනාගැනීමේ පද්ධතියක ක්‍රියාකාරිත්වය පිළිබඳව ඔවුන් සැමවිටම අනුපූරක අවබෝධයක් ලබා දෙනවාද? ඒ දෙකම කඩදාසියකින් ලබා දීම සාධාරණ වන්නේ කවදාද? එකක් වෙනුවට? වර්ගීකරණ පද්ධතියක් සඳහා ROC …

6
K- ගුණයකින් හරස් වලංගු කිරීමෙන් පසු පුරෝකථන ආකෘතියක් තෝරා ගන්නේ කෙසේද?
K- ගුණයකින් හරස් වලංගුකරණය කිරීමෙන් පසු පුරෝකථන ආකෘතියක් තෝරා ගන්නේ කෙසේදැයි මම කල්පනා කරමි. මෙය අමුතු ලෙස සැකසීමට ඉඩ ඇත, එබැවින් මට වඩාත් විස්තරාත්මකව විස්තර කිරීමට ඉඩ දෙන්න: මම K- ගුණයකින් හරස් වලංගුකරණය ක්‍රියාත්මක කරන සෑම විටම, මම පුහුණු දත්තවල K උප කුලක භාවිතා කරන අතර K විවිධ මාදිලි සමඟ …

2
R හි data.frame හි පේළි ගණන ලබා ගන්නේ කෙසේද? [වසා ඇත]
වසා ඇත. මෙම ප්‍රශ්නය මාතෘකාවෙන් බැහැර ය . එය දැනට පිළිතුරු පිළිගන්නේ නැත. මෙම ප්‍රශ්නය වැඩි දියුණු කිරීමට අවශ්‍යද? ප්රශ්නය යාවත්කාලීන ඒක නිසා මත මාතෘකාව කුරුස වලංගු සඳහා. වසර 6 කට පෙර වසා ඇත. දත්ත කට්ටලයක් කියවීමෙන් පසු: dataset <- read.csv("forR.csv") එහි අඩංගු නඩු ගණන මට ලබා දීමට R ලබා …
172 r 

8
රේඛීය ප්‍රතිගාමීයේදී, සත්‍ය අගයන් වෙනුවට ස්වාධීන විචල්‍යයක ලොගය භාවිතා කිරීම සුදුසු වන්නේ කවදාද?
සැක සහිත ස්වාධීන විචල්‍යය සඳහා වඩා හොඳ හැසිරීම් බෙදාහැරීමක් මා සොයන්නේද, නැතහොත් පිටස්තරයින්ගේ බලපෑම අඩු කිරීම සඳහාද?

3
ආර් ගේ ලාමර් වංචා පත්‍රය
භාවිතා කරමින් විවිධ ධූරාවලි ආකෘති නියම කිරීම සඳහා නිසි ආකාරය පිළිබඳව මෙම සංසදයේ විශාල සංවාදයක් පවතී lmer. සියලු තොරතුරු එකම තැනක තබා ගැනීම හොඳ යැයි මම සිතුවෙමි. ආරම්භ කිරීමට ප්‍රශ්න කිහිපයක්: එක් කණ්ඩායමක් අනෙකා තුළ කූඩු කර ඇති බහු මට්ටම් නියම කරන්නේ කෙසේද: එය (1|group1:group2)එසේ ද (1+group1|group2)? අතර වෙනස කුමක් …


21
සංඛ්‍යාලේඛන ප්‍රජාව තුළ රැඳී සිටීමට ජූලියාට බලාපොරොත්තුවක් තිබේද?
ජූලියා නමින් නව භාෂාවක් ගැන ජෝන් මයිල්ස් වයිට්ගේ මෙම බ්ලොග් සටහනට සම්බන්ධ කළ ආර්-බ්ලොග්කරුවන්ගේ ලිපියක් මම මෑතකදී කියෙව්වෙමි . ජූලියා කාලානුරූපී සම්පාදකයෙකුගෙන් වාසි ලබා ගන්නා අතර එය දුෂ්ට වේගවත් ධාවන වේලාවන් ලබා දෙන අතර එය සී / සී ++ (එකම අනුපිළිවෙල , සමානව වේගවත් නොවේ) තරම් විශාලත්වයේ අනුපිළිවෙලකට තබයි . …

6
අඛණ්ඩ හා වර්ගීකරණ විචල්‍යයන්ගේ මිශ්‍රණයක් අඩංගු දත්ත කට්ටල සඳහා ප්‍රධාන සංරචක විශ්ලේෂණය යෙදිය හැකිද?
අඛණ්ඩ හා වර්ගීකරණ දත්ත ඇති දත්ත කට්ටලයක් මා සතුව ඇත. මම PCA භාවිතා කරමින් විශ්ලේෂණය කරමින් සිටින අතර විශ්ලේෂණයේ කොටසක් ලෙස වර්ගීකරණ විචල්‍යයන් ඇතුළත් කිරීම සුදුසු දැයි මම කල්පනා කරමි. මගේ අවබෝධය නම් PCA යෙදිය හැක්කේ අඛණ්ඩ විචල්‍යයන්ට පමණි. ඒක හරිද? වර්ගීකරණ දත්ත සඳහා එය භාවිතා කළ නොහැකි නම්, ඒවායේ …

7
සහසම්බන්ධය හෝ සහසංයුජතාව පිළිබඳ PCA?
සහසම්බන්ධිත අනුකෘතිය සහ සහසංයුජ අනුකෘතිය මත ප්‍රධාන සංරචක විශ්ලේෂණය (පීසීඒ) සිදු කිරීම අතර ඇති ප්‍රධාන වෙනස්කම් මොනවාද? ඔවුන් එකම ප්‍රති results ල ලබා දෙනවාද?

3
උත්පාදක එදිරිව
උත්පාදක මාධ්‍යයන් " පී( x , y)පී(x,y)P(x,y) මත පදනම්ව" සහ වෙනස් කොට සැලකීම " මත පදනම්ව පී( y| x)පී(y|x)P(y|x)" ඇති බව මම දනිමි, නමුත් මම කරුණු කිහිපයක් මත ව්‍යාකූල වී සිටිමි: විකිපීඩියාව (+ වෙබයේ තවත් බොහෝ පහරවල්) SVM සහ තීරණ ගැනීමේ ගස් වැනි දේවල් වෙනස් කොට සැලකීම ලෙස වර්ගීකරණය කරයි. …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.