දත්ත කට්ටලයක් කියවීමෙන් පසු:
dataset <- read.csv("forR.csv")
- එහි අඩංගු නඩු ගණන මට ලබා දීමට R ලබා ගන්නේ කෙසේද?
- එසේම, ආපසු ලබා දුන් වටිනාකමට ඇතුළත් කර ඇති බැහැර කළ අවස්ථා ඇතුළත්
na.omit(dataset)වේද?
දත්ත කට්ටලයක් කියවීමෙන් පසු:
dataset <- read.csv("forR.csv")
na.omit(dataset)වේද?Answers:
datasetදත්ත රාමුවක් වනු ඇත. මා සතුව නොමැති බැවින් forR.csv, නිදර්ශනය සඳහා මම කුඩා දත්ත රාමුවක් සාදමි:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
නඩු ගණන ලබා ගැනීම සඳහා, භාවිතා කරන පේළි ගණන nrow()හෝ NROW():
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
නොකිරිෙම් පසු දත්ත ගණන් කරන්න NA, එම මෙවලම් භාවිතා කරයි, නමුත් ආවරණය කරනවා datasetදී na.omit():
> NROW(na.omit(dataset))
[1] 993
අතර වෙනස NROW()සහ NCOL()ඔවුන්ගේ සිම්පල් ප්රභේද්යයන් ( ncol()හා nrow()) එම සිම්පල් සංස්කරණ මාන (අරා මැට්ට්රිස්, දත්ත රාමු) ඇති බව වස්තූන් පමණක් වැඩ කරන බව ය. ලොකු අකුරු අනුවාදයන් 1 තීරු අනුකෘතියක් ලෙස සලකනු ලබන දෛශික සමඟ ක්රියා කරන අතර R හිස් මානයක් පහත වැටෙන පරිදි ඔබේ දත්ත උපසිරැසි කිරීම අවසන් කළහොත් එය ශක්තිමත් වේ.
විකල්පයක් ලෙස, භාවිතා කරන්න complete.cases()සහ sumඑය ( complete.cases()තාර්කික දෛශිකයක් ලබා දෙයි [ TRUEහෝ FALSE] NAකිසියම් පේළි සඳහා නිරීක්ෂණ තිබේදැයි දක්වයි .
> sum(complete.cases(dataset))
[1] 993
කෙටියෙන්:
ධාවනය dim(dataset)දෙකම ලබා ගැනීමට n හා k , ඔබ ද භාවිතා කළ හැකිය nrow(df)සහ ncol(df)(හා පවා NROW(df)හා NCOL(df)- වෙනත් වර්ග සඳහා ද ප්රභේද අවශ්ය).
ඔබ උදා: හරහා පරිවර්තනය කරන්නේ නම් dataset <- na.omit(dataset), එවිට සිද්ධීන් පහව ගොස් ගණන් ගත නොහැක. නමුත් ඔබ උදා: summary(dataset) NA නඩු සඳහා ගණනය කරනු ලැබේ.
str()ඔබේ වස්තුව පිළිබඳ වෙනත් ප්රයෝජනවත් තොරතුරු සපයන බැවින් එය බැලීමට ද මම නිර්දේශ කරමි . තීරුවක හැසිරෙන්නේ නැත්තේ මන්දැයි බොහෝ විට පැහැදිලි කළ හැකිය (සංඛ්යා වෙනුවට සාධකය, ආදිය).