දත්ත කට්ටලයක් කියවීමෙන් පසු:
dataset <- read.csv("forR.csv")
- එහි අඩංගු නඩු ගණන මට ලබා දීමට R ලබා ගන්නේ කෙසේද?
- එසේම, ආපසු ලබා දුන් වටිනාකමට ඇතුළත් කර ඇති බැහැර කළ අවස්ථා ඇතුළත්
na.omit(dataset)
වේද?
දත්ත කට්ටලයක් කියවීමෙන් පසු:
dataset <- read.csv("forR.csv")
na.omit(dataset)
වේද?Answers:
dataset
දත්ත රාමුවක් වනු ඇත. මා සතුව නොමැති බැවින් forR.csv
, නිදර්ශනය සඳහා මම කුඩා දත්ත රාමුවක් සාදමි:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
නඩු ගණන ලබා ගැනීම සඳහා, භාවිතා කරන පේළි ගණන nrow()
හෝ NROW()
:
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
නොකිරිෙම් පසු දත්ත ගණන් කරන්න NA
, එම මෙවලම් භාවිතා කරයි, නමුත් ආවරණය කරනවා dataset
දී na.omit()
:
> NROW(na.omit(dataset))
[1] 993
අතර වෙනස NROW()
සහ NCOL()
ඔවුන්ගේ සිම්පල් ප්රභේද්යයන් ( ncol()
හා nrow()
) එම සිම්පල් සංස්කරණ මාන (අරා මැට්ට්රිස්, දත්ත රාමු) ඇති බව වස්තූන් පමණක් වැඩ කරන බව ය. ලොකු අකුරු අනුවාදයන් 1 තීරු අනුකෘතියක් ලෙස සලකනු ලබන දෛශික සමඟ ක්රියා කරන අතර R හිස් මානයක් පහත වැටෙන පරිදි ඔබේ දත්ත උපසිරැසි කිරීම අවසන් කළහොත් එය ශක්තිමත් වේ.
විකල්පයක් ලෙස, භාවිතා කරන්න complete.cases()
සහ sum
එය ( complete.cases()
තාර්කික දෛශිකයක් ලබා දෙයි [ TRUE
හෝ FALSE
] NA
කිසියම් පේළි සඳහා නිරීක්ෂණ තිබේදැයි දක්වයි .
> sum(complete.cases(dataset))
[1] 993
කෙටියෙන්:
ධාවනය dim(dataset)
දෙකම ලබා ගැනීමට n හා k , ඔබ ද භාවිතා කළ හැකිය nrow(df)
සහ ncol(df)
(හා පවා NROW(df)
හා NCOL(df)
- වෙනත් වර්ග සඳහා ද ප්රභේද අවශ්ය).
ඔබ උදා: හරහා පරිවර්තනය කරන්නේ නම් dataset <- na.omit(dataset)
, එවිට සිද්ධීන් පහව ගොස් ගණන් ගත නොහැක. නමුත් ඔබ උදා: summary(dataset)
NA නඩු සඳහා ගණනය කරනු ලැබේ.
str()
ඔබේ වස්තුව පිළිබඳ වෙනත් ප්රයෝජනවත් තොරතුරු සපයන බැවින් එය බැලීමට ද මම නිර්දේශ කරමි . තීරුවක හැසිරෙන්නේ නැත්තේ මන්දැයි බොහෝ විට පැහැදිලි කළ හැකිය (සංඛ්යා වෙනුවට සාධකය, ආදිය).