R හි data.frame හි පේළි ගණන ලබා ගන්නේ කෙසේද? [වසා ඇත]

172

වසා ඇත. මෙම ප්‍රශ්නය මාතෘකාවෙන් බැහැර ය . එය දැනට පිළිතුරු පිළිගන්නේ නැත.

මෙම ප්‍රශ්නය වැඩි දියුණු කිරීමට අවශ්‍යද? ප්රශ්නය යාවත්කාලීන ඒක නිසා මත මාතෘකාව කුරුස වලංගු සඳහා.

වසර 6 කට පෙර වසා ඇත.

දත්ත කට්ටලයක් කියවීමෙන් පසු:

dataset <- read.csv("forR.csv")

එහි අඩංගු නඩු ගණන මට ලබා දීමට R ලබා ගන්නේ කෙසේද?
එසේම, ආපසු ලබා දුන් වටිනාකමට ඇතුළත් කර ඇති බැහැර කළ අවස්ථා ඇතුළත් na.omit(dataset)වේද?

— ටොම් රයිට්
source

str()ඔබේ වස්තුව පිළිබඳ වෙනත් ප්‍රයෝජනවත් තොරතුරු සපයන බැවින් එය බැලීමට ද මම නිර්දේශ කරමි . තීරුවක හැසිරෙන්නේ නැත්තේ මන්දැයි බොහෝ විට පැහැදිලි කළ හැකිය (සංඛ්‍යා වෙනුවට සාධකය, ආදිය).

— චේස්

කරුණාකර පළමුව ඕවන්ගේ R මාර්ගෝපදේශය කියවන්න ( cran.r-project.org/doc/contrib/Owen-TheRGuide.pdf ), හැකි නම්, R ( cran.r-project.org/doc/manuals/R- intro.pdf ). දෙදෙනාම ආර් හි නිල වෙබ් අඩවියේ ඇත. ඔබ සැබවින්ම පිළිතුරක් ලබා ගැනීම ඇදහිය නොහැකි තරම් වාසනාවන්තයි. R-help ලැයිස්තුවේ යමෙකු ඔබව අත්පොත වෙත අඩු අලංකාර ලෙස හරවා යවනු ඇත. වරදක් අදහස් නොකෙරේ.

— ජෝරිස් මේස්

Or ජොරිස් - ලක්ෂ්‍යය (වරදකින් තොරව), නමුත් SE අඩවි නිර්මාණය කර ඇත්තේ අත්පොත්වලින් ලබා ගත නොහැකි ආකාරයට ගැටළු / විසඳුම් ඉගෙනීම පෝෂණය කිරීම සඳහා බව මගේ හැඟීමයි. මීට අමතරව, මෙම ප්‍රශ්නය දැන් වෙනත් ආරම්භකයින් සඳහා ලබා ගත හැකිය. සබැඳි වලට ස්තූතියි.

— ටොම් රයිට්

මෙම ප්‍රශ්නය අනෙක් ආරම්භකයින්ට ප්‍රයෝජනවත් වනු ඇති බවට ඔබ කරන ප්‍රකාශයට මම එකඟ නොවෙමි, විශේෂයෙන් ඔවුන් අත්පොත අතපසු නොකරන්නේ නම්. ඔවුන් අනුපිටපත් ප්‍රශ්නයක් පමණක් නිර්මාණය කරනු ඇත.

— ජෝෂුවා උල්රිච්

අවුරුදු හතරකට පසු, මෙම ප්‍රශ්නයට පිළිතුරක් සෙවීමට ගූගල්හි මට ලැබුණු දෙවන පහර මෙයයි. මට අනුපිටපතක් (osh ජොෂුවා උල්රිච්) සෑදීමට අවශ්‍ය නැත.

— රිචඩ්

Answers:

192

datasetදත්ත රාමුවක් වනු ඇත. මා සතුව නොමැති බැවින් forR.csv, නිදර්ශනය සඳහා මම කුඩා දත්ත රාමුවක් සාදමි:

set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
                      B = rnorm(1000))

> head(dataset)
   A           B
1 26  0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91  0.01129269
5 20  0.99160104
6 90  1.59396745

නඩු ගණන ලබා ගැනීම සඳහා, භාවිතා කරන පේළි ගණන nrow()හෝ NROW():

> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000

නොකිරිෙම් පසු දත්ත ගණන් කරන්න NA, එම මෙවලම් භාවිතා කරයි, නමුත් ආවරණය කරනවා datasetදී na.omit():

> NROW(na.omit(dataset))
[1] 993

අතර වෙනස NROW()සහ NCOL()ඔවුන්ගේ සිම්පල් ප්රභේද්යයන් ( ncol()හා nrow()) එම සිම්පල් සංස්කරණ මාන (අරා මැට්ට්රිස්, දත්ත රාමු) ඇති බව වස්තූන් පමණක් වැඩ කරන බව ය. ලොකු අකුරු අනුවාදයන් 1 තීරු අනුකෘතියක් ලෙස සලකනු ලබන දෛශික සමඟ ක්‍රියා කරන අතර R හිස් මානයක් පහත වැටෙන පරිදි ඔබේ දත්ත උපසිරැසි කිරීම අවසන් කළහොත් එය ශක්තිමත් වේ.

විකල්පයක් ලෙස, භාවිතා කරන්න complete.cases()සහ sumඑය ( complete.cases()තාර්කික දෛශිකයක් ලබා දෙයි [ TRUEහෝ FALSE] NAකිසියම් පේළි සඳහා නිරීක්ෂණ තිබේදැයි දක්වයි .

> sum(complete.cases(dataset))
[1] 993

— ගේවින් සිම්සන්
source

කෙටියෙන්:

ධාවනය dim(dataset)දෙකම ලබා ගැනීමට n හා k , ඔබ ද භාවිතා කළ හැකිය nrow(df)සහ ncol(df)(හා පවා NROW(df)හා NCOL(df)- වෙනත් වර්ග සඳහා ද ප්රභේද අවශ්ය).
ඔබ උදා: හරහා පරිවර්තනය කරන්නේ නම් dataset <- na.omit(dataset), එවිට සිද්ධීන් පහව ගොස් ගණන් ගත නොහැක. නමුත් ඔබ උදා: summary(dataset) NA නඩු සඳහා ගණනය කරනු ලැබේ.

— ඩර්ක් එඩෙල්බුටෙල්
source