R හි data.frame හි පේළි ගණන ලබා ගන්නේ කෙසේද? [වසා ඇත]


172

දත්ත කට්ටලයක් කියවීමෙන් පසු:

dataset <- read.csv("forR.csv")
  • එහි අඩංගු නඩු ගණන මට ලබා දීමට R ලබා ගන්නේ කෙසේද?
  • එසේම, ආපසු ලබා දුන් වටිනාකමට ඇතුළත් කර ඇති බැහැර කළ අවස්ථා ඇතුළත් na.omit(dataset)වේද?

2
str()ඔබේ වස්තුව පිළිබඳ වෙනත් ප්‍රයෝජනවත් තොරතුරු සපයන බැවින් එය බැලීමට ද මම නිර්දේශ කරමි . තීරුවක හැසිරෙන්නේ නැත්තේ මන්දැයි බොහෝ විට පැහැදිලි කළ හැකිය (සංඛ්‍යා වෙනුවට සාධකය, ආදිය).
චේස්

3
කරුණාකර පළමුව ඕවන්ගේ R මාර්ගෝපදේශය කියවන්න ( cran.r-project.org/doc/contrib/Owen-TheRGuide.pdf ), හැකි නම්, R ( cran.r-project.org/doc/manuals/R- intro.pdf ). දෙදෙනාම ආර් හි නිල වෙබ් අඩවියේ ඇත. ඔබ සැබවින්ම පිළිතුරක් ලබා ගැනීම ඇදහිය නොහැකි තරම් වාසනාවන්තයි. R-help ලැයිස්තුවේ යමෙකු ඔබව අත්පොත වෙත අඩු අලංකාර ලෙස හරවා යවනු ඇත. වරදක් අදහස් නොකෙරේ.
ජෝරිස් මේස්

11
Or ජොරිස් - ලක්ෂ්‍යය (වරදකින් තොරව), නමුත් SE අඩවි නිර්මාණය කර ඇත්තේ අත්පොත්වලින් ලබා ගත නොහැකි ආකාරයට ගැටළු / විසඳුම් ඉගෙනීම පෝෂණය කිරීම සඳහා බව මගේ හැඟීමයි. මීට අමතරව, මෙම ප්‍රශ්නය දැන් වෙනත් ආරම්භකයින් සඳහා ලබා ගත හැකිය. සබැඳි වලට ස්තූතියි.
ටොම් රයිට්

2
මෙම ප්‍රශ්නය අනෙක් ආරම්භකයින්ට ප්‍රයෝජනවත් වනු ඇති බවට ඔබ කරන ප්‍රකාශයට මම එකඟ නොවෙමි, විශේෂයෙන් ඔවුන් අත්පොත අතපසු නොකරන්නේ නම්. ඔවුන් අනුපිටපත් ප්‍රශ්නයක් පමණක් නිර්මාණය කරනු ඇත.
ජෝෂුවා උල්රිච්

6
අවුරුදු හතරකට පසු, මෙම ප්‍රශ්නයට පිළිතුරක් සෙවීමට ගූගල්හි මට ලැබුණු දෙවන පහර මෙයයි. මට අනුපිටපතක් (osh ජොෂුවා උල්රිච්) සෑදීමට අවශ්‍ය නැත.
රිචඩ්

Answers:


192

datasetදත්ත රාමුවක් වනු ඇත. මා සතුව නොමැති බැවින් forR.csv, නිදර්ශනය සඳහා මම කුඩා දත්ත රාමුවක් සාදමි:

set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
                      B = rnorm(1000))

> head(dataset)
   A           B
1 26  0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91  0.01129269
5 20  0.99160104
6 90  1.59396745

නඩු ගණන ලබා ගැනීම සඳහා, භාවිතා කරන පේළි ගණන nrow()හෝ NROW():

> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000

නොකිරිෙම් පසු දත්ත ගණන් කරන්න NA, එම මෙවලම් භාවිතා කරයි, නමුත් ආවරණය කරනවා datasetදී na.omit():

> NROW(na.omit(dataset))
[1] 993

අතර වෙනස NROW()සහ NCOL()ඔවුන්ගේ සිම්පල් ප්රභේද්යයන් ( ncol()හා nrow()) එම සිම්පල් සංස්කරණ මාන (අරා මැට්ට්රිස්, දත්ත රාමු) ඇති බව වස්තූන් පමණක් වැඩ කරන බව ය. ලොකු අකුරු අනුවාදයන් 1 තීරු අනුකෘතියක් ලෙස සලකනු ලබන දෛශික සමඟ ක්‍රියා කරන අතර R හිස් මානයක් පහත වැටෙන පරිදි ඔබේ දත්ත උපසිරැසි කිරීම අවසන් කළහොත් එය ශක්තිමත් වේ.

විකල්පයක් ලෙස, භාවිතා කරන්න complete.cases()සහ sumඑය ( complete.cases()තාර්කික දෛශිකයක් ලබා දෙයි [ TRUEහෝ FALSE] NAකිසියම් පේළි සඳහා නිරීක්ෂණ තිබේදැයි දක්වයි .

> sum(complete.cases(dataset))
[1] 993

38

කෙටියෙන්:

  1. ධාවනය dim(dataset)දෙකම ලබා ගැනීමට n හා k , ඔබ ද භාවිතා කළ හැකිය nrow(df)සහ ncol(df)(හා පවා NROW(df)හා NCOL(df)- වෙනත් වර්ග සඳහා ද ප්රභේද අවශ්ය).

  2. ඔබ උදා: හරහා පරිවර්තනය කරන්නේ නම් dataset <- na.omit(dataset), එවිට සිද්ධීන් පහව ගොස් ගණන් ගත නොහැක. නමුත් ඔබ උදා: summary(dataset) NA නඩු සඳහා ගණනය කරනු ලැබේ.

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.