유튜브 datasciencelim 님의 R 프로그램 강의 내용을 토대로 통계 프로그램 R의 기초 내용 정리합니다. read.table(file.choose())는 파일 형식으로 된 자료를 읽어옴 엑셀이 아닌 .txt 또는 .csv로 바꿔서 사용 - Tab Delimited Text / Comma Separated Values * XYZ = 데이터프레임 이름 ✔︎ XYZ
유튜브 datasciencelim 님의 R 프로그램 강의 내용을 토대로 통계 프로그램 R의 기초 내용 정리합니다. 데이터 정리를 위한 패키지(tidyr, dplyr) 설치 ✔︎ install.packages("tidyr") ✔︎ install.packages("dplyr") 이후에는 아래와 같이 써주면 된다. ✔︎ library(tidyr) ✔︎ library(dplyr) X =40) : new 데이터셋에서 age가 40 이상인 것만 분류 filter(new, age>=40) # 결과 family type age name 1 1 m 44 d 2 2 f 40 b 3 2 m 53 e 매번 새로운 데이터셋 정의하는 것이 귀찮으므로 pipeline (%>%) 사용 (위부터 순차적으로 진행) X new % gat..
유튜브 datasciencelim 님의 R 프로그램 강의 내용을 토대로 통계 프로그램 R의 기초 내용 정리합니다. ✔︎ runif(100): 임의 수치(random)를 같은 확률(uniform)로 100개 뽑아라 ➲ 0~1 사이의 값 100개가 출력됨 ✔︎ ceiling(x): 수치를 올림해라 ✔︎ table(xyz): 각 요소가 몇 번 나왔는지 ✔︎ barplot(xyz): 막대그래프 # uniform distribution simulation # p = 1/n, n of die = 6 roll
유튜브 datasciencelim 님의 R 프로그램 강의 수강 중입니다. 강의 중 예제를 응용하여 정리합니다. data.frame은 data를 표 형식으로 보여줌 [행, 열] ✔︎ 데이터프레임 이름 [1, ] : 표의 1행을 가로 형식으로 + 카테고리 ✔︎ 데이터프레임 이름 [ ,1] : 표의 1열을 가로 형식으로 ✔︎ 데이터프레임 이름 [1] : 표의 1열을 세로 형식으로 + 카테고리 ✔︎ 데이터프레임 이름 $카테고리 이름 : 표 카테고리에 해당하는 data를 가로 형식으로 ✔︎ 데이터프레임 이름 [x,y]
통계 프로그램 R의 기초 내용 정리합니다. ✔︎ 문자(chr): 작은 따옴표 안에 있는 것은 문자로 인식 (=charactor) ✔︎ 숫자(num): 숫자로 입력된 것 *R에서 숫자는 1부터 시작, 다른 통계 프로그램에서는 0부터 시작 ✔︎ length(x): x안에 몇 개의 벡터가 있는지 cf. nchar(x): x의 글자 수 ✔︎ str(x): Data 속성. 즉 x의 Data가 문자or숫자인지, 몇 개인지 등 (=structure) ✔︎ x==y : x와 y가 같은지 판단. 결과값은 TRUE 또는 FALSE 로 나옴 *R에서는 '=' 은 '담겨 있다'의 의미 ✔︎ z 5]): 5보다 큰 Data의 합 ➲ 63 ✔︎ which(x>5): 5보다 큰 Data의 위치 ➲ [1] 17 18 19 20 21..
통계 프로그램 'R' 공부를 시작해보려 합니다. R만 설치하는 것이 아니라 명령문 입력과 결과값을 보기 편하게 해주는 RStudio도 같이 설치해줍니다. 순서는 R 먼저 설치한 다음에 RStudio를 설치해야 해요. 이후에는 RStudio만 실행하면 됩니다. R 다운로드 (윈도우) https://cran.r-project.org/bin/windows/base/ (맥) https://cran.r-project.org/bin/macosx/ RStudio 다운로드 https://www.rstudio.com/products/rstudio/ 위 사이트를 가시면 아래 두 가지 버젼이 나오는데, 우리는 RStudio Desktop을 다운받을꺼에요. 아래 왼쪽 박스를 누른 후 몇 번의 이동 끝에 무료인 RStudio ..