✔︎ 문자열 지정하는 두 가지 방법 1) x length(y) [1] 1 ✔︎ 문자열 지정 - 나중에 data 추가 가능 - 문자열 지정 후 나중에 data값 입력 가능 - 기존 지정된 범위(아래 예시에서는 5개) 밖에 data 지정 가능 (중간 빈 값 NA로 나옴) - 중간 빈 값에도 data 입력 가능 z z [1] "a" "1" "100" z z [1] "" "" "" "" "" > length(z) [1] 5 z[3] z [1] "" "" "3rd" "" "" z[7] z [1] "" "" "3rd" "" "" NA "7th" z[6] z [1] "" "" "3rd" "" "" "6" "7th" > length(z) [1] 7 ✔︎ 문자열 여부 확인 및 변경 - is.character() : 문자..
유튜브 datasciencelim 님의 R 프로그램 강의 내용을 토대로 통계 프로그램 R의 기초 내용 정리합니다. read.table(file.choose())는 파일 형식으로 된 자료를 읽어옴 엑셀이 아닌 .txt 또는 .csv로 바꿔서 사용 - Tab Delimited Text / Comma Separated Values * XYZ = 데이터프레임 이름 ✔︎ XYZ
유튜브 datasciencelim 님의 R 프로그램 강의 내용을 토대로 통계 프로그램 R의 기초 내용 정리합니다. 데이터 정리를 위한 패키지(tidyr, dplyr) 설치 ✔︎ install.packages("tidyr") ✔︎ install.packages("dplyr") 이후에는 아래와 같이 써주면 된다. ✔︎ library(tidyr) ✔︎ library(dplyr) X =40) : new 데이터셋에서 age가 40 이상인 것만 분류 filter(new, age>=40) # 결과 family type age name 1 1 m 44 d 2 2 f 40 b 3 2 m 53 e 매번 새로운 데이터셋 정의하는 것이 귀찮으므로 pipeline (%>%) 사용 (위부터 순차적으로 진행) X new % gat..
유튜브 datasciencelim 님의 R 프로그램 강의 내용을 토대로 통계 프로그램 R의 기초 내용 정리합니다. ✔︎ runif(100): 임의 수치(random)를 같은 확률(uniform)로 100개 뽑아라 ➲ 0~1 사이의 값 100개가 출력됨 ✔︎ ceiling(x): 수치를 올림해라 ✔︎ table(xyz): 각 요소가 몇 번 나왔는지 ✔︎ barplot(xyz): 막대그래프 # uniform distribution simulation # p = 1/n, n of die = 6 roll
유튜브 datasciencelim 님의 R 프로그램 강의 수강 중입니다. 강의 중 예제를 응용하여 정리합니다. data.frame은 data를 표 형식으로 보여줌 [행, 열] ✔︎ 데이터프레임 이름 [1, ] : 표의 1행을 가로 형식으로 + 카테고리 ✔︎ 데이터프레임 이름 [ ,1] : 표의 1열을 가로 형식으로 ✔︎ 데이터프레임 이름 [1] : 표의 1열을 세로 형식으로 + 카테고리 ✔︎ 데이터프레임 이름 $카테고리 이름 : 표 카테고리에 해당하는 data를 가로 형식으로 ✔︎ 데이터프레임 이름 [x,y]
통계 프로그램 R의 기초 내용 정리합니다. ✔︎ 문자(chr): 작은 따옴표 안에 있는 것은 문자로 인식 (=charactor) ✔︎ 숫자(num): 숫자로 입력된 것 *R에서 숫자는 1부터 시작, 다른 통계 프로그램에서는 0부터 시작 ✔︎ length(x): x안에 몇 개의 벡터가 있는지 cf. nchar(x): x의 글자 수 ✔︎ str(x): Data 속성. 즉 x의 Data가 문자or숫자인지, 몇 개인지 등 (=structure) ✔︎ x==y : x와 y가 같은지 판단. 결과값은 TRUE 또는 FALSE 로 나옴 *R에서는 '=' 은 '담겨 있다'의 의미 ✔︎ z 5]): 5보다 큰 Data의 합 ➲ 63 ✔︎ which(x>5): 5보다 큰 Data의 위치 ➲ [1] 17 18 19 20 21..