본문 바로가기

R

RStudio 변수 유형

728x90

1. 벡터(Vector) : 선형 자료 구조, 같은 자료형의 변수만 저장 가능

자료구조 생성 방법

c(n:m)
n:m
c(1,2,3)
#n과 m은 0이 아닌 정수

c()는 벡터 뿐 아니라 다른 자료구조도 생성하는데 자주 이용된다. 여러 값을 자료구조 형태로 결합한다는 의미로 combine의 첫글자를 따왔다.

벡터는 같은 자료형을 갖기 때문에 c() 함수 사용시 c(1,2,"3")로 자료형이 c(정수, 문자열)인 경우 문자열로 자료형이 통일된다.

rep(n:m, each=k) 는 n부터 m까지 k번 반복, seq(n,m,k) 는 n부터 m까지 k간격으로 자료를 생성한다.

union(Vector1, Vector2) # 벡터1, 벡터2의 합집합
intersect(Vector1, Vector2) #벡터1, 벡터2의 교집합
setdiff(Vector1, Vector2) #Vector1과 Vector2의 차집합 Vector1-Vector2

 

2. 행렬(Matrix) : 2차원 배열구조, 같은 자료형의 변수만 저장. 수학에서의 행렬이다.

 

 

데이터 생성 방법

matrix(data = d, nrow = n, ncol = m, byrow = FALSE, dimnames = "") #byrow의 디폴트는 FALSE

data  = 입력자료, nrow = 행 수, ncol  = 열 수, byrow = 기준 행/열 지정, TRUE일 경우 행이 우선순위. ,dimnames = 행열 이름

matrix(c(data)) #default값인 열을 기준으로 생성
rbind(Vector1, Vector2) #row bind
cbind(Vector1, Vector2) #column bind

rbind, cbind를 이용하여 선형자료를 기준에 따라 묶어서 행렬을 만들 수도 있다.

굳이 Vector가 아니라 c(n:m)형식의 선형 자료형도 가능하다.

 

3. 배열(Array) : 다차원 배열구조, 같은 자료형의 변수만 저장, 행렬+면의 개념

자료구조 생성 방법

array(data, c(n,m,k)) # n = 행, m = 열, k = 면

 

4. DataFrame : 행과 열의 2차원, 데이터베이스의 테이블스키마와 유사함. 

자료구조 생성 방법

data.frame(Vector1 = field1, Vector2 = field2, Vector3 = field3)
# 데이터 = 컬럼명의 형태

행렬을 이용하여 기존 행렬 matrix에 대해 data.frame으로 생성가능

matrix A에 대해서
data.frame(A)

그 밖에 경로에서 테이블이나 csv 등의 데이터 파일을 불러올 수도 있다.

read.table('경로', header = 1, sep = "") # sep는 구분자
read.csv('경로', header = T) # 디폴트 구분자 ","   ,sep[]으로 구분자 설정 가능

테이블 참조

데이터 프레임 df에 대해서 df$칼럼명으로 참조 가능.

 

subset으로 부분객체 생성

 subtable <- subset(df, 조건) # sql 언어 중 where과 유사

조건이 컬럼 =   n 일 경우 열값중 컬럼 = n 인 행만 모인 새로운 테이블이 생성된다.

 

merge로 객체 병합

mearge(table1, table2, 조인 조건)

table1 과 table2 를 조건에 따라 병합. 기준이 되는 컬럼을 세번째 인수에서 지정

 

5.리스트(List) 서로 다른 자료형을 저장, 자료구조도 저장 가능, 키와 값의 쌍으로 저장, 자바의 맵과 유사함.

list("string", "numberic", array)

list() 형태로 생성, key는 생략할 수 있음

728x90

'R' 카테고리의 다른 글

dplyr 패키지  (0) 2023.08.15
RStudio 데이터 입출력  (1) 2023.08.09
R Studio - 패키지 로드  (0) 2023.08.07
Rstudio 설치하기 (window)  (0) 2023.07.13