《빅데이터(big data)》
대량의 복잡한 데이터들의 모음
빅데이터 특징 : 3V(최근에는 5V, 7V로 이야기를 한다)
- Volume(규모) : 거대한 규모의 데이터(데이터의 용량단위가 TB테라바이트)
- Variety(종류) : 다양한 데이터의 형태 및 범위
- Velocity(속도) : 빠른 데이터 처리 및 분석
-> 거대한 규모의 다양한 데이터를 빠른 수집과 처리를 하면서 나타나는 현상
《R》
- 통계학자가 만든 언어로 다양한 통계정보 산출이 가능하다
- 그래픽 처리 기능이 뛰어나다
- 다양한 패키지 제공(다른 사람이 만들어놓은 기능)
- 한글에 취약. 윈도우 계정 이름, 폴더명이 한글로 되어있으면 문제가 발생할 수 있다
- 사용자간의 커뮤니티가 잘 발달되어 있다
《R과 파이썬》
- R과 파이썬은 무료이다
- 통계 분석 소프트웨어 -> SAS, SPASS(유료)
* R : 프로그래밍 언어이나 파이썬에 비해 통계분석(데이터분석)에 특화되어 있다
* 파이썬 : 프로그래밍 언어로 데이터분석 뿐만 아니라 어플리케이션 개발 등 범용으로 사용가능하다
《R studio》
R을 편리하게 사용하기 위한 IDE 소프트웨어
IDE(Integrated Development Environment) : 다양한 언어를 지원하는 프로그래밍 통합 개발환경이자 프로그래밍 도구
- Script : 스크립트 파일을 보여준다
- Environment : 현재 사용 중인 데이터를 보여준다
- Console : 코드 실행 결과를 보여준다
- Files : workspace 안의 여러개의 파일을 보여준다
콘솔(console)
명령어를 작성하고 실행결과를 확인할 수 있는 창
즉, 컴퓨터와 소통을 할 수 있는 창
* + 를 통해 다음 줄의 명령어들과 연결된다
스크립트(script) 파일
여러개의 명령어를 저장해놓은 파일
콘솔창에서 명령어를 입력하여 사용하면 명령어를 해석하거나 재사용하기 힘들기 때문에
사용할 명령어들을 하나의 스크립트 파일에 저장하여 사용한다
주석(comment)
주석처리가 된 코드는 컴퓨터가 실행하지 않는다
1. 사람이 다른 사람에게 코드를 설명하기 위해서 작성한다
2. 코드를 잠시 실행대상에서 제외하고 싶을 때 사용한다
출력함수와 도움말 함수
함수 : 다른 사람들이 만들어놓은 기능
1. print() : 소괄호 안의 하나의 값을 출력한다
2. cat() : 소괄호 안의 여러개의 값을 출력한다
3. help() : 소괄호 안의 키워드를 help 탭에서 설명을 보여준다
단축키
1. 새로운 스크립트 파일 생성 : ctrl + shift + n
2. 주석 처리 : shift + /
3. 한줄 코드 실행 : ctrl + ente(코드를 실행하고 키보드 커서를 다음줄로 이동), alt + enter(커서 이동 X)
4. 화면 확대 및 축소 : ctrl + '+'(확대), ctrl + '-'(축소)
5. 스크립트 파일의 모든 코드 실행 : ctrl + shift + r
6. 한줄 코드 삭제 : ctrl + d
7. 코드 위아래로 이동 : alt + 위아래 방향키
* 단축키 확인 Tools > keyboard shortcuts help 클릭
* 단축키 수정 Tools > Modify keyboard shortcuts... 클릭
《자료형(type)》
자료의 형태
자료형 | 의미 | 예시 |
숫자형(numeric) | 정수, 실수 등... | -10, 3, 0, -17.3... |
문자형(character) | 문자, 문자열 | "A", "hello", "안녕"... |
논리형(logical) | 참, 거짓 | TRUE, FALSE |
* 문자열(string) : 문자의 나열
* 문자형은 큰따옴표""와 작은따옴표 '' 둘 다 사용이 가능하다
* 논리형은 대문자 그대로 사용한다
* 정수형(integer), 실수형(double)
《변수(variable》
값을 저장하는 저장공간
-> 값을 재사용하기 위해 사용한다
변수 생성
변수명 <- 값
ex) age <- 20
<- : 대입연산자(할당연산자)
왼쪽 저장공간에 오른쪽의 값을 저장한다(alt + -)
변수명 = 값와 동일하다
값 -> 변수명과 동일하다
* 일반적으로는 <- 연산자를 많이 사용한다
'R' 카테고리의 다른 글
[R] 리스트, 요인, 제어문, 함수 (0) | 2024.04.02 |
---|---|
[R] 배열, 데이터프레임, 리스트 (0) | 2024.04.02 |
[R] 벡터, 행렬, 배열 (0) | 2024.03.22 |
[R] 벡터 (0) | 2024.03.19 |
[R] 변수명 규칙, 자료형, 연산자 (0) | 2024.03.19 |