자격증/빅데이터전문가

[상식/IT] 빅데이터 분석 도구, R

해요빈 2021. 5. 20. 12:55
728x90
반응형
SMALL
R의 이해와 설치
R이란?

R은 통계 분석, 그래픽 표현, 보고 작성을 위한 프로그래밍 언어 및 소프트웨어 환경이다. R의 통계 분석으로는 선형 및 비선형 모델링, 통계 검정, 시계열 분석, 분류, 군집화 등의 작업이 가능하다. R의 그래픽 표현 및 보고 작성 기능을 이용하여 막대형 그래프, 원형 그래프, 3차원 그래프 등 다양한 출력이 가능하다. R은 다음과 같은 특징을 가지고 있다:

통계 분석, 그래픽 표현, 보고 작성을 위한 프로그래밍 언어 및 소프트웨어 환경
통계 분석
선형 및 비선형 모델링, 통계 검정, 시계열 분석, 분류, 군집화 등의 기능
그래픽 표현 및 보고 작성
막대형 그래프, 원형 그래프, 3차원 그래프 등 출력
GNU GPL Version 2 라이선스에 의하여 관리
Windows, Linux, Mac 등 다양한 운영체제 환경 지원
R의 특징
- 효과적인 데이터 핸들링 및 저장소 기능
- 선형대수 연산에 적합한 연산자 제공
- 일관성 있으며 통합된 데이터 분석 도구
- 데이터 분석의 그래픽 및 출력 기능
- 견고하면서도 간결하고 효과적인 프로그래밍 언어 (조건문, 루프, 사용자 정의 재귀 함수, 입출력 기능 등

RStudio : R의 통합개발도구(IDE)

한편, R의 기능 중 그래픽 유저 인터페이스(GUI) 기능을 보완한 것이 바로 RStudio이다. 처음 R을 이용하여 데이터 분석을 하는 빅데이터 전문가라면 RStudio를 이용하여 통합 개발 도구 환경에서 개발하는 것이 권장된다.

- 좀더 편리한 분석 환경을 위하여 그래픽 사용자 인터페이스 (GUI) 제공 필요성 대두 소스코드 편집기, 디버깅, 시각화 도구를 포함
- www.rstudio.com 을 통하여 다운로드 가능
- 데스크톱 버전 : 오픈소스 에디션과 상업 라이선스 버전 - 일반 사용자의 경우 오픈소스 에디션으로 충분
- 서버에서 구동되는 통합개발도구 및 실험 환경도 제공
RStudio의 특징
특징 (오픈소스 에디션의 경우)
- 소스코드 편집기를 이용하여 R의 명령문을 실행 가능
- 소스코드 편집기에서는 문법 하이라이트, 자동완성,들여쓰기 등의 다채로운 기능 제공
- 프로젝트와 작업 디렉터리의 관리 기능 제공
- 통합된 도움말 및 문서 기능 제공
RStudio의 구성요소
메뉴(Menu)
- 파일, 편집, 코드, 보기 그래프(plots),세션, 빌드, 디버그, 프로파일, 도구,도움말 등의 기능에 접근 가능
도구 바(toolbar)
- 자주 쓰는 기능을 아이콘으로 정의하여 편리하게 접근할 수 있도록 한 UI
- 사용자가 직접 원하는 기능을 등록하여 사용 가능
소스코드 편집 탭 (Editor)
- R 언어로 작성하는 소스코드를 입력
- 문법(syntax)에 따른 하이라이트(문법이 틀린 부분을 알려주는) 기능
- 자동 완성(auto completion) 기능
- 자동 들여쓰기(auto-indent) 기능
콘솔 탭 (Console)
- R 언어로 된 명령문을 직접 입력하여 실행 가능
- 입력한 명령문의 실행 결과는 콘솔창으로 실시간 출력
- 명령문을 이용하여 그래프 출력, 파일 입출력 가능
환경 탭 (Environment)
- 현재 환경에서 정의된 변수의 일람을 볼 수 있는 곳
- 변수의 이름, 변수의 값 등을 볼 수 있음
파일 탭 (Environment)
- 시스템의 파일 읽기, 저장, 삭제 등
- 디렉터리 생성, 변경, 삭제 등
플롯 탭 (Plots)
- 그래프 명령어를 통한 결과가 나타나는 탭
- 그래프의 설정을 직접 바꿀 수 있는 GUI 제공
- 출력된 그래프를 추출(export) 가능
728x90
반응형
LIST