R언어

R을 활용한 통계학개론

뉴질랜드 오클랜드대학교의 로스 이하카(Ross Ihaka)와 로버트 클리포드 젠틀맨(Robert Clifford Gentleman)에 의해 만들어졌으며, R Development Core Team에 의해 유지보수 및 확장이 이루어지고 있다. R언어의 소스 코드는 주로 C, 포트란 등에 의해 개발되었으며, 문법적으로는 AT&T 벨 연구소가 개발한 S언어 및 스킴(Scheme)을 참고하고 있다. R은 GNU 프로젝트의 일부로 GNU GPL(General Public License) 하에서 자유롭게 사용 가능하며, 다양한 운영체제를 위한 프리컴파일(pre-compiled)된 바이너리 버전이 제공되고 있다.

R은 CRAN(The Comprehensive R Archive Network)에서 다운로드하여 설치 가능하며, 윈도우즈, 맥, 유닉스, 리눅스 등에서 동작한다. 2016년 6월에 3.3.1 버전이 출시되었다.

이 가이드는 부산대학교 교양선택과목에 개설된 ‘R을 활용한 통계학개론’ 강좌의 교육과 학습에 필요한 학정보를 담고 있다. 통계학의 기본 개념을 소개하고 통계 패키지 R의 사용법을 예제를 통해 익힌다. 고급 통계학 및 빅 데이터 분석을 위한 기본 지식을 함양시킨다. 인공지능(AI)의 원리를 제대로 이해하기 위한 밑거름이 되게 한다.

R은 다음과 같은 특징을 가진다.

– 인터프리터 언어로 일반적으로 명령어 라인 인터프리터를 통해 실행 가능하다.

– 함수를 이용한 절차지향(procedural programming)뿐만 아니라 객체 지향 프로그래밍도 지원한다.

– 벡터, 배열, 행렬 등의 동적 데이터형 및 고차 함수, 고수준의 내장 함수 등을 기반으로 통계에 적합한 분석 환경을 제공한다.

– 행렬 등의 복잡한 데이터 구조에 최적화된 고속 임베디드 함수를 내장하고 있다.

– 빠른 계산이 요구되는 경우 외부 프로그램과 동적 링크가 가능하다.

– 데이터의 그래프, 플롯(plot) 기능 등 뛰어난 시각화 기능을 제공한다.

– 다른 통계 소프트웨어의 입출력 포맷 및 ODBC를 통한 각종 데이터베이스에 접근 가능하며, 웹 등의 다양한 데이터 소스와의 연결 기능을 갖추고 있다.

– 명령의 문법이 단순하기 때문에 교육 및 실무 현장에서 모두 이용 가능하다. <출처: 네이버지식백과>

수강자의 TIP

학습정보가이드 서포터즈의 활동보고서와 댓글을 참고하여 작성되었습니다.

2022-2 [분반:032]

K-MOOC을 통해 비대면으로 진행되는 강의이다. 통계학 개론의 내용을 주로 다루며, 강의 진행방식은 교수님이 하나의 주제에 대한 개념 설명을 먼저 해준 후 R프로그램을 통해 설명해준 개념을 적용해보는 방식이다.

*수업을 진행하다 보면 복잡한 공식이 많이 나오는데 이 부분에 대해 공식의 도출 과정이나 공식에 대한 자세한 설명이 없어서 이해하기 힘든 경우가 다소 많다. 따라서 통계학에 대한 배경지식이 있는 분에게 이 강의를 추천한다.

2022-2 [분반:032]

R프로그램을 사용할 때 사전에 제공된 메모장에 있는 프로그램 코드를 복사 붙여넣기 하는 정도로만 쓰이기에 처음 써봐도 큰 여러움은 없다. 다만 그 코드를 입력할 시 어떤 작업이 진행되는지는 시험에 출제되기에 알아두는 것이 좋다.

전반적으로 확률과 통계에 초점이 맞춰져 있으나, 통계부분의 중요도가 더 크다. 모집단과 표본, 자료의 정리, 확률과 확률분포, 통계적 추론, 모집단의 비교, 회귀분석, 비모수 통계학, 모의실험 및 통계적 근사등을 학습한다.

2022-2 [분반:032]

<과제정보>

별도의 과제는 없으나 한 주제의 강의가 끝나면 마지막에 퀴즈가 몇 문제씩 출제된다.

<시험정보>

  • 중간고사

온라인으로 K-MOOC홈페이지를 통해 실시되었다. 총 8문제가 출제되었고 문제 당 답안 제출 기회는 2회 주어졌다. 시험 문제는 수업 시간에 배운 내용을 활용하는 간단한 계산 문제와 개념을 묻는 문제가 나왔다.

제한시간이 없는 만큼 모르는 부분은 다시 찾아보고 풀 수 있으며 R프로그램을 사용한 문제는 출제되지 않았다.

2022-1 [분반:000]

  • 기말고사

기말고사는 온라인과 오프라인 2번 진행되었다. 온라인은 중간고사와 동일한 형식으로 진행되었다.

오프라인은 *시험시간이 50분으로 제한되었다. 총 8문제의 큰 문제가 나왔고 파생문제도 나왔다. 문제의 절반이 작년 중간고사, 기말고사 문제에서 숫자만 바뀌어 출제되었다.

*족보에서 숫자만 조금씩 바뀌어 나오는 경우가 많아서 족보를 참조하는 것이 제일 좋다. 족보는 시험 전 플라토 공지에 교수님이 올려준다.

시험문제 예)

1.R 명령어 x <-(1,3,4,5,6,7,16)을 시행하였다. 

(1) r명령어 fivenum(x)를 시행한 결과를 서술하라.

(2) 벡터 x에 저장된 자료를 바탕으로 box-whisker plot를 그려라.

2.다음의 r명령어를 수행한 결과를 숫자로 나타내어라.

x<-c(-3,1,-1,3,0) ; y <-c(-1,1,-3,3,0) ; cov(x,y)

3. 이산형 확률변수 x의 확률분포함수가 f(0)=0.8, f(2)=0.1, f(4)=0.1로 주어져 있는 모집단으로부터 크기 164인 표본을 추출하였다. 표본평균-x의 분산을 계산하라.

4. 5년전 부산지역의 아동 비만율은 10%였다. 올해 아동 비만율이 변화하였는지 알아보기 위해 아동 100명을 조사하였더니 그 중 13명이 비만으로 나타났다.

(1) 5년 전에 비해 아동 비만율이 변했는지 알아보기 위한 귀무가설과 대립가설을 세워라

(2) 유의수준 a=0.05에서 검정하고 p-value를 구하라. 등

추천 논문

더 찾아보기
저자 장대흥 (Dae-Heung Jang)
응용통계연구. 2020-02 33(1):87-105
저자 한경수 (Kyung Soo Han); 박세진 (Se Jin Park); 안정용 (Jeong Yong Ahn)
한국데이터정보과학회지. 2012-10 23(5):971-981
저자 오지우 (Jiu Oh); 성병찬 (Byeongchan Seong)
응용통계연구. 2022-10 35(5):645-655

본 가이드는 부산대학교 교양선택 및 일반선택(일반교양) > 과학과 기술(4영역)에 개설된 R을 활용한 통계학개론 강의 및 학습을 지원하기 위해 작성되었습니다.

댓글 7

익명2
2023년 12월 06일 1:08 오전

부산대 도서관 학습정보가이드 SAM은 최신가이드부터 많이 본 가이드와 학습, 연구, 자기계발 등의 카테고리 항목으로 구성하여 원하는 경로로 빠르게 탐색하기 쉽도록 구축되어 있네요! 각 주제별로 상단에 분류키워드를 제시하고 간단한 설명과 추천도서, 추천사이트 및 영상, 수강자의 tip, 연관 가이드 등의 참고하기 좋은 내용들이 보기 쉽게 스크롤 할 수 있어서 한 주제 분야에서도 시야를 폭넓게 가질 수 있도록 이끌어준다는 점이 가장 큰 장점이라고 느껴져요! 페이지 내에 추천 도서, 추천 논문, 추천 사이트, 강의 보기 등의 다양한 정보들이 제시만 되어있는 것이 아니라 클릭을 하면 해당 링크로 바로 연결할 수 있도록 연관데이터끼리 연계해놓은 것은 이용자가 학습정보가이드를 편리하게 이용할 수 있도록 도와주는 것 같아요. 그리고 이러한 추천 연관 컨텐츠들이 생산된 지 오랜 시간이 지났거나 관련이 없어 활용도가 없었다면 오히려 확장 탐색보다는 방해가 되는 요소로 작용했을 텐데 그렇지 않고 연관이 높은 최신자료들로 구성되어있어 사용하기에 적합하다고 느껴졌어요. 이번 R언어 내용도 이러한 학습정보가이드의 장점들로 잘 이루어져있어서 학습하는데 도움이 되는 가이드 역할을 한 것 같습니다!

익명1
2023년 12월 05일 4:27 오후

R언어를 처음 접해보몈 어려울 수 있는데 조금만 애정을 가지고 기초부분만 하면 교양에서 다루는 대부분의 내용은 전부 잘 해낼 수 있었습니다 주변 도움이나 인터넷을 활용해 처음에 익히는 약간의 시간만 투자하면 두고두고 도움될 것 같아요!

김지성
2023년 12월 04일 8:58 오후

해당 강좌는 kmooc에 등록된 강좌로서 영상으로 수업이 진행되는데 교수자가 판서를 마우스로 하는 것으로 추정된다. 따라서 공식을 알아보기 힘든 단점이 있다. 장점이라면 R이라는 통계 특화 컴퓨터 언어와 통계학개론을 함께 공부할 수 있다는 점이다.

익명2
2023년 11월 14일 1:56 오후

R 언어 배워보고 싶었는데 kmooc로 배워볼 수 있어 유익했어요! 어려운 부분도 다소 있었지만 이 기회에 접할 수 있어 좋았습니다!

익명2
2023년 11월 14일 10:59 오전

R언어 처음엔 생소하고 어렵게만 느껴졌어요 하지만 이런 경험은 대학에서말곤 배우기가 힘들것같아 포기하지않고 도전했는데 많은 도움이된거같아요!

익명1
2023년 11월 11일 12:40 오후

R언어가 여러분반이 많아서 고민했는데, 많은 도움이 되었어요! 분반 옆에 교수님 성함도 알려주시면 좋겠어요~~
학습정보가이드로 활동한 적이 있었는데, 그 이후로 꾸준히 들어와서 보고있어요! 강의에 대한 정보를 얻으면서 나에게 잘 맞을 것 같은 강의를 찾을 수 있어 학습에 많은 도움을 얻고 있습니다. 꾸준하게 글이 올라왔으면 좋겠습니다~

익명1
2023년 11월 03일 5:57 오후

R 언어를 데이터 과학 및 통계 분야에서 필수 도구로 만들어주었고, 나의 소감으로는 R 언어를 배우고 활용함으로써 데이터에 대한 이해력과 분석 능력이 크게 향상되었으며, 업무와 연구에서 효율적으로 데이터를 다룰 수 있게 되어 무척 감사하게 생각합니다.