본문 바로가기 주메뉴 바로가기

전체메뉴

국회도서관 홈으로 정보검색 소장정보 검색

출판사 책소개

알라딘제공
R은 처음부터 기존 프로그램들과는 접근방식이 달라 처음에는 무척 낯설다. 벡터와 행렬이라는 선형대수의 기초부터 들고 나와, 곧 바로 사용가능한 프로시저를 제공하는 다른 프로그램들과는 달리 처음에 무엇을 어떻게 해야할지 무척 당혹스럽게 만든다. “reg y x”와 같은 단순한 회귀분석이나 “n(data)”처럼 데이터의 크기를 측정하는 간단한 작업조차 어떻게 실행해야 할지 난감할 뿐이다.
하지만 경험이 쌓일수록 R의 생소한 특성은 오히려 장점으로 다가온다. 무엇보다 통계적 개념과 사고방식이 프로그램의 구조와 일치한다는 점이 매력적이다. 벡터와 행렬을 이용한 통계 연산에서 출발하는 것도 동일한 맥락이다. 데이터의 크기를 측정할 때도 선형대수학적 관점에서 length라는 표현을 사용하며, data[i, j]와 같은 행렬 표기법으로 대부분의 연산과 데이터 접근이 가능하다.
특히 인상적인 것은 함수의 활용이다. 통계분석에서는 동일한 연산 또는 절차가 자주 반복되는데, 이는 함수를 정의하고 다시 이를 apply 계열 함수로 실행하는 방식으로 구현한다. 이 같은 방식은 연구자의 사고 과정과 실제 분석 절차가 매우 유사하게 이어지도록 한다. 예를 들어 “apply(data, 2, mean)”과 같은 간단한 코드로 데이터의 열별 평균을 계산하거나, “tapply(data$value, data$group, sum)”으로 그룹별 합계를 구하는 것처럼 통계적 사고를 자연스럽게 코드로 표현할 수 있다.
더욱 놀라운 것은 R의 그래픽 기능이다. 학술 논문에서 볼 수 있는 고품질의 시각화를 그대로 구현할 수 있으며, ggplot2 패키지는 데이터 시각화의 문법을 제공하여 복잡한 그래프도 체계적으로 작성할 수 있게 한다. 이 모든 기능을 함수로 작성하고, 각 함수의 모든 요소를 사용자가 제어할 수 있다는 점이 R의 큰 장점이다.
전 세계 사용자들의 기여로 발전해 온 R의 독특한 특성과 처음에는 낯설지만 익숙해질수록 드러나는 효율성, 그리고 통계 언어로서의 정체성은 도구가 곧 본질이라는 도재기중(道在器中)의 철학을 연상시킨다.
독자들은 R이라는 잘 갖춰진 도구를 통해 데이터 분석이라는 미지의 영역을 헤쳐나갈 수 있기를 희망한다.