r2 'R을 이용한 빅데이터 분석' 중 일부 요약 빅데이터 1. 정의 가트너의 3V: 데이터 양(Volume)이 많고, 형태가 다양(Variety)하며, 속도(Velocity)가 빠른 데이터. 가치(Value)를 더하면 4V 2. 환경 *분산 컴퓨팅 -빅데이터의 규모를 감당하기 위해 컴퓨터 용량을 늘이는 방법. 여러 대의 컴퓨터에 작업을 나누어 처리한다. 다수의 컴퓨터로 구성되어 있는 시스템을 마치 한 대의 시스템인 것처럼 작동. * 클라우드 컴퓨팅 - 클라우드(cloud)는 인터넷을 의미, 클라우드 컴퓨팅은 인터넷 기반 컴퓨터 기술을 의미한다. - 사용자가 필요한 SW를 자신이 컴퓨터에 설치하지 않고도 인터넷으로 사용 가능하며 데이터를 각종 기기에 공유하는 사용환경. * 하둡(Hadoop) - 대용량 데이터 처리를 위한 오픈소스 플랫폼. - HDF.. 2021. 12. 7. [프로그래밍 언어] R이란? 다양한 통계 처리 패키지를 제공. 데이터마이닝, 빅데이터 가공에 주로 활용 통합개발환경 : RStudio https://www.rstudio.com/ RStudio | Open source & professional software for data science teams RStudio provides free and open source tools for R and enterprise-ready professional software for data science teams to develop and share their work at scale. www.rstudio.com 2021. 11. 21. 이전 1 다음