posted by 희정냥★ 2012. 6. 30. 16:02

MapReduce

 

MapReduce는 구글에서 분산 컴퓨팅을 지원하기 위한 목적으로 제작하여 2004년 발표한 소프트웨어 프레임워크다. 이 프레임워크는 페타바이트 이상의 대용량 데이터를 신뢰할 수 없는 컴퓨터로 구성된 클러스터 환경에서 병렬 처리를 지원하기 위해서 개발되었다. 이 프레임워크는 함수형 프로그래밍에서 일반적으로 사용되는 Map과 Reduce라는 함수 기반으로 주로 구성된다.
 
현재 MapReduce는 Java와 C++, 그리고 기타 언어에서 적용이 가능하도록 작성되었다.

Map : 흩어져 있는 데이터를 Key, Value의 형태로 연관성있는 데이터 분류로 묶는 작업
 
Reduce : Map화 한 작업 중 중복데이터를 제거하고 원하는 데이터를 추출.

 

 

 

 

 

 

 

'Computer 2.0 > Digital Service' 카테고리의 다른 글

인셉션 인포그래픽  (0) 2012.09.18
스몰셀 망 계획에 활용되는 트위터와 플리커  (0) 2012.07.17
MapReduce  (0) 2012.06.30

댓글을 달아 주세요