![](https://tistory1.daumcdn.net/tistory_admin/blogs/image/category/new_ico_1.gif)
아파치 하둡이란 무엇인가요?IBM에 따르면 아파치 하둡은 당시 야후에서 근무하던 더글러스 커팅이 개발한 오픈 소스 소프트웨어 프레임워크로, 간단한 프로그래밍 모델을 사용하여 대규모 데이터 집합을 매우 안정적으로 분산 처리할 수 있는 기능을 제공합니다. 아파치 하둡 이전 소셜 미디어 플랫폼, 웹사이트, 사물인터넷 기기 등은 매일 대량의 데이터를 생산하고 있으며, 이러한 방대한 양의 비정형 데이터를 저장, 변환 또는 분석 작업을 수행하기 위해 처리하는 것이 어렵습니다. 데이터 저장 문제는 웹페이지를 다운로드하여 순위를 매기는 검색 엔진의 알고리즘을 개발할 때 나타납니다. 2002년 구글이 아파치 너치를 개발할 때 개발자들은 빅 데이터를 처리하는 데 어려움을 겪고 있었습니다. 2002년부터 2006..