Книга Hadoop в действии
Чак Лэм
- Автор: Чак Лэм
- Жанр: Зарубежная компьютерная литература, Интернет, Программирование, Базы данных
- Год издания: 2012
- ISBN: 978-5-94074-785-7
- Издательство: ДМК Пресс
- Возраст: 12+
Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop – это каркас для разработки приложений, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных. Если вам требуется произвести анализ данных, то Hadoop – как раз то, что надо. Прочитав эту книгу, вы познакомитесь с предметом и научитесь писать программы в стиле MapReduce. После нескольких простых примеров автор быстро переходит к вопросу об использовании Hadoop для решения более сложных задач анализа данных. Описываются рекомендованные приемы и паттерны проектирования, полезные при программировании для MapReduce. Для чтения книги требуется знание основ языка Java. Некоторое знакомство с математической статистикой поможет разобраться в более сложных при-мерах.