Novatec Editora lança livro "Analítica de dados com Hadoop"

Por Stephanie Milate

Data de Publicação: 18 de Setembro de 2016

Título ensina a usar técnicas estatísticas e de machine learning em grandes conjuntos de dados

O ecossistema do Hadoop é perfeito para o uso de técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares, você pode se concentrar nas análises particulares que pode fazer, nas técnicas de armazém de dados oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.

É o que ensina o livro Analítica de dados com Hadoop, lançado pela Novatec Editora. Com ele, os cientistas e analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Também conhecerão os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com - e que, na verdade, exigem - quantidades enormes de dados.

O leitor de Analítica de dados com Hadoop também entenderá os conceitos principais do Hadoop e do processamento em cluster, obterá conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em contexto distribuído usando Apache Hive e HBase, aprenderá a utilizar padrões de projeto e algoritmos analíticos paralelos para criar Jobs de análise de dados distribuídos e muito mais.

Sobre esta obra

Autor: Benjamin Bengfort
Jenny Kim
ISBN: 978-85-7522-521-9
Páginas: 352
Ano: 2016
Preço: R$ 95,00

Forneça o código promocional DICAS-L e adquira esta obra com 20% de desconto.

Saiba mais

Sobre os autores:

Benjamin Bengfort é cientista de dados e trabalha para terminar seu doutorado na Universidade de Maryland, onde estuda aprendizado de máquina e computação distribuída. Programador profissional por ofício, escreve sobre uma grande variedade de assuntos, de Processamento de Linguagem Natural e ciência de dados com Python a analítica (analytics) com Hadoop e Spark.

Jenny Kim é engenheira sênior de big data e trabalha tanto com softwares comerciais quanto em ambientes acadêmicos. Tem experiência significativa em trabalhos com dados de larga escala, aprendizado de máquina e implementações de Hadoop em ambientes de produção e de pesquisa. Atualmente, trabalha com a equipe de Hue, na Cloudera.