você está aqui: Home → Agenda Livre
Por Stephanie Milate
Data de Publicação: 18 de Setembro de 2016
Título ensina a usar técnicas estatísticas e de machine learning em grandes conjuntos de dados
O ecossistema do Hadoop é perfeito para o uso de técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares, você pode se concentrar nas análises particulares que pode fazer, nas técnicas de armazém de dados oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.
É o que ensina o livro Analítica de dados com Hadoop, lançado pela Novatec Editora. Com ele, os cientistas e analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Também conhecerão os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com - e que, na verdade, exigem - quantidades enormes de dados.
O leitor de Analítica de dados com Hadoop também entenderá os conceitos principais do Hadoop e do processamento em cluster, obterá conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em contexto distribuído usando Apache Hive e HBase, aprenderá a utilizar padrões de projeto e algoritmos analíticos paralelos para criar Jobs de análise de dados distribuídos e muito mais.
Autor: Benjamin Bengfort Jenny Kim ISBN: 978-85-7522-521-9 Páginas: 352 Ano: 2016 Preço: R$ 95,00 |
Forneça o código promocional DICAS-L e adquira esta obra com 20% de desconto.
Benjamin Bengfort é cientista de dados e trabalha para terminar seu doutorado na Universidade de Maryland, onde estuda aprendizado de máquina e computação distribuída. Programador profissional por ofício, escreve sobre uma grande variedade de assuntos, de Processamento de Linguagem Natural e ciência de dados com Python a analítica (analytics) com Hadoop e Spark.
Jenny Kim é engenheira sênior de big data e trabalha tanto com softwares comerciais quanto em ambientes acadêmicos. Tem experiência significativa em trabalhos com dados de larga escala, aprendizado de máquina e implementações de Hadoop em ambientes de produção e de pesquisa. Atualmente, trabalha com a equipe de Hue, na Cloudera.