当前位置:首页  图书推介

日 期
2023-04-25

《大数据基础》



      作者:刘    铭

      书号:ISBN 978-7-5636-6915-8

      出版时间:2021年11月

      开本:小16开

      页数:236

      字数:319千字

      定价:38.00元

  全书共8章,内容由浅入深,可读性强。在简单阐述原理的基础上,重点阐述应用的详细实现过程。第1章绪论,阐述大数据技术现状,介绍Hadoop技术生态圈构成。第2章Linux基础,介绍Linux系统的安装、配置、命令使用、集群规划和实践。第3章Hadoop基础,对Hadoop技术展开详细介绍。第4章高可用Hadoop集群,系统描述基于Zookeeper构建高可用Hadoop集群的配置过程和生产实践应用。第5章Hive基础,介绍数据仓库Hive的应用场景和实战操作。第6章Hbase基础,介绍Hbase数据库的应用场景和实战操作。第7章Spark基础,对Spark进行详细介绍,并配合具体算法的应用进行实战操作。第8章数据采集基础,对数据采集方法、流程和工具进行系统阐述。

本书是北京市教育委员会2019年度批准立项项目“警务大数据应用技术研究”(项目编号KM201914019002)成果之一,可以作为高等院校大数据技术相关专业本科生的教材,也可作为大学生大数据应用技能竞赛的辅导用书,亦可供从事大数据相关研究的技术人员参考。

本书最大的特色就是实践性较强,在阐述大数据技术相关基础知识的同时辅以大量实践实例,培养学习者的学习兴趣,提高学生的动手能力。

   第1章  绪论

1.1  大数据概述

1.2  对大数据的理解

1.3  大数据处理的基本流程

1.4  Hadoop概述

1.5  Spark概述

  第2章  Linux基础

2.1  Linux简介

2.2  Linux系统安装

2.3  Linux命令

  第3章  Hadoop基础

3.1  HDFS简介

3.2  Hadoop集群安装

3.3  HDFS的文件存储机制

3.4  HDFS的数据存储管理

3.5  HDFS的数据读写过程

3.6  HDFS常用命令

  第4章  高可用Hadoop集群

4.1  Zookeeper基础

4.2  高可用Hadoop集群配置

  第五章  Hive基础

5.1  Hive概述

5.2  元数据库基础

5.3  Hive的配置

5.4  Hive使用方式

5.5  Hive的DDL

5.6  数据导入与导出

5.7  Hive的查询

  第6章  HBase基础

6.1  HBase概述

6.2  HBase接口

6.3  HBase数据模型

6.4  HBase实现原理

6.5  HBase运行机制

6.6  HBase应用

6.7  HBase实战

  第7章  Spark基础

7.1  Spark概述

7.2  Spark集群的安装

7.3  SparkShell

7.4  Spark RDD基础

7.5  Spark案例实战与详解

  第8章  数据采集基础

8.1  数据采集概述

8.2  Flume基础

8.3  Sqoop基础

  参考文献

扫码关注
中国石油大学出版社微信公众号
中国石油大学出版社淘宝店铺
中国石油大学出版社职教双一流公众号
中国石油大学出版社好学好知公众号

版权所有(C)2022 中国石油大学出版社         鲁ICP备15009631号-6        (署)网出证(鲁)字第017号