顶部
收藏

大数据分析及应用实践(第四版)


作者:
杨和稳 王一民
定价:
39.00元
ISBN:
978-7-04-065035-8
版面字数:
218.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-08-14
物料号:
65035-00
读者对象:
高等职业教育
一级分类:
计算机大类
二级分类:
计算机类
三级分类:
物联网应用技术

本书是技工教育和职业培训“十四五”规划教材,是根据教育部最新发布的《高等职业学校专业教学标准》中对本课程的要求修订而成的。

本书主要内容包括认识大数据、大数据技术基础、大数据治理、大数据统计分析技术、数据挖掘、大数据可视化和大数据应用案例实战。本书编写是以大数据分析工具———“蓝鹰”为平台,理论结合实践,通过具体案例介绍如何进行大数据分析。本书为新形态一体化教材,借助先进技术,丰富内容呈现形式,配套多媒体助学助教资源,助力提高教学质量和学习效率。

本书可作为高等院校大数据入门课程的教材,亦可作为大数据技术相关培训教材,同时也可供大数据相关的从业人员参考。

  • 前辅文
  • 第1章 认识大数据
    • 1.1 大数据综述
      • 1.1.1 大数据的产生
      • 1.1.2 大数据的特征
    • 1.2 大数据的基本概念
      • 1.2.1 大数据的定义
      • 1.2.2 大数据的特点
    • 1.3 大数据思维
      • 1.3.1 大数据思维的变革
      • 1.3.2 大数据思维的关注点
      • 1.3.3 企业大数据思维之数字化转型
    • 1.4 大数据的处理过程
      • 1.4.1 大数据采集
      • 1.4.2 大数据导入与预处理
      • 1.4.3 数据治理
      • 1.4.4 大数据统计与分析
      • 1.4.5 大数据挖掘
    • 1.5 企业常用的数据平台
      • 1.5.1 数据分析工具
      • 1.5.2 数据中台
    • 1.6 大数据分析在企业中的实际应用
      • 1.6.1 数据业务应用场景
      • 1.6.2 大数据分析应用案例
    • 实验1 认识蓝鹰数据分析平台
  • 第2章 大数据技术基础
    • 2.1 云计算
      • 2.1.1 云计算的特点
      • 2.1.2 云计算与大数据处理
    • 2.2 基础架构支持
      • 2.2.1 Hadoop
      • 2.2.2 HBase
      • 2.2.3 MapReduce
      • 2.2.4 Hive
      • 2.2.5 Python
      • 2.2.6 R 语言
      • 2.2.7 维度建模
    • 2.3 数据采集
      • 2.3.1 数据的形态
      • 2.3.2 数据采集的方法
    • 2.4 数据存储
      • 2.4.1 数据存储的概念
      • 2.4.2 数据的存储方式
      • 2.4.3 常见数据源类型
    • 实验2 数据接入
  • 第3章 大数据治理
    • 3.1 数据标准管理
      • 3.1.1 数据服务标准
      • 3.1.2 指标梳理标准
      • 3.1.3 技术实现标准
    • 3.2 数据清洗
      • 3.2.1 数据清洗的作用
      • 3.2.2 数据清洗的方法和过程
      • 3.2.3 数据清洗的实例
      • 3.2.4 数据类型
      • 3.2.5 数据转换
    • 3.3 数据资产管理
      • 3.3.1 数据规划
      • 3.3.2 元数据管理
      • 3.3.3 数据质量管理
    • 3.4 数据服务
      • 3.4.1 统计分析
      • 3.4.2 数据开发
    • 实验3 数据预处理
  • 第4章 大数据统计分析技术
    • 4.1 统计分析概述
      • 4.1.1 统计分析的概念
      • 4.1.2 统计分析的特点
      • 4.1.3 统计分析的应用
    • 4.2 统计分析的常见指标
      • 4.2.1 统计指标概述
      • 4.2.2 总量指标
      • 4.2.3 相对指标
      • 4.2.4 平均指标
      • 4.2.5 变异指标
    • 4.3 回归与预测
      • 4.3.1 回归
      • 4.3.2 预测
    • 实验4 数据分析指标
  • 第5章 数据挖掘
    • 5.1 数据挖掘概念
      • 5.1.1 数据挖掘的起源
      • 5.1.2 数据挖掘的定义
    • 5.2 数据挖掘任务
      • 5.2.1 数据总结
      • 5.2.2 分类
      • 5.2.3 关联分析
      • 5.2.4 聚类
    • 5.3 数据挖掘流程
      • 5.3.1 业务理解
      • 5.3.2 数据理解
      • 5.3.3 数据准备
      • 5.3.4 建立模型
      • 5.3.5 结果评价
    • 5.4 数据挖掘的常用方法
      • 5.4.1 决策树
      • 5.4.2 遗传算法
      • 5.4.3 神经网络
      • 5.4.4 关联规则
      • 5.4.5 粗糙集
      • 5.4.6 判别分析
    • 实验5 数据挖掘
  • 第6章 大数据可视化
    • 6.1 数据可视化分类
      • 6.1.1 结构可视化
      • 6.1.2 功能可视化
      • 6.1.3 关联关系可视化
      • 6.1.4 趋势可视化
    • 6.2 可视化表现形式
      • 6.2.1 二维可视化形式
      • 6.2.2 三维可视化形式
      • 6.2.3 仪表盘
      • 6.2.4 定制可视化形式
      • 6.2.5 大数据可视化方式的选择
    • 实验6 数据可视化
  • 第7章 大数据应用案例实战
    • 7.1 网站流量分析
      • 7.1.1 背景分析
      • 7.1.2 案例及需求分析
      • 7.1.3 大数据分析方法
      • 7.1.4 大数据分析过程
      • 7.1.5 结论
    • 7.2 电商行业销售分析
      • 7.2.1 背景分析
      • 7.2.2 案例及需求分析
      • 7.2.3 大数据分析方法
      • 7.2.4 大数据分析过程
      • 7.2.5 结论
    • 7.3 金融行业贷款业务分析
      • 7.3.1 背景分析
      • 7.3.2 案例及需求分析
      • 7.3.3 大数据分析方法
      • 7.3.4 大数据分析过程
      • 7.3.5 结论

相关图书