本书重点介绍Python在多元数据分析和统计建模方面的应用,内容包括三个方面:多元数据的基本分析及可视化、多元数据的无监督机器学习、多元数据的有监督机器学习。内容涉及多元统计分析及软件概述、多元数据的Python处理、多元数据的Python可视化、聚类分析及Python分类、综合评价及Python应用、主成分分析及Python计算、因子分析及Python应用、对应分析及Python视图、相关与回归及Python分析、典型相关分析及Python应用、扩展线性模型及Python建模、判别分析及Python算法。本书内容丰富、图文并茂、可操作性强且便于查阅,能有效帮助读者提高数据处理与统计分析的水平和效率。全书基于Anaconda的Jupyter Notebook进行数据的多元统计分析和课堂教学。作者还建立了学习网站(www.jdwbh.cn/Rstat)和博客(www.yuque.com/rstat),书中例题的数据、习题数据及Python语言代码都可直接从上面下载使用,读者也可从封底的二维码中下载书中的数据和代码。
本书适合各个层次的多元数据分析学习者,既可作为机器学习初学者的入门指南,又可作为中、高级学习者的参考手册,同时还可作为各大中专院校和培训班的多元数据分析及Python建模教材。
- 前辅文
- 上篇 多元数据的基本分析及可视化
- 第1章 多元统计分析及软件概述
- 1.1 多元统计分析的历史
- 1.2 多元统计分析的用途
- 1.3 多元统计分析的内容
- 1.4 统计分析软件及应用
- 1.5 Python数据分析平台
- 案例1:Python数据分析编程平台Spyder
- 思考与练习
- 第2章 多元数据的Python处理
- 2.1 Python的编程基础
- 2.2 Python数值分析
- 2.3 多元数据的收集和整理
- 2.4 Python的数据框
- 2.5 Python数据框的分析
- 案例2:多元数据的基本统计分析
- 思考与练习
- 第3章 多元数据的Python可视化
- 3.1 多元数据可视化准备
- 3.2 条图或柱图
- 3.3 描述统计及箱线图
- 3.4 变量间的关系图
- 3.5 其他多元分析图
- 案例3:城市现代化水平的直观分析
- 思考与练习
- 中篇 多元数据的无监督机器学习
- 第4章 聚类分析及Python分类
- 4.1 聚类分析的概念、类型和特点
- 4.2 聚类统计量
- 4.3 系统聚类法
- 4.4 快速聚类法
- 案例4:全国区域经济发展的聚类分析
- 思考与练习
- 第5章 综合评价及Python应用
- 5.1 综合评价的基本概念
- 5.2 评价指标体系的构建
- 5.3 数据无量纲化及权重确定
- 5.4 综合评价方法及其应用
- 案例5:广东省知识产权发展水平的综合评价
- 思考与练习
- 第6章 主成分分析及Python计算
- 6.1 主成分分析的概念
- 6.2 主成分分析的性质
- 6.3 主成分分析步骤
- 6.4 主成分分析注意事项
- 案例6:地区电信业发展的主成分分析
- 思考与练习
- 第7章 因子分析及Python应用
- 7.1 因子分析模型
- 7.2 因子载荷及解释
- 7.3 因子旋转
- 7.4 因子得分
- 7.5 因子分析步骤
- 7.6 实际中进行因子分析
- 案例7:上市公司经营业绩评价的因子分析
- 思考与练习
- 第8章 对应分析及Python视图
- 8.1 对应分析的提出
- 8.2 对应分析基本原理
- 8.3 对应分析计算步骤
- 8.4 对应分析注意事项
- 案例8:对应分析在农民收入中的应用
- 思考与练习
- 下篇 多元数据的有监督机器学习
- 第9章 相关与回归及Python分析
- 9.1 变量间的关系
- 9.2 一元相关与回归分析
- 9.3 多元相关与回归分析
- 案例9:中国宏观经济发展的多因素分析
- 思考与练习
- 第10章 典型相关分析及Python应用
- 10.1 引言
- 10.2 相关分析的架构
- 10.3 典型相关分析原理
- 10.4 典型相关分析步骤
- 案例10:R&D投入与产出的典型相关分析
- 思考与练习
- 第11章 扩展线性模型及Python建模
- 11.1 数据分类与模型选择
- 11.2 方差分析模型
- 11.3 广义线性模型
- 案例11:服务产品观点的Logistic回归模型
- 思考与练习
- 第12章 判别分析及Python算法
- 12.1 判别分析的概念
- 12.2 Fisher判别法
- 12.3 Bayes判别法
- 案例12:企业财务状况的判别分析
- 思考与练习
- 附录 书中自定义函数及使用
- 参考文献