顶部
收藏

机器学习应用基础


作者:
凌明胜
定价:
40.00元
ISBN:
978-7-04-058183-6
版面字数:
280.00千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2025-02-11
物料号:
58183-00
读者对象:
高等职业教育
一级分类:
计算机大类
二级分类:
计算机类
三级分类:
计算机应用技术

本书是人工智能技术应用校企“双元”合作系列教材之一。

本书遵循初学者对机器学习知识的认知规律,采用由浅入深、循序渐进的讲授方式,详细地介绍了机器学习的基本原理,并采用“原理简述+问题实例+实际代码+运行结果”的模式介绍常用算法。全书共11章,内容涵盖模型评估选择、线性回归、过拟合与欠拟合、逻辑回归、k近邻算法、支持向量机、朴素贝叶斯、决策树、K均值算法、人工神经网络等。

本书配有微课视频、教学设计、授课用PPT、案例源代码、习题答案等丰富的数字化学习资源。与本书配套的数字课程“机器学习应用基础”在“智慧职教”平台(www.icve.com.cn)上线,学习者可登录平台在线学习,授课教师可调用本课程构建符合自身教学特色的SPOC课程,详见“智慧职教”服务指南。

授课教师也可登录“高等教育出版社产品信息检索系统”(xuanshu.hep.com.cn)搜索并下载本书配套教学资源,首次使用本系统的用户,请先进行注册并完成教师资格认证。

本书可作为高等职业院校人工智能技术应用专业的教材,也可作为从事机器学习相关工作的专业技术人员和广大人工智能爱好者的自学参考书。

  • 前辅文
  • 第1章 机器学习概述
    • 1.1 机器学习简介
      • 1.1.1 机器学习入门案例
      • 1.1.2 机器学习的定义
    • 1.2 机器学习的分类
      • 1.2.1 有监督学习
      • 1.2.2 无监督学习
      • 1.2.3 强化学习
      • 1.2.4 机器学习算法选择
    • 1.3 机器学习三要素
      • 1.3.1 模型
      • 1.3.2 策略
      • 1.3.3 算法
    • 1.4 机器学习典型应用
      • 1.4.1 人脸识别
      • 1.4.2 语音识别
      • 1.4.3 自动驾驶
    • 1.5 scikit-learn简介
    • 1.6 本章小结
    • 习题
  • 第2章 模型评估选择
    • 2.1 模型的设计原则
      • 2.1.1 没有免费午餐定理
      • 2.1.2 奥卡姆剃刀原理
      • 2.1.3 训练误差与泛化误差
      • 2.1.4 偏差与方差
    • 2.2 模型验证
      • 2.2.1 训练集、验证集和测试集
      • 2.2.2 数据集划分方法
      • 2.2.3 scikit-learn中数据集划分实现
    • 2.3 模型性能评估
      • 2.3.1 回归模型的评估指标
      • 2.3.2 分类模型的评估指标
      • 2.3.3 模型评估指标的scikit-learn实现
    • 2.4 模型优化
      • 2.4.1 超参数
      • 2.4.2 超参数优化方法
      • 2.4.3 超参数优化方法的scikit-learn实现
    • 2.5 本章小结
    • 习题
  • 第3章 线性回归
    • 3.1 问题引入
    • 3.2 模型建立
      • 3.2.1 一元线性回归
      • 3.2.2 多元线性回归
    • 3.3 参数求解
      • 3.3.1 误差与分布
      • 3.3.2 最大似然估计
      • 3.3.3 最小二乘法
      • 3.3.4 梯度下降
      • 3.3.5 特征缩放
    • 3.4 模型评估
    • 3.5 scikit-learn中的线性回归
    • 3.6 房价预测
      • 3.6.1 数据集描述
      • 3.6.2 导入数据
      • 3.6.3 分析数据
      • 3.6.4 划分数据集
      • 3.6.5 数据缩放
      • 3.6.6 训练模型
      • 3.6.7 预测并评估模型
    • 3.7 本章小结
    • 习题
  • 第4章 过拟合与欠拟合
    • 4.1 过拟合与欠拟合的相关概念
      • 4.1.1 产生欠拟合与过拟合的原因
      • 4.1.2 解决欠拟合与过拟合的方法
    • 4.2 多项式扩展
    • 4.3 多项式拟合
    • 4.4 示例:多项式扩展解决欠拟合
    • 4.5 流水线
    • 4.6 多项式产生过拟合
    • 4.7 正则化
    • 4.8 scikit-learn中Lasso回归、岭回归和ElasticNet回归实现
    • 4.9 房价预测——基于Lasso回归、岭回归和ElasticNet回归
      • 4.9.1 使用Lasso回归进行房价预测
      • 4.9.2 使用LassoCV类进行房价预测
      • 4.9.3 使用岭回归进行房价预测
      • 4.9.4 使用RidgeCV类进行房价预测
      • 4.9.5 使用ElasticNet回归进行房价预测
      • 4.9.6 使用ElasticNetCV类进行房价预测
    • 4.10 本章小结
    • 习题
  • 第5章 逻辑回归
    • 5.1 问题引入
    • 5.2 模型建立
    • 5.3 参数求解
      • 5.3.1 样本概率
      • 5.3.2 最大似然估计
      • 5.3.3 梯度下降求解
      • 5.3.4 权重更新
    • 5.4 模型评估
    • 5.5 scikit-learn中的逻辑回归
    • 5.6 乳腺癌检测
      • 5.6.1 数据集描述
      • 5.6.2 导入数据
      • 5.6.3 划分数据集
      • 5.6.4 训练模型
      • 5.6.5 预测并评估模型
      • 5.6.6 模型优化
    • 5.7 本章小结
    • 习题
  • 第6章 k近邻算法
    • 6.1 问题引入
    • 6.2 k近邻算法的工作原理
      • 6.2.1 k近邻算法的执行过程
      • 6.2.2 影响k近邻算法结果的因素
    • 6.3 k近邻算法的scikit-learn实现
    • 6.4 使用k近邻算法进行分类
    • 6.5 使用k近邻算法进行回归预测
    • 6.6 糖尿病预测
      • 6.6.1 数据集描述
      • 6.6.2 加载数据
      • 6.6.3 划分数据集
      • 6.6.4 模型训练
      • 6.6.5 模型评估
    • 6.7 本章小结
    • 习题
  • 第7章 支持向量机
    • 7.1 问题引入
    • 7.2 最优决策边界
    • 7.3 非线性可分数据
    • 7.4 核函数
      • 7.4.1 核函数定义
      • 7.4.2 常见核函数类型
      • 7.4.3 核函数的选择
    • 7.5 scikit-learn中的支持向量机
      • 7.5.1 线性支持向量机LinearSVC
      • 7.5.2 支持向量机
      • 7.5.3 调参建议
    • 7.6 鸢尾花分类
      • 7.6.1 数据集描述
      • 7.6.2 加载数据
      • 7.6.3 划分数据集
      • 7.6.4 利用LinearSVC分类鸢尾花
      • 7.6.5 利用SVC分类鸢尾花
      • 7.6.6 参数寻优
      • 7.6.7 模型验证
    • 7.7 本章小结
    • 习题
  • 第8章 朴素贝叶斯
    • 8.1 问题引入
    • 8.2 贝叶斯定理
      • 8.2.1 条件概率
      • 8.2.2 贝叶斯定理
    • 8.3 朴素贝叶斯
    • 8.4 朴素贝叶斯的3种形式及scikit-learn实现
      • 8.4.1 高斯朴素贝叶斯
      • 8.4.2 多项式朴素贝叶斯
      • 8.4.3 伯努利朴素贝叶斯
    • 8.5 新闻分类
      • 8.5.1 数据集描述
      • 8.5.2 加载数据
      • 8.5.3 划分数据集
      • 8.5.4 文本特征提取
      • 8.5.5 模型训练
      • 8.5.6 模型评估
    • 8.6 本章小结
    • 习题
  • 第9章 决策树
    • 9.1 问题引入
    • 9.2 信息的度量
    • 9.3 决策树模型
      • 9.3.1 决策树的结构
      • 9.3.2 决策树构建
      • 9.3.3 决策树剪枝
    • 9.4 scikit-learn中的决策树
      • 9.4.1 DecisionTreeRegressor类
      • 9.4.2 DecisionTreeClassifie类
    • 9.5 泰坦尼克号幸存者预测
      • 9.5.1 数据集描述
      • 9.5.2 加载数据
      • 9.5.3 分析数据
      • 9.5.4 数据预处理
      • 9.5.5 划分数据集
      • 9.5.6 训练模型
      • 9.5.7 优化模型参数
    • 9.6 本章小结
    • 习题
  • 第10章 K均值算法
    • 10.1 问题引入
    • 10.2 聚类
    • 10.3 K均值算法简介
      • 10.3.1 算法思路
      • 10.3.2 数学原理
      • 10.3.3 图像描述
      • 10.3.4 停止K均值聚类的标准
    • 10.4 K均值算法优化
    • 10.5 scikit-learn中的K均值
    • 10.6 图像压缩
      • 10.6.1 加载图片
      • 10.6.2 数据预处理
      • 10.6.3 构造聚类器
      • 10.6.4 压缩图片
      • 10.6.5 显示压缩图片
    • 10.7 本章小结
    • 习题
  • 第11章 人工神经网络基础
    • 11.1 人工神经网络定义
      • 11.1.1 生物神经元结构
      • 11.1.2 以数学方式模仿神经元工作
    • 11.2 人工神经网络训练过程
      • 11.2.1 前向传播
      • 11.2.2 损失函数
      • 11.2.3 反向传播
      • 11.2.4 Epoch,Batch/Batch_Size,Iteration
    • 11.3 激活函数
      • 11.3.1 激活函数的作用
      • 11.3.2 常见激活函数
    • 11.4 性能优化
      • 11.4.1 数据增强
      • 11.4.2 Dropout
      • 11.4.3 批归一化
      • 11.4.4 提前停止训练
    • 11.5 鸢尾花分类
      • 11.5.1 scikit-learn中的神经网络模块
      • 11.5.2 利用MLPClassifier实现鸢尾花分类
    • 11.6 本章小结
    • 习题
  • 参考文献

相关图书