顶部
收藏

大模型原理与实践


作者:
李兵、原春锋、阮晓峰 编著
定价:
39.90 元
版面字数:
360.00千字
开本:
16开
装帧形式:
平装
版次:
1
最新版次
印刷时间:
2026-01-13
ISBN:
978-7-04-067068-4
物料号:
67068-00
出版时间:
2026-04-22
读者对象:
高等教育
一级分类:
电气/电子信息/自动化类
二级分类:
电气/自动化专业课
三级分类:
其他

全书系统介绍了大模型的基本概念、核心技术与典型应用,全面梳理了人工智能的发展脉络、大模型的产生背景及其主要应用场景,帮助读者建立对大模型技术体系的整体认识。书中重点讲解Transformer架构、大模型的预训练、微调与推理机制,系统介绍思维链、检索增强生成、强化学习等关键方法,并进一步探讨智能体与多模态大模型等前沿技术方向。通过智能问答系统和智能助手搭建等实践案例,完整展示从模型调用到应用落地的实现流程,促进理论学习与工程实践的有机结合。最后,本书对大模型与人工智能未来的发展趋势进行了展望。

本书可作为高等学校计算机、人工智能及相关专业本科生的人工智能通识课程教材或教学参考书,也适合希望系统了解和学习人工智能基础知识的广大读者与技术爱好者阅读参考。

  • 前辅文
  • 第1章 人工智能与大模型:从概念到应用
    • 1.1 人工智能的起源与发展
      • 1.1.1 人工智能的起源
      • 1.1.2 人工智能的发展历程
      • 1.1.3 人工智能的三大学派
    • 1.2 人工智能的早期探索
      • 1.2.1 连接主义的神经网络
      • 1.2.2 符号主义的专家系统
      • 1.2.3 早期探索的挑战与局限
    • 1.3 深度学习的革命
      • 1.3.1 深度学习复兴的历史转折点
      • 1.3.2 数据时代的到来
      • 1.3.3 图形处理器引发的算力革命
      • 1.3.4 卷积神经网络的空间智慧
      • 1.3.5 视觉识别的历史性突破
      • 1.3.6 自然语言处理的深度学习路径
    • 1.4 大模型的诞生与分类
      • 1.4.1 大模型的核心概念
      • 1.4.2 大模型的优势与局限
      • 1.4.3 大模型时代的到来
      • 1.4.4 大模型的缩放定律与涌现能力现象
      • 1.4.5 大模型的分类体系
    • 1.5 大模型的应用场景
      • 1.5.1 政务领域
      • 1.5.2 医疗领域
      • 1.5.3 金融领域
      • 1.5.4 教育领域
      • 1.5.5 内容创作领域
    • 1.6 本章小结
  • 第2章 解锁大模型潜力:核心能力与应用案例
    • 2.1 常用大模型
      • 2.1.1 国外大模型代表
      • 2.1.2 国内大模型代表
    • 2.2 提示词工程
      • 2.2.1 学会提问
      • 2.2.2 优化生成内容
      • 2.2.3 辨别大模型输出
    • 2.3 大模型的核心能力
      • 2.3.1 多语言理解与文本生成
      • 2.3.2 代码生成
      • 2.3.3 知识记忆与应用
      • 2.3.4 数学推理与逻辑判断
      • 2.3.5 多模态信息处理能力
    • 2.4 核心能力案例展示
      • 2.4.1 PPT制作
      • 2.4.2 写作
      • 2.4.3 数学推理
      • 2.4.4 代码生成
      • 2.4.5 统计图表
      • 2.4.6 文生图与文生视频
      • 2.4.7 图生视频
    • 2.5 本章小结
  • 第3章 大模型技术基石:基本结构与自监督学习
    • 3.1 判别式AI与生成式AI
      • 3.1.1 基本概念
      • 3.1.2 核心方法差异
      • 3.1.3 应用场景差异
      • 3.1.4 差异总结
    • 3.2 神经网络模型结构的发展
      • 3.2.1 传统神经网络
      • 3.2.2 卷积神经网络
      • 3.2.3 循环神经网络
      • 3.2.4 大模型网络
    • 3.3 大模型编/解码结构
      • 3.3.1 大模型整体架构
      • 3.3.2 大模型编/解码过程
    • 3.4 大模型预训练、微调及推理
      • 3.4.1 基本概述
      • 3.4.2 大模型预训练
      • 3.4.3 大模型微调
      • 3.4.4 大模型推理
      • 3.4.5 大模型预训练、微调及推理的总结
    • 3.5 本章小结
  • 第4章 进阶架构解码:思维链、强化学习与检索增强生成
    • 4.1 思维链
      • 4.1.1 基本概念
      • 4.1.2 思维链提示
      • 4.1.3 改进的思维链
      • 4.1.4 思维链的演化
      • 4.1.5 思维链的优势
      • 4.1.6 思维链的前景展望
    • 4.2 强化学习
      • 4.2.1 指令微调的局限性
      • 4.2.2 强化学习的介绍
      • 4.2.3 强化学习训练大模型
      • 4.2.4 大模型强化学习的代表性算法
    • 4.3 检索增强生成
      • 4.3.1 基本概念
      • 4.3.2 检索增强生成的核心模块
      • 4.3.3 检索增强生成的工作流程演进
      • 4.3.4 检索增强生成的变体与前沿拓展
    • 4.4 本章小结
  • 第5章 行业标杆解析:ChatGPT与DeepSeek技术对比
    • 5.1 OpenAI的崛起与行业标杆地位
      • 5.1.1 从传统模型到大语言模型
      • 5.1.2 OpenAI GPT系列
      • 5.1.3 OpenAI的发展路径
    • 5.2 ChatGPT的全球影响及其原因解析
      • 5.2.1 ChatGPT带来的革命性用户体验
      • 5.2.2 ChatGPT的通用解决能力
      • 5.2.3 ChatGPT引发的全球大模型研发浪潮
    • 5.3 从DeepSeek看大模型行业发展规律
      • 5.3.1 大模型的行业发展挑战
      • 5.3.2 DeepSeek-V3模型
      • 5.3.3 DeepSeek-R1模型
      • 5.3.4 DeepSeek的应用
    • 5.4 大模型从研发到应用的路径
      • 5.4.1 从实验室走向产业应用
      • 5.4.2 开源与闭源的技术路线选择
      • 5.4.3 大模型的落地应用模式
    • 5.5 本章小结
  • 第6章 智能体革命:从基础模型到智能体
    • 6.1 背景介绍
      • 6.1.1 基础模型回顾
      • 6.1.2 智能体定义
      • 6.1.3 基础模型与智能体区别
    • 6.2 智能体分类
      • 6.2.1 反应式智能体
      • 6.2.2 认知式智能体
      • 6.2.3 多智能体系统
    • 6.3 智能体的技术架构
      • 6.3.1 感知-决策-行动循环
      • 6.3.2 大模型驱动的智能体
    • 6.4 智能体互通的技术协议
    • 6.5 智能体应用与发展
      • 6.5.1 基于大模型的智能体
      • 6.5.2 具身智能
    • 6.6 本章小结
  • 第7章 视觉大模型:视觉理解与生成
    • 7.1 视觉大模型概述
      • 7.1.1 视觉大模型的概念
      • 7.1.2 视觉大模型的特点
    • 7.2 视觉内容理解
      • 7.2.1 基本概念与技术架构
      • 7.2.2 自监督学习范式
      • 7.2.3 分割与检测大模型
    • 7.3 视觉内容生成
      • 7.3.1 视觉生成模型
      • 7.3.2 主流工具与应用场景
      • 7.3.3 提示词设计技巧
      • 7.3.4 安全挑战
    • 7.4 本章小结
  • 第8章 多模态大模型:多场景应用
    • 8.1 多模态大模型概述
      • 8.1.1 基本概念
      • 8.1.2 发展历程
      • 8.1.3 典型任务
    • 8.2 多模态大模型的主流架构
      • 8.2.1 以大语言模型为核心的架构
      • 8.2.2 原生多模态大模型的架构
      • 8.2.3 两种多模态大模型架构的比较
    • 8.3 多模态大模型的训练范式
      • 8.3.1 多模态大模型训练的整体流程
      • 8.3.2 多模态对齐机制的两种视角
      • 8.3.3 多模态大模型的预训练任务类型
      • 8.3.4 多模态大模型的训练数据类型
      • 8.3.5 多模态大模型的视觉表示插入技巧
      • 8.3.6 多模态大模型的评估基准
    • 8.4 典型多模态大模型的介绍
      • 8.4.1 Flamingo模型
      • 8.4.2 MiniGPT-4模型
      • 8.4.3 GPT-4V模型
      • 8.4.4 DeepSeek-VL模型
      • 8.4.5 Qwen-VL系列模型
    • 8.5 多模态大模型的核心能力与应用
      • 8.5.1 跨模态理解与对话能力
      • 8.5.2 视觉生成能力
      • 8.5.3 复杂推理能力
      • 8.5.4 应用前景
    • 8.6 本章小结
  • 第9章 实战项目:手把手搭建智能问答系统
    • 9.1 智能问答系统概述
      • 9.1.1 基本概念
      • 9.1.2 代表性智能问答系统
      • 9.1.3 智能问答系统的分类
      • 9.1.4 智能问答系统的应用领域
    • 9.2 智能问答系统的核心技术
      • 9.2.1 智能问答系统的流程
      • 9.2.2 用户意图理解
      • 9.2.3 知识库构建与语义向量化
      • 9.2.4 检索增强生成
      • 9.2.5 多轮对话机制
      • 9.2.6 安全与合规机制
    • 9.3 大模型应用开发平台
      • 9.3.1 Dify平台简介
      • 9.3.2 Dify平台部署
    • 9.4 智能问答系统搭建
      • 9.4.1 聊天助手搭建
      • 9.4.2 知识库问答系统搭建
    • 9.5 本章小结
  • 第10章 个性化学习引擎:构建大模型驱动的学习科研助手
    • 10.1 相关知识介绍
      • 10.1.1 Dify平台工具插件介绍
      • 10.1.2 三种助手简介
    • 10.2 数据可视化助手
      • 10.2.1 任务介绍
      • 10.2.2 ECharts插件
      • 10.2.3 数据可视化助手搭建
    • 10.3 数据库查询助手
      • 10.3.1 任务介绍
      • 10.3.2 MySQL数据库
      • 10.3.3 数据库查询助手搭建
    • 10.4 多模态智能识别助手
      • 10.4.1 任务介绍
      • 10.4.2 多模态大模型
      • 10.4.3 多模态智能识别助手搭建
    • 10.5 本章小结
  • 第11章 人工智能的未来
    • 11.1 大模型的发展趋势
    • 11.2 类脑智能
    • 11.3 从通用智能到超级智能
    • 11.4 本章小结
  • 参考文献

相关图书