顶部
收藏

自然语言处理(第2版)


作者:
江铭虎 姚登峰 庞凯怡 邹佳君
定价:
179.00元
版面字数:
630.00千字
开本:
16开
装帧形式:
精装
版次:
2
最新版次
印刷时间:
2026-01-06
ISBN:
978-7-04-062531-8
物料号:
62531-00
出版时间:
2026-03-06
读者对象:
学术著作
一级分类:
自然科学
二级分类:
计算机科学与工程
三级分类:
人工智能

自然语言处理是语言学、计算机科学、人工智能及信息处理等领域的一个分支,利用计算机来理解和生成自然语言,在计算机技术的支持下对语言信息进行定量化的研究。本书重点介绍了自然语言处理的基本问题、自动文本分类与聚类、信息检索与查询、网络文本细粒度情感分类研究、自动文本摘要、人机交互技术以及自动问答系统等,这些内容既有数学理论模型又有实验论证,从理论到实践,深入浅出、结构完整、层次分明、条理清楚,概念阐述明确、公式推导简明扼要,易于理解、便于教学和自学。

本书可作为中文信息处理专业、计算语言学专业以及相关专业高年级本科生、研究生的教学参考书,也可供从事自然语言处理、计算机信息处理以及人工智能相关工作的科研人员参考使用。

  • 前辅文
  • 第一章 概论
    • 1.1 自然语言处理研究的意义、历史与现状
      • 1.1.1 自然语言的特点及研究意义
      • 1.1.2 自然语言处理研究的历史与现状
    • 1.2 自然语言处理的方法、特点与规律
      • 1.2.1 理性主义与经验主义
      • 1.2.2 语料库语言学——经验主义研究方法的代表
      • 1.2.3 汉语语言处理的方法
      • 1.2.4 基于知识图谱的深度学习
    • 1.3 基于语言认知神经机制的类脑计算
      • 1.3.1 类脑计算面临的问题
      • 1.3.2 基于认知神经机制的类脑计算
    • 1.4 本书的主要内容
    • 思考题
    • 参考文献
  • 第二章 自然语言处理的基本问题
    • 2.1 中文自动分词
      • 2.1.1 关键问题
      • 2.1.2 中文分词方法
      • 2.1.3 相关分词工具介绍
      • 2.1.4 分词系统简易评价
    • 2.2 中文文本自动标注
      • 2.2.1 中文词性自动标注的基本方法
      • 2.2.2 基于深度学习的词性标注方法
      • 2.2.3 中文文本语义标注
    • 2.3 句法分析
      • 2.3.1 句法分析的作用、理论与方法
      • 2.3.2 中文句法分析的特殊性与困难
      • 2.3.3 基于深度学习的句法分析方法
      • 2.3.4 自然语言处理通用模块的设计与实现案例
    • 2.4 语料库处理
      • 2.4.1 语料库语言学
      • 2.4.2 语料库的发展
      • 2.4.3 汉语语料库概率统计及平滑算法
      • 2.4.4 语料库处理实例——对话口语语料库特征提取和形式化表达
    • 2.5 小结
    • 思考题
    • 参考文献
  • 第三章 自动文本分类与聚类
    • 3.1 基本概念
      • 3.1.1 文本分类中的关键词、关键句提取
      • 3.1.2 命名实体识别
      • 3.1.3 文本聚类
      • 3.1.4 文本分类
      • 3.1.5 半监督的聚类与分类
      • 3.1.6 情感分类
      • 3.1.7 基于模糊理论及层次组织的分类
    • 3.2 基于粗糙集理论的中文文本自动分类
      • 3.2.1 常用的分类模型
      • 3.2.2 评估方法
      • 3.2.3 现有自动分类模型存在的问题及改进
      • 3.2.4 自动分类功能的设计与实现
    • 3.3 基于概念抽取和联合加权的中文文本分类
      • 3.3.1 基于屏蔽层的概念及原词混合特征的选择
      • 3.3.2 概念特征选择的研究
      • 3.3.3 基于联合加权的特征选择算法
      • 3.3.4 基于SVM的自动分类方法
      • 3.3.5 文本分类系统模块介绍
    • 3.4 基于反馈学习的文本分类系统
      • 3.4.1 学习思想与文本分类
      • 3.4.2 系统设计与实现
    • 3.5 基于Boosting算法的多标签中文文本分类
      • 3.5.1 关于文本分类的若干问题
      • 3.5.2 Boosting算法原理
      • 3.5.3 系统设计
    • 3.6 小结
    • 思考题
    • 参考文献
  • 第四章 信息检索与查询
    • 4.1 信息检索的基本概念
      • 4.1.1 信息检索流程
      • 4.1.2 跨语言信息检索
      • 4.1.3 语义检索
      • 4.1.4 机器学习用于信息检索
      • 4.1.5 以用户为中心的信息检索
      • 4.1.6 扩展查询
    • 4.2 常用检索模型
      • 4.2.1 布尔模型
      • 4.2.2 概率模型
      • 4.2.3 向量空间模型
      • 4.2.4 扩展的布尔模型
      • 4.2.5 其他模型
    • 4.3 基于TF-IQF模型和流行因子的中文查询推荐技术研究
      • 4.3.1 查询推荐系统
      • 4.3.2 基于TF-IQF模型和流行因子的查询推荐研究
      • 4.3.3 基于中文查询日志的实验
      • 4.3.4 基于查询推荐系统的应用研究
    • 4.4 Rough集理论在信息检索中的应用
      • 4.4.1 Rough集理论用于分类与检索
      • 4.4.2 等价关系与容差关系
      • 4.4.3 检索具体步骤
    • 4.5 面向信息检索的词汇分布聚类
      • 4.5.1 信息检索与词汇分布聚类
      • 4.5.2 词汇获取在邮件分类中的应用
      • 4.5.3 基于频繁项挖掘的词汇获取
    • 4.6 小结
    • 思考题
    • 参考文献
  • 第五章 网络文本的细粒度情感分类研究
    • 5.1 网络文本细粒度情感分类研究综述
      • 5.1.1 研究背景与意义
      • 5.1.2 研究现状综述
    • 5.2 面向社交网络文本的多标签情绪分类研究
      • 5.2.1 概述
      • 5.2.2 相关工作
      • 5.2.3 基于图卷积网络的多标签情绪分类模型
      • 5.2.4 实验验证与结果分析
    • 5.3 新冠疫苗推特文本的情感分类研究应用
      • 5.3.1 背景与意义
      • 5.3.2 相关工作
      • 5.3.3 实验方法
      • 5.3.4 结果与分析
    • 5.4 一种多语言视角下的情绪识别方法
      • 5.4.1 引言
      • 5.4.2 方法介绍
      • 5.4.3 实验与结果
    • 5.5 小结
    • 思考题
    • 参考文献
  • 第六章 自动文本摘要
    • 6.1 概述
      • 6.1.1 关键词提取
      • 6.1.2 自动文本摘要的类别
    • 6.2 自动文本摘要的研究进展
      • 6.2.1 基于抽取式的自动文本摘要
      • 6.2.2 基于无监督的自动文本摘要
      • 6.2.3 基于小说、新闻和读者需求的自动文本摘要
      • 6.2.4 基于树状和层次结构的文本摘要
      • 6.2.5 基于特定领域和心理学特征的自动文本摘要
      • 6.2.6 基于深度学习的文本摘要
      • 6.2.7 文本摘要的评价
    • 6.3 深度学习神经网络的研究简述
      • 6.3.1 卷积神经网络模型
      • 6.3.2 长短期记忆模型
      • 6.3.3 词嵌入与预训练语言模型
    • 6.4 小结
    • 思考题
    • 参考文献
  • 第七章 人机交互技术
    • 7.1 引言
      • 7.1.1 人机交互系统的定义
      • 7.1.2 人机对话系统的意义
      • 7.1.3 人机对话系统的研究内容
    • 7.2 语音识别概况
      • 7.2.1 自动语音识别
      • 7.2.2 含噪语音识别
      • 7.2.3 语音情感识别
      • 7.2.4 儿童语音、老年语音和非母语的适应性语音识别
      • 7.2.5 儿童语音和老年语音的语音处理
      • 7.2.6 基于深度神经网络的语音识别
    • 7.3 汉语语音理解
      • 7.3.1 人的自然语言理解过程
      • 7.3.2 闭环反馈结构的语言理解模型
      • 7.3.3 闭环信息反馈语音识别理解的实现
    • 7.4 语音合成
      • 7.4.1 语音合成概况
      • 7.4.2 基于深度学习的语音合成
      • 7.4.3 基于情感韵律的语音合成
    • 7.5 人机对话系统的研究
      • 7.5.1 对话系统的研究概况
      • 7.5.2 基于规则的句法分析理论
      • 7.5.3 鲁棒的口语分析器
      • 7.5.4 对话系统中的语义分析
      • 7.5.5 话语分析与对话管理
    • 7.6 人机交互系统
      • 7.6.1 基于视听觉多媒体的人机交互
      • 7.6.2 车载人机交互
      • 7.6.3 基于手势识别的人机交互
      • 7.6.4 对话机器人——以微软小冰为例
      • 7.6.5 聊天机器人ChatGPT
    • 7.7 小结
    • 思考题
    • 参考文献
  • 第八章 自动问答系统
    • 8.1 问答系统的研究范式
      • 8.1.1 问答系统的基本框架
      • 8.1.2 问答系统分类
      • 8.1.3 问答系统的评价方式
    • 8.2 典型问答系统模型
      • 8.2.1 基于信息检索的问答系统
      • 8.2.2 基于社区的问答系统
      • 8.2.3 基于知识库的问答系统
      • 8.2.4 中文问答系统构建实例——基于句法分析和机器学习的中文自动问答系统
    • 8.3 问答系统的问题与发展方向
      • 8.3.1 问答系统领域面临的挑战
      • 8.3.2 未来发展方向
    • 8.4 小结
    • 思考题
    • 参考文献
    • 附录8A 汉语文本词性标注标记表
  • 术语表