展开全部

主编推荐语

Java自然语言处理:文本挖掘、语音识别、机器翻译。

内容简介

本书详细介绍以Java实现的自然语言处理常用的应用。从基本的文本挖掘技术到语音识别、问答系统和机器翻译技术,包括中文分词、词性标注、依存句法分析等。其中详细介绍了中文分词和词性标注的过程及相关算法,如隐马尔可夫模型等。在自然语言处理的应用领域主要介绍了信息抽取、自动文摘、文本排重、文本分类、文本倾向性分析等领域的基本理论和实现过程,此外还有问答系统、机器翻译等目前应用非常广泛的领域。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 基础篇
  • 第1章 自然语言处理实践基础
  • 1.1 开发环境准备
  • 1.2 技术基础
  • 1.3 专业术语
  • 开发篇
  • 第2章 中文分词原理与实现
  • 2.1 接口
  • 2.2 散列表最长匹配中文分词
  • 2.3 查找词典算法
  • 2.4 Trie树最大长度匹配法
  • 2.5 概率语言模型的分词方法
  • 2.6 新词发现
  • 2.7 Android系统中文输入法
  • 2.8 词性标注
  • 2.9 词类模型
  • 2.10 未登录词识别
  • 2.11 中文分词总体结构
  • 2.12 平滑算法
  • 2.13 地名切分
  • 2.14 企业名切分
  • 2.15 结果评测
  • 2.16 专业术语
  • 第3章 语义分析
  • 3.1 句法分析树
  • 3.2 依存文法
  • 3.3 依存语言模型
  • 3.4 使用Java计算机语言的语义分析
  • 3.5 专业术语
  • 第4章 文章分析
  • 4.1 分词
  • 4.2 词性标注
  • 4.3 重点词汇提取
  • 4.4 句子时态分析
  • 4.5 专业术语
  • 第5章 文档语义
  • 5.1 相似度计算
  • 5.2 文档排重
  • 5.3 在搜索引擎中使用文档排重
  • 5.4 专业术语
  • 第6章 信息提取
  • 6.1 指代消解
  • 6.2 中文关键词提取
  • 6.3 信息提取
  • 6.4 拼写纠错
  • 6.5 输入提示
  • 6.6 专业术语
  • 第7章 自动摘要
  • 7.1 自动摘要技术
  • 7.2 指代消解
  • 7.3 多文档摘要
  • 7.4 分布式部署
  • 7.5 专业术语
  • 第8章 文本分类
  • 8.1 地名分类
  • 8.2 文本模板分类
  • 8.3 特征提取
  • 8.4 线性分类器
  • 8.5 FastText文本分类
  • 8.6 最大熵分类器
  • 8.7 文本聚类
  • 8.8 持续集成
  • 8.9 专业术语
  • 第9章 文本倾向性分析
  • 9.1 确定词语的褒贬倾向
  • 9.2 实现情感识别
  • 9.3 专业术语
  • 系统篇
  • 第10章 语音识别
  • 10.1 总体结构
  • 10.2 语音库
  • 10.3 语音
  • 10.4 Sphinx语音识别
  • 10.5 说话人识别
  • 10.6 专业术语
  • 第11章 问答系统
  • 11.1 问答系统的结构
  • 11.2 问句分析
  • 11.3 知识库
  • 11.4 AIML聊天机器人
  • 11.5 自然语言生成
  • 11.6 JavaFX开发界面
  • 11.7 专业术语
  • 第12章 机器翻译
  • 12.1 使用机器翻译API
  • 12.2 翻译日期
  • 12.3 神经机器翻译
  • 12.4 辅助机器翻译
  • 12.5 机器翻译的评价
  • 12.6 专业术语
  • 参考文献
  • 后记
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。