互联网
类型
可以朗读
语音朗读
193千字
字数
2019-08-01
发行日期
展开全部
主编推荐语
全方位解读大数据背景下的文本分析核心算法,助力打造下一代AI。
内容简介
本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、口碑分析、社交网络分析以及智能系统。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 概述
- 1.1 网络运营与文本分析
- 1.2 文本分析的4V特征
- 1.3 在线文本分析应用
- 1.4 本章小结
- 第2章 预备知识
- 2.1 文本挖掘的主要任务
- 2.2 语义分析与语法分析
- 2.3 文本的结构化分析
- 2.4 文本的标准化分析
- 2.5 机器学习的基本概念
- 2.6 机器学习的重要问题
- 2.7 本章小结
- 第3章 文本建模
- 3.1 文本建模的基本概念
- 3.2 文本建模的应用场景
- 3.3 语言学建模概述
- 3.4 词标注分析
- 3.5 句法分析
- 3.6 知识库与语义网
- 3.7 统计学建模概述
- 3.8 向量空间模型
- 3.9 LSI模型
- 3.10 Unigram模型
- 3.11 pLSI模型
- 3.12 LDA主题模型
- 3.13 主题模型拓展
- 3.14 基于词汇的统计学建模方法
- 3.15 本章小结
- 第4章 文本分类
- 4.1 文本分类的基本概念
- 4.2 文本分类的应用场景
- 4.3 朴素贝叶斯模型
- 4.4 向量空间模型
- 4.5 SVM模型
- 4.6 文本分类的评价
- 4.7 分类特征优化
- 4.8 分类学习策略优化
- 4.9 本章小结
- 第5章 文本聚类
- 5.1 文本聚类的基本概念
- 5.2 文本聚类的应用场景
- 5.3 扁平式聚类
- 5.4 凝聚式聚类
- 5.5 聚类结果分析
- 5.6 聚类特征优化
- 5.7 半监督聚类
- 5.8 短文本聚类
- 5.9 流数据聚类
- 5.10 本章小结
- 第6章 序列标注
- 6.1 序列标注的基本概念
- 6.2 序列标注的应用场景
- 6.3 HMM
- 6.4 最大熵模型和最大熵马尔可夫模型
- 6.5 条件随机场
- 6.6 本章小结
- 第7章 信息检索
- 7.1 信息检索的基本概念
- 7.2 信息检索的应用场景
- 7.3 基于空间模型的信息检索
- 7.4 基于概率模型的信息检索
- 7.5 基于语言模型的信息检索
- 7.6 本章小结
- 第8章 文本摘要
- 8.1 文本摘要的基本概念
- 8.2 文本摘要的应用场景
- 8.3 关键词提取的特征设计
- 8.4 关键词提取的有监督算法
- 8.5 关键词提取的无监督算法
- 8.6 基于图模型的关键词提取算法
- 8.7 关键词提取的技术优化
- 8.8 关键短语提取
- 8.9 关键句提取
- 8.10 本章小结
- 第9章 口碑分析
- 9.1 口碑分析的基本概念
- 9.2 口碑分析的应用场景
- 9.3 基于词典的评价对象提取
- 9.4 基于语料的评价对象提取
- 9.5 评价水平量化
- 9.6 基于语言模型的情感分析技术
- 9.7 本章小结
- 第10章 社交网络分析
- 10.1 社交网络分析的基本概念
- 10.2 社交网络分析的应用场景
- 10.3 社交网络的虚拟社区发现
- 10.4 社交网络的用户影响力分析
- 10.5 社交网络的情感分析
- 10.6 社交网络的话题发现与演化
- 10.7 社交网络的信息检索
- 10.8 本章小结
- 第11章 深度学习与NLP
- 11.1 基本原理
- 11.2 词嵌入模型
- 11.3 RNN与NLP
- 11.4 本章小结
- 第12章 实证研究
- 12.1 研究框架
- 12.2 理论与模型
- 12.3 文本数据处理
- 12.4 研究结论
- 12.5 本章小结
- 第13章 总结
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。