互联网
类型
可以朗读
语音朗读
231千字
字数
2018-10-01
发行日期
展开全部
主编推荐语
获取、存储、分析和可视化社交数据的一站式解决方案参考指南。
内容简介
本书主要内容包括:如何用Python的公共API与社会媒体平台交互,如何为数据分析存储社会媒体数据,使用Python分割社会媒体数据,用文本分析方法理解社会媒体数据,如何用统计和分析手段从海量数据中挖掘出有用信息,如何用Web技术将数据可视化展现出来。
目录
- 版权信息
- 前言
- 本书内容
- 本书需要的工具
- 目标读者
- 排版约定
- 读者反馈
- 客户支持
- 下载示例代码
- 下载本书中的彩色图片
- 勘误
- 反盗版
- 问题
- 电子书
- 第1章 社会媒体、社交数据和Python
- 1.1 入门
- 1.2 社会媒体——机遇和挑战
- 1.2.1 机遇
- 1.2.2 挑战
- 1.2.3 社会媒体挖掘技术
- 1.3 Python的数据科学工具
- 1.3.1 Python开发环境的安装
- 1.3.2 高效的数据分析
- 1.3.3 机器学习
- 1.3.4 自然语言处理
- 1.3.5 社会网络分析
- 1.3.6 数据可视化
- 1.4 Python中的数据处理
- 1.5 创建复杂的数据管道
- 1.6 小结
- 第2章 Twitter数据挖掘——标签、话题和时间序列
- 2.1 入门
- 2.2 Twitter API
- 2.2.1 接口访问频率限制
- 2.2.2 搜索与流
- 2.3 从Twitter收集数据
- 2.3.1 从时间线获取推文
- 2.3.2 推文的结构
- 2.3.3 使用流API
- 2.4 分析推文——实体分析
- 2.5 分析推文——文本分析
- 2.6 分析推文——时间序列分析
- 2.7 小结
- 第3章 Twitter用户、粉丝和社区
- 3.1 用户、好友和粉丝
- 3.1.1 回到Twitter API
- 3.1.2 用户资料的结构
- 3.1.3 下载好友和粉丝的资料
- 3.1.4 分析你的社会网络
- 3.1.5 度量影响力和参与度
- 3.2 挖掘粉丝
- 3.3 挖掘对话
- 3.4 在地图上绘制推文
- 3.4.1 将推文转换为GeoJSON
- 3.4.2 用Folium轻松绘制地图
- 3.5 小结
- 第4章 Facebook帖子、页面和用户互动
- 4.1 Facebook Graph API
- 4.1.1 注册你的应用
- 4.1.2 鉴权和安全
- 4.1.3 用Python连接Facebook Graph API
- 4.2 挖掘你的帖子
- 4.2.1 帖子的结构
- 4.2.2 时间频率分析
- 4.3 挖掘Facebook页面
- 4.3.1 从页面获取帖子
- 4.3.2 度量参与度
- 4.3.3 用词云可视化帖子
- 4.4 小结
- 第5章 Google+话题分析
- 5.1 Google+ API入门
- 在Google+中搜索
- 5.2 在Web GUI中嵌入搜索结果
- 5.2.1 Python的装饰器
- 5.2.2 Flask路由和模板
- 5.3 Google+页面的笔记和活动
- 5.4 笔记的文本分析和TF-IDF计算
- 用n-gram方法捕获短语
- 5.5 小结
- 第6章 Stack Exchange提问和回答
- 6.1 提问和回答
- 6.2 Stack Exchange API入门
- 6.2.1 搜索带标签的问题
- 6.2.2 搜索用户
- 6.3 处理Stack Exchange的存档数据
- 6.4 问题标签的文本分类
- 6.4.1 监督学习和文本分类
- 6.4.2 分类算法
- 6.4.3 评估
- 6.4.4 Stack Exchange数据的文本分类
- 6.4.5 在实时应用中嵌入分类器
- 6.5 小结
- 第7章 博客、RSS、维基百科和自然语言处理
- 7.1 博客和自然语言处理
- 7.2 从博客和网站获取数据
- 7.2.1 使用WordPress.com API
- 7.2.2 使用Blogger API
- 7.2.3 解析RSS和Atom订阅
- 7.2.4 从维基百科获取数据
- 7.2.5 关于网络爬取的一点建议
- 7.3 自然语言处理基础
- 7.3.1 文本处理
- 7.3.2 信息抽取
- 7.4 小结
- 第8章 挖掘所有数据
- 8.1 很多社交API
- 8.2 挖掘YouTube上的视频
- 8.3 挖掘GitHub上的开源软件
- 8.4 挖掘Yelp上的本地商家
- 8.5 创建自定义的Python客户端
- HTTP让事情变得简单
- 8.6 小结
- 第9章 关联数据和语义网
- 9.1 数据网
- 9.1.1 语义网词汇
- 9.1.2 微格式
- 9.1.3 关联数据和开放数据
- 9.1.4 RDF
- 9.1.5 JSON-LD格式
- 9.1.6 Schema.org
- 9.2 从DBpedia挖掘关系
- 9.3 挖掘地理坐标
- 9.3.1 从维基百科抽取地理数据
- 9.3.2 在Google Maps上绘制地理数据
- 9.4 小结
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。