互联网
类型
可以朗读
语音朗读
327千字
字数
2021-02-01
发行日期
展开全部
主编推荐语
第21届Jolt大奖图书,聚焦社交网站生态的某个具体方面,使用Python代码分析社交媒体中的真知灼见。
内容简介
本书指导你挖掘隐藏在Twitter、Facebook、LinkedIn、Instagram和GitHub等流行社交网站上的丰富数据。通过这本畅销指南,数据科学家、分析师和程序员将学习如何在Jupyter Notebook或者Docker容器中使用Python代码分析社交媒体中的真知灼见——哪些人正在通过社交媒体进行联系?他们正在谈论什么?他们目前身在何处?
在本书的第壹部分,每一章都聚焦社交网站生态的某个具体方面,囊括了各大主流社交网站,也包括了网页、博客和订阅源、邮箱、GitHub以及新增加的Instagram的内容。第二部分提供了实用指南,其中包括超过20个供挖掘Twitter数据之用的简短代码解决方案。
目录
- 版权信息
- O'Reilly Media, Inc.介绍
- 译者序
- 前言
- 第一部分 社交网站导引
- 序幕
- 第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等
- 1.1 概述
- 1.2 Twitter风靡一时的原因
- 1.3 探索Twitter API
- 1.4 分析140字(或更多)的推文
- 1.5 本章小结
- 1.6 推荐练习
- 1.7 在线资源
- 第2章 挖掘Facebook:分析粉丝页面、查看好友关系等
- 2.1 概述
- 2.2 探索Facebook的图谱API
- 2.3 分析社交图谱联系
- 2.4 本章小结
- 2.5 推荐练习
- 2.6 在线资源
- 第3章 挖掘Instagram:计算机视觉、神经网络、对象识别和人脸检测
- 3.1 概述
- 3.2 探索Instagram API
- 3.3 Instagram帖子的剖析
- 3.4 人工神经网络速成
- 3.5 神经网络在Instagram帖子中的应用
- 3.6 本章小结
- 3.7 推荐练习
- 3.8 在线资源
- 第4章 挖掘LinkedIn:分组职位、聚类同行等
- 4.1 概述
- 4.2 探索LinkedIn API
- 4.3 数据聚类速成
- 4.4 本章小结
- 4.5 推荐练习
- 4.6 在线资源
- 第5章 挖掘文本文件:计算文档相似度、提取搭配等
- 5.1 概述
- 5.2 文本文件
- 5.3 TF-IDF简介
- 5.4 用TF-IDF查询人类语言数据
- 5.5 本章小结
- 5.6 推荐练习
- 5.7 在线资源
- 第6章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等
- 6.1 概述
- 6.2 抓取、解析和爬取网页
- 6.3 通过解码语法来探索语义
- 6.4 以实体为中心的分析:范式转换
- 6.5 人类语言数据处理分析的质量
- 6.6 本章小结
- 6.7 推荐练习
- 6.8 在线资源
- 第7章 挖掘邮箱:分析谁和谁说什么以及说的频率等
- 7.1 概述
- 7.2 获取和处理邮件语料库
- 7.3 分析Enron语料库
- 7.4 分析你自己的邮件数据
- 7.5 本章小结
- 7.6 推荐练习
- 7.7 在线资源
- 第8章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等
- 8.1 概述
- 8.2 探索GitHub的API
- 8.3 使用属性图为数据建模
- 8.4 分析GitHub兴趣图谱
- 8.5 本章小结
- 8.6 推荐练习
- 8.7 在线资源
- 第二部分 Twitter数据挖掘与分析实用指南
- 第9章 Twitter数据挖掘与分析
- 9.1 访问Twitter的API(开发目的)
- 9.2 使用OAuth访问Twitter的API(产品目的)
- 9.3 探索流行话题
- 9.4 查找推文
- 9.5 构造方便的函数调用
- 9.6 使用文本文件存储JSON数据
- 9.7 使用MongoDB存储和访问JSON数据
- 9.8 使用信息流API对Twitter数据管道抽样
- 9.9 采集时序数据
- 9.10 提取推文实体
- 9.11 在特定的推文范围内查找最流行的推文
- 9.12 在特定的推文范围内查找最流行的推文实体
- 9.13 对频率分析制表
- 9.14 查找转推了状态的用户
- 9.15 提取转推的属性
- 9.16 创建健壮的Twitter请求
- 9.17 获取用户档案信息
- 9.18 从任意的文本中提取推文实体
- 9.19 获得用户的所有好友和关注者
- 9.20 分析用户的好友和关注者
- 9.21 获取用户的推文
- 9.22 爬取好友关系图
- 9.23 分析推文内容
- 9.24 提取链接目标摘要
- 9.25 分析用户收藏的推文
- 9.26 本章小结
- 9.27 推荐练习
- 9.28 在线资源
- 第三部分 附录
- 附录A 关于本书虚拟机体验的信息
- 附录B OAuth入门
- 附录C Python和Jupyter Notebook的使用技巧
- 作者简介
- 封面简介
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。