展开全部

主编推荐语

生动阐述现实中我们看到的和看不到的道德陷阱。

内容简介

数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。

没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题————本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。

现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和伦理困境,带读者一起思考如何平衡伦理问题和数据的效用。

目录

  • 版权信息
  • 前言
  • 序言
  • 第1章 数据科学 伦理导读
  • 1.1 数据科学(伦理)的兴起
  • 1.2 为何关注数据伦理?
  • 1.3 对错之分
  • 1.4 数据科学
  • 1.5 数据科学伦理平衡
  • 1.6 数据科学伦理的FAT流程框架
  • 1.6.1 数据科学中的不同角色
  • 1.6.2 FAT:公平、责任和透明
  • 1.6.3 数据科学伦理的FAT流程框架
  • 1.6.4 评估伦理模型
  • 1.7 本章总结
  • 第2章 伦理数据的收集
  • 2.1 隐私权属于人权
  • 2.1.1 隐私的重要性
  • 2.1.2 你没有任何隐私可言,习惯了就好
  • 2.2 条例
  • 2.2.1 《通用数据保护条例》
  • 2.2.2 公共数据是不可以自由复制的
  • 2.3 隐私保护机制
  • 2.3.1 加密
  • 2.3.2 哈希法(又称散列法)
  • 2.3.3 量子计算
  • 2.3.4 模糊处理
  • 2.3.5 去中心化(或本地化)的差分隐私
  • 2.4 警世故事:“后门”和信息加密
  • 2.4.1 政府“后门”
  • 2.4.2 赞同政府“后门”的观点
  • 2.4.3 反对政府“后门”的观点
  • 2.4.4 那么现状如何?
  • 2.5 偏差/偏见
  • 2.5.1 偏差/偏见:一个被反复使用的术语
  • 2.5.2 样本偏差
  • 2.6 警世故事:路况检测、大猩猩和简历
  • 2.7 人体实验
  • 2.7.1 人体实验伦理准则的起源
  • 2.7.2 A/B测试和C/D测试
  • 2.8 警世故事:约会、幸福和广告
  • 2.8.1 配对预测模型的 OKCupid 测试
  • 2.8.2 脸书(情绪)传染性研究
  • 2.9 本章总结
  • 第3章 伦理数据预处理
  • 3.1 定义和衡量隐私的标准
  • 3.1.1 隐匿法、分组法和干扰法
  • 3.1.2 k-匿名
  • 3.1.3 同质性攻击和链接攻击
  • 3.1.4 l-多样性,t-贴近度
  • 3.2 警世故事:再识别
  • 3.2.1 基于电影评分的再识别
  • 3.2.2 基于搜寻查询的再识别
  • 3.2.3 基于位置信息的再识别
  • 3.3 定义和选择变量
  • 3.3.1 输入选择
  • 3.3.2 定义目标变量
  • 3.4 警世故事:妊娠与人脸识别
  • 3.4.1 针对孕妇的定向广告
  • 3.4.2 人脸识别
  • 3.5 公平的新定义
  • 3.5.1 衡量数据集的公平性
  • 3.5.2 数据篡改
  • 3.6 警世故事:偏见性语言
  • 3.7 本章总结
  • 第4章 伦理建模
  • 4.1 隐私保护数据挖掘
  • 4.1.1 ε-差分隐私
  • 4.1.2 零知识证明
  • 4.1.3 同态加密
  • 4.1.4 安全多方计算
  • 4.1.5 联邦学习
  • 4.1.6 建模阶段隐私保护方法总结
  • 4.2 歧视感知模型
  • 4.2.1 衡量预测模型的公平性
  • 4.2.2 消除偏见/偏差
  • 4.3 警世故事:预测累犯和划红线
  • 4.3.1 累犯预测
  • 4.3.2 划红线
  • 4.3.3 歧视感知建模总结
  • 4.4 可理解的模型与可解释的人工智能
  • 4.4.1 可理解性与可解释性
  • 4.4.2 可理解性量化分析
  • 4.4.3 为何需要理解和解释预测结果?
  • 4.4.4 解释预测模型和预测结果
  • 4.4.5 全局解释
  • 4.4.6 实例解释
  • 4.5 警世故事:解释网页分类
  • 4.5.1 可理解的模型与可解释的人工智能总结
  • 4.6 伦理偏好:自动驾驶汽车
  • 4.7 本章总结
  • 第5章 道德评价
  • 5.1 道德衡量
  • 5.1.1 正确评估:正确对待数据科学
  • 5.1.2 评估FAT
  • 5.1.3 评估其他道德要求
  • 5.2 结果的伦理解释
  • 5.2.1 p值篡改
  • 5.2.2 多重比较
  • 5.3 道德报告
  • 5.3.1 公开透明的报告
  • 5.3.2 符合道德标准的学术报告
  • 5.4 德里克·斯塔佩尔的警世故事
  • 5.5 本章总结
  • 第6章 伦理部署
  • 6.1 系统访问
  • 6.1.1 访问受限
  • 6.1.2 因人而异的数据内容
  • 6.2 预测差异性与结果差异性
  • 6.2.1 基于数据的价格差异化
  • 6.2.2 行为修正与预测成真
  • 6.3 警世故事:人脸识别
  • 6.3.1 使用人脸识别软件
  • 6.4 诚实和换脸技术
  • 6.5 管理方式
  • 设立伦理监督委员会
  • 制订方针
  • 实施政策
  • 6.6 非预期后果
  • 6.6.1 数据科学模型的表现与预期不符
  • 6.6.2 对人类的非预期后果:失业?
  • 6.7 本章总结
  • 第7章 结论
  • 致谢
  • 参考文献
展开全部

评分及书评

评分不足
2个评分

出版方

北京科学技术出版社

北京科学技术出版社,成立于 1981年10月, 已于2010年度转制为企业,成立“北京科学技术出版社有限公司”,出资人为北京市科学技术研究院,是综合性的科技出版社,也是北京市科普传媒基地。 本社立足北京,面向全国,坚持“传播科技知识,创造精彩生活”的方针,以服务于国家经济建设、促进科学技术的进步和满足广大读者的需要为目标,出版自然科学、工程技术、医药卫生、科普、少儿、生活、文化教育、大众社科类图书及电子出版物。