- 给这本书评了4.0培养大数据思维,应对未来的生活
道恩・E. 霍尔姆斯教授是贝叶斯网络、机器学习和数据挖掘方面的专家, 他在《大数据:牛津通识读本》这本书中,用深入浅出的文字扼要介绍了什么是数据、什么是大数据以及它有什么意义,进而对大数据应用所涉及的存储和分析技术进行了简明扼要的综述,并在此基础上分析和研判了大数据在医学、电子商务、安全、生活等各个领域的应用。这样一本概述性质的通俗读物,非常有助于普通读者更多地了解大数据,学习大数据,应用大数据,进而培养一种大数据思维,以适应未来的大数据时代。读一本书,培养一种思维。每天读点书,培养多种思维。
转发转发同时评论快速转发283分享「微信」扫码分享给这本书评了4.0成败关键,在于如何收集与利用关于大数据的专业书籍通常会沦为以下两类:要么是对事物的实际运行方式不提供解释,要么是只适合研究生使用的高难度数学教科书。这本书与这两类有所不同,可被视为大数据的科普书。它涉及的内容包括:大数据运作方式的基础知识,大数据如何改变我们周围的世界,以及它对我们的日常生活及商业世界的影响。至于如何看待大数据,我觉得译者另外提到的三个视角和四个维度,能更好的帮助我们读者更加全面地认识大数据。首先谈谈三个视角。第一从计算视角来看,大数据是一个难以获取、难以组织与管理、难以处理和分析的技术难题(以及因此而引发的各类思维层难题),也正是因为这样的难题驱动,加之人们对大数据在优政、兴业、科研、惠民等不同领域的价值期望,促使相关科研人员进行技术攻关和发明创造,进而推进了相关理论和技术的发展。二是科研视角:从科学研究的角度来看,大数据成为继实验、理论、模拟之后用于科学研究的 “第四范式”(此处的 “范式” 指的是从事某一科学的科学家群体所共同遵从的世界观和行为方式)。三是商业视角:从商业应用的角度来看,大数据能够带来利润。一般而言,只要找到一个合适的应用场景,并为这个应用场景找到一个合适的解决方案,知道数据的来源并且能够获取,而且有技术支撑(研发能力),更重要的是能够找到融资支持(经过可行性分析、盈亏平衡分析等之后),就有可能最终成功应用并获得收益。这在彰显大数据商业价值的同时,也会促使同行去挖掘更多的大数据价值。更进一步说,大数据的价值实现涉及数据、技术与应用的协同,具有典型的多学科交叉与跨界整合特征,因此就总体而言,实现大数据价值至少涉及如下四个维度(层面)。1. 算法(Algorithm):大数据价值的实现路径涵盖了数据采集与汇聚、数据存储与管理、数据处理与分析、应用系统开发与运维,每一个环节都需要依赖不同的算法进行,如数据采集算法、数据汇聚算法、数据治理算法、数据处理和分析算法等。2. 商业应用(Business):大数据应用一般体现在描述性分析、预测性分析或者决策性分析等,任何一种应用都是围绕某个具体场景展开的,因此大数据价值得以实现的一个重要前提,是找到一个合适的应用场景,该应用场景既直击需求痛点并有投资回报预期,又有数据积淀和 IT 建设基础。大数据在这个场景的应用,能够进一步内生和富集更多数据并因而形成数据闭环,就能进一步体现和实现大数据价值。3. 算力(Computing Power):所谓算力,指的是设备的计算能力,显然,对于大数据应用而言,更精准(复杂)的算法以及更高效的计算需求都需要强大的算力支撑,因此算力是大数据价值实现的基本保障。4. 数据(Data):数据是大数据价值实现的基础,因此必须首先解决诸如数据在哪以及如何从不同的数据源获取数据,并进行有效的富集、汇聚和深入加工等问题,从而为应用提供数据支撑或高级语义支撑。
转发转发同时评论快速转发116分享「微信」扫码分享给这本书评了5.0大数据时代,普通人的生活方式1,在当下大数据时代,传统意义上的数据成为了一种资产,对于商家来说是一种提高竞争力和销售利润的资源,对于我们普通消费者来说,需要保护好自己的隐私,减少各类 app 对我们数据的获取。2,电子健康数据(例如社保,运动手环等)和驾驶数据,保险公司收集完之后进行数据分析,更准确分析用户的健康风险程度,进行更准确的保费收取。(特斯拉近日进军保险行业就是这个逻辑)。3,商家收集我们在网络上的各种数据,会预测消费者的需求和推荐可能会购买的商品,获得更大的商业利益。4,关于点击付费广告,互联网公司通过大数据收集消费者数据,对消费者贴标签,区分人群等,可以做更有针对性的广告。5,一个很有意识的新知,商家在互联网公司使用了定制广告服务,有可能会被竞争对手恶意刷点击,进而增加对手的广告费支出。6,现在不单单是互联网公司在收集数据,国家也通过网络方式监控国内外的公民,进行非法监视。(美国斯诺登事件)7,低重复可编码的工作,被机器人取代。甚至创意类型的工作也会被人工智能取代,据我了解,已经有人工智能可以创作歌曲小说新闻稿。8,智能交通工具是未来的一大发展方向。按照《必然》的观点,能随时使用就是拥有,未来的人可能都不属于拥有属于自己的汽车,通过类似现在的滴滴打车形式,在 app 下订单,就有一台无人驾驶汽车为我服务。9,机器人和人工智能的发展,会逐渐取代人的工作。《未来简史》的观点,90% 会成为无用之人。这些无用之人的娱乐方式很有可能是,类似《头号玩家》《黑镜》 ,在虚拟现实里面生活。10,无人驾驶汽车、远程健康监控、智能家居以及电子通勤等都将成为智慧城市的特征。此类城市的运作将依靠对大数据的管理和分析,它们从大量布设的传感器收集而来。(杭州智慧城市,治堵效果显著,就是阿里云的帮助)11,对于大数据智能时代我目前的做法:①1,有意识的训练,抖音的 AI 算法。关注和点赞,育儿、医学,法律,健康,知识类。②注意各类 app 对我们的不恰当隐私的窃取,最防不胜防的就是对剪切板的社区,输入法对我们打字情况的监控。③注意消费主义的陷阱,下大金额订单前给自己一个冷静期。④对于新闻咨询的获取,不主要从算法平台上面获取,主要浏览人民网的各领域新闻。防止人工智能,对我定制广告和资讯,造成我的视野视也越来越狭隘,影响我的决策判断。
转发转发同时评论快速转发评论3分享「微信」扫码分享给这本书评了3.0大数据时代更要“以人为主”本书是牛津通识读本里介绍 “大数据” 这个新词的小册。中文版于 2020 年出版,书中引用的案例至多晚至 2017。三年后来看这本书,已经有很多概念不再是热点,有很多案例也有了后续发展。本书对于 “数据” 概念的定义与介绍集中于前半部分,关于大数据的运用及社会影响则集中于后半部分。吴军老师在他的课程里介绍过很多通俗易懂的计算机知识,本书中的科普并没有高明过那些内容。作为一个非专业读者看得懵懵懂懂。因此借着这本书内容写一点自己的感悟:知识不只是知道,也要运用。书中说大数据分成存储与运用两大部分,我们在电脑数据库中搜索资源,也只是针对一小部分投射出的数据进行分析,并不是从大数据海中拾贝。人脑与电子存储的原理也类似:并不是知识储备多就一定能运用好知识。普通人学习知识,一是要用笔记对知识进行分类;二是从实用角度向外衍生,不要妄想能够超越机器。大数据是 “细节恶魔”。绝大多数的数据都是 “非结构化” 的,单一的数据并没有本身的意义,但借助关键词标记和相关性分析,可以将非结构性的数据变成结构化的画像。对于大信息流,已经阅读的书籍,我们个体也应该懂得筛选和 “以我为主”,否则再多的知识也与我们的人与事无关。大不一定正确,小错也可能因为大系统酿成大错。书中提到利用大数据相关性分析得出的结论往往是脱离现实的。比如国内外都有用大数据制造 “爆款剧” 的案例,往往是爆款不成反而搬石头砸脚。原因是我们看到的数据不一定是真实的人的真实想法。如今的 AI 创作在可见的未来也会污染数据流。个人在信息接受上的决策应该是 “脱虚向实”,回归经典,与虚拟世界的热点和口号保持距离。
转发转发同时评论快速转发评论赞分享「微信」扫码分享