- 给这本书评了3.0若是早两个月出版,就是五星好书
ChatGPT 在今年上半年的突然大热,让一大堆关于人工智能、大模型…… 等类型的书,如雨后春笋般冒了出来。说实在的,不是这本书写的不够好,而是因为它出现的慢。还有他在书中后半部所提的,关于 ChatGPT 怎么使用的一些技巧,又因为我最近在学快刀青衣的《给职场人的 AI 写作课》,两者相比,这本书又倒霉的被比了下来,所以我无法给出高分。不过本书还是有一些地方有创新的,例如通过科普情景剧的方式,以拟人化的表述方法,透过几个虚拟角色的对话,来让我们更好的理解以 ChatGPT 为代表的大模型原理是什么,为我们揭开 ChatGPT 智能外衣下的内核。以及所谓的窗口 (对话机器人)、人机交互界面 (键盘、麦克风)、GPT-4 大模型、必应搜索组件…… 等 在其中所起到的作用。 另外书中提到了关于新奇性搜索(Novel Search)算法,我觉得没有解释得很透。这部分推荐去看《为什么伟大不能被计划》这本书,毕竟这算法是这本书的两位作者所发明的。根据书中的描述,这种算法会随机生成一组解决方案,通过评估新奇性并保留新奇性比较高的方案,从而像生物演化一样发生一定的变异。如此往复循环,直到达到预定的迭代次数或者将问题彻底解决。白话一点的说法,就是不求最好 (最接近),只求最贵 (最无厘头)。
1转发同时评论快速转发111分享「微信」扫码分享给这本书评了3.0人工智能通识这本书主要讲述了 ChatGPT 大模型的前世今生以及未来发展趋势,探讨了大模型时代的技术、应用和产业变化,并对大模型在知识工作、商业企业、创意娱乐等领域的具体应用进行了介绍。该书首先通过拟人化的形式生动形象地解释了 ChatGPT 大模型背后的原理,对这一赋能大模型变革技术与产业的基础能力进行深度剖析 1;其次,以三次工业革命的历史和逻辑作为参照,描绘出大模型将如何驱动社会进入智能革命和脑机协作时代,并为个人和企业应对此次变革提出建议;最后,对国内外大模型产业的构成和发展进行了分析,并对暗藏泡沫隐患的风险点位做出预警。ChatGPT 大模型的出现标志着人工智能从感知智能向认知智能快速发展,大模型具有更好的通用性、精度和效率,可以通过预训练或其他方式在大型数据集上进行学习,再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。大模型时代的到来将引发新一轮的智力革命和产业重构,构建全新的脑机协作关系,但与机会如影随形的泡沫也会随之涌现。因此,需要警惕泡沫风险,同时积极应对大模型时代带来的挑战和机遇。
转发转发同时评论快速转发16分享「微信」扫码分享给这本书评了5.0一本面向科技行业的GPT科普读物【8 级,197k】如果我能早一点看到这本书,我肯定不会去啃《人工智能算法》那三本大部头了。不得不说,自从 Google 大脑发布 transformer 模型后,人工智能的发展速度明显提速了,加上 NV 发布的 A100 和 H100 的助力,AI 正在加速到来。仅仅 1 年多的时间,GPT、LLaMa 等模型快速迭代,已经深入了数以亿计的早期用户的生活了。但就是因为这样恐怖的迭代速度,让我们有些束手无措,摸不清它的发展方向,也不知道人类应该在新时代扮演一个什么样的角色。这是一本 2023 年 4 月份才发布的书,很多的数据甚至是 2023 年 2、3 月份来自 OpenAI 的最新数据,时效性堪比月刊。而且这还不是一本 3w、5w 字的新闻稿,而是一本 20w 字的半专业读物,当中的插图、比喻等不仅严谨,而且质量非常高,作者也完全不忌讳提到哪些内容来自于 AI 生成的。可见生成式 AI 已经开始直接影响到传统行业的工作流了。本书分成了四个部分:技术篇、变革篇、应用篇、产业篇。其中最有意思的其实是技术篇,它用情景剧的方式将 ChatGPT 的基础原理描绘的幽默、生动、浅显易懂。大语言模型如 ChatGPT 和 LLaMa,本质上还是基于深度神经网络和自注意力框架,利用超高算力和超大模型而不断发展的模型。简单来说,它只是一个基于前文推算下一个字应该是什么的概率模型,本身并不神秘。然而就像 KK 的《失控》提到的,当参数规模突破百亿瓶颈,量变确实引发了难以解释的质变。比如参数规模突破 71 亿的时候 AI 开始能判断内容的毒性;突破 130 亿开始拥有三位数加减法的能力;突破 620 亿开始拥有多步推理能力;1750 亿(GPT4)开始拥有自我评估和高位数加减法的能力。当然现在 GPT4 模型的单数还不够大,它为了能够应对人类的损失厌恶,甚至会编造一些内容,这些问题也会随着模型进一步增大而解决。而当进入到 GPT5、6,模型规模达到万亿至百万亿的水平的时候,多模态模型已经可以轻易处理图片视频甚至传感器数据的时候,人和 AI 的边界将愈发模糊,《奇点临近》里描述的双指数增长也确有实现的可能。而后面的变革篇,讲到了曾经发生在人类生活中的几次革命,比如蒸汽革命、纺织革命等,以此来安慰读者,面临这种短时间内巨大的变革,人总能找到方法适应新的环境。比如作者提出了 AI 辅助人类(类似于 L2 级自动驾驶)的副驾模式,以及与人类协作(类似 L4 级自动驾驶)的代驾模式,并提出了如何能与大语言模型更好地协作的方式。紧接着的应用篇和产业篇,作者提出了几个现在就可以产业化的应用方式,甚至还贴心地给出了一些实例,比如法律咨询、市场分析、辅助医疗、文案编辑、产品设计、会议助理等等。而到时间跨度上,将来基于大模型的自动驾驶、AI 辅助工厂、AI 机器人等也确实给人简而言之,这是一本内容紧跟时事却不失趣味的科普读物,强烈推荐所有理工科生阅读!
1转发同时评论快速转发32分享「微信」扫码分享给这本书评了5.0大模型是在数学、统计学、计算机科学、物理学、工程学、神经学、语言学、哲学、人工智能学融合基础上的一次突变,并导致了一种 “涌现”(emergence)。大模型也因此称得上是一场革命。在模型尚未达到某个临界点之前,根本无法解决问题,性能也不会比随机好;但当大模型突破某个临界点之后,性能发生越来越明显的改善,形成爆发性的涌现能力(参见图 Ⅱ)。据谷歌、斯坦福和 DeepMind 联合发表的《大语言模型的涌现能力》(Emergent Abilities of Large Language Models):“许多新的能力在中小模型上线性放大规模都得不到线性的增长,模型规模必须呈指数级增长并超过某个临界点,新技能才会突飞猛进。”
转发转发同时评论快速转发评论赞分享「微信」扫码分享