扫码关注官方微信公众号

安筱鹏:AI大模型——一次重构软件系统、驱动万物智能的技术革命

2023-12-23






近期,在信息社会 50 人“智能时代:经济学的重构”论坛上,安筱鹏博士从大模型发展趋势、在典型行业中应用、对教育体系颠覆以及对组织形态重构等方面,深入分享了对于 AI 大模型的理解和洞察,以下是发言要点。
AI 大模型是通用人工技术(AGI)发展的重要里程碑,AGI 将引发新一轮数字技术竞争格局重构,也是大国新一轮数字技术竞争的制高点,必将对未来 5-10 年全球技术创新、企业竞争和国家博弈产生深远影响。 从这个意义上讲,大模型代表的不是一个技术,而是开启了新的智能时代。
AI 大模型既带了普惠效应,也带了极化效应。 一方面,AI 正在以更快的速度、更广的范围、更深的影响,让每个人、每个组织都能感受到新技术的红利。但另一方面,AI 大模型带来的是人和人的分化、企业和企业的分化、地区和地区的分化、国家和国家竞争力的分化。
AI 大模型正在形成更强大的规模经济和网络效应,人类社会将会迎来 10 万亿美元市值公司的时代。它可以在全球整合技术、人才、市场、资本等资源,让新技术通过高频迭代、低成本试用、大规模普及。这改变的不仅仅是一个企业的竞争力,也是一个地区、国家间核心竞争力和国际竞争格局。
AI 大模型重构软件系统、驱动万物智能,是变革生产力的主要途径。
1

大模型出现后,“鲍莫尔病”是否有新解?

20 世纪 60 年代,美国经济学家威廉·鲍莫尔和威廉·鲍恩提出了一个问题:为什么教育、法律、医疗、表演、休闲等服务行业的成本和价格一直在上升,而有形商品价格持续下降? 制造业等进步部门可以通过使用劳动节约型技术大幅提高生产率,使得产品成本持续下降,而技术进步并没有带来服务业生产率大幅提高,服务业等停滞部门的成本不断上升。 后来人们将这一现象称为“鲍莫尔病”。
半个多世纪以来,“鲍莫尔”不仅没解决,而且越来越严重。 商品价格在不断下降,但美国服务的价格在过去十多年持续攀升。自 2000 以来,美国医疗服务价格增长 200%、大学费用增长 150%+、医疗保健增长 100%,而玩具价格降了 50%、电视价格降了 100%。“鲍莫尔病”在进入新世纪后更严重了。
2021 年 3 月 16 日,OpenAI 公司 CEO 山姆·阿尔特曼(Sam Altma)在《万物摩尔定律》文章中预言:AI 革命是继农耕时代、工业时代、计算机时代之后的第四次革命,10 年后 AI 可以完成几乎所有工作,包括科学发明。可以确认的是,AI 将使产品(Goods)和服务(Services)变得越来越便宜。为此,为迎接一个包容性的智能社会到来,政府应当建立新的税收制度和资本市场。
15195
AI 是否能够提高医疗、教育、法律、政务、创意、影视、娱乐等服务行业的生产效率,为解决“鲍莫尔病”找到新药方? 我们可以看一看几个服务业领域正在发生的变化。

软件业:每个人都是程序人,编程开启大众化时代

软件行业是过去几十年人才最稀缺的行业,AI 大模型正在改变这一格局,AI 软件开发和编程能力正在逼近人类。今年 4 月 GPT4 发布后,国内研究机构 CSDN 测试结果是,GPT-4 的软件编程能力相当于中国月薪 3 万人民币的软件开发人水平。GPT4 通过了谷歌编码 L3 级 (入门级, 18 万美元年薪)工程师测试。
Stability AI 的 CEO 说人工智能将在五年内取代人类程序员。谷歌旗下 Deepmind 公司编程应用 AlphaCode,在编程比赛中超过 45.7% 的人类参赛者。有这样一个案例:一个只有 8 岁的小孩,利用人工智能开发了一款平台跳跃小游戏,代码由 ChatGPT 和 Claude 生成、美术由 Stable Diffusion 提供。
今年的云栖大会上,阿里云也推出了一款代码大模型,叫“通义灵码”, 可自动生成行级/函数级代码、单元测试、代码注释等,为开发者带来高效、流畅的编码体验。
从赋能实体经济的视角来看,大模型生成代码的价值,可能超过生成文字/图片/视频的价值,这个价值被远远低估了。
未来 AI 将重构整个软件体系,所有的软件都需要基于 AI 重新做一遍。这句话的关键词是“所有”。 “所有”的含义是:手机上所有的 APP 会被重构,Windows、Office 等办公软件会被重构,ERP、PLC、SCADA 等工业软件会被重构。所有软件将由 AI 驱动,软件服务模式加速从“流程”驱动到“数据”驱动,SaaS 软件从“在线化”走向“智能化”。软件开发前端从流程事务处理,到人机对话交互;软件开发后端的更多代码将自动生成。
未来所有的智能硬件包括手机、计算机、智能家电、摄像头、机器人、AGV 小车、工程机械等将被 AI 大模型驱动。你可以问家里的摄像头,你家的猫在哪里?你可以让机器人像人一样和你聊天、端茶倒水。你可以让生产线上的码垛机器人,根据人的自然语言指令生成或圆形或方形的堆垛。
E8D4
不是说仅仅在未来会重构,此时此刻的当下已经在发生变革。 今年西门子和微软已经达成新的战略合作,在今年的汉诺威博览会上,展示了 ChatGPT 和其他 Azure 人工智能服务如何增强西门子工业自动化工程解决方案能力,工程团队可以通过自然语言输入生成 PLC 代码,从而显著减少时间和错误概率。
今年 4 月,阿里云工程师就在实验室将通义千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,大模型就会自动生成机器人可以理解的代码,从而远程指挥机器人工作。
7 月 28 日,谷歌 DeepMind 推出了一款新的机器人模型 Robotics Transformer 2(RT-2)。这是一个全新的视觉-语言-动作(VLA)模型。例如,对 AI 说“捡起已灭绝的动物”,机械臂会在一堆塑料玩具中精准地选择恐龙。“灭绝的动物”很多,在此之前,机器人无法做到把“灭绝的动物”和“塑料恐龙玩具”联系在一起。
F95D
未来,当智能设备被 AI 大模型所驱动,其背后折射出的是,伴随着 IT 技术、CT 技术、DT 技术和 OT 技术的融合,伴随着被 AI 大模型所驱动,越来越多的设备正演化成一个智力水平不断成长的智能体。智能时代将是一个智能体涌现和联合的时代,这也将带来人类生产组织和生活方式的深刻变革。
C76B
AI 大模型带来软件效率革命

近期美国技术圈讨论一个招聘案例:一家技术公司准备招聘 1 名员工,有 2 名程序员来应聘:一个是拥有 4 年编程经验的巴基斯坦人 Hamid,一个是拥有 19 年编程经验的德国人 Alex,公司安排两个候选人开发一个软件(创建最小可行性产品 MVP)。一周后,Hamid 完成了 95% 的 MVP,而 Alex 只完成了 7% 的 MVP。为什么只有 4 年编程经验的人反而编程速度更快呢?因为他借助了代码大模型,不仅编程效率更高,整个开发成本也极大降低。

43AFD

2023 年 10 月,GitHub Copilot 开发者突破了 1 亿,付费用户已突破了 100 万。从最早只有 27% 的开发者会使用到如今的 46%,GitHub Copilot 让开发者的代码编写效率提升了 55%,高达 75% 的开发者在使用 Copilot 时感到更有成就感。GitHub CEO 说“很快 AI 将能实现 80% 的编程”。在全球峰会上,他直播用 GitHub Copilot X,仅仅耗时 18 分钟就编写出了贪吃蛇游戏。

AI 大模型重新定义了软件开发中的“人机交互”

简单回顾软件开发的历史,从物理交互界面的效率低、操作员必须熟悉每台机器的物理按钮功能,到编程交互界面的门槛高、操作员必须熟悉计算机硬件细节并精通编程,再到图形交互界面(GUI)空间小,而对话式交互界面(CUI)可以实现效率高、门槛低和无限触达。AI 大模型的出现,真正能够打通人类语言和机器语言。
652E9

医疗:人类医师资源不足是否有解?

2023 年 4 月 28 日,《美国医学会杂志》的研究显示:面对病人的咨询,“ChatGPT 医生”获得好评的数量是人类医生的 4 倍。在“富有同情心”的指标中,ChatGPT 更是收获了 45% 的肯定,而人类医生仅有 4.6%。
医疗大模型可以大幅提高效率、创造新的价值

今天,医患比例严重不足是全球面临的共同难题。2019 年《柳叶刀》的数据显示,全球缺少 4300 万名卫生工作人员。现在,AI 阅片的准确率达到了 95% 以上,年轻医生准确率在 80% 左右。原来阅一个片需要 25 分钟到半小时,在 AI 加持下不到半分钟。

围绕医疗领域,AI 已经有了很多创新。今年 8 月,谷歌发布全球首个全科医疗大模型 Med-PaLM ,这是首个在美国医疗执照考试中达到专家水平的大模型,懂临床语言、懂影像,也懂基因组学。国内也已经发布了超过 40 个医疗大模型,在浙大附属医院、华山医院等医院试用。
不仅如此,AI 大模型在特定的病例识别方面效率更高。国外有一个案例:一个 4 岁男孩牙痛持续加重,后出现走路不稳,历时 3 年,经 17 位医生(包括神经科、神经外科、儿科、内科、骨骼肌肉专科等)问诊也没有确认病因。最终疲惫而沮丧的妈妈将儿子的病历资料提问抛给 ChatGPT,得到的诊断包括脊髓栓系综合征。由此,该名儿童最终得以确诊和治疗。

律师:普惠的 AI 律师将普及

律师这个行业的服务价格,在美国还是比较贵的,大概每小时 150 美元。但现在有一个年服务费只要 36 美元的 AI 律师,他不仅便宜,在某些能力上和那些每小时 150 美元的律师差不多。它可以进行智能化、自动化的法律检索,起草法律文件、起诉书、备忘录、判决书,预测案件判决结果等等。在美国的律师资格考试中,GPT-4 已经超过了 90% 的学生。
目前,已经有一些公司在法律大模型这个细分领域深耕:
EvenUp: 个人伤害索赔领域垂直 LLM,2019 年成立,B 轮融资估值 3.5 亿美金,已落地超 200 家律所。
Harvey: 专为律所打造的 LLM,2022 年 11 月成立,获 OpenAI、红衫投资。
律商联讯: 顶级法律、专利、税务等服务商,2023 年 5 月推出全球首个面向法律界类 ChatGPT 生成式 AI 平台——Lexis+AI™。
汤森路透: 法律业务是三大支柱业务之一,每年 1 亿美元投向 AI。
设计:Midjourney 让最富有创造力的艺术家们不淡定了
2022 年,在美国科罗拉多州举办的艺术博览会上,一幅名为《太空歌剧院》的画作,在数字艺术类别的比赛中一举夺得冠军。据媒体报道,《太空歌剧院》与人们普遍认知的艺术作品有所不同,它是游戏设计师 Jason Allen 通过 AI 绘图工具 Midjourney 创作而成,一时引发很多热议。
电影导演陆川说,AI 用 15 秒出来的效果,比找专业海报公司做一个月作品要强大很多。如果去找专业图像公司来画气氛图,一张至少要花上万元,现在用 AI,可能只要十元钱。
15CB5
面对这样的场景,一些人甚至悲观地表示:我们眼睁睁地见证了艺术的消亡。如果连艺术工作都无法避免被机器所吞没,那么其他高技能的工种也将面临被淘汰的危机。到时候,我们又能剩下什么呢?
今年 11 月 28 日,成立半年只有 4 个人的小公司 Pika 发布自己 Pika1.0, 可以通过输入文字高质量地输出视频,成为颠覆电影和视频创作现象级 AI 应用。近期获 5500 万美元融资,估值在 2-3 亿美元,半年用户超 50 万,国内已与《流浪地球3》开展合作。它将带来一次影视创造模式的革命,也许每个人都可以圆自己的导演梦和演员梦。

11D8E

AI 与 EDA 双向奔赴:引领设计变革

AI 成为芯片设计的“器”,用 AI 帮 AI,AI 与 EDA 的双向奔赴,将开启芯片设计的下一场革命。
英伟达用 AI 设计 GPU,比传统 EDA 减少 25% 芯片面积,功耗更低。随着摩尔定律变慢,开发其他技术来提高芯片性能变得愈发重要。设计更小、更快、功耗更低的算术电路,就是其中的方式之一。基于这样的背景,英伟达的研究人员提出了 PrefixRL——用深度强化学习优化并行前缀电路。英伟达 Hopper 架构 H100 就拥有 13000 个 AI 设计电路。
谷歌也开始使用强化学习(RL)技术设计自己的 TPU AI 加速器布局。Synopsys 和 Cadence 等传统芯片设计工具公司积极拥抱 AI 设计。
中科院陈云霁团队,推出了世界首个完全由人工智能设计的 CPU 芯片“启蒙 1 号”,短短 5 个小时内便生成了一个工业规模的 RISC-V CPU 核心,设计周期则缩短至 1/1000。
2

AI 大模型正颠覆传统教育体系?时代需要什么样的人?

进入新的智能时代,传统的教育体系会不会因为大模型而颠覆呢? 我们这个时代,五年、十年、二十年之后,到底需要什么样的人呢? 我们看到,在教育领域,GPT 已经通过了各种各样的开始,比如 ChatGPT 已经通过美国沃顿商学院 MBA 期末考试。
今年 3 月,OpenAI 和宾夕法尼亚大学推出了一份研究报告,针对 1000 多种职业,探索 AI 大模型怎么影响美国劳动力市场。首先我们先来定义什么是“影响”, “影响”的含义是,当一个职业使用大模型时,能否让工作时间减少至少 50%。研究人员的结论是: 对于 19% 的岗位,至少 50% 的工作内容会被影响。对于 80% 的岗位,也至少有 10% 的工作内容被或多或少地波及。而且高收入工作面临着更大的风险。
AI 大模型是什么?今天的 AI 大模型可能就像历史上的火药,正在从放烟花时代走向枪炮时代,实现从冷兵器到热兵器的跨越。 那什么样的人才不会被这个时代淘汰呢?我觉得有三个标签: 一是想像力,二是创造力,三是批判精神。
现在的教育体系下,我们可以想一下,哪一个是培养想象力、哪一个是培养创造力、哪一个是培养批判精神。如果没有这三个能力的时候,这些培育的人未来能够做什么工作呢?我们靠什么参与全球竞争,这些问题都值得深入去思考。
AI for Science 论文数量井喷,AI 已成为重要的科研手段
AI 不仅仅是一种工具,近年来,AI4S(AI for Science)成为一种基本科学研究方法。理解蛋白质三维空间结构一直是生物学中的重大挑战,过去几十年,结构生物学家通过X射线晶体图学或者冷冻电镜等高科技手段,共得到十几万种蛋白质结构。
直到 2020 年,这一困扰生物学家 50 多年的问题被 DeepMind 团队开发的 Alpha Fold2 模型彻底打破,Alpha Fold2 的预测精准度几乎达到冷冻电子显微镜等实验技术的水平。2022 年 7 月 28 日,DeepMind 公布了从细菌到人类的几乎所有已知(2 亿多个)蛋白质的可能结构,并将其纳入相关数据库,供研究人员免费搜索蛋白质结构。
Google 学术相关数据表明,近 3 年使用 AI 的论文数量增长率超 3 倍。像材料科学、生命科学、能源科学,近 3 年使用 AI 手段开展科研的比例超过 34.5%。换句话说,人们认识和改造世界的方法论已经发生了重大变化。

中山大学:用云加速 RNA 病毒发现,重新定义了人类对病毒演化历史的认知。

全球 RNA 病毒种类丰富多样,且高度分化。受限于聚类统计学算法和传统计算方法,主流配置服务器运行一次试验的时长达 2-3 个月,科研代价大、结果精度不高,研究效率低。
中山大学医学院围绕 RNA 病毒研究,开发 AI 大模型,帮助 RNA 病毒发现技术突破,将 RNA 病毒的发现效率从 2-3 月缩短为一周,扩充全球 RNA 病毒库——近 30 倍的新发现病毒种、约 9 倍的新发现病毒超群。云和大模型大幅提升了人类发现 RNA 新病毒的效率,重新定义了人类对病毒演化历史的认知。
15A91
3

AI大模型重新定义组织和员工?

AI 大模型是人类社会第 25 种通用目的技术,通用目的技术将带来组织形态的变革。
Midjourney 公司 2021 年成立,拥有 1000 万的社区成员,1 亿的营收且零融资。此前只有 11 个员工,包括 1 个创始人,8 个研发,1 个法务和 1 个财务。PIKA 公司成立 6 个月,也只有 4 个员工。它们的规模反映出一个现象:未来的企业会越来越小型化,越来越微粒化。
为什么微粒组织、微粒社会正在崛起?我们可以思考一个问题:人类是怎么协作的?如果我们把时间尺度拉长,看到的是基于信息能力提升所带来的社会协作水平的深化,是人类社会演进的一条主线。
在《人类简史》中,作者赫拉利提到,10 万年前地球上存在着猿人、智人等人类祖先,但在 1 万年前只剩下了智人。智人在进化中率先在语言和信息交流上实现了突破,形成了一种超凡的信息认知。这样,人们不仅可以交流猎物和危险的来源,还可以设定一个目标,实现人与人之间的协作。
到了工业社会,随着印刷、电报、电话的普及,人类的协作从熟人分工演进到陌生人协同,从封闭体系到开放体系,从小尺度到大尺度,从几百人到几十万人,开启了大制造、大零售、大流通的时代。
再到今天,从计算机到互联网,从人人互联到万物互联,从人工智能到区块链,我们正在重构对外部世界的感知、获取和利用的方式。这种沟通方式的变革正在重构分工协作的基础设施、生产工具和协作模式。

一代协作技术,一代组织形态

从 PC 互联网到移动互联网,再到今天的智能时代,信息在组织内部的管理、监督及在外部交易、协作中的成本不断降低、协作模式不断创新,企业边界正在重新定义,科层组织正在瓦解,微粒企业(组织)正在崛起。

康威定律说“系统的技术架构会是组织架构的复刻”,但今天我们看到的更多是“逆康威定律扩展”,即我们用什么样的沟通协作系统,决定了我们是什么样的组织形态。就像经常有人说的一句话,“一代协作技术,一代组织形态”,你有什么样的技术沟通方式就会催生、诞生、孵化出什么样的新的组织形态,不同的技术时代会形成不同类型的组织。
14362
今天,当云计算、大模型、AI 到来的时候,微粒企业正在崛起。过去开发一个软件的功能,达到最小化可行产品(MVP)的团队规模可能需要 40 个人、50 个人,今天可能只需要 3 到 4 个人,组织变得越来越小,这是技术变化的一个趋势。

AI 重新定义组织形态,AI 正在重新定义“员工”

AI 的到来会让你拥有一个新员工,它是一个“学霸”,已经学习了地球上所有的知识。你需要与这个员工不断地交互、协作,不断地驯化与被驯化。

之前有一个概念叫“AI 助理”,这个词的叫法可能不对,它可能是助理,可能是教练、顾问、队友,也可能从 Copilot 辅助驾驶到 Autopilot 自动驾驶, 我们跟 AI 员工之间是一个相互赋能的过程。
试想一下,数字员工应该归属哪个部门?我们看到有“数字招聘员工”、“数字财务员工”等各类数字员工,它不仅具有 IT 属性,还具备一些人的功能,那它是属于人力资源部门还是 IT 部门?这些问题目前没有结论,都是需要探讨的。
5AFAB

文章来源|阿里研究院

(ID:aliresearch)

编辑|段文秀

审核、责编|杨帆