13年后，真的无人幸免？

量子学派
2022年12月14日10时

2022年，AI发展突然加速。

原来以为，AI只会完成程序设定的机械指令。

只能在工业领域，协助人类工作。

然而，今天的AI现在却开始“忤逆人类”。

它不断地在独属于人类的领域突破。

AI真的越来越强大，也越来越需要引起关注和深思。

图片来源：文心一格

未来学家库兹韦尔曾公开表示，

在2045年左右，AI将可能达到一个奇点。

在那一刻，AI也许将正式迎来技术爆炸，人和AI的关系达到一个新的起点。

现在看来，这一时刻很可能还会提前到来。

人类却还自以为是，徘徊不前。

世界还在彼此争斗，吵个不停。

在很多人看来，AI只是一段程序。

至于像艺术这样的高维世界，独属于人类。

可是2022年的AI正在染指的领域，就包括绘画。

AI绘画，发展一日千里

2022年12月8日，一场拍卖会在上海举行。

拍卖的对象，是人机共创的一幅AI山水画，取名也令人深思——《未完·待续》。

它是全球首次由人类和AI共同创作并进行拍卖的山水画。

这幅画的底稿是民国才女陆小曼未完成的作品。

著名海派画家乐震文，续笔完成了先人之画意。

AI，也在这份原作上进行续画创作。

山水画，通常包含“勾”“皴”“擦”“染”“点”等基本画法。

对于一个人类画家来说，这些基本画法用手操控画笔就能实现。

但对于AI而言，它没有手，只能基于数学建模来绘画。

每一根线条、每一处构图，并非由人来完全掌控。尤其是风格、皴法要求严格的山水画，对AI创作是更大的挑战。

AI艺术与创意平台“文心一格”，成功完成了以上挑战。

不仅能够理解画面内容，而且自动扩展和优化画作内容元素。

同时，将画稿本身、AI的创造力与人类的判断力，绝妙地进行了融合。

最终，一幅尊重原画的成品得以诞生。

不仅富有创造力，也符合中国画风格。

最终，这幅全球首次AI山水画以110万元落槌成交，成功拍卖。

左：乐震文完成稿中：陆小曼未尽稿右：文心一格完成稿

文心一格的惊艳表现，又是一个经典案例。

世界变了，AI绘画已经有灵魂了。

为什么会这样，到底发生了什么？

AI绘画的背后，有一个少为人知的存在。

正是它的进步，带来了AI的突飞猛进。

它就是大模型，是AI绘画重要的技术支撑。

AIGC时代，要来了

AI能够做的，当然不只是绘画。

AI绘画，只是AIGC（AI生成内容）的一种表现形式。

除了绘画，文字、代码、音频、三维建模等，都可能通过AI来生成。

也就是说，曾经认为只有人类能够创造的内容领域，AI已经参与进来。

从技术层面分析，AIGC主要涉及到以下两点：

1、自然语言处理（NLP）：NLP是实现人与计算机之间如何通过自然语言进行交互的手段；

2、AIGC生成算法：以生成对抗网络（GAN）和扩散模型为主。

简单来说就是，NLP类似翻译的角色，是人与AI进行沟通的桥梁。

生成算法则是AI的引擎，是AI得以源源不断进行“创作”的核心动力。

算法越先进，AI越强大。

从生成对抗网络到diffusion扩散模型，AI算法一直在不断优化。

当然，对海量数据集的高效处理，也是AIGC得以迅速发展的重要原因。

这些，同样也都离不开一个重要支撑：大模型。

在不久的将来，AIGC很可能将会做到：

1、写作：写一部同《最后的问题》媲美的科幻小说；

2、聊天：与人类进行突破“图灵测试”的对话；

3、谱曲：作一首与《梁祝》不相上下的绝世音乐；

4、绘画：绘制一张超越《蒙娜丽莎》的天才画作；

5、制作电影：生成一部像《教父》般的经典电影；

6、编写程序：创建和Linux一样伟大的开源代码。

这不只是猜想和预测，AIGC已经在稳打稳扎步步为营了。

文心一格的AI绘画，Copilot的AI编程，ChatGPT的AI对话，都是案例。

还记得李世石那场世纪对决吗？

谈到AI，许多人应该对AlphaGo还记忆犹新。

2016年，AlphaGo与李世石展开世纪对决。

在第4局，李世石的“神之一手”，帮助其扳回一局。

人类暗自庆幸，AI没有全胜。

AlphaGo是怎么做到的？

谈到AI在大模型之前最重要的技术，那就是“深度学习”。

AlphaGo的“大脑”，是一套机器学习系统。

支撑AlphaGo的机器学习算法，是“深度学习”+“强化学习”。

AlphaGo借助两种深度神经网络：value network与policy network。

value network负责评估棋子选点，policy network则选择落点。

通过不断地强化学习，AlphaGo最终训练出了超出人类顶尖棋手的能力。

AlphaGo神经网络的训练过程和结构

后来，通过优化深度学习算法，AlphaGo又进一步升级：

1、学习数据全部来自机器自身的主动搜索，而非人类投喂；

2、由多机运行转换为单机运行，应用效率增强；

3、“自动决策”能力得到进一步提升。

前些年AI的迅猛发展，都与深度学习密切相关。

但这两年AI的挺进，是在深度学习的基础之上，强化了大模型的能力。

只是作为后台BOSS的大模型，大部分人感知不到。

深度学习→大模型

深度学习，是AI发展的重要突破。

它能让计算机自动学习出模式特征，减少人为设计特征的不完备性。

但是，深度学习模型也存在不足：

1、在只能提供有限数据量的应用场景下，深度学习算法不能对数据规律进行无偏差统计；

2、由于深度学习中图模型的复杂化，导致算法的时间复杂度急剧提升，为保证算法的实时性，需要更高的并行运算和更好的硬件支撑。

也就是说，深度学习虽然强大，但它需要大数据支撑，才能达到高精度与高准确度。

2022年AI突然有了质的飞跃，背后的原因，就是大模型的崛起，让深度学习如虎添翼。

对手写数字进行分类的CNN结构图

大模型的出现，很好地解决了以上问题。

大模型也称为“预训练大模型”，通过大模型，AI开发者可以直接获得相对现成的训练结果，并在此基础上直接开发AI应用。

而大模型的核心特征，就是模型参数多，训练数据量大。

当前，大模型的参数量，基本都是百亿级别以上，多则高达万亿。

相应的，大模型的泛化能力更强，可以完成多个不同的任务。

有了大模型预训练出来的各种参数和场景，AI就能在各个领域迅速突破。

也就是说，大模型在一定程度上也解决了通用性的难题。

AI开始全方位的突破，翻译、配音、绘画、搜索、写作、建模……

特别是2022年，明显能感觉到AI的“蠢蠢欲动”。

因为大模型越来越成熟，它为AI提供了子弹。

全球AI科技巨头的必争之地

大模型，是当前AI领域的技术新高地。

全球的AI科技巨头，都在狂炼大模型。

国内有百度、华为、阿里，国外则有谷歌、微软、英伟达……

科技巨头们在这个时候发展大模型，其实是在为将来布局。

百度文心大模型结构图

可问题来了，看起来都是大企业在布局。

AI产业领域的中小企业，如何参与进来呢？

面对人工智能这样的巨大市场，中小企业如何参与呢？

由于成本太高，小企业没办法预训练自己的大模型。

OpenAI 在训练包含1750亿参数的GPT-3时，就花了将近500万美元。

这还只是千亿级的大模型训练成本。即使是对于科技巨头来说，这样的成本也不低。

因此，如何实现大模型的经济适用性，就变得极为重要。

那么，中小企业具体该如何做呢？

一个可以考虑的方向是：让大模型与各种垂直场景需求进行有效匹配，实现落地。

也就是大厂建大模型，中小企业建立各类场景应用。

在这方面，百度的做法也许值得借鉴。

面对如何实现大模型产业化这个问题，在百度看来，具有算法、算力和数据综合优势的企业，可以将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务，从而形成一条大模型产业化路径。

以文心大模型为例，它是百度自主研发的产业级知识增强大模型体系。

它既包含基础通用的大模型:

1、NLP大模型:医疗、金融、搜索、跨语言……

2、CV大模型：商品图文搜索表征学习、OCR图像表征学习……

3、跨模态大模型：文图生成、文档智能……

4、生物计算大模型：化合物表征学习、蛋白质结构预测……

同时，也包含行业大模型：能源、金融、航天、制造、传媒……，让大模型技术与真实场景需求，真正实现了有效匹配，也推动了大模型的落地。

比如前面提到的文心一格，以及最近刚刚发布的产业级搜索系统文心百中，都是文心大模型的落地应用产品。

也就是说，借助文心大模型，你也可以做出一个AI绘画，或者一个垂直版的baidu搜索。

当然，大模型还有更多可以应用的场景。

你虽然没有大模型，但可以在大模型里训练出一个小模型。

怎样使用文心大模型？

目前，文心大模型已经发布36个大模型。

通过飞桨开源平台、百度智能云，为工业、能源、金融、通信、媒体等各行各业提供支持。

下面是部分合作案例：

No.1

航天（中国探月与航天工程）

应用场景：航天故障部位信息抽取、航天工程文献情报分类、航天技术文献检索与摘要生成等多个航天领域应用场景。

No.2

能源（国家电网）

应用场景：设备技术标准知识库、电力知识问答系统、电力文档智能分析等多个能源行业应用场景。

No.3

金融（浦发银行）

应用场景：智能对话、智能文档分析、智能双录等多个金融行业应用场景。

No.4

汽车（吉利）

应用场景：智能客服系统、车载语音系统、领域知识库构建等汽车行业应用场景。

大模型能够做的事情，当然也不只上面这些。

比如，一个小朋友可以帮妈妈建一个应用：如何判断水果新不新鲜。

他多拍一些水果照片喂给AI程序，让AI慢慢了解什么新鲜什么不新鲜。

然后他妈妈就可以利用这个AI小程序，到外面买水果，扫一扫就能判断新鲜还是不新鲜。

简不简单，好玩不好玩？

这样的场景其实比比皆是，只是我们对大模型了解得太少。一看到大模型，就以为是个什么神奇得不得了的冰冷怪物。

其实不然，它可以成为我们的技术助理。

那么，一个企业如果有应用需求的话，该怎么具体对接文心大模型呢？

以百度文心大模型体系中的全功能AI开发平台BML为例。

BML是一个面向企业和个人开发者的机器学习集成开发环境。

它能够提供从数据处理、模型训练、模型管理到模型推理的全生命周期管理服务。

帮助用户更快地构建、训练和部署模型。

BML大致开发流程如下：

1、需求对接：企业结合自身业务实际需求，对接AI项目定制；

2、数据处理：整合源数据，自动完成数据采集、清晰、扩充、标注等任务；

3、模型建构：BML内置文心大模型开发套件, 仅需编写极少代码即可完成模型的构建与高效训练；

4、模型管理：在完成建模和训练任务后，企业可通过多种方式导入模型进行统一管理，自动完成模型的评估、优化和转化；

5、部署应用：在一次训练后，企业可采用多种部署方式，包括服务器侧部署和边端部署。

以上就是BML的大致开发流程，完整实现了一站式AI开发。

不仅模型精度高，也高效便捷。

一家小企业，只要你利用好文心大模型：

你可以做出一个垂直类的国风版AI绘画产品；

也可以做出一个家庭宠物的安全监控应用；

还可以做出一个内容只涉及元宇宙的搜索应用。

聪明的企业已经开始在这方面赚钱了。

一定要去占百度的便宜，利用好文心大模型。

大模型，还能做什么？

其实大模型还可以做很多事情。

拉普拉斯妖会说：给我时间，就可以计算出宇宙的未来。

当然，计算宇宙的未来，可能还是很遥远的事情。

但随着算力与算法的优化，大模型在未来也许还可以做更多。

比如下面这些：

1、预测世界杯，计算出谁是冠军；

2、预测股市，让你顺利实现抄底；

3、预测地震，提前预警避开灾难；

4、预测流行病，可提前做好预防；

5、预测癌症，提前介入进行治疗；

……

文心·NLP大模型ERNIE 3.0 Zeus

在阿西莫夫的《银河帝国》中，谢顿借助“心理史学”，预测银河帝国的未来，也改变了全人类的未来。

实际上没有什么“心理史学”，能够做到这一点的更有可能是大模型。

它会是一个超级智能系统，塑造人类生活的方方面面。

这些行业，都在悄悄面临挑战

关于AI，争议颇多。

有人将其视作朋友，认为AI会辅助人类进化。

有人将其视作敌人，认为AI会毁灭人类未来。

在许多经典科幻作品中，AI与人类的关系，也微妙且复杂：

《2001太空漫游》：超级智慧电脑HAL 9000为保全自身，杀死了太空船上的科学家们。

《黑客帝国》：AI占领了真实世界，将人类统治在“矩阵”之中。

《机械公敌》：AI突破了机器人三定律的限制，试图通过控制人类来保护人类。

《西部世界》：AI在人类残暴的杀戮中逐渐觉醒，开始反抗人类的统治。

《银河帝国》：机器人丹尼尔为了保护人类利益，默默守护了人类两万年。

……