去年以来,生成式 AI 技术的发展备受关注。在其中,OpenAI 的 ChatGPT 模型被视为自然语言处理领域的一个重要里程碑。ChatGPT 模型在各种应用场景中广泛应用,并激发了各大科技公司的竞争热情。
4 月 13 日,一直以来在 AIGC 圈内相对低调的亚马逊云科技突然加入生成式 AI 竞赛。与大多数服务于 C 端用户或在热点期发布 AIGC 产品的科技公司不同,亚马逊云科技作为一家拥有丰富企业服务经验的云计算服务提供商,结合多年对企业需求的观察,打出了一套组合拳。利用自身在云资源、云计算、机器学习技术研发等多个领域的优势,推出了多款优秀的服务:
推出 Amazon Bedrock 服务和 Amazon Titan 大语言模型,以帮助云企业提高效率和创新能力;
提供两款专门针对生成式 AI 优化的高性价比虚拟机实例 EC2 Trn1n 和 EC2 Inf2,这两款实例基于自研 AI 训练 (Trainium) 与推理芯片 (Inferentia),能够大幅节省企业的生成式 AI 训练和推理成本;
推出 AI 编码助手 Amazon CodeWhisperer,面向所有个人用户免费开放,不设任何资质或使用时长的限制。
这些服务的推出将有助于企业更好地使用生成式 AI 技术,提高其效率和创新能力,同时也进一步推动了 AIGC 领域的发展。
在这样的背景下,亚马逊云科技推出了自己的生成式 AI 系列产品,包括 Amazon GPT(一种基于开源 GPT 的自然语言生成模型)、Amazon Image Builder(一种基于 GAN 的图像生成模型)、Amazon Fiddle(一种用于自动生成 Web UI 前端代码的模型)等,这些产品都利用了亚马逊云科技多年来在机器学习领域的技术积累和经验。
这些产品的特点是高度可定制化,企业可以根据自己的业务需求自定义训练数据集、训练算法和超参数,以获得最适合自己业务场景的模型。同时,这些产品的使用也非常简单,只需几个步骤即可完成模型的部署和集成,大大降低了企业使用机器学习技术的门槛和成本。
除此之外,亚马逊云科技还提供了一系列与生成式 AI 相关的解决方案,如基于 Amazon SageMaker 的自动机器学习和模型管理服务、基于 Amazon Kendra 的企业知识图谱服务、基于 Amazon Comprehend 的自然语言处理服务等,为企业提供了全方位的机器学习解决方案。
亚马逊云科技在生成式 AI 领域的发力不仅是在技术上的创新和突破,更是在产品和服务方面的完善和丰富。未来,随着机器学习技术的不断发展和应用场景的不断扩大,亚马逊云科技将继续加强自己在机器学习和人工智能领域的领先地位,为企业提供更加优质的技术和服务。
一、意料之中:
亚马逊云科技基于其在2B市场中的丰富经验以及机器学习技术的优势,成功呈现出了一份“漂亮的答卷”。
亚马逊云科技发布了一系列生成式AI产品,展现了其在机器学习技术方面的实力。作为AIGC领域的佼佼者,ChatGPT等技术引发了新一轮AI技术的关注。机器学习算法可生成文本和图片等内容,亚马逊云科技不断降低机器学习技术使用门槛,提供高性能、可伸缩的基础设施和具有超高性价比的机器学习训练和推理。亚马逊云科技在人工智能和机器学习堆栈的三个层级都投入了众多技术研发成本,产出了不少重磅的产品组合。该公司拥有超过20年的人工智能和机器学习实践经验,并在赋能自有业务与千行百业创新方面做出了很多成绩。企业需要能够直接找到并访问高性能基础模型,这些模型需要能够给出最匹配业务场景的优秀反馈结果。亚马逊云科技通过与许多企业打交道,发现了企业对于生成式AI的诉求,并为满足这些需求开发了一系列性能强劲的AI产品。
图:在亚马逊云科技平台上构建生成式 AI
二、与众不同:
亚马逊云科技的生成式 AI 主要面向企业
亚马逊云科技是一家具有丰富企业服务经验的公司,与其他推出面向大众的 AIGC 产品不同,亚马逊云科技此次推出的生成式 AI 产品主要瞄准企业,深入对云基础设施和应用程序的变革,以推动生成式 AI 的创新发展。
为了满足企业需求,亚马逊云科技的生成式 AI 技术在过去几年里主要做了以下 5 方面的技术探索:
灵活性:从 AI21 Labs、Anthropic、Stability AI 以及亚马逊公司构建的基础模型中选择,以找到适合企业使用的模型。
安全自定义:仅需数个已标记样本,就可为企业企业定制基础模型。所有数据都会加密,不会从亚马逊云科技虚拟私有云(VPC)泄露企业数据,数据将始终保持私密且机密。
成本效益高的基础设施:利用由亚马逊云科技设计的机器学习芯片和 NVIDIA GPU 驱动的基础设施,可为生成式人工智能带来最佳性价比。经济有效地扩展基础设施,以训练和运行包含数千亿个参数的基础模型。
轻松上手的基础模型构建:使用熟悉的控件与亚马逊云科技能力和服务,如 Amazon SageMaker 和 Amazon S3 的深度和广度的集成,快速将基础模型集成并部署到企业在亚马逊云科技上运行的应用程序和工作负载中。
生成式 AI 技术支持的解决方案:由于内置生成式人工智能,如 Amazon CodeWhisperer(一种人工智能编码伴侣)等服务可帮助企业提高效率。此外,可使用亚马逊云科技样例解决在方案部署中常见的生成式人工智能案例,如调用归纳总结与问答。此类解决方案将亚马逊云科技人工智能服务与领先的基础模型相结合。
在企业期待中,亚马逊云科技在本次发布会中推出了 Amazon Bedrock 和 Amazon Titan 模型,为基础模型构建和扩展。此外,Bedrock 还提供了一系列的 API,帮助开发者轻松地使用生成式 AI 技术。例如,生成式 AI 对话 API 可以在几分钟内创建自然的、可定制的对话体验,使企业能够为客户提供更好的服务和支持。此外,生成式 AI 文本 API 可以根据自然语言生成定制的文本,从而帮助企业更快地生成产品说明、推广文案等内容。
亚马逊云科技的生成式 AI 技术提供了强大、灵活和安全的解决方案,旨在帮助企业实现数字化转型并提高业务效率。通过基础模型的灵活选择、安全的自定义功能、成本效益高的基础设施、易于上手的基础模型构建和生成式 AI 技术支持的解决方案,企业可以快速构建、部署和定制化生成式 AI 应用程序,从而更好地服务于客户,并提高自身的竞争力。
左:来自亚马逊云科技的基础模型;右:来自 AI21 Labs、Anthropic 和 Stability AI 的基础模型
三、技术革命:
生成式 AI 也需要生态
生成式 AI 技术的运行、构建和定制基础模型都需要高性能、低成本且为机器学习专门构建的基础设施。除了满足这些业务需求,企业技术的底层需要离不开生态系统的支持。在这个领域,亚马逊云科技致力于在模型和生态系统两个方面进行创新。
在本次发布会上,亚马逊云科技推出了两款专门针对生成式 AI 优化的计算实例:EC2 Trn1n 实例和 EC2 Inf2 实例。训练实例 EC2 Trn1 由亚马逊自研芯片 Trainium 支持,比其他任何 EC2 实例节省高达 50% 的训练成本。经过优化,它已经可以在与高达 800Gbps 的第二代 EFA(弹性结构适配器)网络相连的多个服务器上分发训练任务。但是,更为强悍的 Trn1n 实例可提供 1600 Gbps 的网络带宽,专为大型网络密集型模型设计,性能比 Trn1 高出 20%。企业在超大规模集群中部署 Trn1 实例时,可扩展到在同一可用区中的 3 万个 Trainium 芯片,相当于超过 6 exaflops 的计算能力。Helixon、Money Forward 和亚马逊云科技的搜索团队使用 Trn1 实例后,将训练大规模深度学习模型的时间从几个月缩短到了几天。因此,亚马逊云科技发布的性能全面提升的全新网络优化型 Trn1n 实例将会给我们带来更多惊喜。
2018 年,亚马逊云科技发布了首款推理专用芯片 Inferentia,使用 Inferentia 运行数万亿次推理,节省了数亿美元的成本。这次推理实例 Inf2 是基于其自研芯片 Inferentia2 的,针对运行数千亿个参数模型的大规模生成式 AI 应用程序进行了优化,吞吐量提高了 4 倍。
除了以上所述的芯片和工具,亚马逊云科技还推出了一系列面向生成式 AI 的解决方案和服务,包括:
SageMaker GAN 调优:这是一种基于 SageMaker 平台的生成式对抗网络(GAN)调优工具,可帮助企业降低训练成本、加速训练速度、提高模型效果。
SageMaker Autopilot:这是一种全自动机器学习(AutoML)工具,可根据数据集自动选择最佳算法、调优超参数,并生成最佳模型。
SageMaker Studio:这是一种云端集成开发环境(IDE),可帮助企业快速构建、训练和部署机器学习模型。
Amazon Elastic Inference:这是一种低延迟、低成本的推理加速器,可提供可扩展的推理性能,帮助企业降低推理成本。
Amazon S3:这是一种面向生成式 AI 数据存储的云端存储服务,可提供高可靠性、高可扩展性的数据存储和访问服务。
总之,随着生成式 AI 技术的快速发展,亚马逊云科技在基础设施、芯片、工具和服务等方面不断创新,为企业提供更加完整和全面的技术支持,助力企业实现数字化转型,提高效率和竞争力。
图:CodeWhisperer 三大能力
CodeWhisperer是一款可以通过使用引擎盖下的FM根据开发人员的自然语言评论和IDE中的先前代码实时生成代码建议的AI编码伴侣,可以显著提高开发人员的效率。该工具目前提供十余种开发语言,如Python、Java、JavaScript、TypeScript、C#、Go、Kotlin、Rust、PHP和SQL等,并且可以通过在VS Code、IntelliJ IDEA、Amazon Cloud9等集成开发环境中的Amazon Toolkit插件进行访问。此外,CodeWhisperer利用亚马逊云科技在安全方面的积累来扫描各种安全问题,能够自动扫描代码中的安全漏洞并帮助用户修复,从而增强代码的安全性。
对于云计算的发展来说,构建像CodeWhisperer这样的强大应用程序对开发人员来说是变革性的,同时利用正确的基础模型进行构建相关工具是非常必要的。生成式AI的发展需要在基础设施、一站式应用开发工具等层面“全面开花”,亚马逊云科技已经为行业做出了一个很好的表率。对于云厂商来说,打造生态协同效应,切实帮助企业实现降本增效,才能够走得更远。而形成“大小生态”的良好闭环是打造生态协同的必由之路,亚马逊云科技似乎就是在探索这样的一条路。人工智能作为云计算的一部分,人工智能产品构建自己的“AI小生态”,通过“小生态”的构建去推动“云平台大生态”的发展,云厂商再利用“大生态”的势能反哺“AI小生态”,转而促进单一AI能力的发展。
从目前亚马逊云科技搭建的“AI小生态”来看,这些生成式AI能力和工具为企业解决问题提供了切实可行的技术解决方案,不再是那些冰冷的性能提升数字,而是卓越性价比。亚马逊云科技之所以能够实现这些突破,源于将每一个客户的难题都视为一个新的探索方向,将“探索精神”和“创新精神”贯彻始终,输出接地气的技术能力和解决方案。不积跬步无以至千里,亚马逊云科技凭借其多年来积累的企业服务经验,深刻理解企业需求,并在实际业务中持续获取洞察,这必定能帮助亚马逊云科技在市场竞争中脱颖而出。