风海网 > 社会 > 正文

​大模型 PK:阿里云与百度的 " 全家桶谁 " 更胜一筹?

2023-11-24 01:15 来源:风海网 点击:

大模型 PK:阿里云与百度的 " 全家桶谁 " 更胜一筹?

大模型下半场:阿里云与百度开启 " 全家桶 " 之战。

封面图为慢放使用 Midjourney 生成

随着「百模大战」进入深水区,国内的科技巨头、互联网大厂、AIGC 创企及行业龙头纷纷递交了最新答卷。

10 月 31 日,阿里云不仅推出最新通义千问大模型 2.0 版本,还推出了八大行业大模型、大模型应用开发平台,并从 AI 基础设施层面全方位布局,本次发布可谓阿里云的 AI「全家桶」爆发。

而不久之前,百度除了正式发布文心一言 4.0 版本外,包括新搜索、新地图、新文库等数十款百度 AI 原生应用「全家桶」也正式亮相。

那么面向 AI 浪潮,阿里云与百度双方的大模型产品及实力如何?将在大模型方面有哪些新布局?谁更有望为 AI 大模型产业化落地提供更好的底座支持?

本文通过对双方 AI「全家桶」的产品、底层算力、行业应用与生态等方面进行深入对比探讨,试图解答上述疑问,为国内已经布局大模型或者准备应用大模型的企业,提供发展模式与方向。

01.

大模型 " 全家桶 "PK

10 月 31 日,阿里云正式发布了千亿级参数大模型通义千问 2.0,同时扔出一个 AI「全家桶」,从 IaaS(基础设施即服务)、PaaS(平台即服务)和 MaaS(模型即服务)全方位秀出 " 肌肉 "。

相比 4 月发布的 1.0 版本,新版本在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。此外,通义千问 APP 在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。

与此同时,为推动大模型更易在千行百业集成落地,基于通义大模型训练的 8 大行业模型组团上线,主要包括通义灵码 - 智能编码助手,通义智文 -AI 阅读助手,通义听悟 - 工作学习 AI 助手,通义星尘 - 个性化角色创作平台,通义点金 - 智能投研助手,通义晓蜜 - 智能客服,通义仁心 - 个人专属健康助手,通义法睿 -AI 法律顾问。

尽管阿里云这次发布了八大产品模型,但阿里云 CTO 周靖人强调,阿里云此举并非为了直接 To C 提供服务,而是 To B。做行业模型,更多是像个面向客户的 Demo,让客户先了解到大模型能做什么。

在令人眼花缭乱的各类产品发布背后,阿里云面向 AI 时代其实已经做出了坚定选择——做 AI 时代的基础设施、开源路线、开放平台。

除了阿里云在 10 月提交了一份新答卷之外,国内各家大模型厂商也纷纷拿出通用大模型的新版本,试图一较高下,例如腾讯、百度、讯飞、智谱、百川 ......

其中,早在半个月前—— 10 月 17 日,百度发布了文心一言 4.0 版本,新版本在理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近 3 倍,记忆的提升幅度也达到了理解的 2 倍多。百度基于文心大模型研制了智能代码助手 Comate,从内部应用效果来看,整体的代码采纳率达到 40%,高频用户的代码采纳率达到 60%。

此外,包括新搜索、新地图、新文库等数十款百度 AI 原生应用 " 全家桶 " 也正式亮相,备受外界关注。

从产品角度来看,阿里云和百度都推出了大模型的新版本,并且在不同领域都拥有一定优势。阿里云的通义千问 2.0 版本在大模型能力和行业应用方面表现突出,而百度文心一言 4.0 版本则在语言理解、生成和逻辑能力方面更优异。

不过有意思的是,百度似乎对自己的技术实力更自信,起码在对外宣传的口径上是这样。周靖人在云栖大会上表示,通义千问 2.0 综合性能超过 GPT-3.5。而百度创始人、董事长兼首席执行官李彦宏宣称文心一言 4.0 综合水平与 GPT-4 相比已经毫不逊色。

02.

大模型背后的 AI 基础设施

大模型的发展需要更强壮的 AI 基础设施,基础设施主要是两个核心部分构成——芯片与云。

首先由于大模型需要大量的计算资源和存储空间,因此需要高性能的芯片来支持其运行。

飞天芯片是阿里云自主研发的大规模分布式 AI 芯片,专为云计算和大数据处理而设计。它采用了一种新型的架构设计,可支持多种深度学习框架,包括 TensorFlow、PyTorch 等。飞天芯片不仅仅是一颗芯片,它还内置了阿里云自研的云操作系统,可以与阿里云的其他产品和服务无缝集成,提供一体化的解决方案。

昆仑芯片则是百度自主研发的 AI 加速器芯片,专注于高性能计算和智能推断。它采用了高性能计算架构,可实现高能效比和低功耗。昆仑芯片支持多种数据类型,包括图像、语音、自然语言等,适用于多种 AI 应用场景。

飞天芯片和昆仑芯片都具有强大的计算能力。飞天芯片的分布式计算能力使其在处理大规模数据时具有显著优势,并且支持大容量内存和分布式存储,可满足云计算和大数据处理的需求。而昆仑芯片的高性能计算架构则使其在推断等计算密集型任务中表现出色。同时昆仑芯片采用了高速缓存和优化存储技术,提高了数据处理速度和效率

3 月 17 日,李彦宏在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。

其次大模型的实质是一场 " 云计算之争 "。

在这场争夺中,阿里云是国内最早布局云计算的平台之一,可谓是国内云计算领域的先驱。回溯至十多年前,阿里云在云计算和大数据尚未成为主流的年代,就坚信云计算的重要性,并开始着手布局。当时,很多国内技术公司认为 " 做云还太早 "、" 云只是旧瓶装新酒 ",但阿里云选择了坚定的信念:" 必须要做,客户需要,市场需要 "," 每年给阿里云投 10 个亿,投个十年,做不出来再说 "。

如今,云计算不仅成为全社会重要的基础设施,也为今天热潮翻涌的 AI 大模型创新提供算力底座。而阿里巴巴完整的 AI 技术体系,正是建立于自研云计算的基础之上。根据 IDC 相关报告,2022 年下半年,中国公有云市场上,阿里云的市场份额为 31.9%,排名第一。

在云栖大会上,阿里云针对大模型升级了 AI 基础设施,提供更高性能、更低成本的智能算力。周靖人介绍称,全新升级的阿里云人工智能平台 PAI,底层采用 HPN 7.0 新一代 AI 集群网络架构,高效协同调度各类芯片,可支持高达 10 万卡量级的集群可扩展规模,让超大集群像一台计算机般高效运转。

据了解,阿里云 PAI 可支撑多个万亿参数大模型同时训练,超大规模分布式训练加速比高达 96%,远超业界水平;在大模型训练任务中,更可节省超过 50% 算力资源,性能全球领先。

从业绩看,百度云则发力较晚,在 2018 年第四季度才开始公布业绩。据百度财报显示,百度云 2019 年实现营收 46.5 亿元,2021 年则实现营收 151 亿元,两年增长 224.73%。2023 年二季度,百度智能云收入 45 亿元,同比增长 5%。李彦宏在财报电话会上透露,继一季度首次盈利后,本季度,百度智能云再次盈利。不过,与一季度一样,百度并没有给出具体数据。

百度云的优势则在于其搜索引擎所拥有的海量数据,侧重于融合 AI 能力,将 AI 技术与云基础设施服务相结合,聚焦智能服务突出差异化,基于 " 云智一体 " 的技术和产品,在制造、金融、能源等领域积极实践。

百度创始人李彦宏将大模型视为改变云计算市场游戏规则的存在,而阿里董事会主席兼 CEO 张勇则将大降价、联合伙伴推动大模型落地、产品被集成作为关键的 " 三板斧 "。

随着时间的推进,2023 年云厂商们相较于 2022 年的 " 保守 " 状态,已经开始了奔跑,预示着这个市场将迎来一场激烈的竞争。

03.

大模型的商业化解法,已告别免费时代

如今,大模型竞争已经进入第二阶段——拼落地、拼应用、拼商业化。

阿里云积极推动大模型在各行业的落地,已经与 60 多个行业头部伙伴进行深度合作,通义千问已经在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域落地。早在今年 9 月,阿里集团 CEO 吴泳铭在全员信中表示,要让阿里各个场景都变成 AI 技术的应用场。如今,淘宝天猫、钉钉、天猫精灵、斑马智行等均接入通义千问大模型,先后发布了适合各自业务场景的 AI 应用。

百度也展示了文心一言在商业化方面的成果。自 8 月 31 日文心一言面向全社会开放以来,其用户规模已经达到 4500 万,开发者 5.4 万,场景 4300 个,应用 825 个,插件超过 500 个。此外,百度还推出了会员模式,开通后可解锁文心大模型 4.0。

在世界大会上,百度千帆还推出了自己的 "App Store" —— AI 原生应用商店,为基于文心大模型开发的应用提供了交易平台。目前,应用商店已经针对智能办公、营销服务、行业职能、生产提效、分析决策 5 个场景上线了百度自研以及客户开发的 AI 应用。

显而易见,大模型与行业的融合发展已是主要趋势,具体的场景还在逐步探索,一批典型案例则已经发布。

李彦宏提到,百度正在大力推动数字技术与实体经济的深度融合。大模型技术已应用在制造、能源、电力、化工、交通等实体产业中,他认为," 大模型正成为新型工业化的重要推动力。例如,百度与浦发银行合作推出了智能客服 " 小浦 ",与吉利汽车合作推出了智能驾驶 " 银河 "。同时,百度还通过开源的方式向公众开放文心一言 4.0 版本,以推动大模型技术的普及和应用。

阿里云则将大模型应用于电商、金融、制造等领域。例如,阿里云与美的集团合作推出了智能家居" 美的美居 ",与吉利汽车合作推出了智能驾驶 " 斑马智行 "。此外,阿里云还通过与政府、高校和其他企业合作的方式,推动大模型技术的普及和应用。

此外在商业办公方面,双方也有诸多的应用落地。

今年 4 月 18 日,钉钉宣布接入阿里巴巴的通义千问大模型,表态将用大模型把钉钉重做一遍。当时,钉钉发布了一个 AI" 魔法棒 ",演示了聊天、文档、音视频会议等 4 大高频场景中的智能化应用。4 个月后,钉钉在生态大会上交出了新的答卷。叶军称,钉钉已有 17 条产品线、55 个场景全面接入大模型,实现智能化改造。

百度的办公软件如流则可以针对群聊信息多的办公痛点," 一秒划重点 ",差旅助手不仅能订机票酒店,甚至还能通过接入 CRM 等公司系统,总结出拜访客户的背景资料和谈话参考。最新发布的商业办公工具 GBI 可以通过自然语言进行交流使用,主要针对商业办公场景,例如快速进行工程报价计算、完成商业竞价方案等。

经历了 10 月份的密集更新后,国内大模型产品也在积极探索商业化,或将告别免费时代。

11 月 1 日,百度正式上线文心一言专业版,定价 59.9 元 / 月,连续包月优惠价为 49.9 元 / 月,同时还推出文心一言和文心一格的联合会员,价格为 99 元 / 月。这也成为国内首个采用会员模式面向 C 端收费的大模型产品。

此前,钉钉也公布大模型落地应用场景的商业化方案,在专业版年费 9800 元基础上,增加 1 万至 2 万元即可获得一定的大模型调用额度次数。

可以看出,生成式 AI 产品的收费已经是大势所趋。这是因为训练和运行大型模型需要大量的计算资源,包括高性能服务器、大规模数据集和专业的算法工程师团队。因此,没有任何一家企业能够持续地提供免费服务。

实际上,在生成式 AI 的商业化落地方面,国外的 AI 巨头已经采取了行动。

例如,今年 2 月,OpenAI 推出了 ChatGPT 的付费订阅版—— ChatGPT Plus,每月收费为 20 美元。而微软在 9 月 21 日宣布,Microsoft 365 Copilot 将于 11 月 1 日起向企业用户提供服务。这项服务将为 Word、Excel、PowerPoint 等应用添加生成式 AI 功能,每个用户每月需要支付 30 美元的费用,按年付费。

总体来说,阿里云和百度都在大模型的行业应用和商业化方面取得了一定的成果。阿里云的通义千问 2.0 版本在办公、文旅、电力等多个领域都有成功的应用案例,而百度则通过文心一言在搜索、地图、文库等领域为用户提供了更智能的服务。

04.

关键较量:生态系统的构建和优化

最终,在大模型的竞赛中,关键的较量在于生态系统的构建和优化。

先从宏观的愿景来看,阿里云要 " 打造一朵 AI 时代最开放的云 ",百度移动生态决定开启大模型的下一程," 从 AI 人人可用,到生态共荣 "。

10 月 31 日,阿里巴巴董事会主席蔡崇信在云栖大会开幕式上致辞。" 开放 " 成为其致词中最高频的词语。他坚信 " 不开放就没有生态,没有生态就没有未来。"

再从微观数据来看,中国超过一半的大模型公司都在阿里云上运行,包括百川智能、智谱 AI、零一万物、昆仑万维、vivo、复旦大学等。截至目前,中国众多头部主流大模型都已通过阿里云对外提供 API 服务,包括通义系列、Baichuan 系列、智谱 AIChatGLM 系列、姜子牙通用大模型等,大模型厂商与阿里云一同面向客户。

在国内,阿里云是头部大厂中最早做模型开源的公司,坚定选择开源开放。从今年 8 月开始,阿里云陆续开源了通义千问 7B、14B 参数的通用模型与对话模型。在今年云栖大会上,周靖人再次宣布通义千问 72B 模型即将开源,将成为中国参数最大的开源模型。

值得一提的是,阿里云自研大模型与第三方模型并非竞争关系。恰恰相反,阿里云为所有大模型提供开放的社区,还提供免费的 GPU 算力帮助开发者去体验三方大模型,截至目前阿里云已免费提供超 3000 万小时的免费 GPU 算力。

大模型也在反哺阿里云,阿里云成为一朵走向" 自动驾驶 "的云。周靖人表示," 基于阿里云通义大模型,我们对云上产品也进行了 AI 化改造,超过 30 款云产品具备了大模型的能力,带来了开发效率的大幅提升。"

此外,阿里云还发布了一款 AI 开源社区" 魔搭 ",短短一年后便汇聚了 280 万开发者、2300 多个优质模型以及超过一亿的 AI 模型下载量。这些成果展示了阿里云在大模型领域的领先地位和强大的生态优势。

周靖人表示,阿里云要通过训练及推理平台 PAI、开放的模型社区魔搭、一站式模型服务平台 " 百炼 ",来系统地服务和满足大模型生态中所有人的需求,共同促进生态繁荣。

随着大模型应用落地进入下半场,百度也在不断发力" 大模型生态 "的建设。" 我们希望这片土壤可以 ' 长出 ' 更多树、更多花、更多草。"百度集团资深副总裁、百度移动生态事业群组总经理何俊杰表示。

至今,百度的内容生态已有 64 万创作者使用 AI 工具生产了 1400 万条内容 , 获得 300 亿播放量。在商业生态,目前 " 轻舸 " 已经覆盖 400 余家企业,平均广告创编时间由 2 小时缩短到 5 分钟,平均转化量提升 10%。

今年 9 月,百度还正式发布了文心一言插件生态平台——灵境矩阵。李彦宏表示,插件是种特殊的 AI 原应,也是槛最低,最容易上的 AI 原应,能让开发者、创业者快速加到态中。目前,灵境插件平台已有 2.7 万开发者申请入驻,覆盖 20 多个领域。千帆大模型平台有 42 个主流大模型入驻,有 17000 家企业客户,覆盖了各行各业的近 500 个场景。这些展示了百度智能云在大模型领域的实力和生态建设成果。

此外,在 2023 百度云智大会上 , 百度发布了四个生态伙伴支持计划,包括与 10+ 综合伙伴共同成长、与 100+ 应用伙伴专项发展、与 10000+ 创新企业应用服务以及代理伙伴转型升级计划。

双方对比分析来看,在生态建设方面,阿里云通过打造开源社区、汇聚大量开发者、推出优质模型等举措,形成了强大的生态优势。而百度智云则通过发布四个生态伙伴支持计划、搭建插件平台与大模型平台等手段,积极构建大模型的生态体系。

在合作模式方面,阿里云注重与合作伙伴的协同创新,通过共同研发、优化和推广大模型应用来实现合作共赢。而百度智能云则更加注重与产业链上下游企业的合作,通过发布综合伙伴共同成长计划、应用伙伴专项发展计划等举措,建立起了较为完善的大模型合作体系。

结语

2023 年,云计算市场以及大模型之战中,依然充满了不确定性,但确定的是,随着大模型进入下半场,国内市场会带来新的一轮角逐。而阿里云与百度仍然有着毫无争议的身位优势,这些优势中既包括云计算软硬件系统的技术研发能力,也包括盈利能力。

且看大模型的下半场,阿里云与百度谁更胜一筹。