华为,底气十足。
刚刚,华为开发者大会(HDC 2024)召开,华为向世界展现了一种精神:向下扎到根,向上捅破天。下一个破局者,依然是华为。
本次大会,盘古大模型5.0全面升级,将AI扎根到千行百业,解决落地问题;华为云昇腾AI云服务,要做好算力底座,破解算力的瓶颈。
华为抓住了AI当前最核心的问题,技术突破、自证价值、真正落地。当人们习惯强调AI炫技或者价格时,华为更强调产业落地创造实际的价值。
过去几年,华为勇挑大梁,在做底层硬件、算力、AI大模型以及应用生态的全面更新。
如果只看研发资金,华为2023年的投入超1647亿元,是唯一研发超过200亿美金,能与谷歌、苹果、微软和Meta媲美的中国企业。
这种务实精神的背面,是华为的孜孜追求:能否将破局之力,带入更多领域的科技创新?
9.9一杯的奶茶,成本100亿的AI大模型,能有什么共同点?
答:他们都在打价格战。
过去一个多月,几乎是AI界的春晚。从OpenAI更新GPT-4o,谷歌I/O大会,微软的AI PC,英伟达3万亿美金到苹果公布Apple Intelligence。各种“颠覆式”“AI时刻”主导了这段时间的科技圈。
而AI大战的B面,则是价格战。ChatGPT在去年就推出Enterprise企业版,并且下调B端调用价格吸引客户,对于C端用户也有限免费了GPT-4o。Sam Altman声称92%的世界500强公司已在使用ChatGPT。
国内科技界则把价格战卷到了新地步。幻方DeepSeek、智谱AI先后降价,之后字节跳动将豆包通用模型Pro-32k的输入价格,直接打到0.0008元/千tokens,号称比行业均价便宜99.3%;
阿里将9款通义千问模型降价,其中Qwen-Long主力模型降价97%;百度则直接宣布,将ERNIE Speed和ERNIE Lite两款模型免费。
这场降价潮里,是普通用户、开发者和中小企业受益,加速了AI在国内的渗透普及率。但质疑的声音也被提出:价格战能否持续?价格战之外的路,比如模型技术、打造超级应用,谁有差异化竞争优势?
李开复表示,整个行业每年降低10倍推理成本是可以期待的,疯狂降价是“双输”的打法,技术还是最重要的,如果技术不行,就纯粹是贴钱赔钱做生意。
月之暗面创始人杨植麟认为,今天AI在人的工作流中占比可能只有1%,未来AI在某个节点超过人类,就会产生新的商业模式,不再像今天在B端API调用上打价格战,而是一个普惠的AI。
“降低模型推理成本并不难,难的是探索模型总和能力的上限。”Minimax创始人闫俊杰表示。
红杉资本此前发布了报告《生成式AI的第二幕》,指出两点:
·由技术驱动的生成式AI第一幕已经落幕;
·市场进入“第二幕”,需要真正直面人类的问题,回应客户的需求。
这些观点指向一个现实:AI目前最大的问题,还不是需求或成本,数据也不是壁垒,商业和应用上证明AI的价值更重要。
在席卷业界的大讨论里,华为云始终保持冷静。
对账面资金充裕的华为来说,要打价格战不要太容易,是很容易就能相出的策略。但什么是“正确的事,正确地做”?
在HDC 2024,华为给出的答案是降落伞自己先跳,先把事情干好。
会上,华为常务董事、华为云CEO张平安发布盘古大模型5.0,在全系列、多模态、强思维三个方面升级;且展示了盘古大模型应用到自动驾驶、工业设计、具身智能和高铁、钢铁、气象等落地实践案例。
此外,华为云CTO张宇昕、华为诺亚方舟实验室主任姚骏分别就华为云全栈系统性创新、盘古大模型5.0技术解密发表主题演讲,详细解读华为云在AI领域的全栈创新优势。
他们要回答最根本的问题:AI到底能做什么事?行业怎么才能用上AI?中国发展AI还有哪些堵点,要怎么打通?
这需要华为在技术创新能向上捅破天,在产业落地上要向下扎到根。
这种极为务实的精神,指导着华为闯入AI的第二幕。
盘古大模型所有努力都是朝着一个方向:让AI真正解难题、做难事,重塑千行万业。
这既要技术突破瓶颈,也要解决非常实际的落地工程问题。早在盘古大模型3.0发布时,华为云就采用完全的分层解耦设计,包括“5+N+X”的三层架构,可以快速适配、快速满足行业的多变需求。
L0层是包含自然语言、视觉、多模态、预测、科学计算的5个基础大模型;
L1层是N个行业通用大模型,目前已在政务、制造、金融、矿山、气象等30多个行业落地;
L2层是更细化的场景模型,比如政务热线、台风路径预测、网点助手等,主打“开箱即用”的应用服务,目前已在400多个场景落地;
盘古大模型此次升级,直接进入5.0时代,正是让技术真正“创造价值”的。
首先,盘古5.0包括小中大超大杯,4种不同参数规格,可以让客户根据诉求随心选择。
Pangu E(Embeded):十亿级参数,可支撑手机、PC等端侧的智能应用;
Pangu P(Professional):百亿级参数,满足低时延、低成本的推理需求;
Pangu U(Ultra):千亿级参数,成为企业通用大模型的坚实底座;
Pangu S(Super):万亿参数超级大模型,能够处理跨领域多任务;
同时,盘古5.0重点升级了多模态和强思维两方面的能力,帮助大模型更好更精准理解我们生活的多模态的物理世界。
从现场演示来看,它在学习了整张清明上河图后,可以精准回答“赵太丞家有多少个人?”,答,“一共有四个人”。而赵太丞家在原画里占的画幅还不到200分之一。
清明上河图答题
多模态升级后,盘古5.0能精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等多种模态。其次,凭借华为云首创的可控时空生成技术(STCG),AI能够真正“看懂”这些信息,并且生成更符合物理规律的多模态内容。
这种能力,可以直接应用到工业制造、自动驾驶、建筑等价值场景。
比如,输入一张卫星遥感图片,盘古大模型能准确分析这片区域的地理情况,农作物的生长环境,然后预估作物产量,并且给出培育和防病虫害的建议;再比如通过巨大的病理照片找到我们想要的病菌的数量级,赋能医学研究。
在思维链方面,盘古5.0将思维链技术与策略搜索深度结合,极大提升了数学能力、复杂任务规划能力,以及工具调用能力。思维链技术能帮助智能体(如机器人)更好地理解和预测环境变化,"策略搜索"则是智能体用来适应这些变化并做出决策的过程。两者共同作用,能使智能体能够在复杂环境中进行有效的学习和决策。
智能体是AI的未来,能够进行复杂逻辑推理,也是大模型成为行业助手最关键的特征。
在具身智能方面,华为云现场展示了搭载盘古5.0的乐聚“夸父”机器人。
它可以识别和理解自己所处的环境,并且通过学习和决策,完成10步以上的复杂任务规划。比如它除了回答问题、打招呼以外,就能理解人类“口渴”的需求,并从现场物品中选出瓶装水、递水。
中国有很多规模做到世界第一的产业。这背后意味着生产制造的世界工厂,和丰富的消费场景,都是能激发AI、利用AI的对象。
用AI科技革命叠加产业转型升级,也是目前政府推动新质生产力发展的主要阵地。
在HDC 2024上,华为云展示了丰富的盘古大模型落地案例,有两个案例给我印象最深刻。
一个是钢铁大模型。
宝武钢铁是目前全球规模最大的钢铁企业,年钢产量超1亿吨。这个庞然大物要转型,既是一个AI落地课题,也事关绿色环保、产业升级的进程。
2023年,宝武钢铁已经和华为就数字化转型展开合作,双方致力于立足钢铁行业前沿课题,运用人工智能、大数据工具和方法,形成钢铁冶金领域或工业领域大模型。
华为云方案主要应用在高炉炼铁和热轧钢带两个环节中。
高炉炼铁场景被认为是AI落地最难的应用场景,双方通过用盘古钢铁大模型进行高炉炉况预测,指导高炉生产调控,可以大幅提升炉内工况的稳定性。经过实践发现,每减少10℃的温度波动,每吨铁水就能减少1kg焦炭消耗,成本降低3块钱;仅每年高炉炉况的优化,就能让宝钢降低10亿元的成本。
另一个是华为云在自动驾驶的应用。
我们知道,自动驾驶的竞争到了关键时刻。在自动驾驶训练里,最难的是遍历复杂场景的Corner Case,这要靠车企海量的路测数据,或者在虚拟环境仿真训练,成本高、耗时长。
这次升级多模态升级后,盘古5.0可以生成像Sora一样,符合物理规律、真实世界的视频的。
但华为没有去做一镜到底的娱乐视频,而是把能力投入到行业急需的价值场景,就比如,生成自动驾驶的训练数据。
盘古大模型能生成车身六个摄像头视角的视频,并且能控制行驶环境的天气、道路、车况,这就解决了自动驾驶的数据难题。
现在车企在竞速解锁高阶智驾,华为能否跑到前面,或许要由盘古大模型决定。
作为大模型行业应用的主力军和排头兵,政企客户通常业务场景复杂多样,对数据安全、训推效率和开发成本都有极致的要求。能够兼顾安全合规与成本的大模型混合云,正在成为越来越多企业的优先选择。在2023年,华为云就推出业界首个大模型混合云华为云Stack。
经过一年实践,华为云不断精进,总结发布了大模型混合云十大创新技术,包括多样性算力调度、云边协同、AI-Native存储、增强AI网络、算子加速、全链路数据工程、统一数据编码、精细视觉神经网络、无感断点续训、安全护栏,覆盖从云基础设施到AI开发平台以及模型层,致力于解决大模型在政企落地的“最后一公里”,加速政企大模型应用进程。
实际上,行业场景应用之外,AI手机、AI PC等终端也是目前人工智能应用规模最大的场景。
华为的盘古大模型,也坚持“自己的降落伞自己先跳”,把华为的云服务、手机、汽车、操作系统等业务都改造一遍。
去年12月,问界M9发布,车载的智能助手小艺已经接入盘古大模型;今年4月,余承东也宣布MateBook X Pro应用盘古,打造AI PC;目前华为手机,已经升级了AI拍照增强、AIGC生成、云助小艺的功能。
这些提升,是C端消费用户能直接体验到的。随着HarmonyOS NEXT的到来,华为终端和华为云盘古大模型的融合,还将继续深化。
算力是AI时代的核心驱动力。
英伟达成为全球市值第一后,黄仁勋脱下黑色皮衣,跑去加州理工的毕业生做演讲。
他引用诺奖物理得主理查德·费曼的名言,和流行天后Taylor Swift的梗:
“世界是不确定的,是不公平的,你可能拿到的是一张烂牌,那你该shake it off。总会有其他机遇,或者,创造你自己的机遇。”
AI创造遍地机遇的新世界,但算力供应已经紧张。
微软、亚马逊、Meta等企业,都有万张H100级的算力集群。
微软宣布,每年要花500亿美金建数据中心;Meta计划再买35万张H100,到今年底可能累计有60万规模;马斯克也准备了百亿美金,买英伟达更先进的B100和B200。
英伟达销量
然而,英伟达的先进GPU,哪怕是“阉割版”的A800/H800,中国企业也很难再获取。
据报道,英伟达最新中国特供版的H20,算力只有H100的15%,性价比已经不够诱人。
国内除了阿里、百度、腾讯、字节跳动少数互联网公司,其他中厂和明星AI创业公司,都没有万卡级A100/H100的算力储备,依赖头部云厂商的算力投资和合作。
这造成国内算力捉襟见肘。普通用户也能感知到高峰时段明显的等待和卡顿,而大企业用户的采购需求也很难满足。
当算力受限时,我们又要如何创新,创造机遇呢?
华为的答案是,以昇腾AI云服务提供即开即用的澎湃算力。
前两天6月14日,华为云的华东(芜湖)数据中心正式开服。这标志着,华为云的贵州贵阳、内蒙古乌兰察布、安徽芜湖、香港的4大AI云算力中心布局已经成型。
通过AI算力一张网,供应全国长三角、大湾区、京津冀等地的需求,也为中国出海企业提供坚实可靠的支撑。企业不用再为自己买卡和自建数据中心焦虑,能从华为云买到即开即用的算力。
去年9月,任正非提出,我们即将进入第四次工业革命,基础就是大算力。华为CFO孟晚舟说,要致力于打造中国坚实的算力底座,为世界构建第二选择。
如今,华为云在不断兑现自己的承诺。昇腾AI云服务,就是专门提供AI算力,一个从硬件、基础设施、算力集群、架构到软件应用,华为全栈自研的生态。
除了自主可靠外,昇腾AI云服务在稳定性上也有竞争优势。业界万亿参数模型训练的平均无中断时长约2.8天,昇腾能做到40天稳定无中断;业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟。
在兼容性上,已全面适配行业主流的100多个大模型,服务600多家企业客户,以云服务的方式协助客户开发,训练,托管和应用模型,支撑了国内像大模型训练、自动驾驶研发、智慧城市等高算力需求的开发项目。
华为在寻找一条破局之路。
它打破算力的束缚,成为一贯在做的“黑土地”,支撑模型研发、AI应用的诞生,让千行万业放开手脚去转型升级;另一边推动AI大模型,从技术突破到产业落地,从理论前沿到最后一公里的突破。
华为在给世界构建第二选择,也是在让中国AI往前的底气。