2025年,AI模型、AI算力、AI应用彼此推动,呈螺旋上升之势。传统云架构也正在被打破,朝AI云原生的方向演进。
国际市场调研机构IDC数据显示,2024下半年,中国公有云市场增速17.7%。
2024年5月,火山引擎将大模型推理成本降低了90%以上,这一策略不仅降低了客户使用AI的成本,还迫使其他云厂商跟进降价。成本的下降带来了市场的扩容。据IDC数据,2024年12月中国公有云大模型日均token调用量高达9522亿,这一数字是2024年6月日均调用量963亿的近10倍。
6月11日至12日,2025火山引擎原动力大会在京举办。新华社记者张漫子摄
而2024年大模型调用总量中,火山引擎市场份额达46.4%。截至2025年5月,豆包大模型日均tokens调用量16.4万亿,相比2024年5月的1200亿增长137倍。
“把时间拉长,我们正处于PC时代到移动时代再到AI时代的变化之中。技术主体也在发生变化:从网页、App,变为AI智能体。”日前在京举办的2025火山引擎原动力大会上,火山引擎总裁谭待说。
应用范式的变化,正带来云计算基础架构的创新。过去几年,传统云计算的产品创新几乎是停滞的,谈到云计算,人们常提起的是IaaS、PaaS(平台即服务)、SaaS(软件即服务)。而在AI时代,AI模型快速迭代、AI应用加速爆发、AI算力指数级增长,这个分层结构正被消解。
谭待说,IaaS、PaaS、SaaS的架构更关注技术分工,而AI云原生更多是按照业务架构重新划分IT架构。具体而言,是以Agent为核心重新优化计算、存储与网络架构。目标是让算力基础设施能在单位时间内更快、更多地产生token,以使AI应用的响应速度越来越快。
“复杂的Agent、完成好复杂任务,不仅需要模型优化,背后的服务也得优化,还要准备好调优的环境等。把基建做好、把池塘做大,这是最重要的事情。”谭待说。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
「DQ」推出新品:桂花酒酿华夫脆、桂花酒酿波波
2022年8月29日,「DQ」推出新品:桂花酒酿华夫脆、桂花酒酿...
ROG掌机推出新固件,提升低功耗下性能表现
,ROG掌机已在5月11日正式发布,搭载AMDZ1Extreme...
boAt推出AirdopesGenesisTWS
,boAt在印度市场推出了新款TWS耳机——boAtAirdop...
DoogeeT30Pro平板官宣6月发布:联发科
感谢IT之家网友华南吴彦祖的线索投递!,Doogee宣布将于6月...
星巴克全球CEO纳思瀚访华:我最大的好奇是关于增
LaxmanNarasimhan最近有了一个中文名字:纳思瀚。随...
中国第一口万米深井开钻
中国第一口万米深井开始钻探。据中石油消息,5月30日11时46分...