您的当前位置:首页 > 探索 > 华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本 正文
时间:2025-08-23 20:12:07 来源:网络整理 编辑:探索
新浪科技讯 8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM推理记忆数据管理器),实现高吞吐、低时延的推理体验。在当今数字化时代,AI发展
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。
责任编辑:郭栩彤
8月22日大满贯:男单4强对阵出炉,林诗栋对手强,王曼昱PK桥本2025-08-23 19:30
公办民办幼儿园均可享受免保教费2025-08-23 19:27
淮南市:清凉一群人 情暖一座城2025-08-23 19:16
新疆巴依木扎赛马节开幕2025-08-23 19:13
2021中国新疆伊犁天马国际旅游节即将启幕2025-08-23 19:06
斯诺克世锦赛正赛对阵出炉,丁俊晖首轮遭遇劲敌2025-08-23 19:05
特步携手成都世运会 持续加码国际赛事赞助2025-08-23 18:18
十五运会安保“百日行动”开展首周 广东刑事治安警情同比下降14.7%2025-08-23 18:15
小升初英语作文:The Nightingale2025-08-23 18:04
人工智能将给制造业带来什么,全球制造业的大咖在这个行业大会上热议……2025-08-23 18:03
理想汽车智驾量产负责人王佳佳离职2025-08-23 20:12
育碧《孤岛惊魂》系列将制作真人剧 男主曝光2025-08-23 20:10
花样“带娃”:孩子“暑有所托,假有所获”2025-08-23 19:56
《黑暗迷宫》曝首款先导海报 聂远葛天联袂演绎“宫”心计2025-08-23 19:43
系列第七部《JOJO的奇妙冒险:飙马野郎》动画制作进展公布2025-08-23 19:31
十五运会安保“百日行动”开展首周 广东刑事治安警情同比下降14.7%2025-08-23 19:06
从数据追踪到决策核心:网易红彩用户的炼己三重奏2025-08-23 18:18
(辉煌60载 魅力新西藏)十六载军人筑“心”路 守护西藏云端“生命线”2025-08-23 17:51
罗斯球衣何以与乔丹并立?他的巅峰虽短却无可复制2025-08-23 17:42
新西兰大胜中国台北进八强 可能在半决赛碰中国男篮2025-08-23 17:34