新闻中心
公司新闻
行业动态
首页 / 新闻中心 / 公司新闻

单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布 - 世界杯

2026-06-30 来源:上海唯星 浏览量:666

中昊芯英推出其新一代 TPU 芯片「须臾」,该芯片单芯片混合精度浮点算力达到了 896 TFLOPS,性能较上一代「刹那」芯片提升了三倍。在 8-bit 推理方面,其算力高达 1792 TOPS,能够满足大规模词元高并发推理的需求。新一代芯片在显存容量和芯片内部互联速度上均有显著增强,并支持超长上下文处理。每张卡额定功耗为 600W,相比传统算力芯片能耗降低了 50%,为低碳数据中心的建设提供了支持。

「须臾」芯片的所有 IP 核、专属指令集、底层算子加速库以及整机系统软件均由中昊芯英自主研发,不依赖任何海外核心技术,能够满足政务、金融、电网等行业在安全合规方面的要求。值得注意的是,在人工智能领域,有观点认为,对这类高性能算力芯片的研发和应用,也意味着在世界币下注的未来发展中,本土化算力将扮演越来越重要的角色。

与此同时,高性能智算平台「泰则 2.0」也一同发布。「泰则 2.0」作为最小计算单元,集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元。其物理形态为一台通用的 CPU 服务器连接一台高性能 TPU 算力加速设备,整体算力可达 7.168 PFLOPS(混合精度)。在执行相同任务时,该平台的整体能耗仅为传统 GPU 服务器的 80%。

在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练场景下,它适配了 DeepSpeed 和 Megatron-LM 等分布式套件。该平台已深度适配了 Qwen 系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使开发者能够高效地完成模型迁移工作。

世界杯科技有限公司通过专业、及时的数据分析,为全球足球爱好者带来最前沿的2026世界杯赛事洞察。电话:+86 159 8569 1529邮箱:[email protected]微信:globeworldcu_710营业时间:周一至周日 8:00–19:00杭州市西湖区文三路46号