国产TPU 化茧成蝶为高性能AI 智算提速_火狐官方网站|站点

国产TPU 化茧成蝶为高性能AI 智算提速

2026-06-29 12:35:08

来源：火狐官方站点

英伟达凭借 GPU 创造了辉煌业绩，却也腹背受敌，面临着来自谷歌 TPU、苹果 M 系列等强劲竞争。其中，谷歌专门为加速机器学习应用中的矩阵运算而设计的一种定制化 DSA（Domain Specific Architecture，领域特定架构）芯片 ——TPU（Tensor Processing Unit，张量处理单元），已发展到第六代，成为了对标英伟达 AI 芯片的强力替代方案之一。

9 月 9 日，第五届深圳国际 AI 展（GAIE）第二届智能算力发展论坛期间，国产芯片企业中昊芯英（杭州）科技有限公司（以下简称 “中昊芯英”）与中国联合网络通信有限公司深圳市分公司（以下简称 “深圳联通”）宣布合作共建广东地区首个国产 TPU 智算中心。合作双方依托各自深厚底蕴与资源互补，共谋智能未来，携手启动了高性能 AI 智算中心项目，其布局重要性不言而喻。

中昊芯英创始人兼 CEO 杨龚轶凡和深圳联通副总经理赵桂标在接受各个媒体采访时表示，此次合作不仅是对国家智算能力布局要求的积极响应，也为深圳乃至全国的 AI 产业高质量发展注入了强劲动力。

中昊芯英与深圳联通的合作项目一期集成 32 个算力节点，总算力超 50P，未来将扩展成千卡级训推一体化枢纽，稳固中昊芯英提供了搭载其自主研发高性能 TPU 芯片 “刹那 ®” 的 AI 服务器，以及大规模 AI 计算集群系统 “泰则 ®”，为项目搭建提供了坚实的 AI 计算底座。

据了解，中国联通统筹规划 “1+N+X” 智算布局，以深圳为智算核心高地之一，遵循 “规划先行、市场驱动、适度超前、小步快跑” 的原则，旨在推动全国范围内的 AI 产业发展。

深圳联通依托其雄厚的网络资源与丰富的运营经验，携手政府及行业伙伴，精心打造面向特定行业的智算节点。这些节点预装了适配的软件与模型，旨在为社会各界提供高效、便捷的智能算力服务（MaaS），深度赋能产业升级，推动经济社会高质量发展。

该项目的最大亮点在于算力共享，优化资源配置，避免闲置与不足，减少相关成本。依托联通云 “星罗” 平台，实现多元异构算力适配与服务编排，融合 “通算 + 智算 + 超算” 调度能力，提供一体化算力服务，支持企业私有化部署与智能算力网络管理，引领算力服务新高度。

据介绍，为打造为算力核心高地，合作双方通过构建智算中心进一步强化了算力基础设施。其中，大亚湾核心算网调度平台实现了算力资源的统一纳管与高效调度。该平台不仅整合了国内外各类高性能算力资源，还能按照每个客户需求灵活分配任务，确保算力资源的高效利用。例如，针对高校及科研机构忙闲不均的算力需求，平台通过智能调度实现资源优化配置，提升整体使用效率。

此外，作为算法调度核心，中国联通推出的 “星罗平台” 集成了大模型应用与评测功能，为客户提供一站式模型选择与应用服务。客户可轻松上传自有模型进行训练推理，或利用平台功能进行模型微调，实现从模型选择、感知到应用的全程服务，极大地促进了算力与算法的深层次地融合与应用创新。

上述合作不仅代表了双方在技术层面的深层次地融合，同时也是对未来 AI 产业高质量发展趋势的深刻洞察与精准把握。杨龚轶凡表示：“双方的基础是各自的优势。” 中昊芯英的优点是芯片设计、软件优化以及集群的软硬件栈构建，为 AI 算法提供了坚实的硬件基础；而深圳联通则擅长云平台建设、物理层面的突破、智算中心管理以及能耗控制，为 AI 算法的运行提供了高效、可靠且可扩展的云端环境。“双方合作不仅弥补了彼此的短板，还共同构建了高效、可靠的AI算法基础设施资源平台，实现了资源的最优配置和效益的最大化，” 他说。

他补充道：“TPU 智算中心开启了商业化落地模式，具有里程碑意义。此前，中昊芯英已向多家模型公司销售 TPU，但非共建单一优化平台。此次合作标志着双方共建最优算力平台的新篇章。”

随着 AIGC（AI Generated Content，人工智能生成内容）时代的全面到来，大模型训练、神经网络开发等前沿应用对算力的需求呈现出了爆炸性的增长态势。事实上，在中国 AI 发展浪潮中，自研芯片需求十分殷切。

早在 2018 年，杨龚轶凡依托谷歌 TPU 研发经验，归国创立公司，专注人工智能（AI）TPU 芯片研发，聚焦于 AIGC 需求，专注于为超大规模 AI 模型提供高性能 AI 芯片与计算集群。

历经五年深耕，中昊芯英成功量产基于全自研 GPTPU 架构的高性能 TPU 芯片，引领了技术革新。这一成就不仅彰显了中国在 AI 芯片领域的突破，也让中昊芯英在 2024 年荣获杭州市准独角兽企业称号，进一步巩固了其行业领先地位。

近年来，伴随 TPU 架构 AI 芯片的迅速发展，其高效的矩阵运算能力已成为 AI 大模型训练的关键推手，不断推动着 AI 技术在各领域的深入应用与革新。随技术迭代，TPU 芯片性能持续提升，满足日渐增长的算力需求，为 AI 产业的蓬勃发展奠定了坚实基础。

在国内，TPU 架构 AI 芯片发展势头强劲，多家企业积极投入研发，致力于提升芯片性能的突破与应用场景的拓展。随着 AI 技术的广泛应用和算力需求的激增，TPU 芯片以其高效、低功耗的特点，在 AI 大模型训练、智能推理等领域展现出巨大潜力，为推动国内 AI 产业的加快速度进行发展赋能。

在杨龚轶凡看来，随着大模型的爆发，AI 正式迈入了一个崭新纪元。昔日被戏称为 “人工智障” 的 AI，如今已蜕变为真正意义上的 AI，其展现出的判断力令人瞠目。传统 AI 多局限于模式与物体识别，仅停留于 “见过与否” 的初级层面。而今，AI 不仅能识别，更能进行复杂的逻辑推理，如规划从 A 楼 5 层至 B 楼 2 楼的最佳路径，展现出前所未有的智慧。

这一飞跃得益于大模型的崛起，它们如同智力的放大器，模型规模与人类智力水平间似乎存在某种正相关关系，尽管这尚属实验性结论，却已成为业界的共识。在此背景下，强大的算力集群成为支撑高参数量模型运算的关键，将构建坚实的计算底座，让 AI 在实际应用中展现出更为精湛的逻辑推理与决策能力，预示着一个由 AI 驱动的全新智能时代的到来。

作为国内 TPU 架构 AI 芯片核心技术的领航者，中昊芯英凭借其独特的 “算力基础设施 + 生态合作 + 产业应用场景” 三位一体化策略，不仅为客户量身定制了能够引发生产模式深刻变革的 AI 创新技术方案，更有力地推动了 AI 技术的工程化落地与产业化进程。这一举措不仅彰显了中昊芯英在 AI 芯片领域的深厚积累与前瞻视野，更为整个行业的加快速度进行发展注入了强劲动力。

杨龚轶凡表示，TPU 是一种全新的架构，复杂性不言而喻。其首要挑战在于非线性优化计算方式，以提升模型运算效率，这一过程既漫长又投资巨大。研发中，需通过模拟器模拟芯片运行，以验证优化算法的实际效果，这一过程充满迭代与试错，类似科研探索。

他指出，随技术的发展，在相同制造工艺、芯片尺寸和能耗条件下，TPU 相较于传统 GPU 架构，其无法替代的优点是专为 AI 深度学习定制。TPU 舍弃了 GPU 的部分灵活性，如光线追踪等复杂计算，转而专注于优化深度学习中的非线倍，具有非常明显的性价比。“在 AI 领域，尤其是深度学习模型的训练和部署，性价比是决定模型能否广泛落地的重要的条件，” 他说。

TPU 的架构设计使其在处理深度学习模型时，无论是单线程还是集群性能均表现出色，非常适合于大规模模型训练和推理。其网络基础架构和网络形态专为深度学习数据流量特征设计，无向前兼容负担，逐渐增强了 AI 算法运行的性价比。

他回顾道，中昊芯英团队凭借在谷歌 TPU 及 Oracle - Sun 高性能服务器级 GPU 的深厚经验，构建了模拟器与创意框架，经过多轮优化验证架构，确认其能为算法带来 3 - 5 倍性能提升后，才推进至芯片实现阶段。从设计到实现完整规划到成功实现量产，历经近 5 年才完成了第一代产品。

他坦言：“首代产品的研发，缺乏现实参照，全凭想象与探索，导致量产风险很高。然而，正是这些挑战促使团队采用最尖端工具、封装技术及生产制程，历经近 5 年的艰苦努力，最终实现了产品的诞生。”

他强调，这一过程不仅是技术上的突破，更是对人类智慧与生产的基本工艺极限的挑战，凝聚了无数人的心血与汗水，展现了系统化工程的浩大与艰辛。随技术的不断迭代，未来的研发之路虽仍充满未知与挑战，但团队已积累了宝贵的经验，为后续产品的顺利推出奠定了坚实基础。“国内研发的自主可控 AI 芯片不仅能带动经济效益，还能带动社会效益，” 他说。

在算力领域，智能算力和绿色算力可以说是两大支柱。智能算力赋能 AI 创新，基于 GPU 等芯片，支撑算法训练与运行，提升科学计算效能。而绿色算力则关注计算能效与环保，衡量单位碳排放的算力输出，推动节能减排，实现数字化的经济与环境保护的双赢。

关于智能算力落地应用，杨龚轶凡表示，芯片与系统集成的挑战尤为显著。随着芯片数量的激增，通信效率成为一大难题。犹如千百人同室而语，协调难度骤增，背景噪音干扰严重，信息传递效率急剧下降。如何设计高效的信息交换协议与物理链路，以实现从千到万乃至十万级别核心间的顺畅交流，成为亟待解决的技术瓶颈。

恰恰是 TPU 独特的片间互联能力展现出强大的可拓展性优势。它能够轻轻松松实现千片以上互连，形成数据网络，并支持节点间的灵活交互与通信。这一特性使得 TPU 在构建大规模集群时更为简便，谷歌第 6 代 TPU 已能内部连接 16000 个芯片，无需依赖外部以太网，为万卡至百万卡级别的集群部署奠定了坚实基础。

他说，软件栈与系统集群的复杂性亦不容忽视。产品设计完成后，光通信的可靠性问题接踵而至，跳码、误码现象频发，需要在软硬件层面综合施策，以确保系统稳定运行。

此外，物理层面的能耗、计算机房等限制也是不容忽视的挑战，需逐步优化芯片设计与系统架构，以突破性能瓶颈。对此，深圳联通副总经理赵桂标指出，随着智算中心单机密度与功耗密度的急剧攀升，能耗管理成为行业发展的核心问题。深圳联通在高密机房的规划建设及运营方面有着非常丰富的经验，已连续两年荣获国家绿色数据中心荣誉，成为智算中心运营的典范。

他说，在能耗控制方面，深圳联通采取了两大策略：一是规划与建设阶段积极采纳新技术，如液冷、磁悬浮冷机及模块化电源、间接蒸发冷却等高效能设备，并充分的利用自然冷源，从源头上降低能耗；二是运营管理层面持续精进，通过精细化管控与 PUE（电源使用效率）优化，不断降低能耗水平。

他认为，智算中心的未来竞争将聚焦于电力效率，因此，如何大大降低能耗是行业共同面临的挑战与机遇。深圳联通与中昊芯英等企业在芯片设计、数据中心建设运营等多维度一起努力，将推动智算中心绿色、高效发展。

在企业布局与市场需求合力推动下，中昊芯英 AI 高性能智算中心运营方案日臻成熟，正成为产业升级转型的强劲引擎，赋能算力时代新飞跃。项目成功启动对深圳联通与中昊芯英均意义深远：深圳联通借此完善了智算体系，助力深圳数字化的经济腾飞；中昊芯英则在华南树立 AI 算力新标杆，推动国产 AI 算力运营与产业升级迈向新高度。

“展望未来，深度学习稳固了 AI 领域主导地位，TPU 则以其深度优化特性，将持续增强 AI 赛道竞争力，成为推动技术发展的关键力量，” 杨龚轶凡对此充满信心。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

一台车救活整个公司！合资B级车，标配8AT，神车“最后一搏”仅售12万

便宜1700元！苏州Costco顾客排队20小时抢购苹果手机，“黄牛”出没叫卖代排队

政治局会议重磅！稳住楼市股市，A50、港股爆拉超4%，更有14年来首次

114-106！库里30+8，爱德华兹27分，勇士逆转终结森林狼4连胜

妹妹教哥哥读英语，奈何哥哥一口英语太魔性，网友：谁辅导作业谁“疯”！

再见Kanavi！JDG官宣：xun加入，Kanavi离队！新阵容组建完毕

科技一周大事（12 月 2 日-8日）：苹果自研 5G 基带有望明年登场

上一篇:世界级航空机场
下一篇:智慧公厕提升公卫管理！智慧公厕专业厂家广州中期科技有限公司解

智慧服务

国产TPU 化茧成蝶为高性能AI 智算提速

来源：火狐官方站点