光计算芯片算力提升50倍,如何实现突破?

您当前的位置:   首页 > 首页 > 新闻资讯
光计算芯片算力提升50倍,如何实现突破?
发布时间:2026-06-19 06:23:02

光计算以光子作为信息载体,在数据的传递、交互及计算过程中,展现出低功耗、低时延、高并行的天然优势。在芯片制程受限于物理规律,摩尔定律逐渐逼近极限的后摩尔时代,光计算作为非冯·诺伊曼结构代表,被视为构建新质算力基础设施的有效途径,有望为人工智能、科学计算、多模态融合感知、超大规模数据交换等对算力需求庞大且能耗敏感的应用场景,提供强大的硬件加速支持。

近日,中国科学院上海光学精密机械研究所(以下简称“上海光机所”)空天激光技术与系统部谢鹏研究员团队宣布,成功研制全球首款超高并行光计算集成芯片“流星一号”(Meteor-1),并在国际上首次实现并行度超过100的光子计算原型验证系统。

超高并行光计算芯片——“流星一号”(来源:谢鹏研究员团队

一直以来,如何在提升光计算并行度的同时,保证芯片的计算密度,是光计算领域面临的关键挑战。这一突破被视为光计算领域“里程碑式进展”,为突破传统电子芯片算力与功耗瓶颈开辟全新路径。

上海光机所博士后于潇、沙方圆、北京大学蔚姿奇(上海光机所实习生)为共同第一作者,上海光机所韩溪林工程师、新加坡南洋理工大学 Guangwei Hu 南洋助理教授和上海光机所谢鹏研究员担任共同通讯作者。前排从左至右依次为:王镇、蔚姿奇;后排从左至右依次为:于潇、韩溪林(来源:谢鹏研究员团队

光子矩阵计算颠覆冯·诺依曼架构

据上海光机所官方披露,研究团队围绕光计算技术并行度提升,创新超高并行光计算架构,融合芯片级多波长光源、高速光交互、可编程光计算和光电混合计算算法等,成功研发了全新片上并行光计算集成芯片系统。

“流星一号”基于自主研发的光子矩阵计算架构,突破传统电子芯片依赖串行计算的物理限制。该系统核心光芯片全部自主研制,包含了自主研制的集成微腔光频梳 (频率间隔~50GHz,输出光谱范围> 80nm,可支撑波长复用计算通道数 > 200),作为芯片级多波长光源子系统;自主研制的大带宽、低时延、可重构光计算芯片 (通光带宽 > 40nm),作为高性能并行计算核心;自主研制的高精度、大规模、可扩展的驱动板卡,作为光学矩阵驱动子系统 (通道数 > 256);基于该光子集成芯片系统,首次验证了并行度 > 100 的片上光信息交互与计算原型;在 50GHz 光学主频下,单芯片理论峰值算力 > 2560TOPS ,功耗比 > 3.2TOPS / W。这一算力指标基本对标英伟达先进 GPU 芯片。

光计算芯片算力提升50倍,如何实现突破?(图1)

超高并行光计算架构(来源:eLight)

据悉,该芯片采用三维集成工艺,在5×5毫米的硅基光子芯片上集成超过100个独立光计算单元,每个单元可同时执行矩阵乘法、卷积等核心运算,实现并行度超过100的光子计算。

多波长复用并行光学计算架构(来源:eLight)

实验数据显示,“流星一号”在处理图像识别、自然语言处理等任务时,能效比(算力/功耗)达到传统GPU芯片的50倍以上,延迟降低至纳秒级。这一性能源于光子计算独有的优势:光子以接近光速传输,且无电阻热损耗,天然适合高密度并行计算。

“传统芯片受限于电子迁移速率,而光子计算直接利用光波进行信息处理,理论上可实现指数级算力提升。”谢鹏研究员在《光:快讯》期刊发表的论文中指出。

光计算芯片算力提升50倍,如何实现突破?(图2)

该成果已通过国际光子学领域权威专家评审,相关研究成果以《具备100波长复用能力的并行光计算》(Parallel Optical Computing Capable of 100-Wavelength Multiplexing)为题,以封面论文形式发表于在6月17日的《光:快讯》(eLight)上。审稿人对该研究评价称:“我认为这一成果标志着光计算系统在光谱处理和光学机器学习领域取得了重要突破。”

论文链接:https://doi.org/10.1186/s43593-025-00088-8

(来源:eLight)

国产芯片“换道超车”新支点

行业分析认为,“流星一号”的诞生为国产半导体产业提供了“换道超车”的战略机遇。当前,全球高端芯片市场被英伟达、AMD等巨头垄断,中国在7nm以下先进制程仍面临技术封锁。而光计算芯片不依赖传统光刻机工艺,其核心器件可通过国内成熟的光电子集成技术实现自主可控。

民生证券研报指出,光子计算在数据中心、自动驾驶、AI大模型推理等场景具有不可替代性。以数据中心为例,单台搭载“流星一号”的服务器可替代50台传统GPU服务器,能耗降低80%。若实现规模化商用,将重塑全球AI算力市场格局。

国家“十四五”光电发展规划明确将光子芯片列为重点突破方向,并设立专项基金支持产学研协同。上海光机所已与华为、阿里云等企业启动联合测试,计划于2026年前推出首款商用光子计算加速卡。

“流星一号”超高并行光计算集成芯片 实物图(来源:谢鹏研究员团队

资本与市场双线并进,但未来仍存挑战

高盛在最新研报中预测,光子计算市场规模将在2030年突破千亿美元,年均复合增长率超60%。

国际巨头亦加速布局。英特尔宣布投资10亿美元建设光子芯片研发中心,英伟达则通过收购Ayar Labs切入光子互联领域。对此,谢鹏团队回应称:“我们欢迎良性竞争,但‘流星一号’在并行度、能效比等核心指标上已领先国际同类产品至少2年。”

要实现光计算从前沿技术迈向实用性技术,必须充分发挥光子计算相对于电子计算的优势,需要突破三个方面:

矩阵芯片规模:通过扩大光计算芯片的矩阵规模提升计算能力,该技术路径主要受限于器件物理性质和制备工艺水平。

光学主频:通过提高光信号的加载速率实现更大计算能力,其受限于器件本身的性能。

信息并行度墙:这是决定光计算能否实用的关键,需要通过多维信息复用的方式,实现更大的信息吞吐量。

并行光学计算的光谱一致性(来源:eLight)

光计算芯片算力提升50倍,如何实现突破?(图3)

上海光机所研究团队最重要的创新点在于实现了光芯片的高并行度计算能力。在当前工艺情况下,“矩阵芯片规模”和“光学主频”提升有限且代价大,而突破“信息并行度”是光计算性能提高的极优选择。其有望将光计算的算力能力提升 2-3 个数量级,使其达到与电芯片、电子计算同台竞技的性价比水平。需要特别指出的是,虽然当前研究成果在矩阵规模和光学主频方面仍存在提升空间,距离超越最先进 GPU 芯片的性能还有一定差距,但研究团队对未来发展持乐观态度。

此外,光计算芯片商业化仍面临工程化挑战。当前“流星一号”原型系统需在-40℃低温环境下运行,且光子器件良率仍低于电子芯片。上海光机所联合中芯国际、长电科技等企业成立攻关联盟,目标在3年内解决封装、散热等工程难题。

“光子计算不是要取代电子芯片,而是成为算力基础设施的重要补充。”谢鹏强调。随着AI大模型参数规模突破万亿级,传统架构已触及物理极限,而光计算提供的“第三条道路”正成为全球科技竞争的新焦点。如果未来能将目前行业内最大的矩阵规模、最高的光学主频和本研究实现的超百并行度这三个关键参数进行系统集成,从理论上来看,单芯片算力有望突破 5000POPS,这一性能相当于 1000 颗英伟达最先进芯片的算力总和。

责编:Luffy

光计算芯片算力提升50倍,如何实现突破?(图4)