太阳能光伏
HOME
太阳能光伏
正文内容
光通讯产品的卖点 通信行业深度报告:光子的黄金十年,AI拉动下的光学革命
发布时间 : 2024-10-10
作者 : 小编
访问数量 : 23
扫码分享至微信

通信行业深度报告:光子的黄金十年,AI拉动下的光学革命

(报告出品方:国盛证券)

一、光通信-AI 算网融合下的传输最优解之一

1.1 光通信产业链

光通信产业链涵盖多个环节,上游芯片厂商和下游客户较为强势。简单来看光通信产业 分为上中下游,上游主要是核心零部件环节包括光芯片、光学元件、电芯片,中游可以 分为光器件、光模块,下游按照应用场景可以分为电信市场和数通市场,整条光通信产 业链较为复杂,话语权较强的集中在上游和下游两端,因此对于光模块厂商而言成本控 制能力至关重要,决定了公司的整体盈利能力。

上游零部件: 光芯片:有源光芯片(激光器芯片、探测器芯片等)、无源光芯片(波分复用、光 耦合器等); 主要厂商:源杰科技、仕佳光子、光迅科技、长光华芯、华工科技、海信宽带、武 汉光安伦、华为海思、中兴通讯、Lumentum、Finisar、Avago、AAOI、II-VI、Ociaro、 Acacia、三菱、住友、博通等。 光学元件:平面/球面光学元件、横压玻璃非球面透镜等; 主要厂商:天孚通信、太辰光、腾景科技、光库科技、中瓷电子、博创科技、昂纳 技术等。 电芯片:电芯片目前仍以海外进口为主,包括 LD driver、TIA、LA、CDR、DSP 等; 主要厂商:Marvell、博通、Credo、超燃半导体、华为海思、傲科光电等。

中游器件模块: 光器件:有源光器件-激光器(DFB/FP/VCSEL)、探测器(PIN/APD)、光放大器、 光调制器(DML/EML)、光收发次模块(TOSA/ROSA/BOSA)等;无缘光器件-光隔 离器、光分离器、光开关、光纤连接器、波分复用解复用器、光分路器、光衰减器、 FA 光线阵列、光耦合器等; 主要厂商:光迅科技、博创科技、华工科技、Lumentum、Finisar、AAOI、II-VI 等。 光模块:数通光模块、电信光模块,100/200/400/800G/1.6T 等; 主要厂家:中际旭创、新易盛、光迅科技、华工科技、博创科技、联特科技、剑桥 科技、Lumentum、Finisar、Avago、AAOI 等。

下游应用: 电信市场:通信设备厂如华为,中兴,烽火,瑞斯康达、格林伟迪、剑桥科技、Nokia、 Cisco 等;终端电信运营商如三大运营商、中国广电、Verizon、T&T、沃达丰、软 银等。 数据中心市场:云厂商如阿里云、腾讯云、华为云、百度云、AWS、Microsoft、Google、 Meta 等。

1.2 网络架构分析以及对应光通信网络

光通信与网络架构密切相关,网络架构的持续演进和多样性对光通信提出一系列特定的 需求。网络架构是指网络系统中各个组件和子系统之间的结构和组织方式,决定了数据 在网络中的传输方式、管理方式以及网络整体的性能和可靠性,网络架构包括硬件和软 件两个方面。不同的网络架构对光通信具备不同的需求,包括传输速率、带宽要求、传 输距离、技术标准、通信协议、部署环境等。

1.2.1 以太网 VS IB,兼容性与高性能之争

以太网(Ethernet)是当前广泛应用的局域网,基于 IEEE 组织 802.3 网络标准,使 用标准的以太网设备、线缆和接口卡,借助交换机或路由器实现各个网络节点之间的通 信。以太网最初由 Xerox、Intel、DEC 公司联合开发,并于 1980 年发布首个以太网标准, 即 10Mbps 基带局域网;后来标准逐步完善,推出了多个传输速率,目前具备标准以太 网(10 Mbit/s)、快速以太网(100 Mbit/s)、千兆以太网(1000 Mbit/s)和万兆以太网 (10 Gbit/s)等。以太网通常采用总线架构,广泛支持家庭和办公室网络、5G 承载、云 计算、智慧城市和数据中心等多种应用场景。

InfiniBand(IB)具有高带宽、低时延、高可靠性和高可扩展性,适用于高性能计算 和人工智能等领域,如超级计算机、GPU 服务器、大数据分析等。IB 网络带宽从 SDR、 DDR、QDR、FDR、EDR、HDR 到 NDR 不断发展,提供多个传输速率的选择,InfiniBand 通过专用设备、线缆和接口卡,以交换机实现直接连接和高效通信。IB 网络由 InfiniBand Trade Association(IBTA)定义,技术在超级计算机集群和 GPU 服务器等领域广泛应用, 采用先进的分布式网络架构,显著提升性能,支持更高的传输速率和更大的带宽,尤其 适用于科学计算和大规模 AI 数据中心。

以太网和 IB 网络“纷争”由来已久,两者在带宽、时延、可靠性、可扩展性差距明显。以太网和 IB 网最初各自的设计目标和应用场景不同,直接导致两者在性能侧重上存在差 异,整体来看,以太网兼容性较高、成本较低、灵活性较好,IB 网性能更优秀,具备高 带宽、低时延、高可靠性和高可扩展性等优点: 延迟:IB 网引入 RDMA 技术,延迟大幅降低。传统 TCP/IP 协议来自网卡的数据 需要先拷贝到核心内存——再拷贝到应用存储空间——再经由网卡发送到 Internet, 这种核心内存的转换增加了数据流传输路径的长度,传输延迟较大;IB 最突出的优 势在于率先引入 RDMA(远程直接数据存取)协议,允许应用与网卡之间的直接数 据读写,同时 RDMA 的内存零拷贝机制允许接收端直接从发送端的内存读取数据, 因此整体 CPU 负担大幅降低,延迟显著提升。

带宽:以太网和 IB 网带宽和速率均不断升级。以太网传输速率从 10M 起步,目前 已经发布了 100G、200G、400G、800G 甚至 1.6T 以太网接口,传输速率的跨度较 大;InfiniBand 的网络带宽不断升级,从早期的 SDR、DDR、QDR、FDR、EDR、 HDR,一路升级到 NDR、XDR、GDR。

兼容性:以太网兼容性显著高于 IB 网络。以太网遵循 TCP/IP 模型或 OSI 模型,可 以与各种不同的系统和设备互连互通,支持各种网络拓扑,以太网生态系统在产业 链中的成熟度更高;IB 网络使用自身定义的网络协议,需要特定的软件和驱动才能 与其他系统和设备互连互通,甚至不同的应用场景还需要特定 IB 线缆接入。

扩展性:IB 网是针对集群设计的架构,拓展性更高。IB 设计之初就支持子网灵活 拓扑布局,可以较为简单的添加、重置、删除子网,能够创建具有数千个节点的高性能集群。 可靠性:IB 网络稳定可靠性较高。IB 网是一个完整的网络协议,并具备端到端流 量控制,可以避免拥塞、确保信息有序传递、提高网络效率。 成本:以太网成本较低,IB 成本较高。以太网使用的设备、线缆和接口卡都是标 品,供应商和产品可选范围较大;而 IB 网使用的设备、线缆和接口卡都是专用的, 可选厂商较少且客户议价权较弱。

总体来看,以太网作为过去数十年使用最广泛的通信协议,其受众群体众多,用户接受 程度高,兼容性强,但因为过去在高性能 AI 计算场景使用较少,且供应商分散,导致综 合效果相较于封闭的英伟达方案有所欠缺。随着大模型超算的持续推进,超以太网联盟 的成立,以太网正发起直追,凭借广泛的群众基础,以太网在 AI 时代依旧有这极强的生 命力,与 IB 的良性竞争也将进一步加速网络架构层面的发展,去匹配持续升级的计算。

1.2.2 英伟达:IB 和 NV 网络打造高性能集群

AI 时代 GPU 成为核心处理器,分布式训练诉求提升,集群构架下 IB 网络优势尽显。 GPU 采用并行计算方式,擅长处理大量、简单的运算,因此多适用于图像图形处理和 AI 推理。但是大模型复杂度日益提升,单卡 GPU 显存有限,无法满足训练需求,需要联合 多张 GPU 甚至多台服务器协同工作,分布式训练成为核心训练方式,集群网络成为趋势, 根据以上对 IB 网络和以太网的叙述中可知,目前来看 IB 网络的高性能更能满足于 AI 集群训练的需求。 为提高 gpu 集群性能,英伟达选取 IB 网络架构,光通信能力成为大模型训练/推理环 节的核心能力。英伟达在 IB 网络早有布局,起初 Mellanox 是全球 IB 交换机领先厂商, 2019 年被英伟达 68 亿美金收购,当前来看,AI 大模型训练均以英伟达的网络配置方案 为主,IB 网络在大模型应用场景中占据较为绝对的地位,基于英伟达 A100、H100、GH200 GPU 构建的网络基本配套用 IB 交换机。

(1)A100:目前 A100 SuperPOD 主要用 200G quantum 交换机,全 200G 连接, 一条线缆对应 2 个 200G 光模块

A100 顶配模式: 以 140 台 DGX(1120 张)的顶配集群为例,在服务器到叶交换机层,每张显卡连 接一个叶层交换机口,每个服务器有 8 张卡,20 台服务器分为 7 组,所以需要 7X8 台叶交换机与 1120 条连线; 叶到脊层,每组中的 8 台叶交换机连接分别有一条线连接向 10 台一组脊交换机, 同时 UFM 管理模块需要分别连接两个脊交换机,共需要 1124 条连线; 脊到核心层,连接方式较为复杂,按照表供需 1120 条线。

A100 标准模式: 一个标准的 DGXA100SuperPOD 部署结构为,140 台 DGXA100GPU 服务器(每台 服务器 8 张 GPU)、HDRInfiniBand200G 网卡、170 台 NVIDIAQuantumQM8790 交 换机(其中交换机速率为 200G,每个端口数为 40 个),采用 IB fat-tree 胖树网络 拓扑。

(2)H100:DGX H100 SuperPOD 计算集群互联中,理论上需要配置 3 块 800G 光 模块(2*800G +2*400G)

DGX H100 SuperPOD 节点内部是 NVLink4 互联 8-GPU,节点之间通过 NVLink4 Network 互联。 基本部署结构信息为:32 台服务器(每台服务器 8 张 GPU)+12 台交换机,网络拓 扑结构为 IB fat-tree(胖树),交换机单端口 400G 速率,可合并形成 800G 端口; 交换机建议 NVIDIA Quantum QM9700 switc。 此处我们和 A100 一样,参考 H100 的 SuperPOD 组网白皮书,根据线缆数量计算 光模块用量。 用于 H100 计算集群互联中,服务器到叶层需要 400G 通路,叶层到脊层交换机互 联需要 800G 通路。 根据线缆计算,叶层一张 H100 需要 2 块 400G(1020*2/1016≈2),脊层 H100 需 要 2 块 800G(1024*2/1016≈2),因此,计算集群互联中,约等于需要 3 块 800G 光模块(2*800G 光模块+2*400G 光模块)。 故 GPU:光模块理论可达极值为: Nvlink Switch 1:4.5 + InfiniBand 1:3 = 1:7.5(实际应用中目前因价格过高没有推 广,只做空间参考。)

(3)GH100:跨服务器显存共享第一次成为现实

GH100 集群架构:三层架构,第一层是显卡,第二层是 L1 交换机,第三层是 L2 交 换机,每 8 张显卡与 3 个 L1 交换机形成一个 POD,或者说“小集群”,每个小集群 再通过胖树架构连接到 L2 交换机,从而实现互联。 显卡到 L1 交换机的距离较短。

1.2.3 超以太网联盟:广泛的群众基础,持续优化提高性能表现

超以太网联盟(UEC)成立,有望打破 IB 网络在 AI 时代的垄断地位。2023 年 7 月 19 日在 Linux 基金会的牵头下成立超以太网联盟(Ultra Ethernet Consortium),创始成员 包括 AMD、Arista、博通、思科、Eviden、HPE、Intel、Meta 和微软等,EUC 目标是超 越现有的以太网功能。 UEC 成立后,以太网与 IB 网络谁更适合大模型,尚未成定论。当前来看,全球跨服务 器 AI 连接主力军为 IB 协议与以太网协议。英伟达凭借其领先的显卡性能和用户粘性, 使得 IB 协议在目前的 AI 连接领域拔得头筹,但 IB 由于溢价较高,用户往往需要付出更 多的隐形组网成本,相同预算下,采购到的显卡,光模块、交换机硬件数量就会较少。 当前行业为了改变这种趋势,有两条路线正在浮现,第一是如谷歌等超级巨头,通过全 套自研的 TPU 芯片以及 OCS 交换系统,以自身技术实力实现生态闭环,从而降低成本。 第二则是 AMD 带领的以太网联盟,以包容,开放的生态,与交换机厂商一起,扩大以太 网份额与性能,让更加高性价比的网络惠及客户。我们认为,随着以太网等开放协议渗 透率逐渐提升,组网成本中的“隐性花费”有望降低,客户可以将更多的预算投入如高 速率光模块、交换机等实际设备的购买中。

以太网的“开放”性能获得 AMD 大力支持,未来借助开放性或有望与 IB 网络在 AI 集 群架构中形成竞争力,进一步增加下游客户可选择性,光通信的网络架构渠道得以拓宽。 全面拥抱以太网。无论是从显卡服务器设计亦或是网络架构上,AMD 全面拥抱“开放” 理念,服务器采用标准化设计,可以兼容任何客户的集群。在网络方面,内部互联的 Infinity Fabric 协议将开放给合作的交换机厂商与战略伙伴。同时,在跨服务器的显卡连 接上,AMD 旗帜鲜明的指出“Ethernet is the answer”,以太网将成为 AMD 用于构建集 群的协议。相比于业界的另一主流协议 IB,AMD 认为以太网拥有更好的性能,更好的大 规模集群能力,以及最为核心的开放性。

1.3 800G/1.6T 后全面进入 TB 时代

AI 拉动光模块速率升级,1.6T 光模块产品将领衔市场。大模型训练把对算力的需求带 上了新高度,当今的 AI 训练推理亟需超大内存来承载千亿参数量、TB 级别大小的大模 型,内存性能也顺理成章成为 AI 算力的瓶颈所在。英伟达 H200 提前发布,整个技术路 线的迭代随之加速,1.6T 时代也有望更早来临。高算力、低功耗是未来市场的重要发展 方向,随着 AIGC 发展趋势明朗,高算力需求催化更高速率的 800G、1.6T 光模块需求。 1.6T 光模块需求趋势明确,国内厂商加快布局新市场。中国企业已经成为全球光通信产 业的重要一极,尤其是光模块领域迅速追赶,已经占到全球 50%的份额。从整个产业来 看,中际旭创、新易盛、光迅科技、剑桥科技等国内厂商已有 1.6T 光模块新产品落地, 华工科技、联特科技已在研发阶段。

中际旭创:公司 1.6T OSFP-XD DR8+可插拔光通信模块,结合了最先进的单通道 200G 光学技术和行业领先的数字信号处理技术,传输速率达到 1.6Tbps,实现了 1U 机架配置中 51.2T 的交换机吞吐量,在 0-70C 温度范围内,以低于 23W 的低功 耗支持 2 公里的传输距离。公司 AI 大客户目前已明确提出了 1.6T 的需求,新产品 将根据客户需求进行完善和量产准备,2024 年 1.6T 光模块主要为测试、认证以及 小批量需求,真正的规模上量则会在 2025 年开始。

新易盛:公司 1.6T 4×FR2 光模块产品采用 OSFP-XD 的封装形式和单波 200bps 技 术,公司采用的技术方案包括 EML 和硅光子学调制器以及薄膜铌酸锂(TFLN)调制器。 1.6T 光模块具有 4×SN 连接器,电接口使用 16×100Gbps 信号,光学侧使用 4× 400G FR2 信号,模块可以支持长达 2 公里的传输距离,可用于 1.6T 的点对点连接 或 2×800G 或 4×400G 的扇出应用。公司新产品兼具高容量,低每比特成本,低 的功耗的特点。

光迅科技:公司 1.6T DR8 高速光模块,遵循 OSFP MSA 及 CMIS 协议标准,采用 OSFP-XD 的封装形式,模块电接口侧采用 16 个通道,单通道信号速率 100Gb/s; 光接口侧采用 8 通道,单通道信号速率 200Gb/s,在整体硬件设计上,该模块采用 最新一代 5nmDSP,可满足数据中心低能耗诉求,实现 10km 传输链路预算。在制 成工艺上,基于公司成熟稳定的 COC(chip on carrier)以及 COB(chip on board)工艺 平台,可保证产品稳定性。

华工科技:公司在 400G 及以下全系列光模块已实现批量交付,800G LPO 系列模块 产品已向客户送样,正在验证测试过程中。公司围绕当前 InP、GaAs 化合物材料, 布局硅基光电子、铌酸锂、量子点激光器等新型材料方向,自主研发并行光技术, 积极推动新技术、新材料在下一代 1.6T、3.2T 等更高速产品应用;公司 1.6T 光模 块目前仍在研发阶段,可匹配客户进度及送样窗口。

OFC 2023 年全球光通信行业风向标,1.6T 时代已加速到来。OFC 是光通信领域中全 球规模最大、专业性最强、影响力最大的国际性盛会,受到全球光通信、芯片乃至云计 算公司的高度重视。第 48 届 OFC 展会于 2023 年 3 月 5-9 日在美国加利福尼亚州圣地亚哥以现场和虚拟组件的混合形式召开,展会中讨论的热点话题包括量子网络、机器学 习(ML)和人工智能(AI)等网络分析技术,以及 5G 创新等。在本届 OFC 展会上,国外相 关厂商在光芯片、光学元件、电芯片等领域展示了最新的产品和创新。国内参会企业在 800G/1.6T 光模块、薄膜铌酸锂、硅光、相干光通信等领域也有新产品推出。整体来看, 在 800G 领域,中国光模块供应商已经走在业界前列,200G 相关光电芯片产品在展会的 亮相,也使得 1.6T 可插拔光模块的竞争力进一步增加。随着 AIGC 高速发展下拉动的算 力需求大爆发,下游 1.6T 需求已提前释放,将在 2024 年全面进入 1.6T 时代。

二、光子通信新路径—封装与材料的革新

2.1 封装侧:CPO/LPO/板上光互联

2.1.1 传统 PAM4+DSP

光模块传输的原理基于光学和电学相互转换,具体包括光接收模块和光发送模块。光模 块的原理是,在发射端原始电信号经过驱动芯片处理后,激活半导体激光器或发光二极 管发射调制光信号;接收端接收光信号后,光探测二极管将其转换为电信号,经过前置 放大器处理后输出。光模块中的主要电芯片包括 DSP(数字信号处理器)、LDD(激光驱 动器)、TIA(跨阻放大器)、LA(限幅放大器)以及 CDR(钟与数据恢复芯片)等。

400G 及以上速率的光模块主要有 QSFP-DD、CFP8 和 OSFP 封装。随着 5G 建设、数据 要素规模的演进以及 AIGC 对海量数据传输的需求,电信、数通领域需要更强性能的光 交换机,也因此需要更高速率的光模块。目前主流的 200G/400G/800G 的产品都是 基于 PAM4 技术+DSP 芯片来实现高速信号的调制、传输和恢复。 PAM4(4-Level Pulse Amplitude Modulation,四电平脉冲幅度调制)是一种调制 技术,采用 4 个不同的信号电平来进行信号传输,每个信号周期可以传输 2bit 信息。 传统数字信号通过不归零编码(Non-Return-to-Zero,NRZ)来传输信号,只有高、低电 平代表 1、0 两种信号,每个信号周期能够传输 1bit 信息。PAM4 能携带 NRZ 两倍的信 息量,从而实现传输速率的倍增。PAM4 的优势在于可以在不增加带宽的情况下提高传 输速率,缺陷在于对噪声更敏感,其眼图开口更小,难以将原始信号区分开来。

PAM4 的调制方法包括基于 DSP 的数字 DAC 实现方法和基于模拟的组合方法。主流模 拟模式可以通过添加两个 NRZ 信号通道来工作,数字模型基于高速 DAC,可实现 0/1/2/3 电平的快速输出。DSP 是数字信号处理技术,主要用于解决光通信系统中的数字时钟恢 复、色散、带宽不足引起的低通滤波效应、偏振旋转等问题,消除噪声和非线性干扰。 对于 100G 以上的单波应用,目前的电驱动芯片和接收端光器件无法达到 50GHz 以上的 带宽,相当于在发射端引入低通滤波器,造成码间干扰,使得接收器无法恢复正确信号。 引入 DSP 后,信号可以在发送端进行压缩,在接收端通过自适应非递归(FIR)滤波器 恢复,从而减少对光器件带宽的要求。PAM4+DSP 解决方案具有较好的信号处理能力, 表现在电口适应性强、光电性能好等,但具有更高的功耗和成本。

目前 PAM4+DSP 是应用相对广泛并且性价比较高的传统主流方案,但有进一步性能提 升空间。在高速通信领域,PAM4 逐渐成为一种重要的调制方式,尤其在数据中心和光 通信系统中得到广泛应用,是 400G 光模块的主要调制方式。PAM4 调 制在电口适应性强、光电性能好,但在功耗和成本上有进一步提高空间,在 400G ZR 中 DSP 模块功耗占比 49%,在成本上,DSP 价格较高,400G 光模块中,DSP 的 BOM 成本 约占 20-40%。

2.1.2 CPO 共封装是长期方向

CPO(Co-packaged Optics)是一种在数据中心光互连领域应用的光电共封装方案。 CPO 方案通过将光模块与交换芯片进行共封装,可以降低成本和功耗。长期来看,CPO 是实现高集成度、低功耗、低成本、小体积的最优封装方案之一: 减少走线距离:CPO 将光模块逐渐靠近交换芯片,缩短了芯片和模块之间的走线距 离,从而提高了数据传输的效率和速率。 绕过 DSP 和散热结构:CPO 方案绕过了光模块中的 DSP 单元和散热结构,采用硅 光子模块和超大规模 CMOS 芯片的共封装方式,以提高整体的集成度和降低功耗。 优化成本和功耗:减少元器件的复杂性,采用共封装的方式,实现了对成本和功耗 的双重优化,使其更适用于大规模数据中心的部署。

目前由于技术和产业链尚未完全成熟,CPO 在短期内可能难以大规模应用,但其在未来 共封装光学的思路有望逐步替代传统的可插拔光模块,CPO 有望为数据中心光互连技术 提供更紧凑、高效、低功耗的解决方案。

2.1.3 LPO,800G 时代最具潜力的方案

LPO 简介:LPO(linear drive pluggable optics,线性驱动可插拨光模块),主要运用于 高速光模块领域,就是通过线性直驱技术替换传统的 DSP,实现系统降功耗、降延迟的 优势,但系统误码率和传输距离有所牺牲。该技术适用于数据中心等短距离传输场景。 LPO 技术主要用于高速率光模块中。光模块传输速率涵盖很大的范围,根据传输速率的 不同,光模块可分为 155M、622M、1.25G、2.5G、8G、10G、16G、25G、32G、40G、 50G、100G、200G、400G 等。传输速率越高的光模块,结构越复杂。根据封装类型的 不同,光模块可分为 SFP、eSFP、SFP+、XFP、SFP28、QSFP28、QSFP+、CXP、CFP、 CSFP 等。

LPO 方案相较于 PAM4+DSP 有何优势? 为了降低 DSP 的功耗和延迟,LPO 概念应运而生。LPO 技术去掉了 DSP 芯片,将其功 能集成到交换芯片中,只留下驱动(Driver)和跨阻放大(Transimpedance Amplifier, TIA)芯片。LPO 光模块中用到的 TIA、driver 芯片性能有所提升,从而实现更好的线性度。但是,LPO 的系统误码率和传输距离有所影响,因此这项技术只适用于短距离的应 用场景,例如数据中心服务器到架顶交换机的链接。

LPO 技术具有以下几个优点: (1)低功耗。LPO 功耗相较可插拔光模块下降 50%,与 CPO 接近。根据 Macom 的 数据,具有DSP功能的800G多模光模块的功耗可超过13W。而利用MACOM PURE DRIVE 技术的 800G 多模光模块功耗低于 4W,下降 70%。低功耗不仅节省电能,而且能够减 少模块内组件的发热。 (2)低延迟。去掉 DSP 芯片后,系统减少了对信号复原的时间,延迟大幅降低。DSP/ 重定时功能增加了延迟,以 MACOM PURE DRIVE 技术为例,因采用信号串行方案,LPO 光模块可以做到皮秒级别的延迟时间。 (3)低成本。DSP 价格较高,400G 光模块中,DSP 的 BOM 成本约占 20-40%;LPO 的 Driver 和 TIA 里集成了 EQ 功能,成本会较 DSP 上浮少许,但 LPO 方案还是可以将光 模块成本下降许多。 (4)可热插拔。相比于 CPO,LPO 没有显著改变光模块的封装形式,采用可插拔模块, 便于维护,并且可以充分利用现有的成熟技术。

LPO 产业进度:国内外并驾齐驱。LPO 作为一种新技术,预计 2024 年年底量产,目前 新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信宽带推 出 800G 线性互联光缆。高线性度的 TIA、Driver 芯片作为 LPO 技术的核心零部件,目 前有 Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前,剑桥 科技与 Macom 深入合作,且正在向微软供货高速光模块,我们认为,北美云厂商正在 积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受 LPO 方案,建议持 续关注。

值得注意的是,LPO 方案需要和交换机进行配合,对光模块厂商在产业内上下游合作协 同要求更高,龙头公司如中际旭创、新易盛将更加具备优势。

2.1.4 光互联的进化:向短距离渗透,向高密度升级

点到点连接层面,冯诺依曼瓶颈凸显,光互联的两端,距离越来越短。从分布式数据中 心互联,到 AI 超算中心的机架间光互联,甚至芯片间光互联、存储介质间光互联,可以 说,光纤两端的距离正在缩短。究其原因,是“冯诺依曼瓶颈”凸显:电子在处理器和 内存之间的传输速度因带宽和物理延迟而被限制,将数据传输通道改为光子,或将有效 解决冯诺依曼瓶颈。 将以上假设聚焦到 AI 新品 AI 超算中,我们发现,光连接需求大幅增长。为匹配高性能 芯片的计算能力,通信网络带宽和器件用量双增长。根据英伟达发布会,一套满配的 GH200 将用到 241 芯公里的光纤;华为星河 AI 白皮书中提到要使用“高吞吐”网络以充分释放 AI 集群算力,主板之间体现在“端口高吞吐”,机架之间体现在“网络高吞吐”, 我们认为,光连接在整个算力系统的价值量将持续提升。 AOC 是一种性价比高、易于维护的光连接解决方案。AI 超算和 DCI 场景中,主流连接 方案是光模块+光纤、AOC(Active Optical Cables,有源光缆)和 DAC(Direct Attach Cables, 直连电缆)三种,前两者的区别在于,AOC 将光模块和光缆集成化,避免光口被污染的 可能性,以提升可靠性。对于后两者,此前在端口速率低于 400G 的时代,DAC 凭借极 低成本成为市场主流,后来随着端口带宽进一步提升和多模光模块成本降低,采用光传 输的 AOC 方案赢得青睐,DAC 未来有望加速向 AOC 升级。

面到面交换层面,ROADM 进化出 OXC,光交换建起更加高效、易于维护的“立交桥” 系统。ROADM(Reconfigurable Optical Add/Drop Multiplexers),可重构光分插复用器, 现今广泛用于骨干、城域和数据中心互连(DCI)的组网需求。随着光互联的密度大幅 增加,传统的集成度较低的 ROADM 无法满足需求,且维护效率低,进而衍生出集成度 极高的 OXC(optical cross-connect)。我们认为,OXC 目前广泛用于电信骨干传输网络, 未来有望应用于交换网络同样复杂、密集的 AI 超算内部或分布式超算互联网络中。

根据中兴通讯的实践,20 维的 ROADM 需要站点内 3 个机柜、100 多块单板、400 多根光纤;OXC 采用高度集成的单板和光背板,减少了占地面积和功耗,并简化了 内部光纤连接。20 维的 OXC 只需要 1 个机柜、约 30 块单板,同时也降低了相应的 功耗。光线柔性板连接节点内所有光纤,实现自动连纤,提高配线效率,降低维护 成本。

2.2 材料侧:硅光/薄膜铌酸锂

光通信系统中电光调制器是关键环节,通常可以按照材料平台分为三大类别。电光调制 器通过调制将高速电子信号转换为光信号,制备电光调制器有三种较为常见的方案,可 以按照材料的不同划分为磷化铟方案、硅光方案、铌酸锂方案。磷化铟调制器目前使用 较为广泛,且历史较久,适合中长距离光通信网络的收发模块,但存在尺寸、功耗、成 本较高的欠缺,因此材料侧也出现了硅光和薄膜铌酸锂两种较为创新的平台,铌酸锂方 案又可以分为传统铌酸锂和薄膜铌酸锂方案,前者适用于长距离、大容量传输场景,但 由于体积较大,与光器件小型化的发展趋势相悖,且难以进行大规模晶圆制造;而薄膜 铌酸锂调制器尺寸更小、损耗和功耗较低、带宽更大、成本更低,是更为理想的材料平 台。

2.2.1 硅光

老生常谈“硅光”。硅光技术提出已久,当市场广泛讨论硅光技术,默认指的硅光技术的 “最终集成模式”即硅光模块,但其实严格意义来看,硅光技术包含了三类产品:硅光 器件、硅光芯片、硅光模块。硅光器件是基础硬件,包括光源、调制器、探测器、波导 等;硅光芯片是将各发送/接收/探测/调制芯片等集中在一起的单芯片,具备高性能、低 功耗、低成本等优点;而硅光模块是硅光技术的集大成者产品形式,将光源、硅光芯片 和模块如光发送器件和光接收模块、甚至外部驱动电路等都集中在一起的一体化模块。

硅光本质上是硅基光电子大规模集成技术,较传统方案更具优势,集中体现在速率高、 成本/功耗低、集成化程度高、体积更小等方面。硅光技术是一种利用硅材料的光学和 电学特性来实现光学器件的制造和集成的技术,硅作为主要材料,通过在硅基底上制备 光学元件,如波导、光调制器、光耦合器等,从而实现在硅芯片上集成光学功能,此外 硅光材料还是光电共封装 CPO 技术的基础。相较传统光模块,硅光技术成本、能耗、体 积更低:

集成度高:硅芯片是集成电路制造中常见的材料,硅光技术可以与传统的半导体制 造工艺相兼容,实现光学器件的高度集成,减小整个光学系统的体积。 制造成本低:硅是广泛使用的廉价半导体材料,硅光技术相对于其他光学材料的制 造成本更低,有利于大规模制造和商业应用。 兼容性强:硅光技术可以与现有的电子集成电路技术兼容,使得光学器件可以与电 子器件在同一芯片上集成,实现光电混合集成,易于与 CMOS 电子器件集成是硅光 技术的关键优势之一。 带宽高:硅光技术借助光互连实现低能耗和低散热,有效避免了解决网络拥堵和延 迟,激光代替电子信号传输又加快了传输速率。 短距离通信应用:硅光技术主要应用于短距离通信领域,例如数据中心内部的通信, 因为硅光器件对于短距离通信的需求具有良好的性能。

硅材料自身应用历史悠久,掣肘硅光技术发展难点集中于光激光器,技术升级突破进展 中。硅基材料自身发光效率较低,光激光器成为技术痛点,因此市面上主要硅光方案一 般是 CMOS 方案(采用大规模集成电路技术工艺集成单片硅光引擎)或者混合集成方案 (光芯片仍使用传统的三五族材料,再将三五族的激光器与硅上集成的调制器、耦合光 路等加工在一起)。不过根据 C114 信息,硅光最近的突破性进展引入了在硅上制造有源 光学元件的创新方法,并在几年内实现了量产,未来硅光技术进展有望加速。

从工艺角度来看,硅光可以分成单片集成和混合集成,目前混合集成使用较广,但是单 片集成性能更优,是未来发展趋势。单片集成是指将光子学组件直接集成到同一块硅芯 片上,包括光源、光调制器、波导、耦合器等光学元件,统一被整合在硅芯片上,从而 形成一个紧凑的光学电路,单片集成方式的优势在于可以减小尺寸、提高集成度,并降 低制造成本。混合集成是指将硅芯片与其他材料的光学组件结合在一起,即将电子器件 (Si-Ge、HBT、CMOS、射频等)、光子器件(激光/探测器、光开关、调制解调器等)、 光波导回路集成在一个硅芯片上,其中硅芯片主要负责电子部分的处理,而其他材料的 光学元件则负责光的生成和调制,混合集成的优势在于可以利用硅芯片的电子器件和其 他材料的优异光学特性,实现更高效的光通信和传感应用。目前来看,光器件如波分复 用器、变换调谐器等已经可以实现单芯片集成,而光模块尚需要混合集成。

制造工艺是限制硅光光模块发展的瓶颈,封装工艺却为硅光光模块带来新的希望,,AI 大模型引发算力革命下,CPO 加速推动硅光加速,共振引领光通信走向代际更替。前文 提到的 CPO 是把硅光模块和 CMOS 芯片共同封装的技术,缩短了光学引擎和交换芯片的 连接距离,从而降低传输损耗,速度与质量双提升,除了硅光的制造工艺,光模块的封 装技术与硅光落地难度密切相关,共封装技术进一步降低了硅光单片集成的难度,未来 两者有望形成良性循环,将光通信从 800G/1.6T 时代加速引向硅光时代。 800G/1.6T 时代已来,硅光前景光明。AI 的爆发使得 800G 时代加速到来,而随着硬 件的竞争迭代加速,光通信对应速率也明显缩短,我们预计 2024 年 1.6T 整体进展有望 持续加速,2025 或将迎来 1.6T 批量交付。产品代际迭代周期的缩短,光模块厂商对新 技术新材料将更加开放,硅光在高速率背景下有这比较明显的纸面优势,整体进展有望 持续加速,硅光份额在未来数年有望实现持续的提升。

2.2.2 薄膜铌酸锂

薄膜铌酸锂——“光学硅”。铌酸锂材料是可靠材料中电光系数最优的选择(考虑居里点 和电光系数)。薄膜工艺拉进电极距离,降低电压提升带宽电压比。相比其他材料兼具大 带宽/低损耗/低驱动电压等诸多光电最需要的优点。当光模块切换到 1.6/3.2T 阶段,有 望向单波 200/400G 演进,薄膜铌酸锂的大带宽优势将更加突出。 薄膜铌酸锂有何优势?传统的体铌酸锂波导层的芯层-包层折射率差非常小,带来波导模 场太大的问题;波导模场面积很大,相应的电极之间的距离就会随之增加,那么实现电 光调制就需要外加足够大的驱动电压来获得足够的电场,功耗难题凸显。而薄膜铌酸锂 的优势是可以采用刻蚀等方法制作强限制的波导模场,利用这种工艺可以将电极置于离 波导模场很近的地方,从而降低驱动电压。同时,薄膜铌酸锂还顺带解决了带宽问题: 调整薄膜铌酸锂波导模场包层(硅/二氧化硅)的厚度就可以实现不同带宽。这样一来, 薄膜铌酸锂可以同时实现极宽的带宽、低调制电压、低损耗和更好的传输效率。 铌酸锂进入门槛较高,全球玩家稀少。铌酸锂调制器设计难度大,工艺复杂,技术门槛 高,全球仅三家光通信厂商可以批量生产电信级别的铌酸锂调制器:日本的富士通 (Fujitsu)和住友(Sumitomo),美国 Lumentum 的铌酸锂调制器生产线(2019 年由光 库科技收购)。其他头部光通信设备厂家在计划研发或正在测试薄膜铌酸锂调制器产品。

三、光子的现在与未来—光交换/光计算

3.1 谷歌的光交换 OCS 体系

谷歌数据中心网络深度转型,OCS 顺利上马。为解决传统电交换机功耗较高、存在一定 通信延迟、通信协议异构、需要频繁升级换代的问题,谷歌应用了光路交换(Optical Circuit Switching,OCS)技术,通过两组微机电系统(MEMS)棱镜动态地将光纤输入端口折 射到输出端口,这些镜子可以进行二维旋转,自由构建端口到端口的光路。OCS 颠覆了 传统电交换机的原理,服务器发出来的数据包无需经过光电转换,也就是无需“换乘交 通工具”,极大降低了数据传输的延迟。

使用 MEMS 光路开关芯片的优势在于,可以实现低损耗,低切换延迟(毫秒级别)、低 功耗、低成本。MEMS 光开关的关键部件有:a)光纤准直器,b)相机模块,c)封装 MEMS 阵列,d)注入模块,e)二向色分光器和组合器。以 Palomar 型号为例,其使用 两个 MEMS 反射镜阵列工作。由绿线指示的带内光信号路径,与带内信号路径叠加, 850nm 波长通道(红色)用于调节反射镜。不需要光到电到光的转换或耗电的网络分组 交换机,从而节省了电力。

3.2 Intel 等为主的光计算芯片

当下,摩尔定律瓶颈问题凸显。目前台积电的商用制程已经达到 5 纳米级别,在研制程 已经升级到 3 纳米,并有望在 2024 年放量。3 纳米若再进一步升级制程就会触及原子级 别尺寸的微观空间,如此狭小的蚀刻电路沟槽中,晶圆的良率难以保证致使芯片制造成 本飙升,同时,“短沟道效应”凸显,5 纳米芯片普遍出现漏电现象,最终令芯片发热量 增加,耗电失控。因此,寻找一种可以突破摩尔定律极限的新型计算方式迫在眉睫。

光子具有光速传播、抗电磁干扰、光波任意叠加等特性,因此光子天生适合做数据并行 传输,因而光子芯片运算速度极快。光子学技术在计算机中的应用包含两个层次,一个 层次是利用光子作为传输信息载体的光互联技术,另一个层次是直接在光域实现信息的 处理和运算。 光计算芯片可以分为模拟光计算和数字光计算。模拟光计算最经典的就是计算机视觉中 的傅立叶变换,传统的进行二进制计算的点芯片处理傅立叶变换积分会消耗很大一部分 算力,然而光通过透镜的过程本身就是一次傅立叶变换。数字光计算与电计算相似,通 过构建逻辑门实现计算。

前沿学界正在尝试将光互联搬进芯片内。芯片外的光互联尺度已经越来越短,那么,在 芯片内若将电子结构一并改为光子结构,从理论上说可以进一步增强芯片性能,同时, 由于无需光电/电光转换,能耗进一步降低。 光透镜实现可编程,是光计算的重要里程碑。2017 年,沈亦晨等人发表了《Deep learning with coherent nanophotonic circuits》,开创性地提出可编程光计算单元,该论文提出一 种网络状干涉器,在光通过干涉器的时候,利用它们相互之间的干涉和对干涉器的控制 来进行线性运算,可以总结为用一个干涉器的集联来完成大规模的线性计算,以此应用 于人工智能的矩阵计算。 2023 年 5 月 31 日,中科院半导体研究所研制出一款基于光学计算的卷积处理器,与其 他光计算方案相比,该方案具有高算力密度和线性扩展性的优点,这标志着我国在光计 算方面有了重大突破。

光子计算芯片以光子为信息的载体具有高速并行、低功耗的优势,我们认为,光计算是 未来高速、大数据量、多矩阵计算的人工智能计算处理的最具有潜力的方案之一。目前 来看,全光计算还处于概念阶段,距离商业化应用较远,当下可以关注上文所述的硅光 芯片间互联,如硅光光模块、CPO 共封装光学等。

四、光子的更多场景—卫星+汽车

4.1 卫星光—星间激光

将光通信带入卫星一直是全球产业链发展的重要方向,与传统的微波或者无线电通信相 比,激光通信具有需要功率小,通信速率高,保密性好等特点,尤其是在卫星通信频谱 资源日益拥挤的时代,无需专用频谱的卫星激光通信有望加速发展,但与之相对的是, 星地之间的气象条件复杂,星地之间瞄准与捕获机制复杂等等痛点,一直制约了星地激 光通信的发展。从目前来看,虽然全球各国都积极进行了相关实验卫星或实验项目的尝 试,星地激光通信要成为主流仍然有较长的路要走。

但随着低轨星座的发展,星与星之间的激光通信有望率先起量,星间激光通信是指利用 激光束作为载波在空间进行图像、语音、信号等信息传递,具有传输速率高、抗干扰能 力强、系统终端体积小、质量轻、功耗低等优势,可以大幅降低卫星星座系统对地面网 络的依赖,从而减少地面信关站的建设数量和建设成本。 除了继承了上文中提到的优点外,由于星座间两星的距离较短,同时发射端与接收端同 处于太空环境中,不会受到云雨气象条件干扰的同时,激光的发射与捕获环节的技术难 度也相较星地通信低。 全球较早搭载星座间激光通信系统的是 Starlink 的 V1.5 卫星,最早的三颗 V1.5 卫星于 2021 年 6 月发射,截止目前,共有近 3000 颗 V1.5 卫星在轨运行,凭借星间激光通信,星链得以像诸如南极洲等信关站难以部署的地区提供稳定的卫星互联网服务。

与传统的地面光通信类似,卫星激光通信所用的设备也由光学部分和电学(通信)部分 组成,与地面不同的是,卫星上由于两颗卫星之间相对位置高速变化,对于接受系统也 提出了更高的要求。

光学分系统由光学天线、中继光路及各收发光学支路构成,各部分紧密衔接,共同实现 激光信号的高质量收发。跟瞄分系统由粗跟踪单元、精跟踪单元、提前量单元等构成,主要完成空间光信号的瞄准、捕获、跟踪,利用具备方位和俯仰功能的跟瞄转台,加上 控制信号的计算与处理,实现需要通信的两颗卫星激光通信光学天线的精确对准,并保 证双方互发的激光信号能通过光学分系统进入对方的通信分系统。通信分系统由激光载 波单元、电光调制单元、光放大单元、光解调单元等构成,主要完成卫星激光通信系统 光信号的调制/解调、光放大及信号处理等功能。 从目前的主流方案来看,主流的星间激光通信主要有两种调制方式,非相干与相干,非 相干通信体制采用强度调制/直接探测(Intensity Modulation/Direct Detection,IM/DD) 方式,分为开关键控( On-Off Keying,OOK )和脉冲位置调制( Pulse Position Modulation,PPM)。相干通信体制采用相位调制/相干探测方式,分为二进制相移键控 (Binary Phase-Shift Keying,BPSK)/零差(外差)相干探测、差分相移键控(Differential Phase-Shift Keying,DPSK)/自差相干探测、正交相移键控(Quadrature Phase-Shift Keying,QPSK)/零差(外差)相干探测等。 相干调制具有精度高,传输速率高,传输距离长等特点,但是由于其需要额外的电路元 件,同时由于运行环境处于太空,需要对这部分电路元件进行抗辐照处理,因此成本较 高。

由于目前 Starlink 尚未公布其星间卫星通信的主要参数,我们只能参考当前主流的卫星 激光通信产品的参数与调制方式。从已公开数据来看,当前海外主要低轨星座的卫星组 件都采用了相干中的 BPSK 调制模式,主流通信速率均为 10Gbps 左右。

我国的光通信行业经过多年发展,在相关激光器,光放大器等组件上已经形成了较为成 熟的产业链,卫星通信上的光学部分与通信部分与地面光通信有着较高的相似度,我国 有望凭借在传统光通信行业上的深厚积累,快速追赶欧美先进水平,除了国产星座搭载 激光通信载荷外,随着全球星间激光链路放量,国内光器件厂商也有望切入全球市场。

4.2 汽车之光—激光雷达

激光雷达是以发射激光束对目标进行探测、跟踪和识别的雷达系统,激光雷达通过将接 收到的反射信号与发射信号进行比较、进行数据处理之后,可获得目标的距离、方位、 高度、速度、姿态甚至形状等特征参数。 激光发射系统:用于制造、生成激光,光线经由激光发射器发出,通过控制光线方向和 线数的光束控制器,最后通过发射光学系统校正后发射。 激光接收系统:被反射的光经接收光学系统汇集后,光电探测器将接收到的反射光转化 电信号。 信息处理系统:接收到的信号经过放大处理和数模转换,经由信息处理模块计算,获取 目标表明形态、物理属性等特性,最终建立物体模型。 扫描系统:主要用于扩大光源的探测范围,并产生实时的平面图信息。 激光雷达&光通信,产业进入加速整合期。激光雷达产业链与光通信行业具有高度协同 相关性。

首先,从产品结构看,光模块和激光雷达主要部分均包括激光发射模块和接收模块。光 模块实现光电信号的转换,主要包括 TOSA、ROSA 以及滤光片、棱镜等光学元件,其中 TOSA 中的主要器件为激光发射器和激光驱动器,ROSA 中的主要器件为探测器和放大器。 其次,从激光波长来看,光模块和激光雷达的光波段高度重合。光通信主要采用波长为 850~1650nm 的电磁波,目前重点应用的波长有 850nm、1310nm 和 1550nm 三种,对 应频率由高至低,传输距离由短及长。而激光雷达的主流波长为 905nm 和 1550nm,与 光通信波段高度重合。 905nm 和 1550nm 方案有何不同?905nm 方案可以用硅做接收器,成本低且产品成 熟;1550nm 需要用 Ge(响应速度稍低)或者 InGaAs 探测器,且该波段对人眼更加安 全,这样可以发射更高的激光功率以达到更高的测距灵敏度和信噪比。我们认为,两种 方案未来有望相辅相成,1550nm 雷达可用于检测汽车前方或后方数百米的障碍物,更 便宜的 905nm 雷达则专注于感知汽车周围环境。

将三者对比来看,ToF 最大的优势是利用现有的光通信产业链能迅速搭建测试环境,产 业化进程较快。从长远来看,FMCW 通过出色的环境光抗干扰性能、人眼安全性、高信 噪比、更远的探测距离,有望占据激光雷达市场的一席之地。 此外,从激光器技术路线看,均主要采用 EEL 和 VCSEL 激光器。车载激光雷达主流采用 EEL 和 VCSEL 两类半导体激光器,而在光模块的 TOSA 组件中,同样以半导体激光器类 型为主,VCSEL 主要用于多模光纤模块,DFB/FP/DBR 主要用于单模光纤模块。 最后从生产工艺和产线的角度看,激光雷达本身量级较光通信体量差距较大,光通信厂商可复用现有产线快速进行切换,其成本可控。光通信厂商可以满足激光雷达产业链快 速扩产的要求。 随着激光雷达的陆续上车和点云数的提升、摄像头和超声波雷达的数量和精度增加,使 得大算力冗余、算力先行成为主机厂的共识,以提高车端神经网络算法的深度和精度, 带来实时行车场景数据识别准确率、L3、L3+高阶自动驾驶落地确定性的提升,2023 年 进入智能汽车算力“军备竞赛”元年,我们预计,2024 年将进入大规模放量元年,加速 汽车产业 L3 及 L3+智能驾驶渗透率的向上拐点。据沙利文数据预测,2025 年中国激光 雷达市场规模有望达到 43.1 亿美元,较 2019 年实现 63.1%的 CAGR。

头部激光雷达公司营收持续增长,映证激光雷达需求。随着产业链趋于成熟,激光雷达 行业参与者众多,竞争较为激烈,但头部厂商仍然保持着营收体量稳健上涨的势头,证 实了激光雷达潜在市场广阔,能够容下较多厂商参与。

中低端车型迎来激光雷达市场下沉,高端车型单机线数“内卷”。随着激光雷达成本不 断降低,以往只有理想 L7 等高端车型才能选装的激光雷达下沉至 20 万元左右的中端车 型,我们认为未来有望进一步下沉至 10 万级别的低端车型中。高端车型上,为提升激光雷达分辨率和识别稳定性,单机线数竞争激烈,12 月底发布的问界 M9 配置 192 线激 光雷达,最远可探测距离达到 250 米,点频达到业界最高的 184 万点/秒,扫描频率达 到 20Hz。

总结来看,激光雷达是光通信产业链切换下游赛道获得全新增长空间的优良机会,伴随 激光雷达技术成熟度越来越高,叠加 L3 级别自动驾驶铺开,激光雷达有望迎来广阔市场 空间,带动上游光通信获得全新的 EPS 增厚的机会。

五、边缘计算:始于 AI,赋能应用

5.1 模型由大到小,AI 走上应用的快速路

随着 GPT-4 的发布,标志大语言模型正式迈入了多模态时代,参数量近一步膨胀。4 月 份,OpenaI 创始人 Sam Altman 在一场 MIT 举办的活动上表示,“未来的 AI 进展不会 来自于让模型变得更大”,我们认为,这代表着 OpenaI 之后的努力将会更多的转向如何 让现有的大模型更好用,渗透进更多的场景。 2023 年五月初的几大变化,让我们更加坚信了,万物搭载模型,模型赋能万物的时代 正在加速到来。知名华人 AI 研究者陈天奇牵头开发的 MLC-LLM 解决方案,MLC LLM 为 用户在各类硬件上原生部署任意大型语言模型提供了解决方案,可将大模型应用于移动 端(例如 iPhone)、消费级电脑端(例如 Mac)和 Web 浏览器。

MLC 的主要功能包括了: (1)支持不同型号的 CPU、GPU 以及其他可能的协处理器和加速器。 (2)部署在用户设备的本地环境中,这些环境可能没有 python 或其他可用的必要依赖 项;通过仔细规划分配和积极压缩模型参数来解决内存限制。 (3)MLC LLM 提供可重复、系统化和可定制的工作流,使开发人员和 AI 系统研究人员 能够以 Python 优先的方法实现模型并进行优化。MLC LLM 可以让研究人员们快速试验 新模型、新想法和新的编译器 pass,并进行本地部署。

MLC-LLM 等模型给中小开发者提供了低成本,快速训练专属于自己的小模型的完整工具, 而 MLC-LLM 则为中小开发者在算力较低的环境或者边缘进行模型的推理搭建了基础,三 大工具,我们认为已经形成了 AI 走向边缘的“基建雏形”。 硬件赋能,AIGC 在边缘端的革命进一步加速。2023 年 2 月,高通演示了 10 亿参数规 模的 Stable Diffusion,6 月完成了在终端运行参数量更大的图生图模型 ControlNet。在 2023 骁龙峰会上,高通推出新一代旗舰移动芯片骁龙 8Gen3、旗舰 PC 芯片骁龙 X Elite 和音频芯片S7系列。其中骁龙8Gen3专为AIGC定制,与前代相比,其AI性能提升98%, 支持本地运行 100 亿参数的大模型;骁龙 X Elite AI 处理速度达到竞品的 4.5 倍,异构 AI 引擎性能达 75 TOPS,支持本地运行 130 亿参数的大模型。本次发布的骁龙 8Gen3 进一步为边缘端大模型优化,不到 1 秒就能使用 Stable Diffusion 生成 1 张图像,在运行70 亿参数的大语言模型时,每秒可以生成 20 个 Token,超过了人类阅读的速度。我们 认为,云端协同的“混合 AI”路线有望帮助移动端 AI 应用成长为“完全体”,手机进行 内容输出的效率远低于 PC,但未来在本地运行的 AI 加持下,用户得以将少量的输入转 化为大量输出,这便是混合 AI 的重要意义之一。

“本地运行 AIGC”有望成为智能手机、PC 的新卖点。AI 能力近年始终作为智能手机 的辅助功能,常用于广告算法、应用推荐、照片标记等不痛不痒的后台能力。当下随着 终端芯片足以支持本地大模型快速处理 Token,AI 能力有望走向台前,和用户直接交互 并生成内容。本地推理大模型在成本、时延、隐私上具有天然优势,也可以作为桥梁, 预处理海量复杂 Token,并将其导向云端大模型,搭载 AI 能力的终端芯片,作为 AI 触 及万千场景的血管地位加速明晰。消费电子近年来始终存在创新困局,而混合 AI 的出现, 有望创造新的使用场景从而刺激终端换机。 英特尔发布酷睿 Ultra 处理器,开启 AIPC 新纪元。AIPC 集成了 AI 应用加速 NPU 单元, 可以方便地让用户通过大模型进行新的交互并有效地提高日常办公的效率和质量,同时 也在有望 PC 上部署专业的边缘 AI 模型进行本地化 AI 创作,AIPC 有望彻底改变 PC 用 户的使用习惯和场景,也改变了 PC 产业的发展未来,PC 由个人计算终端升级成了个人 AI 应用中心。

总结来说,除了开源社区、前沿学者正在不断加速模型的可用性,以及边缘推理的探索, 越来越多的大厂也加入到了布局边缘模型的新一轮“军备竞赛”中来,我们认为,随着 两方的共同努力,一个由“基础模型”,“低成本定制工具”,“模型优化工具”三者共同 构建的边缘模型生产与利用体系将会飞速发展。AIoT 类业务 2023 年受到消费需求以及 价格竞争影响,整体处于预期低位,2023 年,高算力骁龙、英特尔新品完成硬件铺路, 可以静待后续应用跟进。

5.2 应用曙光已现,期待 AI 飞轮下的百花齐放

当下市场以及投资者关注的应用方向,主要集中于基于云端算力的如 ChatGPT, Midjourney,Copilot 等等,而提起边缘智能设备或者边缘应用时,则更多的将其作为一 种“入口”,或是直接忽略“边缘算力”与 AI 结合的可能。 其实 AI 在边缘侧的应用或者“渗透”由来已久,其中最典型的案例便是如人脸识别,图 像处理等分析式 AI 功能。我们日常生活中见到的如自动驾驶,智能零售、智慧工厂、智 能巡检等场景均是由边缘或者本地端提供算力进行解决。如英伟达的 Orin,地平线等公 司的智能驾驶芯片,就是边缘算力运行 AI 模型的例子,自动驾驶芯片通过每秒分析上千 帧画面,来保证车辆对前方路况的理解并做出相应反应。同时,模组厂商也在积极探索如何让模组算力更好的参与进车辆自动驾驶功能中来,如美格智能最新的 C-V2X MA925 系列模组,在帮助 T-BOX 与外界通信的同时,自身搭载的算力能够提供 GNSS 服务,并 能够内生解决 V2X 的运行,让 T-BOX 不再需要额外挂载处理芯片。

不难发现,当前运行在边缘端的 AI 模型,更多的是以传统的图像识别形式存在的“分析 型”AI,而我们认为,真正能够让边缘算力需求扩张,或者打开边缘 AI 天花板的“生成 式”AI,则是下一阶段乃至未来需要在边缘应用侧更加关注的重点,在“生成式”AI 在 边缘设备的部署上,我们更愿意用本段标题中的“曙光已现”来形容,各个大厂的先期 产品和布局让我们看到了“生成式”走进边缘的路径和初步方案,接下来,我们将会介 绍两大方向,并阐述为什么边缘算力对这些场景是不可或缺的。

边缘应用方向 1:基于生成式模型的“智能助理”

智能助理这一概念,最早火爆,是伴随“Siri”的推出,消费者第一次系统性的认识到了 基于语音唤醒的智能助理这一概念。然而随着多年发展,这一形式的智能助理除了搭载 平台扩充到了如车机、智能音响、扫地机器人等平台外,其本质内核仍然没有改变,依 旧是基于对语音输入关键词的截取,在功能库中寻找对应的功能。并不具备主动生成的 能力。 AI Agent(人工智能体)在大模型快速发展的驱动下进入加速成长期。诸如 GPT 等 LLM 应用在更新信息、处理多轮对话和面对复杂任务时依然存在局限,AI Agent 通过增加规 划、记忆和工具使用三大能力克服了这些局限,极大扩展了大语言模型的应用范围,使 其能够胜任更加复杂的任务,这为 AI Agent 扮演人类日常生活的“助理”提供了可能。

汽车是 AI Agent 最具潜力的应用场景之一。车主在驾驶时,需要既快又准地对汽车进 行操作,在座舱还未智能化的时代,这种操作依靠机械按钮、操作杆进行,而未来的人 车交互愈发向中控屏幕集中,传统的操作习惯就需要改变。而 AIAgent 的能力则贴合了 这种需求:快速响应、准确理解命令和无手操作,而 AI 赋予的智能化可以将 Agent 的能 力进一步外延,这些抽象的能力具象到应用场景中,可以将 AI Agent 的能力总结为 5 个 层次:辅助操作、车身数据采集&可视化、汽车服务(导航、保养、保险等)、生活助理、 具身智能。

此外,我们观察到了海外爆火的应用“Rewind”,通过记录笔记本电脑的屏幕输出信号 与麦克风信号,并形成数据库,最后基于这些数据库与自有模型,帮助用户回忆,总结 在电脑上看到的,处理过的所有资料,大大提高了用户的工作效率。

基于两点应用方向和现在出现的应用趋势,我们判断,边缘算力将在“智能助理”类应 用的发展和商业化上起到重要作用,第一,智能助理面对的是海量用户,这些用户所提 出的 Prompt 将是及其复杂或者存在非常多的冗余,如何通过本地小模型,对用户的需 求进行预处理,从而将需要云端算力处理的 Token 将至最低,甚至对于不复杂的推理需 求,可以通过本地算力直接响应客户需求。第二,对于像“Rewind”、汽车智能座舱这类涉及到用户隐私资料的部分,为了保证用户安全,所有的数据归纳将会完全依靠本地 算力进行。因此,在降本,隐私方面,边缘算力对于“生成式智能助理”能否形成商业 闭环,至关重要。

边缘应用方向 2:具身智能

具身智能是指能够理解、推理并与物理世界互动的智能系统。AIGC 的“智能”表现在 能够进行上下文理解和情景感知,输出文字、图像、声音,而具身智能能够在物理世界 中进行操作和感知,输出各种机械动作。通过物理环境的感知和实际操作,具身智能可 以获得更全面的信息和数据,进一步提高对环境的理解和决策能力。按照具身智能的定 义,目前具身智能的实例繁多,其中包括人形机器人、自动驾驶汽车等。 基于现在具身智能展现出的能力,我们认为,具身智能的两大核心是负责算力的芯片和 与外部通信的模组。当前物联网模组进入智能化时代,集成了边缘算力的智能模组正在 逐渐成为支撑边缘算力的核心形式。具身智能将边缘算力需求提升到了一个新高度,具 身智能的“大脑”不仅要处理视觉信息、生成提示词,更要负责输出指令来执行机械动 作,例如特斯拉针对人形机器人开发了 DOJO D1 芯片,充沛的算力(362 TFLPOS@FP8) 驱动 Optimus 机器人流畅地执行各种任务。因此我们认为,在移动芯片无法满足所需算 力的场景下,边缘 IDC 将是算力的有效补充措施。

此外,通信能力也是决定机器人能力的核心。具身智能的通信强调低时延、多连接、连 续性能力,例如自动驾驶汽车上,L4 级别需要带宽>100 Mbps,时延 5-10ms。具身智 能未来也有望进化成结构复杂、体型庞大或者多点分布的产品,各子模块之间需要信息 融合、多维感知、协同运行,本身也会需要稳定高速的无线连接。我们认为,未来具身 智能将会越来越强调边缘通信能力与边缘算力的匹配和耦合,而两者结合的较佳形式, 算力模组,将有望成为具身智能的“大脑”。

5.3 物联网:复苏与扩张共振

伴随万物互联的趋势进一步加速,海内外物联网行业发展稳步进行,连接数持续增加。 物联网是万物数字化的首要基础,更是后续智能化、算力化的必备条件,物联网从产业 链角度来看可以分成四大级别,从基础的设备层到网络层、平台层、应用层不断升级, 设备层包括了物联网模组和基础的传感器等零部件,智能终端首先需要具备联网的通讯 模组才能截图物联网系统,因此模组与连接数/智能终端存在一比一甚至多比一的关系, 因此从连接数来看,能够大概反映出物联网行业整体景气度,经历过前几年的低谷期, 目前连接数逐步提高,物联网行业景气度逐步攀升。

从国内看-物联网用户绝对数稳步提升:2023 年是《物联网新型基础设施建设三年 行动计划(2021—2023 年)》的收盘之年,据工信部统计,最新数据截至 2023 年 11 月末,三大运营商蜂窝物联网终端用户达到 23.12 亿户,比上年末净增 46772 万户,占移动网终端连接数的比重达 57.3%。

从全球看-物联网连接数继续维持稳步提升态势:根据 IoT Analytics,2022 年全球 物联网连接数量增长 18%,达到 143 亿个活跃物联网端点,预测到 2023 年,全 球联网 IoT 设备数量将再增长 16%,达到 167 亿个活动端点,增速略有下降但是 设备连接数依旧保持增长态势。

物联网按照通信方式可以分为 wifi\蓝牙\蜂窝三大类,蜂窝物联网领域中国移动占据首 要份额,对应产业链空间较大且稳定,下游供应链值得重视。根据 IoTAnalytics,Wi-Fi 占所有物联网连接的 31%。到 2022 年,全球出货的支持 Wi-Fi 的设备中有一半以上基 于最新的 Wi-Fi6 和 Wi-Fi6E 技术,主要应用在智能家居、建筑和医疗保健等领域;全球 27%的物联网连接依赖蓝牙连接,设备能够在消耗有限的功耗的同时保持可靠的连接; 蜂窝物联网(2G、3G、4G、5G、LTE-M 和 NB-IoT)目前占全球物联网连接的近 20%, 2022 年全球蜂窝物联网连接同比增长 27%,远远超过全球物联网连接的增长率,主要 得益于 2G 和 3G 等旧技术的逐步淘汰,2023 年,排名前五的网络运营商(中国移动、 中国电信、中国联通、沃达丰和 AT&T)占据全球 84%的蜂窝物联网连接,从物联网收 入来看,前五名网络运营商占据了物联网网络运营商市场的 64%,其中中国移动、AT&T、 德国电信(包括 T-Mobile)、中国联通和 Verizon 领先市场。

物联网下游应用具有碎片化和长尾化的特征,其中智能汽车、笔记本电脑、网关 CPE 等相对的大颗粒市场,均呈现良好的复苏趋势。物联网涉及多种行业,构成其下游碎片 化特征的重要原因之一,此外物联网单品众多但是出货量均难以形成大规模效应,如自 动售货机、监控设备、智能城市设备如智能井盖/智能路灯等等。在各个下游应用场景中, 具备部分定制化需求的场景逐步形成较大规模的出货,成为物联网中大颗粒场景,如智 能汽车联网需求、笔记本电脑联网模块需求、网关/FWA/CPE 需求等。在经历过去两年 的原材料紧缺、库存积累、全球经济承压后,几个大颗粒市场复苏迹象较为明显。

智能汽车:自动驾驶、智能驾驶需求逐步落地,5G 渗透率逐步提升。在智能汽车 中物联网产品主要是指前装 T-Box,作用是整车的通讯接头,目前 4G T-Box 渗透率 较高,5G 渗透率尚存在较大空间,伴随 5G 制式迭代升级加速、智能/自动驾驶 OTA 的升级需求不断提速,车载 T-BOX 装置率尤其是 5G 的渗透率逐步提升。在乘用车 市场,根据高工智能汽车研究院监测数据显示,2023 年 1-10 月中国市场乘用车车 联网前装标配 1301.24 万辆,同比增长 23.69%,标配搭载率 77.78%;其中,前装 标配 5G 车联网交付上险 131.99 万辆,同比增长 245.61%;但 5G 前装搭载率仍不 到 10%(为 7.89%)。基于目前国内 5G 发展整体略快于海外,我们认为,5G 车载 T-BOX 有望率先在国内迎来规模出货,移远通信、广和通、美格智能等模组厂商均 积极部署 5G 车载模组,在国内还细分为数传模组和自带 SOC 芯片的智能模组,有 望率先把握 5G 机遇;展望海外,4G 车载前装在稳步推进中。

笔记本电脑:出货量下滑趋势缓解,内置蜂窝模组渗透率逐步提高。在笔记本 电脑中的物联网产品主要体现为PC联网模块,按照制式主要区分为4G和5G, 其中 4G 部分又可以进一步细分为 CAT9/12/16 等不同级别,笔记本联网的细 分市场主要在于商务本。前两年受制于整体消费电子的低迷和累计电脑库存难 以消化,笔记本联网模组也经历了低谷期,但伴随 2023 年逐步接近笔记本电 脑新一轮的换机潮,叠加商务本的联网渗透率稳步提升,PC 侧模组出货的回 暖趋势较为显著。根据 Canalys 数据,2023 年第三季度,全球个人电脑市场继 续回升,总出货量为 6560 万台,同比下滑 7%,但较二季度,回升了 8%,出 货量创下近一年内的最低跌幅,进一步体现了库存水平的恢复和相关需求的反 弹。据 Strategy Analytics 统计,2021 年全球 5G 移动 PC 渗透率为蜂窝笔电的 5%,约 60 万台,2022 年上涨至 8%,约 100 万台;Strategy Analytics 预计, 2025 年蜂窝笔电全球出货量将达到 1430 万台,其中支持 5G 占比将增长至 65%,即增长至 929.5 万台。

网关/CPE/FWA:海外 5G 加速落地带动模块市场新机遇。FWA 是一种无线接入 技术,通常用于提供固定位置的宽带互联网接入服务,其方式与标准固定线路连接 中使用的调制解调器和路由器类似;国内光纤光缆较为成熟因此较少用到 FWA 业 务,主要使用群体是海外客户为主,FWA 网关的直接客户以海外运营商为主,北美 是全球固定无线接入市场占比较大的地区,在固定无线宽带技术的投资较多。目前 海外正在经历 4G 加速切换到 5G 的通信产业制式升级周期,借助 FWA 将 5G 完成 最后一英里的连接,可以消除部署和维护物理线路相关的成本和时间延迟;而且此 前 4G FWA 在使用体验中由于速度和可靠性不够快,不足以替代固网宽带的需求, 随着 5G 带来的速度提升,5GFWA 有望成为移动宽带和标准固定线路连接之间的汇 聚点。根据 statista 预测,到 2026 年,预计 5GFWA 连接数将达到 7182 万个,到 2030 年,5GFWA 可能占所有连接数的 21%。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。「链接」

灼识科技: 深耕光通信行业十余载 助力行业高质量发展

成立于2013年的四川灼识科技股份有限公司(下称“灼识科技”)是一家专业从事光通信设备研发、制造、销售的国家高新技术企业、省级“专精特新”企业、成都市新经济培育企业。

灼识科技研发生产的光纤熔接机可实现自动切纤、自动放纤、5秒熔接、15秒加热,极大提高了熔接效率。该产品已销售到100多个国家和地区,海外市场占有率超70%。

灼识科技凭啥占领如此大的市场份额?它发展历程中两个重要时刻的果断抉择,是其生存和发展壮大的关键。

第一次抉择:

“跟风模仿”还是自主创新?

光纤通信就是利用光波作为载波来传送信息,而以光纤作为传输介质实现信息传输,达到通信目的的一种新通信技术。

“严格意义上来说,我们并不是这个行业传统的制造者,而是属于‘门外汉’。2013年,公司才开始接触这个行业,并且开始从事这个行业的。”灼识科技董事长罗春晖介绍,当时一个偶然机会,了解到国外一款光纤熔接机价格高达4万多元,而国内却没有企业能生产。看好光纤熔接机的巨大市场,罗春晖暗下决心,不仅要把产品做出来,还要把价格打下来。

摆在灼识科技面前的只有两条道路,要么“跟风模仿”,要么自主创新,怎么走?罗春晖毅然决然选择了后者:灼识科技从高校和研究机构招来有专业技术背景的人才,组建了一支技术团队。

“光纤熔接机的对准精度非常高,两个光纤的对准精度在100纳米这个级别。涉及到图像识别技术、精密调新技术等,在当时,如果我们去模仿国外企业,是做不出来的。”罗春晖记忆犹新地说,我们集思广益,发明创造了一整套东西,相当于重新构建了一款光纤熔接机。

因为技术创新也颠覆了光纤熔接机的成本。灼识科技的光纤熔接机以8000多元的价格完美代替国外进口产品,不仅在国内迅速走红,也受到国际市场的追捧,产品远销到北美、南美、欧洲、非洲等100多个国家和地区。

第二次抉择:

打“价格战”还是“价值战”?

2020年前后,灼识科技又走到一个十字路口,在众多企业模仿下,它面临新的选择,打“价格战”还是“价值战”?企业果断地选择了后者。

“现在有很多企业都在从事光通信设备制造,我们跟他们不同的是我们一直在创新,我们不会以低价来作为卖点,而是以价值来赢得市场。”罗春晖说,灼识科技在研发上面没有上限,鼓励员工新发明、新方法,企业愿意为试错买单。

正是凭着这种思想,灼识科技产品通过欧盟CE、ROHS、美国FCC、英国UKCA等国际认证;通过国家质量监督检验所、中国信通院、泰尔实验室的合格检测,获得近百项各类专利。

同时,企业产品也越来越智能化、人性化。以该公司多款光纤熔接机为例,机器采用工业CPU,响应速度快,最高300倍聚焦放大可实现5秒极速纤芯对准熔接,15秒加热,工作效率相对于普通熔接机提高50%,在高原、极寒、沙漠等恶劣条件下严格测试,性能依然表现出色。

记者注意到,看似小巧精美的光纤熔接机工具箱,打开后却自带板凳和操作平台,极大方便技术人员在户外工作使用。“人性化工具箱,带板凳的专利设计,开机便可进入工作状态……这些,我们都是从用户的角度考虑设计的。”罗春晖说道。

如今,灼识科技已经成长为光通信行业的知名品牌,被广泛应用于电信、移动、联通等运营商、工程公司和事业单位的光缆线路施工、维护、应急抢修,安防监控以及科研院所的研究、教学等,企业年产值过亿元。

“今年一季度我们完成了4800万元产值,我们的成绩离不开恰巧赶上通讯‘大爆发’的红利。接下来,企业将坚持可持续健康发展之路,持续创新研发,让产品的品质与技术革新始终处于行业前列,为客户提供全方位技术及服务支持。”罗春晖信心满满。

记者手记:既要埋头苦干,也要抬头看路

企业发展,既要埋头苦干,也要抬头看路。纵观灼识科技发展的历程,企业面对抉择的果断令人印象深刻。虽然抉择伴随一定的风险和代价,但灼识科技勇于承担,最终获得了更好的发展,在市场中成为领跑者。

并且,灼识科技的抉择体现出充分的长期眼光。无论是自主研发,还是强调产品智能化,都为企业的发展留出了更多的空间和可能性。此外,在大胆的抉择背后,灼识科技也重视产品和服务。专注本业,踏实抓好产品质量,当好客户的服务者。这份务实,也可以说是抉择的底气,值得更多企业借鉴。

记者 刘小莉 文/图 实习记者 徐子清

相关问答

天翼看家卖点?

用户仅需提出需求,中国电信工程师就能针对性提供适合使用的解决方案,并提供免费上门入户专业化安装服务,一站式解决家庭宽带、设备安装、设备绑定、业务开通等...

手机是通讯工具,可是拍照却成了主要卖点,算不算本末倒置呢?

手机在过去只是一款通讯工具,iPhone推出以前的手机,仅仅只是实现快速沟通,可以拨打电话和发送短信的效率工具,但在近几年里,手机存在的价值已经不只限于通讯...

华为手机的卖点是什么-ZOL问答

华为手机的卖点主要有以下三个:华为手机的信号很好:众所周知华为是一家做通信技术的公司,所以它的手机的信号肯定是领先的。华为手机的质量有保证:华为的大部...

移动互联网有什么特点与优势?

移动互联网的特点1.用户体验至上:如果一个商品或一项服务想要成功,在移动互联网时代,谁更加了解消费者的需求,如何了解消费者体现简单、精准的用户体验上,...

京东电子产品最好卖的是什么?

销量,一直是决定一款手机好坏最直接的标准,同时也是各大手机厂商进行排位的依据。但是一款手机的销量如何,手机厂商是不会公布的,一些统计机构也仅是公布总数...

重金补贴的智能温室,为何如此受青睐?

我们需要用有限的资源养活不断增长的人口,让他们吃饱、吃好。农业的问题,却又不只是吃饭问题。这是一个全球化的时代,美国跨越太平...一、什么是智能温室?智能...

基础设施费包括哪些?有哪些项目呢-找法网

然后自己卖点菜,卖点水果,这些,请问一下,他是不是需要缴纳基础设施费呢?基础设...基础设施主要是指与开发产品相关的道路、供热设施、供水设施、供电设施、供气...

搭载上“歼20”御用的“PL-15”,枭龙的表现如何?

枭龙FBC-1战斗机是一款发展潜能很大,而且改进型性能提升很大的战斗机,如今的枭龙BLOCK-3型战斗机,已经是一款真正意义上的第四代半战斗机了,当然,由于它是轻...

世界上著名的即时通讯工具有哪些?

AGOO:较新的即时通讯工具。将通讯、游戏、档案寄存的功能三合为一。拥有精密的讯息加密技术和全球独有的“随身宝”功能,但人气欠缺是其面临的最大困境。还...

华为智选“千元机”,超50万人购买好评率97%,卖点究竟在哪里?

没有芯片之后,华为发布新机的节奏也慢了下来,不过华为曾多次强调自己不会放弃手机业务,在尽可能保证产品发布的同时,华为还为消费者提供了智选平台,吸纳其它...

 吴福民  店面设计 
王经理: 180-0000-0000(微信同号)
10086@qq.com
北京海淀区西三旗街道国际大厦08A座
©2024  上海羊羽卓进出口贸易有限公司  版权所有.All Rights Reserved.  |  程序由Z-BlogPHP强力驱动
网站首页
电话咨询
微信号

QQ

在线咨询真诚为您提供专业解答服务

热线

188-0000-0000
专属服务热线

微信

二维码扫一扫微信交流
顶部