一、“AI 革命”,服务器芯片量价齐升
1.1 算力:核心硬件 GPU,大模型带动需求激增GPU 用途由图形处理拓展至计算。GPU 是图形处理器的简称,它是一种专门用于处理图 形、视频、游戏等高性能计算的硬件设备。GPU 相对于传统的中央处理器(CPU)而言, 其拥有更多的计算核心和更快的内存带宽,能够大幅度提高计算效率和图形渲染速度。 现阶段,随着例如英伟达 A100、H100 等型号产品的发布,GPU 在算力方面的优势相较 于其他硬件具有较大优势,GPU 的工作也从一开始的图形处理逐步转化为计算。 根据用途和性能表现,GPU 可以分为专业卡和消费级卡两类:专业卡通常用于工程、科 学、医学等领域的高性能计算和大规模数据处理,主要厂商包括英伟达、AMD 等;消费 级卡则主要用于普通家庭和游戏玩家,主要厂商包括英伟达、AMD、英特尔等。目前 GPU 在硬件中拥有最高的算力,成为最适合支撑人工智能训练和学习的硬件,我们 认为其原因主要在于: 更多处理单元:GPU 相比于 CPU 等其他硬件有更多的处理单元(核心数更多),因 此可以并行处理更多的数据。主要系 GPU 最初是为了图形渲染而设计的,而图形渲 染涉及的计算是高度并行化的。这种并行化的特性使 GPU 非常适合进行机器学习和 深度学习这样的大规模数据并行计算。 具有更高的内存带宽和更大的内存容量:在进行深度学习等计算时,需要大量的内 存和高速的内存带宽来存储和处理海量数据。GPU 相比于其他硬件(如 CPU),具 有更高的内存带宽和更大的内存容量,可以更有效地存储和处理数据,从而提高计 算速度。具有专门的计算单元:相较于其他硬件,GPU 具有例如张量核心和矩阵乘法等计算 单元,可以更快地执行常见的机器学习和深度学习操作:如卷积和矩阵乘法。这些 计算单元与通用计算单元相比,具有更高的效率和更快的速度。GPGPU——为计算而生。GPGPU 全称是“general-purpose computing on graphics processing units”,简称“通用图形处理单元”,其主要利用 GPU 的功能来执行 CPU 的 任务,虽然在设计初期是为了更好地图形处理,但是多内核多通道的设计使其非常适合 科学计算,发展至今 GPGPU 也成为了专为计算而设计的硬件。多领域驱动,GPU 千亿美金市场拉开序幕。GPU 市场规模的大小取决于多种因素:其中 游戏和娱乐市场一直是 GPU 市场的主要驱动力,因为这些领域需要高性能的 GPU 来支 持更高质量的游戏画面和娱乐内容。同时人工智能和机器学习的发展对 GPU 市场也有着 巨大的影响,因为这些技术需要大量的计算能力,而 GPU 可以提供比 CPU 更高的效率。 此外,科学和研究领域的需求以及新兴市场(如游戏机和数据中心)也对 GPU 市场的规 模产生了影响。根据 Verified Market Research 数据,2021 年全球 GPU 市场规模为 334.7 亿美金,预计到 2030 年将达到 4473.7 亿美金,期间 CAGR33.3%。
LLM 模型带动算力需求: 算力是指计算机系统能够完成的计算任务量,通常用来描述计算机的处理能力。算力的 单位通常采用 FLOPS(Floating Point Operations Per Second)表示每秒钟能够完成的浮 点运算或指令数,例如一台计算机每秒钟可以完成 10 亿次浮点运算,那么它的 FLOPS 值就是 10 GFLOPS(10 Giga FLOPS)。目前我们以全球龙头英伟达在 2020 年发布的 A100 产品为例,根据英伟达官方介绍,A100 的理论浮点运算性能可以达到 19.5 TFLOPS(19.5 Tera FLOPS),即每秒 195 万亿次浮点运算。大型语言模型(Large Language Model,简称 LLM)是一种使用深度学习算法处理、理 解自然语言的基础学习模型。LLM 基于数亿到数千亿个参数的神经网络,通过训练数据 学习自然语言的规律和模式,并能够生成高质量的自然语言文本。这些模型的训练需要 大量的计算资源和海量的文本数据,因此需要使用分布式计算和大规模数据处理技术。 目前,LLM 模型能够在例如语音识别、文本摘要、智能翻译等领域中实际应用,但是 LLM 模型大规模应用目前仍然存在一些挑战和限制:需要大量的训练数据和计算资源,很难 处理语言的多样性和不确定性。GPT-3 开启大模型时代。GPT-3 是由 OpenAI 研发的一种基于深度学习的自然语言处理 模型,其使用了大量的语料库进行预训练,使其能够理解语言的规则和模式,并生成与 输入文本相关的自然语言文本,GPT-3 的主要特点是它具有大规模的预训练模型,而同 时大规模的训练模型与之对应的便是庞大的算力需求,根据 OpenAI 团队成员 2020 年 发表的论文《Language Models are Few-Shot Learners》,GPT-3 模型拥有约 1750 亿参 考量,这使得 GPT-3 拥有其他较少参考量模型来说更高的准确性。同时基于 1750 亿参 数的模型仅需少量的样本训练,就能够接近于 BETR 模型使用大量样本训练后的效果。 我们认为,大模型无论在性能还是在学习能力上,相较于其他模型都具备明显优势,未 来或将成为行业趋势。
伴随大模型的明显优势,与之而来的则是对于算力要求的显著提升。以 GPT-3 为例,其 1750 亿的参数,如果以英伟达旗舰级 GPU 产品 A100 对 GPT-3 进行训练,1024 块 A100 卡需要耗费超过 1 个月(大于 30 天),则我们可以按比例计算出,如果需要单日完成训 练,需要的 A100 数量将超过 30000 块。目前 AI 服务器通常选用 CPU 和加速芯片组来满足其庞大算力需求,其中加速芯片包括 GPU、FPGA、ASIC 等逻辑芯片,其中 GPU 由于其具有最强的计算能力同时具备深度学 习等能力,目前成为服务器中加速芯片的首选。根据中商产业研究院数据,2021 年全球服务器出货量达 1315 万台,同比增长 7.8%, 对应全球市场规模达 995 亿美元。根据 Counterpoint 预计,2022 年全球服务器市场规 模有望达到 1117 亿美元,同比增长 17.0%。预计云服务提供商数据中心扩张增长驱动 力主要来自于汽车、5G、云游戏和高性能计算。
AI 服务器渗透率依旧较低,增长空间巨大。根据 TrendForce 数据,截止 2022 年全球搭 载 GPGPU 的 AI 服务器(推理)出货量占整体服务器比重约 1%,同时 TrendForce 预测 2023 年伴随 AI 相关应用加持,年出货量增速达到 8%,2022~2026 年 CAGR 为 10.8%。 根据 TrendForce 数据,2022 年全球 AI 服务器采购中,Microsoft、Google、meta、AWS 为前四大采购商,合计占比 66.2%。中国地区 ByteDance(字节跳动)采购比例最高, 达到 6.2%。GPU 在 AI 服务器中价值量占比接近 50%。我们以 Nvidia DGX A100 为例,其搭载了 8 张 Nvidia A100 Tensor GPU,根据新浪科技数据,Nvidia DGX A100 售价约为 19.9w 美 金;Nvidia A100 Tensor 价格为 1.00~1.20w 美金。我们按照 1.20w 美金售价计算可得 出 GPU 在 Nvidia DGX A100 价值量占比约为 48.24%。我们从服务器的数量角度出发进行 GPU 数量推算:根据上文 TrendForce 预计 2023 年预 计全球 AI 服务器(推理)出货大约在 14.4 万台,到 2026 年预计实现出货量 20.0w 台。 我们假设训练 AI 服务器和推理 AI 服务器的比例为 1:4,则我们可以得到 2023/2026 年 训练服务器的数量大约为 3.60/5.00 万台。由于两种 AI 服务器对应的模型训练阶段不 同,我们假设推理 AI 服务器和训练 AI 服务器使用的 GPU 数量分别为 4 张和 8 张,则可 以计算出 2023 年和 2026 年全球 AI 服务器领域所需 GPU 数量约为 86.4 万张和 120 万 张,我们以 A100 约 1.20w 美金的价格作为参考计算出 2023 年和 2026 年 AI 服务器所 需 GPU 的价值分别为 103.7 亿美元和 144.0 亿美元。1.2 存储:AI 提振需求,有望加速困境修复整体来看,ChatGPT 将从算力侧和数据传输端全面带动显卡及高算力芯片需求,由此将 从算力芯片、应用端、存算一体、先进封装、封装设备、IC 载板等多个领域带动硬件市 场增量需求。人工智能已成为解决艰巨业务挑战的首选解决方案。AI 正在为各行各业的企业组织开辟 创新之路,从改善客户服务、优化供应链、获取商业智能,到设计新产品和服务等。NVIDIA 作为 AI 基础架构的先行者,NVIDIA DGX 系统可提供更强大、完整的 AI 平台,将企业 组织的核心想法付诸实践。目前 AI 大规模训练方面,NVIDIA 推出的最新 DGX 系统包括 A100、H100、basePOD、SuperPOD 四款产品,其中,DGX A100、DGX H100 为英伟达 当前服务于 AI 领域的服务器产品。
H100 采用先进工艺芯片采用台积电 4N 工艺+台积电 CoWoS 2.5D 封装,有 800 亿个晶 体管对比 A100 有 540 亿个晶体管,同时搭载了 HBM3 显存,可实现近 5TB/s 的外部互 联带宽。H100 是首款支持 PCIe 5.0 的 GPU,也是首款采用 HBM3 标准的 GPU,单个 H100 可支持 40Tb/s 的 IO 带宽,实现 3TB/s 的显存带宽。DGX H100 带来性能的快速飞跃,通过全新张量处理格式 FP8 实现。其中 FP8 算力是 4PetaFLOPS,FP16 达 2PetaFLOPS,TF32 算力为 1PetaFLOPS,FP64 和 FP32 算力为 60TeraFLOPS。在 DGX H100 系统中,拥有 8 颗 H100 GPU,整体系统显存带宽达 24TB/s, 硬件上支持系统内存 2TB,及支持 2 块 1.9TB 的 NVMe M.2 硬盘作为操作系统及 8 块 3.84TB NVMe M.2 硬盘作为内部存储。根据官网信息,NVIDIA DGX H100 对比上一代产 品具有 6 倍的性能及 2 倍的网络速度和高速可扩展性,同时英伟达表示目前新款 DGX H100 已经全面投入生产。国内华为的昇腾 Atlas 800(型号 9010)训练服务器是基于昇腾 910+Intel Cascade Lake 的 AI 训练服务器,具有高计算密度、高能效比与高网络带宽易拓展、易管理等特点,该 服务器广泛应用于深度学习模型开发和 AI 训练服务场景,适用于公有云、互联网、运营 商等需要大算力的行业领域。AI 处理器昇腾 910 是一款具有超高算力的 AI 处理器,其 最大功耗为 310W,华为自研的达芬奇架构大大提升了其能效比。八位整数精度(INT8) 下的性能达到 640TOPS,16 位浮点数(FP16)下的性能达到 320 TFLOPS。Atlas 800(型号 9010)训练服务器从配置来看,拥有 8 个昇腾 910 模组,单模组支持HBM2e技术,且拥有32GB容量及1228GB/s传输速度,AI算力达2.24 PFLOPS FP16/1.76 PFLOPS FP16。本地存储支持 2 个 2.5 SATA+8 个 2.5 SAS/SATA 或 2 个 2.5 SAS/SATA+6 个 2.5 NVMe。 AI 服务器带来存力硬件需求快速扩展。根据美光数据测算,人工智能服务器中 DRAM 容 量是普通服务器的 8 倍,NAND 容量将是普通服务器的 3 倍,而大容量及高速率存储器 将是算力数据迭代运算的重要基础。我们认为,人工智能计算量日益增加,对于 AI 服务 器硬件需求将进一步提升。从服务器硬件配置角度,HBM 技术将快速在 AI 服务器中普 及,其价格远高于现有基础服务器配置,未来 AI 服务器需求将带领存储芯片出现量价齐 升的趋势。1.3 模拟:多相电源配套增长,接口升级多相电源为 CPU 供电核心。主板主要有两种供电方式:线性电源和开关电源,其中开关 电源式为功耗相对较大的元器件,例如 CPU、内存和芯片组等供电。其中,内存和芯片 组皆采用单相供电,而 CPU 由于功耗巨大,须采用多相供电保证其稳定工作。计算力作 为数字经济时代的核心生产力,推动着经济蓬勃向前发展。作为计算应用的代表领域, 云计算、人工智能、自动驾驶等应用,对核心处理器 XPU(CPU、GPU、DPU、AI 等)的 算力要求越来越高,使这些主芯片对供电的要求越来越严苛,特别是中高端的 XPU 处理 器,需要更多相数、多路输出、多种协议的电源管理芯片。典型的单相开关供电电路通 常由 PWM 控制器((Pulse Width Modulation)控制器)、电感(L)、电容(C)、一对场效应 管(MOSFET)以及 MOSFET 驱动芯片(Driver Mos)组成。多个单相供电回路并联在一起, 且工作时间交错,即组成多相供电。
CPU 电能基本来源于 12V 8PIN 接口。12V 输入经过 MOSFET 上桥进入电容与电感,在电感与电容填充电能并达到所需的电压后,上桥中断,下桥开 启。此时电容电感释放能量,同时起到滤波稳定功能,下桥控制电路。通过 PWM 控制器 频繁切换实现持续稳定的电流与电压供给。整体流程循环如下:(1)MOS 上桥开启,输 入 12V 电压;(2)电感电容储电;(3)MOS 上桥关闭,MOS 下桥开启;(4)电感电容 放电,提供所需电压与电能。互联接口升级: A100 的 NVlink3 代和 NVSwitch2 代升级到了 H100 的 NVlink4 代和 NVSwitch3 代。DGXA100 是 8 块 A100 通过 12 个 NVlink3 连接到 6 块 NVSwitch2;DGXH100 是 8 块 H100 通过 18 个 NVlink4 连接到 4 块 NVSwitch3。 第三代 NVSwitch 芯片(NVSwitch3),可以连接服务器内部各 GPU 卡,同时还可以将 GPU 服务器扩展外连来建立一个独立完整的 GPU 高速集群。同时在 NVSwitch 芯片内通过硬 件加速器来支持组播报文加速和引入 SHARP(Scalable Hierarchical Aggregation and Reduction Protocol),主要用来加速和优化 All-Reduce 的 AI 计算性能。通过第三代NVSwitch 芯片组成的物理交换机,可以建立一个最多 256 个 H100 GPU 卡的集群,整网 提供 57.6TB/s 的 all-to-all 带宽。NVlink4.0 技术规范可以大大优化 GPU 的性能和扩展 性。NVlink 是为了解决服务器内部 GPU 之间点到点通讯的一种协议。NVlink 对比传统网 络不会有例如端到端报文重传,自适应路由,报文重组等开销。极度简化的 NVlink 接口 可以为 CUDA 提供从会话层,表示层到应用层的加速。NVlink 随 GPU 架构演进而发展, 从第一代 P100 的 NVlink1 到现在 H100 的 NVlink4。NVlink3 可同时支持 50G NRZ 和 56G PAM4,NVlink4 首次引入 112G PAM4 Serdes,可以提供 900GB/s 的双向带宽,较 NVlink3 的 600GB/s 提升 1.5 倍。网络接口升级: DGX 服务器包括 4 个网络:计算网络、存储网络、In-band 管理网络和 Out-of-band 管 理网络。计算网络接口:DGXA100 服务器计算网络是 8 张单口 200Gbps 的 CX6 或者 CX7 的 IB 网卡。DGXH100 服务器 4 个 800G 的 OSFP 接口内部是 8 个 CX7 的网卡芯 片组成,可支持 IB 或者 Eth,每个 OSFP 口可以通过分线来支持 2 个 NDR 400G 的 IB 网络或者 2 个 400G 以太网络,并且这里已经从 A100 的 56G PAM4 Serdes 升级 到了 112G PAM4 的 Serdes。存储&In-band 网络接口:DGXA100 服务器存储是两张双口 CX6 或者 CX7 的 IB 或者 Eth 网卡,每一块双口网卡上,一口作存储用,另一个口做 in-band 管理。 DGXH100 服务器同样是使用两张双口 400G 的 CX7 VPI 网卡,可支持 IB 或者 Eth,官方建议一个 NDR400G 走 IB 存储,另一个降速成 Eth200G 走 In-band 管理网。Out-of-band:DGXA100 服务器是两个千兆电口 Lan 和 BMC。DGXH100 服务器 Out-of-band 网络还是推荐使用 BMC RJ45 千兆电口。
内存接口升级: 内存接口芯片,是用于服务器内存模组(又称内存条)的核心逻辑器件,是服务器 CPU 与内存之间数据及指令传输的桥梁。内存模组用于暂时存放 CPU 中的运算数据,是影响 服务器性能的重要因素,由于服务器 CPU 对内存模组的高传输速率、大容量需求日益增 长,因此为了服务器系统性能得到最佳发挥,服务器内存模组往往需要配置内存接口芯 片,用于提升访问速度和稳定性。从数量上来讲,服务器内存模组与内存接口芯片一一 对应。内存模组根据其结构,大致可分为 UDIMM、RDIMM 和 LRDIMM 3 类,仅考虑 DDR~DDR4, UDIMM 内存模组无缓冲,价格低廉,但容量较小,不能满足服务器的要求,多用于 桌面式 PC。 RDIMM 支持 Buffered 模式和高性能的 Registered 模式,较 UDIMM 更为稳定,此 外,RDIMM 支持更高的容量和频率,容量最大可支持 32GB,频率最大支持 3200 MT/s。缺点在于由于寄存器的使用,其延迟较高,能耗也较大。 LRDIMM 作为 RDIMM 的替代品出现,其最大容量进一步提升至 64GB。我们判断,海量数据时代对数据处理和存储需求将持续推动内存接口芯片迎量价齐升和 市场高速扩容。我们接下来将从量价两个维度展开分析:1)量的方面,受益于服务器出 货量增长和单台服务器内存模组用量不断上升,2)价的方面,内存接口技术升级及内存 接口芯片结构升级渗透带来内存接口芯片本身价值量提升。内存接口芯片伴随内存技术的发展而发展,当前主流的 DDR4 内存技术面世至今历经多 次迭代,已进入成熟期。2020 年 7 月 DDR5 标准正式推出,内存技术迭代大幕正式拉 起。我们判断未来内存技术升级将推动内存接口芯片市场加速扩容:1)DDR5 突破处 理器性能瓶颈,处理器及存储龙头大力推进,有望加速渗透替代 DDR4 市场份额;2) 新一代内存接口芯片技术难度增大,ASP 有望大幅抬升;3)DDR5 时代内存接口芯片 采用“1+10”架构,价值量相较前代提升。DDR5 内存性能远超 DDR4 的规格上限,配套内存接口芯片性能及技术难度随之提升, 推高内存接口芯片 ASP。DRR5 相较于 DDR4 单颗 DRAM 内存密度提升 4 倍至 64Gbit, 最大数据传输速率提升一倍达到 6.4Gbps,工作电压由 1.2V 压低至 1.1V 使对应功耗降 低超过 20%,故而 DDR5 内存将对保证内存数据传输速率和稳定性的内存接口芯片提出 更高要求,进而新一代内存接口芯片在满足更高性能要求的同时技术难度也相应提升, 从而提高新一代内存接口芯片价值量。
二、行业利好层出不穷,自主可控势在必行
2.1 设备:供应链限制延续,国产替代加速全球设备五强占市场主导角色。全球设备竞争格局,主要前道工艺(刻蚀、沉积、涂胶、 热处理、清洗等)整合成三强 AMAT、LAM、TEL。另外,光刻机龙头 ASML、过程控制 龙头 KLA 市占率较高。根据彭博,ASML、AMAT、LAM Research、TEL、KLA 五大厂商 2021 财年收入合计 845 亿美元,占全球市场约 82%。中国大陆 12 寸晶圆厂扩产迅速,全球占比持续提升。根据 SEMI,全球 300mm 晶圆产 能在 2022 年-2025 年复合增速有望达到接近 10%,至 2025 年达到 920 万片/月。其中, 中国大陆 300mm 晶圆厂产能在全球的占比将从 2021 年的 19%提升至 23%,有望在 2025 年成为全球产能第二的地区,仅次于届时韩国 24%的占比。此外,中国台湾省的 产能占比预计将在 2021 年-2025 年下降 1%,到 2025 年占比 21%,日本产能占比从 2021 年的 15%下降至 2025 年的 12%。设备国产化率较低,海外龙头垄断性较高。我国半导体设备市场仍非常依赖进口,从市 场格局来看,细分市场均有较高集中度,主要参与厂商一般不超过 5 家,top3 份额往往 高于 90%,部分设备甚至出现一家独大的情况,目前国内厂商目标市场主要是国内晶圆 厂需求,尤其是内资投建的需求。设备国产化率较低,国产厂商成长空间巨大。我国半导体设备市场仍非常依赖进口,目 前国内厂商目标市场主要是国内晶圆厂需求,尤其是内资投建的需求,潜在收入目标空 间较大。 BIS 出台新出口管制,国产替代需求迫切。2022 年 10 月 7 日,美国商务部工业与安全 局(BIS)公布了《对向中国出口的先进计算和半导体制造物项实施新的出口管制》。根 据卓纬律师事务所,新规则主要集中在对某些高端计算半导体芯片、超级计算机最终用 途交易,涉及实体清单(Entity List)的交易以及某些半导体制造项目和某些集成电路(IC) 最终用途的交易。包括“将某些先进、高性能的计算机芯片和含有此类芯片的计算机商 品加入商业管制清单”、“扩大《出口管制条例》(EAR)的适用范围”等。同时,BIS 将 31 家中国实体列入 Unverified List(UVL),被列入的 31 家中国实体包括 长江存储、北方华创等;药明生物等并移除 9 家中国实体被移除。被列入 UVL 后,实体 将无法享受出口管制下的许可例外。此外,UVL 实体在进行出口、再出口及转让受 EAR 管辖物项的交易时,需获取 UVL 声明,该声明附带许多调查义务;出口商在向 UVL 内实 体出口商品时,需进行电子出口信息申报。很大程度上增加了交易成本。 根据卓纬律师事务所,在公告中,BIS 将 31 家中国实体被列入 UVL 的理由为:由于这些 实体处于美国政府控制之外,BIS 无法对其进行最终用途核查,因此无法确定这 31 家中 国实体是否为“善意诚信的”(Bona fide),即 BIS 无法确定 31 家中国实体对于《出口 管制条例》(ERA)的物项的最终用途是否具有合法性和可靠性。同理,由于原 UVL 中的 9 家中国实体积极配合 BIS 并完成最终用途的核查,BIS 将这 9 家中国实体从 UVL 中移 除。国内国产化逐渐起航,从 0 到 1 的过程基本完成。北方华创产品布局广泛,刻蚀机、 PVD、CVD、氧化/扩散炉、退火炉、清洗机、ALD 等设备新产品市场导入节奏加快,产 品工艺覆盖率及客户渗透率进一步提高,在集成电路领域主流生产线实现批量销售,产 品加速迭代;第三代半导体、新型显示、光伏设备产品线进一步拓宽,出货量实现较快 增长。拓荆科技作为国内唯一一家产业化应用 PECVD 和 SACVD 设备的供应商,设备广 泛用于中芯国际、华虹集团、长江存储、合肥长鑫、厦门联芯、燕东微电子等国内主流 晶圆厂,PEALD 已实现销售;中微公司介质刻蚀机已经打入 5nm 制程,新款用于高性能 Mini-LED 量产的 MOCVD 设备 UniMax 2022H1 订单已达到 180 腔;芯源微前道涂胶显 影设备在 28nm 及以上多项技术及高产能结构方面取得进展,公司前道物理清洗设备已 经达到国际先进水平并成功实现国产替代,新签订单结构中前道产品占比大幅提升;华 海清科 CMP 设备在逻辑芯片、3D NAND、DRAM 制造等领域的工艺技术水平已分别突破 至 14nm、128 层、1X/1Ynm,到 2021 年底,公司 CMP 设备累计出货超过 140 台,未 发出产品的在手订单超 70 台。盛美半导体主要设备产品包括兆声波单片清洗设备、单片 槽式组合清洗设备及铜互连电镀工艺设备,客户涵盖海力士、长江存储、中芯国际等。 精测电子、上海睿励在测量领域突破国外垄断。2.2 材料:需求持续增长,国产化迈入深水区全球半导体材料市场规模有望在 2023 年超过 700 亿美金。根据 SEMI,2021-2023 年 的晶圆厂建设投资达到历史新高,仅 2022 年的支出就增长了 14%,达到近 260 亿美元。 2022 年将有 28 个新量产晶圆厂开始建设,其中包括 23 个 300mm 晶圆厂和 5 个 200mm 及以下晶圆厂。晶圆厂的投建,晶圆产能的扩充带来半导体材料需求持续增长,继 2021 年市场规模创新高后,SEMI 预计 2022 年全球半导体材料市场规模将同比再增长 7%, 其中晶圆制造材料 2022 年有望同比增长 8.4%,封装材料增长 3.9%。中国大陆半导体材料市场全球占比逐步提升。根据 EET Asia,强劲的下游需求及晶圆产 能的扩张驱动 2021 年全球半导体材料市场规模同比增长 15.9%达到 643 亿美金新高。 其中晶圆制造材料和封装材料市场规模分别为 404 亿美金和 239 亿美金,同比增长 15.5% 和 16.5%。晶圆制造环节中的硅片、化学品、CMP 和光掩膜环节是增速最快的几大领域。分地域来看,中国大陆半导体材料市场规模近几年在全球的占比持续提升,2021 年占全 球比重提升至 18.6%,已成为仅次于中国台湾省的全球第二大区域。
半导体材料国产化率仍待转化。在国家产业政策大力扶持和国内半导体市场稳定增长等 利好条件下,特别是国家“02 专项”等专业化科研项目的培育下,国内半导体材料领域 将涌现更多具有国际竞争力的公司和产品,在更多关键半导体材料领域实现进口替代, 打破国外厂商的垄断。半导体芯片制造工艺半导体将原始半导体材料转变成半导体芯片, 每个工艺制程都需要电子化学品,半导体芯片造过就是物理和化学的反应过程,半导体 材料的应用决定了摩尔定律的持续推进,决定芯片是否将持续缩小线宽。目前我国不同 半导体制造材料的技术水平不等,但整体与国外差距较大,存在巨大的国产替代空间。 各类材料持续持续突破,业绩佐证国产替代正式开幕。随着半导体市场晶圆代工的持续 扩产,对于晶圆制造中不可缺失的基础材料将会有着非常大的需求拉动,而在此阶段我 们可以看到随着技术及工艺的推进以及中国电子产业链逐步的完善,在材料领域已经开 始涌现出各类已经进入批量生产及供应的厂商。2.3 零部件:供不应求,市场空间超 500 亿美金2022 年全球半导体零部件市场规模或超过 500 亿美金。根据富创精密招股书及国内外 半导体设备厂商公开披露信息,设备成本构成中通常原材料(不同类型的精密零部件产 品)占比 90%以上为原材料,考虑国际半导体设备公司毛利率通常在 40%-45%左右, 则全部精密零部件市场约为全球半导体设备市场规模的 50%-55%。根据 SEMI,2021 年 全球半导体设备市场规模达到 1025 亿美金,预计 2022 年进一步提升 14.7%至 1175 亿 美金。若按零部件占设备市场规模的 50%测算,则 2022 年全球半导体零部件市场规模 或超过 500 亿美金。 根据 SEMI,2019-2021 年中国大陆半导体设备销售额占全球的平均比重为 25.9%,若 以此作为大陆零部件市场占全球的比重进行测算,则 2022 年中国大陆零部件市场规模 为 152 亿美金。富创精密在招股书中采用了成本占比法测算精密零部件市场空间,公司根据不同类型设 备 2020 年公布的市场规模,以及国内代表性公司披露的原材料成本,和精密零部件在 成本中的占比,并考虑设备厂商毛利率水平,累加得到公司主要产品的全球市场规模约 160 亿美金。欧洲企业引领真空系统行业。根据 SEMI,2020 年半导体全球真空子系统市场规模为 27 亿美金,约占关键子系统的 22.1%。真空子系统主要包括真空泵、压力表和真空阀。目 前市场被欧洲及日本企业占据,欧洲厂商份额超过 60%且有持续提升的趋势,其中 Edwards,Pfeiffer,VAT Valve 三家占全球份额的 55%,日本厂商份额约 22%。
刻蚀、沉积需求驱动电源系统高增速。SEMI 测算电源系统占半导体关键子系统的从 2016 年的 9.8%提升至 2021 年的 13%,从量价角度来看,平均每个反应腔需要的射频电源 系统数量持续增加,同时下游对以高频为代表的高端电源子系统需求增加带来平均价质 量的增加。多重曝光及 3D NAND 层数不断增加,带来了对刻蚀、沉积步骤的需求提升, 以 3D NAND 为例,时间更长、更复杂的刻蚀步骤对电源系统解决方案的需求也在不断 提升。从下游应用来看,电源系统中 71%的需求来源于刻蚀设备。2020 年中国晶圆厂前道设备零部件采购额超过 10 亿美金。根据芯谋研究,2020 年中 国大陆晶圆厂 8 英寸和 12 英寸前道设备零部件采购金额超过 10 亿美金。其中不含海外 厂商在国内的产线,中国内资晶圆厂采购金额约 4.3 亿美金。中国晶圆厂采购的设备零 部件主要包括石英(Quartz)、射频发生器(RF Generator)、各种泵(Pump)等,分别 占零部件采购金额的比重≥10%。此外各种阀门(Valve)、吸盘(Chuck)、反应腔喷淋 头(Shower Head)、边缘环(Edge Ring)等零部件的采购占比也较高。 如果以 2020 年全球 192 亿美金的市场规模为基础,中国的 10 亿美金采购额占全球的不 到 5%,我们认为主要是因为国内设备厂商正处于持续研发突破,产品初步起量阶段, 也因此随着国产设备厂商的放量,未来国内零部件需求预计会快速增长。全球前十大关键子系统供应商市占率自 2010 年起始终维持在约 50%。2000-2010 年 伴随收购并购,行业持续整合,全球关键子系统前十大厂商的合计份额逐步提升,2010 年以来前十大家的份额始终维持在 50%左右的水平。2020 年,蔡司仍占据第一位置, 受益于对射频电源子系统的强劲需求,MKS 超过 Edwards 跃居第二。
三、边际改善,拐点已至
3.1 存储:供需改善,价格触底3.1.1 DRAM:周期轮动,价格底部2022 年供需位元差加大,供大于求困局未破。根据 TrendForce,2023 年 DRAM 市场需 求位元成长率为 8.3%,系近年来首次低于 10%,远低于供给位元成长的 14.1%。因此 2023 年的 DRAM 市场在供过于求的情势或愈演愈烈,供大于求仍是当前困局。下游需求疲软,DRAM 市场规模连续多季度萎缩。2022 年疲弱的经济状况和高通胀率 降低了全球范围内个人电脑、智能手机和其他消费电子产品的需求,DRAM 需求也因此 下降。预计 2022 年下半年 DRAM 销售额将下降 40%至 293 亿美元,而 2022 年上半年 销售额达 490 亿美元。同时,根据 CFM 闪存市场,三季度存储市场规模环比大跌 29.72% 至 177.64 亿美元,创 10 个季度新低,预计 2022 年 Q4 市场规模将进一步环比下跌。2022 年 Q4 多厂商业绩下行,行业平均下跌达 30%。三星:2022 年 Q4,DRAM 销售收入达 54.05 亿美元,环比减少 23.6%,市场份额为 44.5%。DRAM Bit 出货量环比高个位数增长,ASP 环比下跌超 30%。 SK 海力士:2022 年 Q4,DRAM 收入达 34.07 亿美元,环比减少 35.3%,DRAM 出货量 环比持平,ASP 下跌超 30%。 美光:2022 年 Q4,DRAM 收入为 28.29 亿美元,环比下跌 41.2%,DRAM Bit 出货量环 比下降约 25%,DRAM ASP 环比减少 20%以上。 南亚科技:2022 年 Q4,DRAM 收入环比减少 30.3%至 2.53 亿美元。 华邦电子:2022 年 Q4,DRAM 收入环比减少 29.8%至 1.06 亿美元。库存端,以美光各季库存进行追踪,自 2021 年 Q1 开始,公司库存逐步进入下降通道, 至 2021 年 Q4 达到底部。自此开始,受下游需求疲软影响,公司库存水位逐步增加,至 2023Q1,公司库存水位已达近三年最高点,为 81.29 亿美元,环比 2022 年 Q4 增幅超 22%。高库存水位下,各厂商去库存压力迫在眉睫,同时叠加需求疲软,直接导致 DRAM 市场产品价格大幅下跌。供需对峙下,存储厂商唯有降价。根据 Trendforce,2023 年 Q1 下游各领域产品价格均 有超过 10%的下降。目前来看,PC 制造商仍有 9 至 13 周的 DRAM 库存等待消化,但移 动设备领域的库存水平相对健康,不过定价仍预计要下降 10-15%。由于消费者对 DRAM 的需求低迷,供应商将销售的目光投向了服务器方面,然而这却导致服务器 DRAM 库存 的大量堆积。考虑到 DRAM 主流产品和利基产品的定位、单价和格局等不尽相同,我们对 DRAM 价格 分主流产品和利基产品两大类进行跟踪。 主流产品:现货和合约价均下跌。 合约价:以 DDR4 8Gb 1Gx8 2133Mbps(基于 8G 存储)为例,在经历 2022 年 10 月 份合约平均价稳定后,至 2023 年 1 月价格进一步下跌至 1.81 美元,月度环比跌幅 约 22%。 现货价:以 DDR4 16G (2G*8) 2666 Mbps 和 DDR4 8G (1G*8) 2666 Mbps 为例, 整体下跌趋势延续已久,进入 2023 年主流现货平均价跌幅趋缓,但仍未见反弹。截 至 2023 年 4 月 6 日,以上所述的 16GB 和 8GB 产品现货价格分别为 3.21 美元和 1.65 美元。现货价:我们以 DDR3 4Gb 512Mx8 1600MHz 产品为例,现货价格已至上一轮周期底部, 利基市场主要面向存储速度性能不太高的市场,上一轮 DDR3 周期价格上行系三星、海 力士等龙头厂商为准备利润更高的 DDR5 生产,逐步淘汰 DDR3 产能,导致 DDR3 短期 内供需失衡所致。同样,在本轮的 DDR3 价格下行周期中,三星放缓 line13 的 DDR3 产 能转换至 CIS,也给供给端带来更多压力。本轮底部区间,在行业面临寒冬,下游需求疲 软,供给过剩的背景下,价格反弹压力较大。
3.1.2 NAND Flash:供需修复,价格有望逐步企稳NAND Flash 寡头地位逐步增强,根据 Trendforce 数据显示,CR6 包括三星、铠侠、西部 数据、美光、英特尔、海力士总体市场规模占比约 99%,其中三星、铠侠、西部数据三 家行业龙头,约占比 70%的市场份额,在市场上有较大的影响力。根据 Trendforce 数据的预测,预计受益于下游新增需求的快速发展,NAND Flash 的需 求量也会有增长趋势。从行业供给格局来看,三星依旧占领较大的市场份额,但还未形 成绝对的寡头地位,且国内公司长江储存也将持续发展,有望进一步提升市场份额。2022 年 10 月 26 日,存储芯片大厂铠侠(Kioxia)和西部数据(Western Digital)在日本庆祝 位于四日市最先进制程晶圆厂 Fab7 完工。此 Fab7 晶圆厂第一期的总投资约为 1 万亿日 元(约合人民币 487.97 亿元),具备生产第六代 162 层 NAND Flash 闪存和未来更先进 3D NAND Flash 闪存的能力,计划于 2023 年初开始出货 162 层 NAND Flash 闪存。头部厂 商已正逐步覆盖 3D NAND 236 及 256 层甚至更高叠层工艺制程,持续技术迭代更新。NAND Flash 需求端受到全球人工智能和机器学习对海量数据处理,其市场规模正快速增 长。而 NAND Flash 主要覆盖的下游应用设备为手机、服务器、PC 及车载工控等,我们 认为,手机及 3C 产品的储存容量和硬盘搭载率提升将推动 NAND Flash 需求量持续增 高。对于服务器设备,云端储存及处理数据场景越发增长,服务器需求量及单设备搭载 量同样推动 NAND Flash 市场的需求量提升。除此传统需求领域外,随着车载智能化的 逐步提升,车载 NAND Flash 市场也有望迎来高速增长。1)手机及传统 3C 产品,NAND 单机搭载量提升近十年,智能手机作为成熟市场,每年全球手机出货维持在 11 至 13 亿部左右,保持稳 定波动。而随手机智能化水平越发提升,其摄影摄像功能、高清显示功能及各类多功能 软件所消耗的储存空间持续增长,用户对于手机的储存空间越发增加。智能手机市场对 应 Flash 市场的增长逻辑,主要来源于单机搭载量的持续提升。根据 Counterpoint 数据显示,2020 年智能手机 NAND 闪存平均容量首次突破 100GB 大 关。在 iOS 和 Android 手机中有所不同。在 iOS 手机中,2020 年第四季度的平均 NAND 容量达到 140.9GB,而同期 Android 手机的平均容量为 95.7GB。Android 手机的平均容 量在过去几年中一直在快速增长。2020 年 iOS 和 Android 手机的平均容量分别增长了 5.6%和 20.5%。同时根据 Trendforce 数据显示,预估 2023 年智能手机 NAND Flash 单 机搭载容量年成长仍能维持 22.1%。我们认为,IPhone 产品组合仍全线往更高容量 1TB 靠拢;Android 高端机种也跟进将 512GB 做为标准配备,中低端机储存空间则随硬件规 格持续升级而提高,因此整体平均容量仍有增长空间。
全球 PC 市场(包括笔电、桌面 PC、工作站等)在 2020-2021 年期间迎来强换机周期且 居家办公刺激需求端提前消费,根据 IDC 数据统计,2021 年全球 PC 出货量达 3.46 亿台。2022 年需求迎来疲软态势,根据 IDC 数据预测,2022 年整体出货量将下滑至 2.93 亿台,同比降低 15.2%。 另外,由于消费市场需求减缓,教育市场也获基本满足,及因经济状况弱化同样使商用 市场需求遭到挤压。根据 IDC 数据预测,预计 2023 年全球 PC 市场将进一步萎缩。PC 加上平板电脑的整体市场预估 2023 年下降 2.6%,预计在 2024 年恢复成长。根据 IDC 数据,由于 2020-2021 年受到居家办公的提前消费影响,平板电脑(包括二合 一的可拆卸式平板在内)市场在 2020/2021 年出货量达到 1.65/1.69 亿部,同比增长 13.8%/2.4%。但随 2022 年消费逐步疲软,根据 IDC 数据,2022 年全球出货量同比下 滑 3.6%至 1.63 亿台。PC 及移动平板电脑作为存量市场,整体年度出货量波动不大,基本维持亿部的出货量。 近些年随电脑固态硬盘替代传统硬盘趋势及单机储存量提升,其中SSD搭载率有所提升。 据中国闪存市场 ChinaFlashMarket 数据,预计到 2018 年 SSD 240GB 价格与 1TB HDD 同价的,在笔记本电脑上的搭载率将达到 52%。到 2019 年 SSD 480GB 价格与 1TB HDD 同价的时候,在笔记本电脑上的搭载率将达到 65%以上。另外,消费类 SSD 在零售渠道 市场每个月也有 200 万片硬盘升级 SSD 的出货量。2)AI 带动服务器及云端数据储存有望快速放量,进一步推动 NAND Flash 需求云计算时代市场的快速增长,云储存、云计算的数据量不断提高。在数字化时代的发展 下,随工作量的云上迁移和云本地应用的加速开发,在移动互联网技术不断迭代升级的 背景下,全球数据量呈现爆发式增长。根据 IDC 数据显示,全球数据储量由 2016 年的 16ZB 增长至 2021 年的 54ZB,复合年均增长率为 27.5%,随着数字经济的不断发展, 预计 2022 年全球数据储量将达 61ZB。
根据 Omdia 数据,云数据及企业级数据储存需求将在 2026 年达到 5255 亿每 GB 当量, 2021 年至 2026 年,CAGR 将达到 33.0%。3)车载 NAND Flash 有望受汽车智能化持续增长2022 年全球新能源汽车销量突破千万。根据 Clean Technica 数据,2022 年全球新能源 汽车销量突破千万达 1009.12 万辆,占整体汽车市场 14%份额,其中比亚迪以 184.77 万辆的全年销售数据获得全球销量冠军。根据中国汽车工业协会数据,2023 年 1 月和 2 月我国新能源汽车月度销量分别为 40.78 万辆和 52.49 万辆,由于 1-2 月为汽车销量传 统淡季,2023 年 1 月与 2 月销量与 2022 年 12 月 81.38 万辆的月销量相比仍有差距。 后续随着汽车电动化进程不断深化,我们认为全球范围内新能源汽车销量将会维持高速 增长态势。根据 IDC 及 IHS 数据显示,车用 DRAM 和 NAND 市场规模将从 2020 年的 20.4 亿和 12.6 亿,增长到 2025 年的 85 亿美元和 61 亿美元,预计年复合增长率为 33%和 37%。 车规级 NAND Flash 需要符合 AEC-Q100 等车规标准,随着汽车行业智能化、网联化的 演进,与 SOTA(软件在线升级),MaaS(出行即服务)得以实现,市场对车载存储的程 序和处理的数据量提出更多的新需求。 车用存储芯片规模成长的驱动因素,主要为三个方面,首先为智能座舱产生巨量数据交 互,其次是 ADAS 系统及车载娱乐系统。随着自动驾驶的普及及自动驾驶等级的提升 (L2~L5),会产生大量的道路和环境数据,用于收集车辆运行和周边环境数据的各类传 感器也会越来越多,包括摄像头、毫米波雷达、激光雷达等,根据安全和功能需要对数 据进行处理和保存,从而产生了大容量 NAND 存储的需求。英特尔估计,自动驾驶汽车 每天将产生 4000GB 的数据量,即再低等级的自动驾驶车辆也需要大量车载数据存储。 根据 Semico Research 数据显示,L1/L2 级别的自动驾驶需要 8GB 的 NAND 容量,而 L3 为 256GB,到 L5 的时候需要 1TB,自动驾驶技术升级对 NAND 需求呈现指数级的增长。价格端:环比下降收窄,价格将逐步企稳考虑到 NAND Flash 主流产品和利基产品的定位、单价和格局等不尽相同,我们对 NAND Flash 价格分主流产品和利基产品两大类进行跟踪。 主流价格:现货价增长后企稳,合约价自 2022 年 6 月开始下跌。 现货价:以 MLC NAND Flash 64Gb(8Gx8)及 MLC NAND Flash 32Gb(4Gx8)为例, 经历 2022 年 4 月涨价后,价格逐步企稳跌幅趋缓。截至 2023 年 4 月 7 日,以上两款 64Gb 和 32Gb 价格分别为 3.85 美金和 2.14 美金。合约价:以 MLC NAND Flash 128Gb(16Gx8)、MLC NAND Flash 64Gb(8Gx8)及 MLC NAND Flash 32Gb(4Gx8)三款为例,从 2021 年 7 月价格稳定后,在 2022 年 6 月开始 出现价格下降,截至 2023 年 2 月 24 日,以上三款合约价分别为 4.14/2.98/2.59 美金。3.2 模拟:库存修复,价格止跌模拟行业边际改善。模拟料号整体 3 月跌幅收窄,部分料号价格回暖。预计 Q2 价格进 一步趋于稳定。行业库存持续去化,国内产品在原厂及经销商库存基本修复至正常水位。 大空间+高增速+低波动优质赛道。IC insights 预测 2021~2026F 模拟 IC CAGR 为半导 体各品类中最高,达 11.8%。WSTS 数据显示,2012-2020 年模拟电路需求同比增速波 动相较数字电路更小,成长更具稳定性。
分应用领域:通讯设备占比巨大,汽车领域为第二大应用领域。通讯设备占比最大,预 计 2022 年占比 37.5%,较 2018 年+0.9pct;汽车领域市场为第二大应用领域,预计 2022 年占比 24.7%,较 2018 年+1.7pct;工业/电脑领域市场份额占比小幅降低,预计 2022 年较 2018 年分别变动-1.1pct/-1.0pct 至 19.5%/6.5%;消费电子/政府及军用领域相对 稳定,预计 2022 年较 2018 年分别变动-0.2pct/-0.3pct 至 10.8%/1.0%。 分地区:亚太地区模拟芯片需求较大,国内市场最为突出。2020 年,中国大陆为全球最 大模拟芯片市场,占比 36%。消费需求中高端市场仍然坚挺,需求反弹国内模拟 IC 公司更为受益。恩智浦 2022Q3 法 说会表示需求下滑主要影响中低端安卓机型,高端需求仍然坚挺,超宽带、移动支付等 新兴功能仍在增长。由于本土模拟 IC 公司的客户结构中安卓机型占比更高,因此本次周 期下行受到冲击更大。未来若消费需求反弹,国内模拟 IC 公司将由量价齐跌转向量价齐 升,营收、业绩和利润率都将迎来拐点,下游消费占比较高的模拟 IC 公司将贡献较大的 业绩弹性。(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)精选报告来源:【未来智库】。「链接」