算力是驱动经济社会数字化转型的新引擎,是新时代的核心生产力。很长一段时间,CPU主导了整个数据中心,虚拟化算力成为云计算的重点。伴随数字经济的推进,每年各行业产生的数据量以30%的速度向上增长,网络带宽也从10G向20G、100G,甚至400G迈进,然而影响算力的关键硬件CPU性能的增长速度每年却不足3%。当CPU再无力解决数据中心基础设施遇到的瓶颈时,新一代DPU芯片出现了。DPU是Data Processing Unit(数据处理单元)的简称,是最新发展起来的专用处理器的一个大类,被业界认为是继CPU、GPU之后,数据中心场景中的第三颗重要的算力芯片,为高带宽、低延迟、数据密集的计算场景供给计算引擎。DPU 可以重新分配算力和优化算力资源,带来新的数据中心创新范式,因而被认为是未来几年行业内最重要的创新。DPU 是在目前算力困境、摩尔定律放缓的大背景下产生的。随着单一服务器的网络端口的速度达到 200G 或以上,原来的网络、存储、虚拟化、安全等基础设施多方面任务,已经无法有效率地由CPU承载,而将这一类基础设施任务转移到新的计算单元DPU上。DPU也因此从处理网络负载和卸载CPU任务的智能网卡,演变成新一代数据中心算力和服务的核心。作为新型数据专用处理器,DPU针对基础设施层的计算负载,通过创新专用DPU计算架构等方式,解决CPU处理效率低下以及任务负载无法处理等问题,是未来算力网络的核心基础设施。国际芯片巨头如因英伟达、英特尔、AMD等厂商都已积极开展DPU芯片研发工作,预计到2025年,全球及国内市场有望分别达到245.3亿美元与565.9亿元,可见DPU芯片发展势头不容忽视。首颗国产DPU芯片,填补国内市场空白目前我国DPU领域还处于起步阶段,在国家大力推进数字经济的背景下,国内DPU厂商面对全新赛道,正奋起直追,在机遇与挑战之间努力抢占新技术制高点。位于中关村壹号的国内DPU芯片研发领军企业中科驭数是国内DPU芯片领域唯一拥有自研核心架构能力的企业,近一年多来获得了三轮数亿元规模的融资,被评为中国信科“潜在独角兽”。中科驭数创始团队大多来自科研院所计算机体系结构国家重点实验室,在计算机体系结构领域有着近二十年的技术积累,至今已经进行了三代DPU芯片的研发迭代。2022年12月21日,中科驭数宣布:其研发的第二代DPU芯片——K2成功点亮。这是国内首颗功能较完整的ASIC形态的DPU芯片,ASIC(Application Specific Integrated Circuit)形态即专用集成电路形态,是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路形态,与普通集成电路相比,具有体积更小、功耗更低、可靠性更高、性能更好、保密性更强、成本更低等优点。ASIC形态DPU芯片对于中国芯片行业升级以及中科驭数的发展都具有里程碑式的意义。“K2出现之际,正值国家提出东数西算战略,可谓生逢其时。它的成功,为中科驭数DPU芯片产品规模化量产打下了坚实的基础。”中科驭数创始人、CEO鄢贵海表示。K2采用了28nm成熟工艺制程,可以支持网络、存储、虚拟化等功能卸载,是目前国内首颗功能较完整的ASIC形态的DPU芯片,具有极其出色的时延性能,可以达到1.2微秒超低时延,支持最高200G网络带宽。此外,基于DPU芯片核心技术,中科驭数研发了超低时延DPU网卡、RDMA加速卡、数据查询加速DPU卡,以及面向金融计算领域的极速风控、极速行情等产品。其中,中科驭数面向金融计算领域的极速行情加速卡,可达到业界领先的1微秒级别的转发穿透时延,在加工处理行情时,能够实时根据行情生成快照,最大吞吐量可达每秒近千万条信息处理速度。应用场景广泛,解决多种行业难题近年来,随着新基建、东数西算、“双碳”目标等政策规划的提出,以及云计算、智能驾驶、大数据、物联网等技术的创新突破,为我国经济数字化转型提供了广阔场景,不断催生多元算力需求。K2作为我国第一颗功能比较完整的DPU数据处理芯片,它的成功研制为我国数字经济时代基础设施建设提供了保障,为整个社会的数字化转型提供强劲且绿色的动力。在实际应用中,K2广泛布局在金融计算、高性能计算、数据中心、云原生、5G边缘计算、自动驾驶等领域,它的直接效果是给CPU“减负”,带来算力和运营效率的双倍提升,可用在一些超低时延和超大吞吐的应用上,在建设数字化、智能化产业中发挥巨大的价值。在未来的实际应用中,K2将推动云计算网络、安全、存储等方向上的技术革新,助力大数据计算基础架构创新,赋能数据中心、运营商网络高性能计算网络,助力大数据和人工智能多领域基础设施产业升级。国内芯片技术的新时代标杆与技术集成开拓者目前,业界DPU主要运用FPGA形态方式,简单来说FPGA就是一块可由工程师反复编程的逻辑器件,本体是一种数字集成电路,一个可以通过编程来改变内部结构的芯片,具备布线资源丰富、可重复编程、集成度高、投资较低的特点。FPGA也存在不足,它的所有功能均需依靠硬件实现,只能实现定点运算,无法实现分支条件跳转等操作,虽然速度上可以和专用芯片相比,但设计的灵活性与通用处理器相比有很大的差距。随着我国计算机领域的飞速发展,FPGA形态的芯片已不能满足当前产业经济发展需求。而中科驭数ASIC形态K2芯片则恰到好处地弥补了FPGA的不足。K2芯片具有成本低、性能优、功耗小等优势,包含带宽支撑200G、60兆TPS转发速度,主打延迟高性能网络,不仅在网络加速方面的功能显著高于智能网卡和基础网卡所能提供的延迟指标,还能对数据中心起到支撑作用,支撑各种软件定义的技术。同时,中科驭数的自主研发优势,能更好地避免商业经济捆绑与威胁,且能更好地适配用户系统与产业特性,有利于当产业性能与贸易经济发生细微变化时,能及时有效作出调整,具备强大的市场竞争力。结语2019年,中科驭数研发了第一代DPU芯片K1,2022年,研发了第二代DPU芯片K2。从K1到K2,中科驭数拼搏进取,锐意创新,逐步填补了国产DPU市场的空白。“未来,中科驭数将继续坚持自主可控、核心功能自研的策略,在软件层面坚持开放,与上下游厂商充分融合,推进国内DPU产业发展。”中科驭数创始人兼CEO鄢贵海表示。小贴士[1] CPU是central processing unit的简称,即中央处理器,作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。[2] DPU是Data Processing Unit的简称,它是最新发展起来的专用处理器的一个大类,是继CPU、GPU之后,数据中心场景中的第三颗重要的算力芯片,为高带宽、低延迟、数据密集的计算场景提供计算引擎。[3] ASIC是Application Specific Integrated Circuit的简称,即专用集成电路,是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。[4] GPU是graphics processing unit的简称,即图形处理器,又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。[5] RDMA是Remote Direct Memory Access的缩写,意思是远程直接数据存取,就是为了解决网络传输中服务器端数据处理的延迟而产生的。[6] FPGA(Field Programmable Gate Array)是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。[7] TPS是Transaction Per Second的简称,一个表达系统处理能力的性能指标,每秒处理的消息数。
北区硬科技(四)|中科驭数“中国芯” 为DPU献上“中国方案”
作者:实创科技园 来源: 头条号 61803/07
算力是驱动经济社会数字化转型的新引擎,是新时代的核心生产力。很长一段时间,CPU主导了整个数据中心,虚拟化算力成为云计算的重点。伴随数字经济的推进,每年各行业产生的数据量以30%的速度向上增长,网络带宽也从10G向20G、100G,甚至40
免责声明:本网转载合作媒体、机构或其他网站的公开信息,并不意味着赞同其观点或证实其内容的真实性,信息仅供参考,不作为交易和服务的根据。转载文章版权归原作者所有,如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。联系电话 010-57193596,谢谢。