首页 » 导购 >

芯擎科技蒋汉平:7nm高性能智能车规芯片算力趋势分析

2021-08-30 18:16:10来源:盖世汽车

8月26日,由盖世汽车主办的“2021行业首届智能汽车域控制器创新峰会”于上海汽车城瑞立酒店隆重召开。本次会议持续两天,将围绕智能汽车、智能驾驶域控制器、智能座舱域控制器、底盘及车身域控制器、智能驾驶计算平台、电子电器架构、软件定义汽车、车规芯片等行业焦点话题展开。会议期间,湖北芯擎科技有限公司产品规划管理部总经理蒋汉平发表了《7nm高性能智能车规芯片算力趋势分析 》的主题演讲。

芯擎科技蒋汉平:7nm高性能智能车规芯片算力趋势分析

湖北芯擎科技有限公司产品规划管理部总经理 蒋汉平

首先非常感谢有这样的机会跟大家聊一下我们芯擎公司,以及我们对高性能智能车规芯片算力趋势的分析。我们今天主要是作为本土的芯片公司向大家描述作为未来趋势的芯片,各方面的算力以及取舍的依据。

首先给大家介绍一下我们公司,我们公司是吉利旗下的ECarx和安谋中国共同出资成立的,注册地是湖北武汉,在北京和上海设有分支机构,目前有200多人,我们主要专注于SOC设计、开发和先进汽车电子芯片的开发。公司成立于2018年,开始运营是2019年,公司CEO是汪凯博士。

这是公司完整的生态,首先电子电气架构是依托于吉利,自动驾驶算法有母公司ECARX,它在国外也投资了算法公司和国内的算法公司。在神经元网络方面,有ARM中国给我们提供先进的芯片IP,我们本身是做复杂SoC芯片开发。

做7nm车规级芯片门槛非常高,我们主流团队做过10nm芯片,并成功量产商用,在2018年就完成了这个工作,所以我们在7nm复杂SoC设计上技术积累是非常丰富的,再有就是功能和信息安全,由于有吉利和ECARX加持,我们对车的功能安全理解非常深刻。我们设计的座舱和基于手机芯片演变过来的方案有差异,我们更多是从车的角度,从电子电气架构的角度来理解车规芯片算力和分配。

目前我们的目标是提供软硬件平台和应用,包括做一些复杂的SoC设计,芯片级安全设计,核心IP设计和算法工作。告诉大家一个好消息,我们7nm车规芯片已经流片了,今年年底芯片就会回来,参考设计以及整体软件,SDK等等都会提供。

回到正题,电子电气架构从完全分布式到集中式,域集中、区集中到中央集中都是算力逐渐演进的过程,博世提供的电子电气架构趋势,我从芯片角度解释一下,它对芯片设计的规格产生了什么样的影响。

在分布式架构里面,多数模块化的功能都是通过ECU单元叠加的,就是1+1的过程,实际上对于芯片能力要求是比较低的,集中在可靠性和安全性上。MCU要求50DMIPS,现在开始走域控制器,就是把功能安全、信息安全接近的芯片进行一定的融合,形成一个域,在这个域里面做决策。这里有一个大前提,就是功能安全和信息安全要接近一致。这种情况下MCU达到了2k DMIPS,再往下就是域融合,比如说Tesla有三个域,这种情况下的算力就已经到了SoC级别,算力是50-20K DMIPS。

回到当下中央计算把大量算力集中起来,把分布式控制放在ECU端,这种情况下算力就接近50-300K DMIPS,这个时候也需要做特殊的AI加速要求,也就是100TOPS算力,最顶层是车云协同。车云协同不仅涉及到电子电气架构,还涉及到交通基础设施,网络基础设施,所以整个趋势还没有完全的确定。

这就是从分布式到集中式域融合再到区控制的过程,从几百DMIPS到几十K DMIPS。OTA升级实际上是电子电气架构变革最深刻的东西,它给整个算力的预埋,带宽的预埋,芯片的成本,应用的升级,软件定义汽车都提供了快速的通道,所以OTA升级是软件架构和芯片、电子电气架构融合的引爆点。

从电子电气架构来说,汽车智能化需要更强的运算能力,总体来说这种架构是适配未来趋势的方式。

算力也不能说无限的增长,因为我们是做芯片的,芯片PPA(功耗、成本和面积)都是很要命的。我们以前做芯片的时候很讲究功耗,有些车厂说现在是新能源,你不用担心电的问题,但是我们马上就告诉他,你不用担心电的问题,但是你要担心散热。所以我们不认为算力无限的膨胀和预埋是未来的趋势,特别是在SoC上,所以我们需要精准高效的算力来适配电子电气架构的变革。

这是车载芯片CPU的整体趋势,从智能座舱来说,它的起步就是60K DMIPS,未来五年市场上主流的智能座舱都是在60K DMIPS之上,传统的基于以前的座舱慢慢演进过来的曲线可能还停留在30K DMIPS范围内,这种情况下是很难适配算力集中趋势的。车身电子需要10 DMIPS,底盘15K DMIPS,半自动驾驶350K DMIPS,智能网联是20K DMIPS。

除了CPU以外,内存也是大问题。我们经常谈CPU能力,可是CPU能力都是要吞吐的,这种情况下DDR的带宽、内存系统的设计、内存子系统的设计都是关键点。这里有一个经验数据,这是在IVI和L2的时候,基本上能够达到102GB/s,如果是L3,L3+情况下要接近200GB/s,L4更大。

回到娱乐系统本身,从传统曲线来看,CPU能力2010年是10DMIPS,2020年是40DMIPS,也就是用10年才增加了3倍,可是大家想一想这个时候手机增加了多少倍?原因是什么呢?不是地图软件不行,而是算力不够。现在有变化了,现在算力两年就增加了1倍,达到80DMIPS,原因是新的座舱芯片提供者出现了,比如说高通、三星,他们都是做手机出身的,他们用手机器件晚两年做车上芯片,这个时候算力就会快速提升。为什么在新势力车企芯片里面可以看到预埋的算力,可以跨越未来好几年?它必须要保证软件定义汽车,在汽车生命周期里能够不断地适应,这个算力的预埋就变得至关重要。

GPU算力从2010年到2020年也只增加了10倍,可是2020年到2022年增长3-4倍,所以可以看到下一代Tesla,在座舱内玩PS5,当屏幕变多了以后应用就变多,花样就变多,个性化需求变多了对图形处理要求就多。NPU从0到0.5经历了10年,从0.5到6.2用了两年时间,

不同的计算单元适合不同的功能,比如DSP适合做数字信号处理,可以处理雷达数据,CPU做逻辑控制和通用计算,做图像图形前后处理,GPU做渲染和并行计算,NPU更多是矩阵计算。从传统计算机到深度学习到神经网络,可以看到视觉的部分越来越多,DSP部分越来越多,NN变的更多。

经常有人问你们为什么要做7nm?首先比较7纳米和16纳米,10纳米实际上是过渡的制程,7纳米比16纳米的速度增高了35%,同等性能情况下功耗降低了60%,密度是3.3倍,SRAM Scaling是0.37X,7nm有如下有点

一、7纳米的集成度更高,单位面积的晶圆上可以放置更多的逻辑门,同时封装面积变小,节约了晶圆成本和封装成本。

二、芯片耗电量更低,同样大小的逻辑电路做出来,用更先进的工艺会导致耗电量更低。半导体器件的耗电量和供电电压的平方成正比,先进工艺的管子开启电压会变小,进而导致功耗变低。

三、响应速度更快,单管开断速度更快,同样的逻辑电路能跑到的主频更高。

四、设计难度更大。这个为什么是优势?因为在芯片行业里面是有马太效应的,就是强者恒强,弱者更弱。实际上芯片公司工艺提升是互动的过程,我们提供设计文件给芯片厂做出厂测试,一个良率的降低有可能是自己设计的问题,也可能是工艺参数设置有问题。质量不稳定,性能不稳定也可能是时序设计没做好,也可能是工艺参数有问题,这个过程当中有经验的人沟通就会非常充分,这样才能够保证7纳米芯片走到量产,这是关键因素。

最后给大家介绍一下我们芯擎的产品,目前我们还是叫SE1000,它是业界领先的全数字智能驾舱SOC,采用了行业领先的低功耗车规7纳米工艺制程,符合AEC-Q100标准,支持ISO26262 ASIL-D安全等级的安全孤岛,高性能,低功耗,可灵活配置的CPU集群,不依赖虚拟化支持MuIti-OS、一机多屏。支持全数字仪表盘,提供丰富的2D/3D用户界面。支持7个4K/2K高分辨率显示屏幕同时输出,最高支持12路2目60fps的摄像头同时输入。具备硬件加/解密引擎的隔离式安全子系统,提供安全引导、安全通讯及认证等车内安全的应用。具备高算力、灵活的神经网络处理器,支持高性能智能语音和机器视觉等人工智能应用,支持L1、L2等ADAS功能。

我今天介绍的就是这些,希望各位同仁参与到我们的生态系统里面来,谢谢大家。