知方号

知方号

从K3V1到麒麟9000,华为海思麒麟芯片的进化史<华为usg6600f 海思 cpu>

从K3V1到麒麟9000,华为海思麒麟芯片的进化史

电子发烧友网报道(文/程文智)2023年5月份时,ICInsights发布了2023年第一季度的McClean报告,华为旗下的芯片设计公司海思半导体(HiSilicon)凭借26.7亿美元的销售额,挤掉英飞凌,首度进入半导体销售额排行榜前10大排名,这也是中国半导体厂商首次进入前10大半导体厂商排名。2023年8月12日,ICInsights再次发布2023年上半年前10大半导体厂商排名,海思半导体以52.2亿美元的销售额守住了第10的位置。不过,由于美国对华为的打压,海思作为华为旗下的公司也在打压之列,根据美国对华为的禁令,晶圆代工厂从9月15日起将不能再为华为制造芯片。

图:ICInsights发布的2023年上半年前10大半导体厂商排名。(数据来源:ICInsights)

在美国禁令持续升级的影响,海思未来将可能有一段时间无法使用涉及美国技术的产品和代工方案。比如芯片设计需要的EDA软件供应商基本都是隶属于美国,给华为代工先进芯片的台积电也用到了美国的技术,目前台积电已经明确表示美国禁令不取消将不能为海思代工5nm及以下工艺的麒麟芯片。这些限制给海思未来的发展蒙上了一层阴影。也就是说,华为目前最先进的5nm工艺芯片麒麟9000处理器将成为麒麟芯片的绝唱。现在就让我们一起回顾以下,华为麒麟芯片的十年“攀登史”。

图:华为麒麟系列芯片发展史。(数据来源:华为)

第一代手机AP------K3V1海思半导体的前身是1991年成立的华为集成电路设计中心,在做手机芯片之前,海思做过SIM卡芯片、视频监控芯片、机顶盒芯片等。在2006年,联发科技推出了GSM的Turn-Key解决方案,帮助GSM功能机产业迅速崛起,当时的海思也希望能够复制联发科技的模式,同年启动了GSM智能手机Turn-Key解决方案的开发。历时3年后的2009年,海思推出了第一个GSM低端智能手机解决方案,采用了WindowsMobile操作系统。其中基带处理器(BP)技术是自研的,技术源自华为GSM基站。应用处理器(AP)芯片名为K3V1,采用110nm制程,当时竞争对手的工艺制程已经达到65nm、55nm,甚至是45nm。

图:华为手机芯片的起点K3V1。

由于K3V1的110nm制程相对于45nm制程来说,功耗和性能都落后于竞争对手,再加上WindowsMobile操作系统市场份额太低,方案是做出来了,但是少有客户接受,海思第一代GSM处理器战绩惨烈,沦为试错产品。采用Arm内核,支持安卓的K3V2有了K3V1的失败,2009年移动终端芯片从海思半导体转移到了华为的移动终端公司内,华为内部称之为“大海思”,并由有“拼命三郎”之称的王劲负责移动终端芯片的研发。2012年,王劲团队推出了第二款手机SoC芯片K3V2,该芯片采用了Arm架构,并且支持安卓操作系统。K3V2是当时业界最小的手机SoC芯片,也是继英伟达Tegra3之后的第二颗四核A9处理器。

不过K3V2采用了非主流公司Vivante公司的GC4000GPU,兼容性不够好,导致最终体验并不好。而且该芯片也没有用上当时先进的28nm制程,只采用了台积电的40nm制程,相比高通的APQ8064和三星的Exynos4412,K3V2功耗依然偏高,发热量大。虽然K3V2饱受诟病,但华为依然把这颗芯片用在了自家手机上,不断从软件侧和硬件侧对其进行改进,当时这款芯片用在了华为D2、P2、和Mate1手机上,这是华为第一次把自家的海思芯片用在华为自家手机上。2013年6月,华为拼尽全力打造了一款经典的超薄旗舰手机P6,厚度仅为6.18毫米,采用了大量前沿工艺,并搭载了K3V2改进版K3V2E。虽然P6仍然有许多Bug需要靠软件补丁来弥补,但P6以当时最薄的机身和优秀的外观设计,加上华为不遗余力地推广,最终赢得了市场的认可,销量高达400万部。这份成绩单在当时来看是相当不错的了。不幸的是,王劲在此时由于劳累过度,因病逝世,但幸运的是,华为的手机芯片开始了正式攀登之路。麒麟登场------麒麟9102014年初,华为推出了麒麟910,这是华为首款以“麒麟”为名的芯片。该芯片采用了1.6GHz主频的四核Cortex-A9架构和Mali-450MP4的GPU,采用了28nmHPM制程。值得一提的是,麒麟910首次集成了华为自研的巴龙710基带,这让麒麟910可以支持LTE4G网络,在TDLTE网络下最高可带来112Mbps下行速度。麒麟910也是全球首款四核SoC芯片。

麒麟910的首发放在了华为P6的升级版P6s上,随后这款芯片还用在了华为Mate2、荣耀3C4G版、MediaPadM1平板、荣耀X1平板,惠普Slate7VoiceTabUltra和Slate8Plus等终端上面。里程碑芯片------麒麟920真正让海思的手机处理器走向成熟的是麒麟920芯片,该芯片是2014年6月发布的,采用了业界领先的big.LITTLE结构,采用4×A151.7GHz+4×A71.3GHz和Mali-T628MP4GPU,采用28nmHPM工艺制造,集成了音频芯片、视频芯片、ISP,集成自研全球第一款LTECat.6的Balong720基带,可支持TD-LTE/LTEFDD/TD-SCDMA/WCDMA/GSM共5种制式,支持峰值300M极速下载。使得首次搭载麒麟920的荣耀6成为全球第一款支持LTECat.6的手机。当年搭载麒麟920的荣耀6一出来,就飙升到各跑分软件的第一名,使海思麒麟芯片第一次达到与行业领袖高通对飙的地位。

也是从麒麟920开始,麒麟芯片真正开始成熟了,受到的肯定开始大于质疑。2014年9月,海思还发布了麒麟925SoC芯片,相较于麒麟920,大核主频从1.7GHz提升到1.8GHz,并首次集成了命名为“i3”的协处理器。这款芯片用在华为Mate7和荣耀6Plus上,创造了华为Mate7在国产3000价位上高端旗舰的历史,全球销量超750万。随后的2014年10月,海思还推出了麒麟920的另一个升级版------麒麟928SoC芯片,相较于麒麟925,大核主频从1.8GHz提升到2.0GHz。该款芯片随荣耀6至尊版一起发布,到这时,海思开始试着提升主频来提高自己驾驭芯片发热的能力。中规中矩的麒麟930在麒麟920之后,海思在2015年3月快速推出了麒麟930/935SoC芯片。其中麒麟930采用4×A532.0GHz+4×A531.5GHz+Mali-T628MP4GPU+微智核i3;麒麟935采用了4×A532.2GHz+4×A531.5GHz+Mali-T628MP4GPU+微智核i3。两颗芯片均采用28nm制程制造,且都集成了自研的Balong720基带,集成音视频解码、ISP等组件,集成i3协处理器。其实麒麟930只能算是常规升级,并没有过多的亮点,但在未能获得14/16nm制程的前提下,海思巧妙避开发热不成熟的A57架构,转而使用提升主频的能耗比高的A53架构。而高通骁龙810因为选择了A57大核,造成功耗过大,发热严重,在2014年遭遇滑铁卢,海思麒麟930/935则凭借散热小和优秀的能耗比打了一个翻身仗。麒麟930陆续用在荣耀X2、P8标准版、M28.0平板和M210.0平板上,麒麟935则用在P8高配版、荣耀7和MateS上。首款采用16nm制程的手机SoC------麒麟9502015年11月,海思推出的麒麟950,是业界首款采用16nmFinFET制程的旗舰SoC,这代表着麒麟正式进入全球手机芯片第一阵营。从麒麟950开始,海思从制程追赶者成为了领先者,率先选择了当时业界最领先的16nmFinFETPlus制程。该芯片采用了4×CortexA722.3GHz+4×CortexA531.8GHz+Mali-T880MP4+微智核i5架构,集成了自研的巴龙720基带,并且首次集成了自研双核14-bitISP,首次支持LPDDR4内存,集成了自研的音视频解码芯片,是一款集成度非常高的手机SoC芯片。麒麟950也是全球首款采用A72架构和采用Mali-T880GPU的芯片,该芯片的综合性能再次飙至第一,凭借性能优势和工艺优势,麒麟950的成绩优秀,除了GPU体验,其它各方面受到消费者众多的好评。该款芯片陆续用在华为旗下的Mate8、荣耀8、荣耀V8运营商定制版和标配全网通版等手机上。

2016年4月,海思发布了麒麟955SoC芯片,把A72架构从2.3GHz提升到2.5GHz,集成自研的双核ISP,给了徕卡双摄加持的P9和P9Plus、荣耀V8顶配版和荣耀NOTE8手机很好的助力。在徕卡双镜头及麒麟955的加持下,P9系列成为华为旗下第一款销量破千万的旗舰机。去除所有短板的麒麟960如果说麒麟950还有GPU短板的话,麒麟960则将这个短板也补全了,2016年发布的麒麟960大幅提升了GPU性能,同时还解决了之前集成基带不支持CDMA的问题,成为当时第一款集成了全网通基带的手机SoC芯片。

麒麟960采用的是四个A73(大核最高频率2.4GHz)+四个A53(小核1.5GHz)的大小核架构,GPU是Arm最新的MaliG71MP8。在存储方面,支持UFS2.1;基带方面,直接在SoC中集成了支持LTECat12/Cat13的巴龙750基带,可实现四载波600Mbps的下行速率,上行速率也可达150Mbps,并且支持CDMA网络。稍微遗憾的是依然采用的16nm制程工艺。也就是在这一年,海思凭借麒麟960各方面综合性能表现,麒麟9系列芯片正式跻身行业顶级芯片市场,与高通、苹果形成三足鼎立的态势。AI加持的麒麟9702017年9月发布的麒麟970,海思首次在SoC中集成了人工智能计算平台NPU,开创了端侧AI行业先河。从麒麟970开始,海思正式开启了AI探索前进之路,为华为的全场景智慧战略打下了坚实的基础。在CPU方面,麒麟970采用的仍然是ARM公版A73架构+A53架构大小核心搭配,4个A73大核最高主频为2.4GHz,4个A53小核最高主频1.8GHz。在GPU方面,采用了Arm的Mali-G72架构,在核心数方面,增加到了12核。通信基带方面,支持LTECat.18,最高下载速率达到了1.2Gbps(4x4MIMO,3CCCA,256QAM)。制造工艺方面,采用了台积电的10nm制程。

麒麟970还支持同时使用两张SIM卡时,主副卡同时用4G。此外,麒麟970还特别针对高铁时的使用做了优化,信号更稳定。值得一提的是,麒麟970里面多了一颗NPU。传统的CPU(包括x86和ARM)和GPU也是可以用来做深度学习计算的,但由于它们本身并不是专门为深度学习定制的,效率并不高。而麒麟970的这颗NPU采用了来自寒武纪(Cambricon)的IP,专门为深度学习而定制,FP16性能达到了1.92TFLOP,差不多是麒麟960的3倍(0.6TFLOP左右)。从此以后,手机全面进入了AI时代。加了“吓人”技术的麒麟9802018年9月初,在德国柏林举行的消费电子展IFA2018上,海思推出了麒麟980,该芯片为业界首次采用7nm制程,集成了双核NPU,集成了69亿个晶体管,且具有GPU增强功能“GPUTurbo”,也就是余承东之前在微博上透露的“吓人”技术。在麒麟980上,海思与众不同地采用了2+2+4的大中小核形式,其中两个频率为2.6GHz的A76大核负责高负载任务,两个频率1.92GHz的A76“中核”负责日常任务。四个A76大核之外,还有四个A55小核(1.8GHz)负责轻度运算。值得一提的是,相比前几代的公版设计,麒麟980的CPU部分采用了半定制架构,可见华为海思已经在充分利用Arm的新DSU集群以及异步CPU配置了。在GPU方面,这次麒麟980采用了MaliG76,这是ARM重新设计架构后的新款高端GPU,它有4到20个shadercore,其纹理单元、渲染单元、计算单元管道位宽均大幅增加,为复杂图形和机器学习的工作负载提供显著的提升。华为宣称,新GPU相比前代性能提高了76%,这可以说弥补了华为一直以来GPU的短板。在网络方面,麒麟980率先支持LTECat.21,峰值下载速率1.4Gbps,但遗憾的是仍然不支持5G网络。同时,这款芯片也支持2133MHzLPDDR4X的内存。麒麟970的时候首次为手机端SoC引入了神经网络加速芯片NPU。在麒麟980中,华为再次引入了业内首款双核NPU,NPU核心采用了寒武纪1H,实现每分钟图像识别4500张,支持人脸识别、物体识别、物体检测等AI场景。支持5G的麒麟9905G如果说麒麟970发布的关键词是AI能力,麒麟980发布的关键词是7nm工艺的话,那么华为麒麟9905G芯片发布的关键词就是5G了。2023年9月,华为在德国柏林消费电子展上,推出了麒麟990系列芯片,包括麒麟990和麒麟9905G两款芯片。其中麒麟9905G是华为首款旗舰5GSoC芯片,采用了7nm+EUV制程,首次将5G芯片巴龙5000集成到SoC上,率先支持NSA/SA双架构和TDD/FDD全频段,且集成了约103亿晶体管。依旧延续采用台积电的7纳米工艺,采用四颗A76+四颗A55共八核心,在GPU和CPU方面有部分提升。

在CPU方面,麒麟9905G配备了两颗2.86GHz的Cortex-A76核心、两颗2.36GHz的A76核心及四颗1.95GHz的A55核心,与此同时GPU采用的是Mali-G76(MP16)。另外它的NPU是由两颗AscendD110Lite和一颗AscendD100Tiny核心组成,后者主要是用于一些低功耗的AI应用。而在连线能力方面,麒麟9905G适用于SA/NSA组网,但不支持毫米波技术。在Sub-6GHz环境下,它的下载和上传速度分别能达到2.3Gbps和1.25Gbps。另外,这款芯片配备有第五代ISP,官方声称它能带来“单反级别”的噪点抑制表现。麒麟990是针对4G网络的芯片,它与麒麟9905G的主要分别在于两颗A76中核心跟四颗A55小核心的频率分别下降到了2.09Ghz和1.86Ghz,另外NPU里也会少一颗D100Lite核心。巅峰之作------麒麟90002023年,麒麟9000发布,该芯片采用了5nm制程,集成了多达153亿个晶体管,比苹果A14的118亿个晶体管还要多出将近30%,堪称麒麟巅峰之作。与麒麟990系列类似,麒麟9000系列芯片也包括两个型号,分别是麒麟9000核麒麟9000E。这两个型号的芯片规格相近,只是麒麟9000的性能会略高于麒麟9000E。麒麟9000内置了8核CPU核心,包括一个最高频率为3.13GHz的Cortex-A77大核,3个2.54GHz的A77中核,及4个2.04GHz的A55小核;大核主频突破3.1GHz,爆发性能强,是目前频率最高的手机处理器。同时集成24核心的Mali-G78GPU,图像处理能力升级,架构超过麒麟990Mali-G76,核心数也多了一半,性能提升60%。麒麟9000E则比9000版少一个NPU大核,搭载的是22核Mali-G78GPU。

麒麟9000通过支持5GSA双载波聚合,Sub-6G下行理论峰值速率达4.6Gbps,上行理论峰值速率达2.5Gbps。此外,麒麟9000搭配麒麟W650支持Wi-Fi6+,理论峰值速率达2.4Gbps。无论使用5G还是Wi-Fi,麒麟9000及其配套的麒麟W650成为迄今为止最快的手机SoC解决方案。结语从当前麒麟9000的表现来看,其实力已经快接近苹果和高通的水准,假以时日,超过他们并不是没有可能,但令人扼腕的是,在美国禁令逐步收紧的影响下,海思追赶的脚步戛然而止,只能眼看着差距被进一步拉大。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至lizi9903@foxmail.com举报,一经查实,本站将立刻删除。