百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

大话芯片功耗

zhezhongyun 2025-08-06 23:57 36 浏览

点击蓝字

关注我们

来源:数字IC自修室

Power is Power。——Cersei Lannister

大家好,我是海龟先生,本期的封面来自于美剧冰与火之歌,感觉代码写不下去的时候可以听听看该剧的主题曲,还是比较振奋人心的,闲话不多说,欢迎来到数字IC自修室。

随着芯片上晶体管数量的不断增加,上层应用程序复杂度的提升,现今的半导体行业对芯片功耗的关注比以往任何时候都要多,尤其是在手机等移动端设备,如果产品动不动就没电了,那是一件十分令人头痛的事情。另一方面,电池材料相关技术发展十分缓慢,导致目前的电池容量在相同密度下还是和电池体积呈正相关性,因此在做芯片设计的时候从顶层到底层都会采用低功耗(Low Power)技术。可能有些同学会问,那有些正常工作情况下直接和电源相连接的设备是不是不需要考虑功耗?

这个问题包含几个方面的考虑因素。首先地球上的石化能源是有限的,功耗高就意味着在相同的时间内需要消耗更多能源,其次对于高性能计算芯片来说,当功耗超过一定阈值(~150W),就需要使用昂贵的液态冷却或其他热量散发装置,所以出于节约能源,环境保护和帮助客户节约电费的角度来说低功耗设计依旧是必须考虑的因素。那么接下来我们就来简单了解一下芯片中功耗的主要来源以及相应的减少功耗的常用技术。值得注意的一点是尽管IC的前后端设计者通常会采用各种方法来减少功耗,但是应用层和架构层的设计才是最至关重要的,上层的应用和架构没有设计好,即使后端有再多的低功耗辅助技术也不能从根本上解决问题。就好比做一种美食,如果食材本身不新鲜,那无论多好的炊具也无法改善食物的口感。

1.功耗的主要来源

1.1 动态功耗(Dynamic Power)

动态功耗主要包含:

● 门电路开关过程中负载电容(Load capacitance)的充放电功(Switching Power)

● 来自于pMOS和nMOS都部分开启时的短路电流(Short-circuit Power)

以下图的CMOS反相器(Inverter)为例,当输入Vin从1变为0的过程中,nMOS关闭,pMOS开启并给负载电容CL充电,当输入Vin从0变为1的过程中,pMOS关闭,nMOS开启并使负载电容放电,电容充放电的过程中消耗的能量构成了Switching Power.

在充放电的过程中存在一小段窗口pMOS和nMOS都是处在部分开启的状态,因此会有电流直接从VDD流到GND,构成Short-circuitPower。

通过对上面的充放电行为进行物理分析,结合欧姆定律和电容充放电和能量相关公式,我们可以得到充放电功耗:

其中α是翻转系数(Switching Activity Factor),C是负载电容,VDD是工作电压,f是工作频率,这个几个参数对后面我们讨论降低功耗有着至关重要的意义。

1.2 静态功耗(Static Power)

静态功耗主要包含:

● 晶体管关闭状态的漏电功耗(Subthreshold Leakage)

● PN结反向偏置电流功耗(Reverse-Biased Junction Leakage)

● 栅极漏电流功耗(Gate Leakage)

其中Subthreshold Leakage占主导地位。在通用微处理器架构里,时钟网络(Clock Tree)和片上存储器通常会占用大部分的功耗。

2.低功耗技术

2.1 Clock Gating

Clock Gating即把不用的功能模块的时钟信号关闭,通过减少前面讲到过的Switching Activity Factor来降低功耗。具体实现方法如下:

通过与门和Latch(毛刺消除)组成的Clock Gating Cell,Register的Clock端口的时钟随使能信号开关,当时钟关闭时,由该Register所驱动的下游组合逻辑也相应降低了功耗。Clock Gating实现的重点在于找到合适的使能信号,目前的芯片设计Flow中只要符合以下三个条件后端的工具链就会自动生成ICG(Intergated Clock Gating) cell:

● Register Bank的使能信号不可以(简化)为常量0或1;

● 对于不包含Latch的Clock Gating,使能信号必须来自于与被Gate的Register时钟同步的Register;

● Register bank满足用户所指定的最小位宽要求;

关于Switching Activity Factor,还有一点值得一提的是电路中的Glitch,因为实际的Silicon中会有组合逻辑延迟(Propgation Delay),因此对于一个门电路来说,由于输入信号的到达时间会存在差异,所以实际的跳变会变得更加严重,从而增加Switching Activity Factor。因此有条件的话可以在做功耗分析时加入Glitch Power的预估。

2.2 电压域(Voltage Domain)和动态电压频率调节(Dynamic Voltage and Frequency Scaling)2.2.1 Voltage Domain

在上面的公式中,工作电压VDD与动态功耗是平方的关系,所以电压的调整对功耗的影响也十分显著,但是根据alpha-power law,在其余条件不变的情况下,电压的降低会导致延迟的增加,即电路的性能降低。通常来说,整个芯片会根据具体的性能需求被分成几个不同的Voltage Domain,这种方案带来的挑战就是如何处理跨电压域(Voltage Domain Crossings)的信号,常用的解决方案是采用Level Shifter实现:

上图A来自于VDDL Domain,P1,P2,N1,N2均工作在VDDH,其中N1和N2分别接到A和~A,反相器也工作在VDDL,当A=0时,N1关,N2开,Y接地输出0,P1开,X接VDDH,保证P2关闭;当A=1时,N1开,N2关,X接地,P2开,Y接VDDH,P1关。从而达到A到Y不同电压域之间的逻辑转换。

2.2.2 DVFS

对于很多系统来说,处理不同数据和任务对于性能的需求是不一样的,比如我现在正在码文章的时候所消耗的计算资源和我看电影的时候所需要的计算资源是不一样的。利用这个特点,我们可以根据计算任务负荷来动态调整电压和频率至能满足需求的最低程度,这就是DVFS。

DVFS的具体实现方法多种多样,例如Linux里的OnDemand功耗策略,有兴趣的同学可以参考相关文献。

关于频率角度的低功耗,在设计中常采用多时钟域的方法,例如处理器的Bus通常比核心频率要低。由于存在多个时钟域,我们设计中需要考虑跨时钟域信号的同步问题,后续我们会有相关文章详细介绍,通常来说,工作频率为整数倍关系的时钟域之间被认为是同步的,处理相对比较简单。

DVFS实现存在比较大的一个缺点就是切换过程中的时间overhead较大(us级别)。

2.3 Power Gating

Power Gating是减少静态电流非常有效的方法,下图中当Power Gated Block正常工作时,Sleep信号为0,工作电压VDDV通过开启的PMOS接到VDD,当系统进入低功耗模式,Sleep信号变为1,VDDV被断开,整个Power Gated Block关电,这里需要注意此时该Block的输出端值为X,因此如果Output被下游Always On模块使用,为了保证不影响下有逻辑的正常工作,通常会在Interface上加入Isolation Cell,这一过程目前主要由后端的tool自动加入。

Power Gating带来的一个问题是系统状态的恢复,一般来说被Power Gated Block中的Register值在唤醒时要么处于Reset状态,要么已经被保存以便恢复,在设计中通常将重要的讯息保存到State Retention Register或者Memory里的方案。

Power Gating通常针对整个Block(Coarse-grainedpower gating)而非单独的逻辑门,因为Area和Performance的Overhead都比较大。

3. 低功耗架构

早期工艺下的芯片架构设计通常考虑如何最大化每一颗晶体管的性能,但如今随着工艺进入到7nm以下,芯片架构设计越来越关注性能功耗比。

3.1 并行化(Parallelism)和流水线(Pipelining)

并行化和流水线都能在维持相同性能的情况下降低功耗,下图中(a)是原始的设计电路。(b)采用了并行化做法,额外增加一组A和B逻辑,输出端每个时钟周期分别从两组逻辑取得结果,因此每个输入端是需要保证每两个周期提供一个有效结果,即频率变为原来的一半。(c)采用流水线做法,假设A和B被切分成delay相近的两级,那么逻辑的整体频率可以提升至2f,这样以数据吞吐量衡量的性能也就近似为两倍,在维持性能不变的情况下,我们完全可以降低工作电压。

3.2 总线编码(Bus Encoding)

通过给总线上的数据编码通常有助于减少总线上的功耗,常见的方式有

● 反向编码(Bus Invert Coding)

例如总线上需要传输0000->1110转换的数据,这里总线上会有3个bit跳变,但如果我们对第二个数据做取反操作,那么总线上就只有1个bit跳变,这样4个bit的总线最多只可能同时有两个bit跳变,具体实现还需要设计反向条件的算法。

● 异或编码(Transition Signaling)

这种方法仅针对特定的转换率很高的总线,发送端输出编码后bit值为前一个时钟传输bit值和当前时钟传输bit值的异或,接收端解码值为前一个时钟接受到的bit值和当前时钟接收到的bit值得异或,举个简单的例子,如果我们要传输的数据为10100110(跳变5次),那么实际总线上传输的数据为11000100(跳变3次)。

3.3 其他

在设计架构的时候,考虑到Memory的功耗密度(Power Density)通常低于Logic的功耗密度,并且Memory的Leakage控制比较规范化,如果同时有增加Logic或者Memory两种方案,通常增加Memory是对降低功耗比较有利的方案。

另外新型的异构计算架构(Heterogeneous Computing)在性能和功耗方面比单纯通用型处理器架构更加优秀,正所谓“专业的人做专业的事”,同样的AI算法在CPU上跑,不但性能不好,而且时间久功耗也大,因此在可预见的未来,异构计算将会成为趋势。

4. 结语

今天的功耗相关话题就先说到这儿,本文中的图片均来自于Weste&Harris的教材,如果你有任何问题想交流欢迎随时联系作者,我是海龟先生,对芯片行业爱得深沉。

欢迎大家继续关注我们后续文章。

本文作者 | 海龟先生

相关推荐

VSCode中值得推荐的常用的23个高效前端插件(工具篇)(一)

VSCode是我们前端开发的一个强大的IDE,所以选择趁手好用的插件是提高开发效率,然后剩下的时间用来摸鱼是很有必要滴。工具篇(23)Chinese(Simplified)vscode我们都知道是...

高级前端进阶,用gulp提升你的开发效率

前言:这两天动手配置了一下gulp,发现gulp配置简单,构建速度快,在某些使用场景下还是个不错的选择,本文从零开始构建,到最后打包发布到生成环境。通过本文可以快速上手gulp,文末附送github源...

Chrome 110 3大新特性!CSS支持画中画!

大家好,很高兴又见面了,我是"前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发!今天带着大家一起看看最新发布的Chrome1...

用html中If语句——判断ie浏览器的版本

if语句的代码的语法非常简单,,就是一个if判断语句来判断浏览器的类型和版本,应用类似<!--[iflteIE6]>和<![endif]-->语法结构包孕起来...

谷歌浏览器怎么开启无痕浏览_谷歌浏览器怎么开启无痕浏览模式

很多用户在使用谷歌浏览器时,不希望留下任何上痕迹,开启无痕浏览器是最好的选择。这个模式下可以更好的保护个人隐私记录,给你带来更加安全的冲浪体验,接下来就给大家详细介绍下谷歌浏览器的无痕浏览模式,希望对...

Linux命令那么多,其实只需要记住这些就足够了!

你好,这里是网络技术联盟站,我是瑞哥。Linux命令行是一个强大且灵活的工具,可以极大地提高用户的工作效率和系统管理能力。我们都知道,Linux命令非常多,但是在实际的工作中,日常使用到的命令并不多,...

Linux如何查看文件_linux如何查看文件大小

Linux如何查看目录下的所有文件?用ls(list)查看当前目录下的所有文件和子目录。Ls查看目录下的文件,怎么区分是目录还是文件呢?第一种方式,我们可以通过颜色来区分目录和文件。默认情况下,目录显...

Linux系统man命令使用详解_linux man命令详解

man命令是在Linux和Unix系统上用于查看系统手册页(manualpages)的工具。手册页提供了关于系统命令、函数和文件的详细文档。命令语法:man[选项][命令或主题]参数:[选项]...

linux ps命令详解_linux中ps

linux中ps只显示进程的静态快照,及瞬间的进程状态,它拥有众多的风格,可分为3组:UNIX风格,BSD风格,GNU风格,本文介绍UNIX风格的ps指令。参数ps[-aefFly][-ppid...

如何在 Linux 上查找系统硬件信息?hwinfo命令很强大!

hwinfo是一个功能强大的硬件信息查询工具,专为Linux系统设计。它能够提供系统中几乎所有硬件组件的详细信息,包括但不限于CPU、内存、硬盘、网络设备、USB设备、显卡、声卡等。与其他常...

Linux Shell 入门教程(二):常用命令大全与使用技巧

在上一节《理解Linux与Shell》中,我们了解了Linux是什么、Shell是什么以及常见的Shell类型。这一篇,我们将正式动手操作,掌握使用频率最高、最实用的Linux命令...

SpringBoot应用部署神器:可视化服务管理脚本让运维更轻松

在SpringBoot应用的生产环境部署中,传统的手动启停服务方式不仅效率低下,还容易出错。今天分享一个功能强大的可视化服务管理脚本,让SpringBoot应用的部署和运维变得简单高效。痛点分析:传统...

一次虚拟机性能问题导致的应用故障

最近我负责维护的一套语音平台出了问题。故障现象据客户反馈是转入IVR以后没有正常响应,客户无奈挂机了。老实说,刚开始接到用户反馈的时候,我是不太相信的。我们的系统平时运行运行很稳定,客户的并发数不大,...

linux中的常用命令_linux常用命令及含义

linux中的常用命令linux中的命令统称shell命令shell是一个命令行解释器,将用户命令解析为操作系统所能理解的指令,实现用户与操作系统的交互shell终端:我们平时输入命令,执行程序的那个...

linux学习笔记——常用命令-文件处理命令

ls目录处理命令:ls全名:list命令路径:/bin/ls执行权限:所有用户ls–ala--alll–long-i查看i节点ls–i查看i节点命令名称:mkdir命令英文原意:m...