如何编写有利于编译器优化的代码-EDN 电子技术设计

 在嵌入式开发中，代码的体积和运行效率非常重要，代码体积往往和芯片的FLASH、RAM容量对应，程序的运行效率也要求在相应能力的处理器上运行。在大多数情况下，成熟的开发人员都希望降低代码体积、提高代码运行效率，然而具体该怎么做呢？本篇文章将以国际知名编译器厂商IAR Systems的编译器为例，来解答开发人员在实际工作中常常遇到的问题，工程师朋友们可以在IAR编译器上进行实践验证。

在嵌入式开发中，代码的体积和运行效率非常重要，代码体积往往和芯片的FLASH、RAM容量对应，程序的运行效率也要求在相应能力的处理器上运行。在大多数情况下，成熟的开发人员都希望降低代码体积、提高代码运行效率，然而具体该怎么做呢？本篇文章将以国际知名编译器厂商IAR Systems的编译器为例，来解答开发人员在实际工作中常常遇到的问题，工程师朋友们可以在IAR编译器上进行实践验证。ct9ednc

对于嵌入式系统，最终代码的体积和效率取决于由编译器生成的可执行代码，而非开发人员编写的源代码；但是源代码的优化，可以帮助编译器生成更加优质的可执行代码。因此，开发人员不仅要从整体效率等因素上去构思源代码体系，也要高度关注编译器的性能和编译优化的便捷性。ct9ednc

有优化功能的编译器可生成既小又快的可执行代码，编译器是通过对源代码的重复转换来实现优化。通常，编译器优化会遵循完善的数学或逻辑理论基础。但是某些编译优化则是通过启发式的方法，经验表明，一些代码转换往往会产生更好的代码，或者开拓出进一步编译优化的空间。ct9ednc

编译优化只有少数情况依赖于编译器的黑科技，大多数时候编写源代码的方式决定了程序是否可以被编译器优化。在某些情况下，即使对源代码做微小改动也会对编译器生成的代码效率产生重大影响。ct9ednc

本文将讲述在编写代码时需要注意的事项，但我们首先应明确一点，我们没有必要尽量减少代码量，因为即使在一个表达式中使用 ?:- 表达式、后增量和逗号表达式来消除副作用，也不会使编译器产生更有效的代码。这只会使你的源代码变得晦涩难懂，难以维护。例如在一个复杂的表达式中间加入一个后增量或赋值，则在读代码的时候很容易被忽略。请尽量用一种易于阅读的风格来编写代码。ct9ednc

循环

下面看似简单的循环会报错吗？ct9ednc

for (i = 0; i != n; ++i) ct9ednc

{ ct9ednc

a[i] = b[i]; ct9ednc

}ct9ednc

虽然不会报错，但其中有几点会影响到编译器生成的代码效率。ct9ednc

例如，索引变量的类型应与指针相匹配。ct9ednc

像 a[i] 这样的数组表达式实际上是 *(&a[0]+i*sizeof(a[0])，或者通俗地说：将第 i个元素的偏移量加到 a 的第一个元素的指针上。对于指针运算，索引表达式的类型最好与指针所指向的类型一致（__far 指针除外，因为其指针所指向的类型和索引表达式的类型不同）。如果索引表达式的类型与指针所指向的类型不匹配，那么在把它与指针相加之前，必须将它强制转换为正确的类型。ct9ednc

如果在应用中，堆栈空间资源（堆栈一般放在RAM中）比代码尺寸资源（代码一般放在ROM或者Flash中）更宝贵，则可以为索引变量选择一个更小的类型来减少堆栈空间的使用，但这往往会牺牲代码尺寸和执行时间（代码尺寸变大，执行时间变慢）。不仅如此，这种转换也会妨碍循环代码的优化。ct9ednc

除上述问题外，我们也要关注循环条件，因为只有在进入循环之前可以计算出迭代次数的情况下，才可以进行循环优化。然而，这项计算工作非常复杂，并非用最终值减去初始值并除以增量那么简单。例如，如果 i 是一个无符号字符，n 是一个整数，而 n 的值是 1000，那么会发生什么情况？答案是变量 i 在达到 1000 之前就会溢出。ct9ednc

虽然程序员肯定不想要一个无限循环，重复地将 256 个元素从 b 复制到 a，但是编译器无法了解程序员的意图。它必须假设最坏的情况，并且不能应用需要在进入循环之前提供行程数的优化。此外，如果最终值是一个变量，您还应该避免在循环条件中使用关系运算符 <= 和 >=。如果循环条件是 i <= n，那么 n 有可能是该类型中可表示的最高值，因此编译器必须假定这是一个潜在的无限循环。ct9ednc

别名

通常，我们不建议使用全局变量。这是因为您可在程序的任何地方修改全局变量，并且程序会因全局变量的值而变化。这就会形成复杂的依赖关系，使人很难理解程序，也很难确定改变全局变量的值会对程序产生怎样的影响。从优化器的角度来看，这种情况更糟糕，因为通过指针的存储就可以改变任意全局变量的值。如果能通过多种方式访问一个变量，这种情况就会被称为别名，而别名使代码更难优化。ct9ednc

char *bufct9ednc

void clear_buf() ct9ednc

{ct9ednc

int i; ct9ednc

for (i = 0; i < 128; ++i) ct9ednc

{ ct9ednc

buf[i] = 0; ct9ednc

} ct9ednc

}ct9ednc

尽管程序员知道向 buf 所指向的缓存区进行写操作不会改变这个buf变量本身，但编译器还是不得不做最坏的打算，在循环的每一次迭代中从内存中重新加载 buf。ct9ednc

如果将缓存区的地址作为参数传递，而不是使用全局变量，则可以消除别名：ct9ednc

void clear_buf(char *buf)ct9ednc

{ ct9ednc

int i; ct9ednc

for (i = 0; i < 128; ++i) ct9ednc

{ ct9ednc

buf[i] = 0;ct9ednc

} ct9ednc

}ct9ednc

使用这个解决方案后，指针 buf 就不会被通过指针的存储影响。如此一来，指针 buf 在循环中就可以保持不变，其值只需在循环前加载一次即可，而不是在每次迭代时都要重新加载。ct9ednc

然而，如果需要在不共享调用者/被调用者关系的代码段之间传递信息，则直接使用全局变量即可。但是，对于计算密集型任务，尤其是涉及指针操作时，最好使用自动变量。ct9ednc

尽量不用后增量和后减量

在下文中，关于后增量的所有内容也适用于后减量。C 语言中关于后增量语义的标准文本指出：“后缀 ++ 运算符的结果是操作数的值。在得到结果后，操作数的值会递增”。虽然微控制器普遍拥有可在加载或存储操作后增加指针的寻址模式，但其中只有很少能以同样的效率处理其他类型的后增量。为符合标准，编译器必须在执行增量之前将操作数复制到一个临时变量。对于直线代码来说，可以从表达式中取出增量，然后放在表达式之后。比如以下表达式：ct9ednc

foo = a[i++];ct9ednc

可以改为ct9ednc

foo = a[i];ct9ednc

i = i + 1;ct9ednc

但如果后增量属于 while 循环中的条件，又会发生什么？由于在条件后面没有可以插入增量的地方，因此必须在测试前添加增量。对于这些常见但是又与生成可执行代码效率密切相关的设计，诸如IAR Systems的Embedded Workbench这样的工具都在总结了大量实践后提供了优化方案。ct9ednc

比如以下循环ct9ednc

i = 0;ct9ednc

while (a[i++] != 0)ct9ednc

{ct9ednc

... ct9ednc

}ct9ednc

应改为ct9ednc

loop: ct9ednc

temp = i; /* 保存操作数的值 */ct9ednc

i = temp + 1; /* 递增操作数 */ ct9ednc

if (a[temp] == 0) /* 使用保存的值 */ ct9ednc

goto no_loop;ct9ednc

... ct9ednc

goto loop; ct9ednc

no_loop:ct9ednc

或ct9ednc

loop: ct9ednc

temp = a[i]; /* 使用操作数的值 */ct9ednc

i = i + 1; /* 递增操作数 */ct9ednc

if (temp == 0)ct9ednc

goto no_loop;ct9ednc

... ct9ednc

goto loop; ct9ednc

no_loop:ct9ednc

如果循环后的 i 的值不相关，最好将增量放在循环内。比如以下几乎相同的循环ct9ednc

i = 0; ct9ednc

while (a[i] != 0) ct9ednc

{ ct9ednc

++i; ct9ednc

... ct9ednc

}ct9ednc

可以在没有临时变量的情况下执行：ct9ednc

loop:ct9ednc

if (a[i] == 0) ct9ednc

goto no_loop;ct9ednc

i = i + 1;ct9ednc

... ct9ednc

goto loop; ct9ednc

no_loop:ct9ednc

优化编译器的开发者们很清楚后增量会使代码编写变得更复杂，尽管我们已尽力去识别这些模式，并尽量消除临时变量，但总有一些情况使我们无法产生有效代码，尤其是遇到比上述更复杂的循环条件时。通常，我们会将一个复杂的表达式分割成若干个更简单的表达式，就像上面的循环条件被分割成一个测试和一个增量那样。ct9ednc

在 C++ 环境中，选择前增量还是后增量的重要性更高。这是因为 operator++ 和 operator-- 都可以以前缀和后缀的形式重载。将运算符作为类对象重载时，虽然没必要模仿基本类型运算符的行为，但也应尽量接近。因此，对于那些可以直观地对对象进行递增和递减的类，例如迭代器，通常会有前缀（operator++() 和 operator--()）和后缀形式（operator++(int) 和 operator--(int)）。ct9ednc

为了模拟基本类型的前缀 ++ 的行为，operator++() 可以修改对象并返回对修改后对象的引用。那么模拟基本类型的后缀 ++ 的行为会怎样？您还记得吗？“后缀 ++ 运算符的结果是操作数的值。在得到结果后，操作数的值会递增”。就像上面的非直线代码一样，operator++(int) 的实现者必须复制原始对象，修改原始对象，并按值返回副本。由于存在复制操作，因此 operator++(int) 的开销要高于 operator++()。ct9ednc

对于基本类型，如果忽略 i++ 的结果，优化器通常可以消除不必要的复制，但优化器不能将对一个重载运算符的调用变为另一个。如果您出于习惯编写 i++ 而不是 ++i，您就会调用开销更大的增量运算符。ct9ednc

虽然我们一直在反对使用后增量，但不得不承认，后增量在有些情况下还是有用的。如果确实要给一个变量进行后置增量操作，那就继续吧。如果后增量操作和您期望的操作一致，可以使用后增量操作。但请注意，切勿为避免多写一行代码来递增变量，而使用后增量操作。ct9ednc

每当您在循环条件、if 条件、switch 表达式、?:- 表达式或函数调用参数中添加不必要的后增量时，都会使编译器不得不生成更大、更慢的代码。这个清单是不是太长了，记不住？今天就开始培养好的习惯吧！在使用后增量操作前，先问问自己能不能把增量操作作为下一条语句。ct9ednc

结语

当然，软件开发工作并不是只要求开发人员去“将就”编译器，他们与编译器之间的相互协同是快速而高效地完成编程工作的基础之一。此外，从编译器的发展过程来看，它们不仅要跟随技术和语言的演进而迭代和创新，而且还要广泛参考更多的开发习惯，那些历史更悠久、使用更广泛的编译器可以为开发人员带来更高的效率。ct9ednc

因此，在了解了如何编写利于一款优秀编译器优化的代码之后，用户们的工作效率就可以事半功倍。本文中提到的这些原理和tips，也是IAR Systems这样的公司长时间总结的最优实践，而且都可以在该公司的Embedded Workbench中进行验证和探索，在其工具界面中可以查看代码的执行时间和代码尺寸，从而找到最佳解决方案。ct9ednc

ct9ednc

好的工具除了通用的代码编译优化，还支持高度灵活的自定义优化设置，如IAR Embedded Workbench包含针对运行效率和代码体积的不同优化等级，对于不同的应用需求，还可以设置从整个工程，到每个源代码文件，甚至是每个函数的优化等级，帮助工程师为自己的应用适配出最佳的优化方案。希望此篇文章对于开发人员更深度地了解程序优化有所帮助。ct9ednc

关于更多嵌入式相关的知识，欢迎关注IAR Systems的官方微信公众号。ct9ednc

阅读全文，请先

嵌入式系统技术实例

上一篇： 安森美的智能成像方案使道路更安全 下一篇： RAIN RFID标签助力大规模数字化管理：让每个物品都有自己的数字身份

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

ST移动安全解决方案：构建全场景安全连接生态随着移动设备的普及与应用场景的复杂化，移动安全体系正经历关键变革——从早期依赖手机SIM卡的单一安全架构，逐步向融合NFC近场通信、嵌入式安全元件（eSE）及嵌入式SIM卡（eSIM）的多元技术体系演进。
客户的咖啡机卡住了：一个PUT拯救一条PCB产线的故事我曾担任工程师，在一家电子代工服务公司的工程部门工作，我们部门负责为生产线设计测试设备，同时也协助客户解决产品问题，当时生产的产品是一种咖啡机的PCB组件···
AI时代的氮化镓：市场与技术将走向何方？ AI时代，氮化镓、碳化硅这样类新兴技术也正与AI挂钩，因为AI基础设施的算力、电源需求都不同于往常。为此，我们采访了英飞凌高级副总裁、氮化镓业务负责人Johannes Schoiswohl，谈了谈氮化镓市场与技术的未来…
2025年及未来半导体行业的八大趋势从近期的历史来看，未来一年及以后，科技领域将取得一些惊人的进步，变革的步伐将继续加快···
Microchip推出新款交钥匙电容式触摸控制器产品 MTCH2 该触摸控制器旨在与全面的工具生态系统集成，以简化开发流程并加快产品上市···
瑞萨推出包括先进可编程14位SAR ADC在内的全新Analog 全新产品几乎适用于任何应用，大幅减少元件数量、BOM成本和占板空间···
新型导热材料散热提升了72%，热阻降低一个量级？最近，得克萨斯大学的研究团队开发出一种新型热界面材料（TIM），这种材料引入了液态金属合金 Galinstan 与陶瓷氮化铝，组成一种机械化学介导的胶体液态金属，显著提升了实际应用中的热传导性能···
从汽车到 VR：触觉技术如何在多领域创造商业价值让我们一同探究触觉技术是如何重塑各行业，并带来切实的商业影响的···
Vishay推出新型1008封装商用版和车规级功率电感器器件节省空间，工作温度高达+165 C，电感值达4.7 H···
意法半导体推出集成化高压功率级和节省空间的评估板，栅极驱动器、功率 MOSFET、自举二极管和快速启动的保护功能一体化封装，节省电路板空间70%，紧凑的圆形评估板，加快电扇和电泵开发···
Vishay推出含Immersion许可的新款多尺寸、多力度级别I 器件节省成本和空间，力度达120 N，额定工作电压低至12 V（8 V至16 V），可提供车载和商用高分辨触控效果···
为何工程师、研究人员偏爱FLIR X-HS系列热像仪？精准高 FLIR X-HS科学红外热像仪，符合国防、学术和商业研究与测试应用的行业标准，可满足对高速或高分辨率红外数据采集功能的需求，适用于全世界大多数关键测试场景，是科学家/工程师/研究人员和质量保证经理等比较倾向选择的型号

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

如何编写有利于编译器优化的代码

循环

别名

尽量不用后增量和后减量

结语