基于GCC的编译器的优化等级的执行原理

转载授权以及围观->欢迎添加WxId：Allen-Iverson-me-LYN

前情提示：在使用基于GCC做编译器的IDE的时候，在很多时候我们会选择不同的Optimize优化等级，不同的优化等级，在Debug中我们发现程序执行的逻辑和我们设定的代码执行流程并不是很一致，甚至有时候差异巨大。所以我们来基于GCC介绍一下编译器优化执行的逻辑。

取自于官网：https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html

1.-O0：

2.-O，-O1：

3. -O2

下面可以看到开启了例如finline-functions此类内联函数的优化，所以程序执行的效率更快，对于程序执行逻辑有比较多的修改，你会发现调试的时候打了断点执行，但是执行跳来跳去的。

基于GCC的编译器的优化等级的执行原理

4. -O3

该选项除了执行-O2所有的优化选项之外，对于loop循环展开的优化开启更多，提高了程序执行效率，但是会以损失优化代码大小为条件。
这种一般都是采取很多向量化算法，提高代码的并行执行程度，利用现代CPU中的流水线，Cache等。这个选项会提高执行代码的大小，当然会降低目标代码的执行时间。（摘自知乎）

基于GCC的编译器的优化等级的执行原理

5. -Os

这个优化标识和-O3有些异同，同是，都是基于-O2进行的更升一级的优化，但是，-O3的目标是宁愿增加目标代码的大小，也要拼命的提高运行速度；-Os是尽量的降低目标代码的大小，这对于存储容量很小的设备来说非常重要。例如开启的优化标志中，有-fprefetch-loop-arrays -freorder-blocks-algorithm = stc等在内存中强制对齐数据，用来减少编译的程序代码的大小。

6. -Ofast:

知乎参考：https://www.zhihu.com/question/27090458

————————END————————

如果大家觉得有用，可以关注我，有更多的文章。

vlambda博客
学习文章列表