C语言的编译流程

作者 XiaoBai 日期 2018-10-06
C语言的编译流程
集成开发环境(IDE):
是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等工具。集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务套。

编辑器:编写代码的一些窗口。

编译器:检查用户代码的一些语法错误,将其编译成汇编代码。

汇编器:将编译出来的汇编文件编译成一定功能的目标代码。

连接器:将目标代码连接成可执行文件。


编译器
  1. 词法分析:扫描器(Scanner)将源代的字符序列分割成一系列的记号(Token)。lex工具可实现词法扫描。
  2. 语法分析:语法分析器将记号(Token)产生语法树(Syntax Tree)。Yacc工具可实现语法分析(Yacc: Yet Another Compiler Compiler)。
  3. 语义分析:静态语义(在编译器可以确定的语义)、动态语义(只能在运行期才能确定的语义)。
  4. 源代码优化:源代码优化器(Source Code Optimizer),将整个语法书转化为中间代码(Intermediate Code)(中间代码是与目标机器和运行环境无关的)。中间代码使得编译器被分为前端和后端。编译器前端负责产生机器无关的中间代码;编译器后端将中间代码转化为目标机器代码。
  5. 目标代码生成:代码生成器(Code Generator).
  6. 目标代码优化:目标代码优化器(Target Code Optimizer)。

C语言的编译原理及过程:

​ C语言编译的完整过程: C源码 –> 预编译处理 –> 编译,优化处理 –>汇编 –>目标代码 –> 链接 –>可执行文件

​ C语言编译的简化过程: 预处理 –> 编译 –>汇编 –>链接

1.预处理:包括以下几个过程

​ a.宏定义指令:将所有的#define删除,并且展开所有的宏定义

​ b.条件编译指令:处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif等

​ c.头文件包含指令:处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置

​ d.特殊符号指令:预编译器可研识别一些特殊的符号,例如:删除所有注释 “//”和”/ /”

​ e.添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号

​ f.保留所有的#pragma编译器指令,因为编译器需要使用它们


对应的GCC指令

1.预处理

gcc -E *.c -o *.i

参数-E表示只进行预处理

2.编译: 编译过程就是把预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码

gcc –S *.i –o *.s

3.汇编: 汇编器是将汇编代码转变成机器可以执行的命令,每一个汇编语句几乎都对应一条机器指令。根据汇编指令和机器指令的对照表一一翻译即可。

gcc –c *.c –o *.o

4.链接:通过调用链接器ld来链接程序运行需要的目标文件,以及所依赖的其它库文件,最后生成可执行文件.链接的主要内容是把各个模块之间相互引用的部分处理好,使得各个模块之间能够正确地衔接,链接分为静态链接和动态链接。

静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。

静态库文件:是一个二进制文件,存放的功能函数实现,在文件编译时要访问文件,编译之后静态库文件可以删除

动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去

动态库文件:是一个二进制文件,存放的功能函数实现,在文件执行时要访问文件,编译时不需要动态库文件

​ linux动态库文件后缀名: .so
​ window动态库文件后缀名: .dll

目标文件:是一个二进制文件,由函数组成,不能单独执行,给主函数的文件调用。