进程虚拟地址空间区域划分
在我们用一门语言写一个程序,会产生两种东西:指令和数据。在我们进行编译链接后,生成一个可执行文件存放在我们的磁盘上,运行这个程序时,会把这个程序加载到内存中。 而在加载的过程中,把可执行文件的哪些内容加载到了内存?加载到内存当中是如何存放的?分为哪些区域?具体如何划分?
在此之前我们需要知道,程序不可能直接加载到物理内存! 下面以X86 32位Linux环境下为例进行分析。
在程序执行时,Linux系统会给当前进程分配一个2^32(4G)大小的一块空间,这块空间就是进程的虚拟地址空间,其中拥有进程要用的所有资源,所有资源构成了状态的划分。
这块空间默认被划分成两个部分:用户空间和内核空间,用户空间默认占3G大小的空间,内核空间默认大小为1G。 系统中所有进程都有一个地址空间。
在用户空间中,系统并不是从0地址(0x00000000)开始存放资源,在0x00000000 到 0x08048000 这段内存是不能被访问的,所以在对空指针解引用时程序会崩溃。
接下来的内存段存放的是 .text 段和 .rodata 段。.text 段存放的是指令,.rodata 段存放的是只读数据,例如程序中定义的字符串常量 char* str = "hello world"; ,这两段的资源都是只读资源,在我们试图修改这两段的数据时,程序会直接崩掉。
接下来存放的是 .data 段和 .bss 段,.data 段存放的是已初始化且值不为0的全局变量和静态变量,而 .bss 段存放的是未初始化或初始化为0的全局变量和静态变量。
紧跟着的是 .heap堆内存段,程序动态申请的空间都在这段内存。
如果程序链接了动态库,在堆内存后的这段内存用于加载共享库。
再往下就是函数运行、或开辟线程时的 stack 栈空间,和其他内存段不一样,栈空间的增长方向和其他段是相反的,从高地址向低地址增长。
最后的内存段存放的是命令行参数和环境变量。 截取自《深入了解计算机系统》。
每个进程的用户空间是私有的,但内核空间是共享的!
|