Linux中的地址空間分配原則

發布時間：2011-2-26 20:45 發布者：hikesoso2010

有這么一系列的問題，是否在困擾著你：用戶程序編譯連接形成的地址空間在什么范圍內？內核編譯后地址空間在什么范圍內？要對外設進行訪問，I/O的地址空間又是什么樣的？　　

先回答第一個問題。Linux最常見的可執行文件格式為elf(Executable and Linkable Format)。在elf格式的可執行代碼中，ld總是從0x8000000開始安排程序的“代碼段”，對每個程序都是這樣。至于程序執行時在物理內存中的實際地址，則由內核為其建立內存映射時臨時分配，具體地址取決于當時所分配的物理內存頁面。　　

我們可以用Linux的實用程序objdump對你的程序進行反匯編，從而知曉其地址范圍。　　

例如：假定我們有一個簡單的C程序Hello.c　　

# include 　　
greeting ( )　　
{　　
printf(“Hello,world!\n”);　　
}　　
main()　　
{　　
greeting();　　
}　　
之所以把這樣簡單的程序寫成兩個函數，是為了說明指令的轉移過程。我們用gcc和ld對其進行編譯和連接，得到可執行代碼hello。然后，用Linux的實用程序objdump對其進行反匯編：　　
$objdump -d hello　　
得到的主要片段為：　　
08048568 :　　
8048568:
pushl  %ebp　　
8048569:
movl  %esp, %ebp　　
804856b:
pushl  $0x809404　　8048570:
call 8048474  <_init+0x84>　　8048575:
addl $0x4, %esp　　8048578:
leave　　8048579:
ret　　804857a:
movl  %esi, %esi　　0804857c

:　　
804857c:
pushl  %ebp　　804857d:
movl  %esp, %ebp　　804857f:
call 8048568  　　8048584:
leave　　8048585:
ret　　8048586:
nop　　8048587:
nop　　
其中，像08048568這樣的地址，就是我們常說的虛地址（這個地址實實在在的存在，只不過因為物理地址的存在，顯得它是“虛”的罷了）。　　

虛擬內存、內核空間和用戶空間　　

Linux虛擬內存的大小為2^32（在32位的x86機器上），內核將這4G字節的空間分為兩部分。最高的1G字節（從虛地址0xC0000000到0xFFFFFFFF）供內核使用，稱為“內核空間”。而較低的3G字節（從虛地址0x00000000到0xBFFFFFFF），供各個進程使用，稱為“用戶空間”。因為每個進程可以通過系統調用進入內核，因此，Linux內核空間由系統內的所有進程共享。于是，從具體進程的角度來看，每個進程可以擁有4G字節的虛擬地址空間(也叫虛擬內存)。　　每個進程有各自的私有用戶空間（0～3G），這個空間對系統中的其他進程是不可見的。最高的1GB內核空間則為所有進程以及內核所共享。另外，進程的“用戶空間”也叫“地址空間”，在后面的敘述中，我們對這兩個術語不再區分。　　

用戶空間不是進程共享的，而是進程隔離的。每個進程最大都可以有3GB的用戶空間。一個進程對其中一個地址的訪問，與其它進程對于同一地址的訪問絕不沖突。比如，一個進程從其用戶空間的地址0x1234ABCD處可以讀出整數8，而另外一個進程從其用戶空間的地址0x1234ABCD處可以讀出整數20，這取決于進程自身的邏輯。　　

任意一個時刻，在一個CPU上只有一個進程在運行。所以對于此CPU來講，在這一時刻，整個系統只存在一個4GB的虛擬地址空間，這個虛擬地址空間是面向此進程的。當進程發生切換的時候，虛擬地址空間也隨著切換。由此可以看出，每個進程都有自己的虛擬地址空間，只有此進程運行的時候，其虛擬地址空間才被運行它的CPU所知。在其它時刻，其虛擬地址空間對于CPU來說，是不可知的。所以盡管每個進程都可以有4 GB的虛擬地址空間，但在CPU眼中，只有一個虛擬地址空間存在。虛擬地址空間的變化，隨著進程切換而變化。　　

從上面我們知道，一個程序編譯連接后形成的地址空間是一個虛擬地址空間，但是程序最終還是要運行在物理內存中。因此，應用程序所給出的任何虛地址最終必須被轉化為物理地址，所以，虛擬地址空間必須被映射到物理內存空間中，這個映射關系需要通過硬件體系結構所規定的數據結構來建立。這就是我們所說的段描述符表和頁表，Linux主要通過頁表來進行映射。　　

于是，我們得出一個結論，如果給出的頁表不同，那么CPU將某一虛擬地址空間中的地址轉化成的物理地址就會不同。所以我們為每一個進程都建立其頁表，將每個進程的虛擬地址空間根據自己的需要映射到物理地址空間上。既然某一時刻在某一CPU上只能有一個進程在運行，那么當進程發生切換的時候，將頁表也更換為相應進程的頁表，這就可以實現每個進程都有自己的虛擬地址空間而互不影響。所以，在任意時刻，對于一個CPU來說，只需要有當前進程的頁表，就可以實現其虛擬地址到物理地址的轉化。　　

.內核空間到物理內存的映射　　

內核空間對所有的進程都是共享的，其中存放的是內核代碼和數據，而進程的用戶空間中存放的是用戶程序的代碼和數據，不管是內核程序還是用戶程序，它們被編譯和連接以后，所形成的指令和符號地址都是虛地址（參見2.5節中的例子），而不是物理內存中的物理地址。　　

雖然內核空間占據了每個虛擬空間中的最高1GB字節，但映射到物理內存卻總是從最低地址（0x00000000）開始的，如圖4.2所示，之所以這么規定，是為了在內核空間與物理內存之間建立簡單的線性映射關系。其中，3GB（0xC0000000）就是物理地址與虛擬地址之間的位移量，在Linux代碼中就叫做PAGE_OFFSET。　　

我們來看一下在include/asm/i386/page.h頭文件中對內核空間中地址映射的說明及定義：　　
#define __PAGE_OFFSET
(0xC0000000)　　……　　
#define PAGE_OFFSET
((unsigned long)__PAGE_OFFSET)　　
#define __pa(x)
((unsigned long)(x)-PAGE_OFFSET)　　
#define __va(x)
((void *)((unsigned long)(x)+PAGE_OFFSET))　　

對于內核空間而言，給定一個虛地址x，其物理地址為“x- PAGE_OFFSET”，給定一個物理地址x，其虛地址為“x+ PAGE_OFFSET”。　　

這里再次說明，宏__pa()僅僅把一個內核空間的虛地址映射到物理地址，而決不適用于用戶空間，用戶空間的地址映射要復雜得多，它通過分頁機制完成。

本文地址：http://www.qingdxww.cn/thread-56060-1-1.html 【打印本頁】

本站部分文章為轉載或網友發布，目的在于傳遞和分享信息，并不代表本網贊同其觀點和對其真實性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問題，我們將根據著作權人的要求，第一時間更正或刪除。