컴파일러는 뭐지?

초심 프로젝트의 세번째 주제로 커널을 주제로 새롭게 알게된 것을 정리했다. 교재는 다음과 같다.

주교제	Linkers and Loaders

또한 내가 예전에 컴파일러 강의를 들으면서 새롭게 알게된 내용과 나름대로 공부한 내용을 추가했다.
이해를 돕기 위해 강의 자료였던 kipa_dd.zip 을 참고하기 바란다.

일반적으로 C 와 같은 High-Level Language 로 구현된 소스코드를 기계어로 변환시켜주는 프로그램(Tool) 이라고 생각할 수 있다. 다음은 텀즈에 나온 컴파일러의 정의이다.

컴파일러는 특정 프로그램 언어로 작성된 문장을 처리하여 기계어 또는 컴퓨터가 사용할 수 있는 코드로 변경시켜주는 특수한 용도의 프로그램이라고 정의할 수 있다. 
C 나 Pascal과 같은 언어로 프로그램을 개발할 경우, 프로그래머는 편집기를 이용하여 한줄 한줄 문장을 작성하게 되는데, 이러한 파일들을 소스코드라고 부른다. 
소스코드의 작성이 끝나면 프로그래머는 그 소스코드의 언어에 맞는 컴파일러를 실행시킨다.

다음은 '프로그램은 왜 실패하는가?' 에 나온 컴파일러의 설명이다

1. C, C++ 같은 언어들의 경우 소스 코드는 우선 전처리기를 거친다.
2. 컴파일러는 소스 코드를 적절히 파싱해서 하나의 구문 트리(syntax tree) 를 생성한다.
3. 컴파일러는 그 구문 트리를 운행(traversing)하면서 어셈블리 코드를 만들어 낸다.
4. 어셈블리는 어셈블리 코드를 목적 코드(object code)로 번역한다.
5. 링커는 목적 코드가 담긴 목적 파일을 한데 묶어서 하나의 실행 파일(executable)을 만든다.

가장 흔히 생각하는 컴파일러로 gcc 를 생각할 수 있다. 하지만 gcc 는 GNU Compiler Collection 의 약자로서 우리가 흔히 알고 있는 컴파일러는 cc 라고 하는 명령어로 존재한다.

컴파일러의 구조는 크게 Front End 와 Back End 로 나눌 수 있다.

Front End : 소스 코드를 읽어들이고, 어휘(lexical) 분석, 구문(syntax) 분석, 의미(semantic) 분석을 한 뒤 Back End 를 위한 중간 코드(Intermediate code) 를 생성(build) 한다.
Back End : 중간 코드를 읽어들이고, 최적화해서 코드를 만들어낸다.

Tool-Chain 은 각종 소스 파일들을 컴파일하고 build 하여 실행 파일을 생성하는 데 필요한 여러가지 유틸리티 및 라이브러리의 모임이다.
그게 3 가지로 구성된다.

GCC(GNU Compiler Collection)
GNU Binary Utilies
Libraries(glibc, newlib)

GCC 는 크게 4 가지 과정의 작업을 수행한다.

Preprocessing
Compiling
Assembling
Linking

위의 작업을 담당하는 여러가지 프로그램들로 구성되어 있다.

c(g++) : C 뿐만 아니라 C++ 소스 파일또한 컴파일가능하다. 자동으로 Linking 시에 standard C++ 라이브러리를 include 한다.
- cc1 : 실질적인 C 컴파일러
- cc1plus : 실질적인 C++ 컴파일러
- collect2 : 시스템에 GNU Linker 가 없을 때, global initialization code(예를 들면, constructors 와 destructors) 를 생성한다.
- configure : GCC 를 컴파일하기 위해 필요한 makefile 을 만들고, 변수값들을 설정한다.
- crt0.o : C runtime 시에 필요한 초기 파일을 같이 링킹시킨다.
- gcc : 컴파일러와 링커가 output 파일을 생성해낸다.
==== GNU Binary Utilies ====
binutils 에는 아래와 같은 두개의 주요한 유틸리티와 부가적인 유틸리티들이 포함되어 있다.

- ld : GNU Linker
- as : GNU assembler
- nm : 오브젝트 파일로 부터 심볼 리스트를 출력
- objcopy : 오브젝트 파일 포맷을 변환해서 복사한다. (ex : ELF -> HEX, BIN 으로 변환해서 복사)
- objdump : 오브젝트 파일의 정보를 출력
- ar : archive 파일(.a)을 생성하고 수정하고, 추출한다.
- ranlib : archive 의 index 를 만들어서 archive 에 저장한다. index 는 라이브러리를 링크할 때 속도를 향상시키고 archive 에서 위치에 관계없이 함수들이 서로 호출이 가능하게 한다.
- size : 오브젝트 파일의 각 섹션 별 용량과 총 용량을 출력
- strings : 파일에서 printable 한 문자의 리스트를 출력
- strip : 오브젝트 파일에서 심볼을 지워서 사이즈를 줄일 때 사용

==== Libraries ====
크게 두 가지 종류의 라이브러리를 사용한다.

- Glibc : FSF 에서 관리, native UNIX system 에서 사용하던 라이브러리를 완벽하게 대체
- Newlib : 많은 프로그래머들에 의해서 생성된 코드들의 모음으로서 embedded system 에서 사용할 수 있도록 패키지화 했다. glibc 와는 달리 UNIX system 에서 사용되는 라이브러리를 완벽하게 대체하지 못한다.

라이브러리는 링크될 때, 사용되는 데 방법에 따라서 정적 라이브러리(libc.a)와 동적 라이브러리(libc.so)로 나뉘어 진다.
일반적으로 gcc 를 이용해서 컴파일을 하는 경우, 기본적으로 동적 라이브러리(libc.so)와 링크된다.
정적 라이브러리로 링크하기 위해서는 다음과 같이 한다.
<code text>
#gcc -static -o test test.c
</code>
====== Object Files ======
소스 파일을 컴파일하게 되면, 오브젝트 파일(Object file)이 생성된다. 흔히 UNIX 계열에서는 ELF format 을 사용하고, Window 계열에서는 PE format 을 사용한다. 그 외에도 각 아키텍처 별, 또는 운영체제 별로 다르게 존재한다. 여기서는 가장 많이 사용되고 있는 ELF 에 대해서 자세히 알아볼 것이다. 오브젝트 파일은 binary 코드와 데이터로 구성되어 있으며, 크게 3 가지로 분류할 수 있다.
- Linkable : link editor(linker) 에 의해서 사용(input)되어 질 수 있는 프로그램
- Executable : loader 에 의해서 메모리에 올려서 실행할 수 있는 프로그램
- Loadable : loader 에 의해서 프로그램과 함께 메모리에 올리는 프로그램(ex : .so)
오브젝트 파일은 아래와 같이 구성되어진다.
- Header information : size of code, name of source file, creation date
- Object code
- Relocation information : 동적 라이브러리(Dynamic) 로 컴파일할 경우만 사용
- Symbols
- Debugging information
===== ELF (Executable and Linking Format) =====
COFF 의 단점을 개선한 포맷으로 원래 cross-compiled embedded system 을 위해 만들어 졌다. COFF 는 time-sharing 시스템에서 잘 동작하지 않고, C++ 를 지원하지 않으며 dynamic linking 의 문제가 있었다. ELF 는 현재 UNIX System V, Linux and BSD 에서 채택했으며, 기존의 a.out 포맷보다 shared library 에 대해서 나은 지원을 한다. 또한 디버거를 위한 정보 또한 이전보다 완성도가 높다.
ELF 오브젝트 파일은 3 가지로 타입으로 구분할 수 있다.

- Relocatable object(=Linkable) : section tables
- Executable object : program header table
- Shared object : have both of them

하나의 segment 는 여러 개의 section 들로 구성된다. 예를 들어, 하나의 loadable read-only segment 는 code section, read-only data section, dynamic linker 를 위한 symbol 들로 구성되어 있다. 여기서 section 들은 linker 에 의해 처리되어 지는 부분이고 segment 는 loader 에 의해 memory 로 mapping 되는 부분이다.
아래의 그림은 Relocatable 과 Executable object 를 비교한 그림이다.

{{ :computer:compiler:compiler3.jpg
}}

Relocatable object 는 gcc -c 로 만들 수 있다. Executable object 는 gcc -o 로 만들 수 있다.
이해를 돕기 위해 예를 들어보겠다. a.c, b.c, c.c 라는 3 개의 소스 파일이 있다고 하자. 각 3 개의 파일들은 서로를 참조한다. 때문에 프로그램을 실행하기 위해서는 3 개의 파일을 모두 컴파일 해야 한다.
```
#gcc -c a.c b.c c.c  ---- 1
#gcc -o a.c b.c c.c  ---- 2
```
1 의 결과, 모두 .o 형태의 Relocatable object 가 생성되었을 것이다. readelf 명령을 이용해서 보면 각각의 파일들 모두 독립적인 section(.text, .data, .bss 등) 을 가지고 있는 것을 볼 수 있다. 다음은 3 개의 .o 파일 중 하나를 출력한 것이다. 참고로 모두 동적 라이브러리를 링크했다.
```
ELF Header:
  Magic:   7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00
  Class:                             ELF32
  Data:                              2's complement, little endian
  Version:                           1 (current)
  OS/ABI:                            UNIX - System V
  ABI Version:                       0
  Type:                              REL (Relocatable file)   // relocatable file
  Machine:                           Intel 80386
  Version:                           0x1
  Entry point address:               0x0
  Start of program headers:          0 (bytes into file)   // program header table 없음
  Start of section headers:          216 (bytes into file)
  Flags:                             0x0
  Size of this header:               52 (bytes)
  Size of program headers:           0 (bytes)
  Number of program headers:         0
  Size of section headers:           40 (bytes)
  Number of section headers:         10
  Section header string table index: 7
 
Section Headers:                 // 모든 section 들의 주소가 0 으로 지정되어 있지 않음
  [Nr] Name              Type            Addr     Off    Size   ES Flg Lk Inf Al
  [ 0]                   NULL            00000000 000000 000000 00      0   0  0
  [ 1] .text             PROGBITS        00000000 000034 000027 00  AX  0   0  4
  [ 2] .rel.text         REL             00000000 00030c 000010 08      8   1  4
  [ 3] .data             PROGBITS        00000000 00005c 000000 00  WA  0   0  4
  [ 4] .bss              NOBITS          00000000 00005c 000000 00  WA  0   0  4
  [ 5] .rodata           PROGBITS        00000000 00005c 000007 00   A  0   0  1
  [ 6] .comment          PROGBITS        00000000 000063 000033 00      0   0  1
  [ 7] .shstrtab         STRTAB          00000000 000096 000041 00      0   0  1
  [ 8] .symtab           SYMTAB          00000000 000268 000090 10      9   7  4
  [ 9] .strtab           STRTAB          00000000 0002f8 000014 00      0   0  1
Key to Flags:
  W (write), A (alloc), X (execute), M (merge), S (strings)
  I (info), L (link order), G (group), x (unknown)
  O (extra OS processing required) o (OS specific), p (processor specific)
 
There are no program headers in this file.
 
Relocation section '.rel.text' at offset 0x30c contains 2 entries:
 Offset     Info    Type            Sym.Value  Sym. Name
00000014  00000501 R_386_32          00000000   .rodata
00000019  00000802 R_386_PC32        00000000   printf   //printf 함수의 경우, 공유 라이브러리를 이용하지만, 현재는 찾을 수 없기 때문에 값이 0 임 
 
There are no unwind sections in this file.
```
위에서 주석을 달았지만, Relocatable object 의 경우에는 대부분의 section 들의 주소가 0 으로 되어 있는 것을 볼 수 있다. 또한 printf 함수 같은 공유 라이브러리를 참조하는 경우, 아직 찾을 수 없기 때문에 0 으로 세팅되어 있다.
이번에는 2 결과로 생성된 a.out 파일을 살펴보자.
```
ELF Header:
  Magic:   7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00
  Class:                             ELF32
  Data:                              2's complement, little endian
  Version:                           1 (current)
  OS/ABI:                            UNIX - System V
  ABI Version:                       0
  Type:                              EXEC (Executable file)  // executable file
  Machine:                           Intel 80386
  Version:                           0x1
  Entry point address:               0x8048278
  Start of program headers:          52 (bytes into file)
  Start of section headers:          7444 (bytes into file)
  Flags:                             0x0
  Size of this header:               52 (bytes)
  Size of program headers:           32 (bytes)           // program header table 존재
  Number of program headers:         6
  Size of section headers:           40 (bytes)
  Number of section headers:         34
  Section header string table index: 31
 
Section Headers:   // 각 section 의 주소가 지정되어 있음
  [Nr] Name              Type            Addr     Off    Size   ES Flg Lk Inf Al
  [ 0]                   NULL            00000000 000000 000000 00      0   0  0
  [ 1] .interp           PROGBITS        080480f4 0000f4 000013 00   A  0   0  1
  [ 2] .note.ABI-tag     NOTE            08048108 000108 000020 00   A  0   0  4
  [ 3] .hash             HASH            08048128 000128 000028 04   A  4   0  4
  [ 4] .dynsym           DYNSYM          08048150 000150 000050 10   A  5   1  4
  [ 5] .dynstr           STRTAB          080481a0 0001a0 00004c 00   A  0   0  1
  [ 6] .gnu.version      VERSYM          080481ec 0001ec 00000a 02   A  4   0  2
  [ 7] .gnu.version_r    VERNEED         080481f8 0001f8 000020 00   A  5   1  4
  [ 8] .rel.dyn          REL             08048218 000218 000008 08   A  4   0  4
  [ 9] .rel.plt          REL             08048220 000220 000010 08   A  4   b  4
  [10] .init             PROGBITS        08048230 000230 000017 00  AX  0   0  4
  [11] .plt              PROGBITS        08048248 000248 000030 04  AX  0   0  4
  [12] .text             PROGBITS        08048278 000278 000160 00  AX  0   0  4
  [13] .fini             PROGBITS        080483d8 0003d8 00001b 00  AX  0   0  4
  [14] .rodata           PROGBITS        080483f4 0003f4 00000f 00   A  0   0  4
  [15] .eh_frame         PROGBITS        08048404 000404 000004 00   A  0   0  4
  [16] .data             PROGBITS        08049408 000408 00000c 00  WA  0   0  4
  [17] .dynamic          DYNAMIC         08049414 000414 0000c8 08  WA  5   0  4
  [18] .ctors            PROGBITS        080494dc 0004dc 000008 00  WA  0   0  4
  [19] .dtors            PROGBITS        080494e4 0004e4 000008 00  WA  0   0  4
...
Program Headers:
  Type           Offset   VirtAddr   PhysAddr   FileSiz MemSiz  Flg Align
  PHDR           0x000034 0x08048034 0x08048034 0x000c0 0x000c0 R E 0x4
  INTERP         0x0000f4 0x080480f4 0x080480f4 0x00013 0x00013 R   0x1
      [Requesting program interpreter: /lib/ld-linux.so.2]
  LOAD           0x000000 0x08048000 0x08048000 0x00408 0x00408 R E 0x1000
  LOAD           0x000408 0x08049408 0x08049408 0x00100 0x00104 RW  0x1000
  DYNAMIC        0x000414 0x08049414 0x08049414 0x000c8 0x000c8 RW  0x4
  NOTE           0x000108 0x08048108 0x08048108 0x00020 0x00020 R   0x4
...
Relocation section '.rel.plt' at offset 0x220 contains 2 entries:
 Offset     Info    Type            Sym.Value  Sym. Name
080494fc  00000107 R_386_JUMP_SLOT   08048258   __libc_start_main   
08049500  00000207 R_386_JUMP_SLOT   08048268   printf    // 공유 라이브러리 함수인 printf 의 주소가 지정되어 있음
...
```
역시 위에서 주석을 추가한 것처럼, Executable object 는 각각의 Relocatable object 의 각 section 들을 통합해서 하나의 section 으로 통합했다.
또한 공유 라이브러리 역시, 주소가 할당되어 있다. Executable object 는 loader 에 의해서 바로 메모리에 할당되기 전까지의 준비가 되어 있어야 하기 때문에, dynamic linking 을 제외하고는 모든 것이 정해져야 한다.
Relocatable 는 Executable 를 만드는 과정의 중간 단계라고 보면 된다.
==== ELF Header ====

- e_entry : Executable object 의 경우에만 의미가 있으며, 처음 메모리에 올라갈 주소를 나타냄
- e_phoff, e_shoff : 각각 처음부터 테이블의 위치를 파악하기 위해 사용함
- e_shstrndx : name string index 를 가지고 있는 table header 를 가리킴
==== ELF Section Header ====

- sh_offset : section 이름에 해당 section 의 위치값을 가리킴
==== ELF Sections ====
Section type 들은 다음과 같다.
- PROGBITS : .text, .data, debugger info 같은 program contents
- NOBITS : .bss 와 같이 0 크기의 영역 용량을 할당받는 것
- SYMTAB and DYNSYM : .symtab 와 .dynsym 같은 symbol 테이블
- STRTAB : .strtab 과 .dynstr 같은 string 테이블
- REL and RELA : .rel.text, .rel.data, and .rel.rodata 같은 relocation 정보를 가짐
- DYNAMIC and HASH : dynamic linking 정보와 runtime symbol hash table

Flag bits
- ALLOC(memory allocaton), WRITE(write perm), and EXECINSTR(executable)

| 종류 | 설명 |
| .text | PROGBITS type, ALLOC+EXECINSTR attribute, 'text'(실행가능한 코드)를 포함 |
| .data | PROGBITS type, ALLOC+WRITE attribute, 초기화된 데이터를 포함 |
| .rodata | PROGBITS type, ALLOC attribute, read-only 데이터를 포함 |
| .bss | NOBBITS type, ALLOC+WRITE attribute, 초기화되지 않은 데이터를 포함 |
| .rel.text | REL or RELA type, .text section 을 relocation 하기 위한 정보를 가짐, 실행가능(executable) object 를 수정하기 위해서 주소 명령이 필요함 |
| .rel.data | REL or RELA, .data section 을 relocation 하기 위한 정보를 가짐, 합쳐진(merged) 실행가능(ececutable) object 를 수정하기 위해 데이터 포인터의 주소가 필요함 |
| .init and .fini | PROGBITS type, ALLOC+EXECINSTR attribute, .text 와 비슷함, 프로그램이 시작(start) 하거나 종료(terminate) 될 때 수행되기 위한 코드, C 와 Fortran 은 필요가 없지만, C 는 필수적으로 필요함 |

| .symtab and .dynsym | 각각 SYMTAB 과 DYNSYM 타입을 가짐, symbol table 을 포함, dynamic linker symbol table 은 ALLOC 타입임 |

.strtab and .dynstr	STRTAB 타입, symbol table 을 위한 name strings 또는 section table 을 위한 section name 의 table, .dynstr section 은 ALLOC 타입임
.interp	interpreter(해석 프로그램)를 사용하기 위해서 이름을 포함하고 있음, 예를 들어 dynamic linking 을 하기 위해 /lib/ld-linux.so 를 사용 할 수 있음, shell script 같은 스스로 실행할 수 있는(self-running) interpreted text file 과 같은 개념임
.got(global offset table), .plt(procedure linkage table)	dynamic linking 을 위해 사용됨
.debug	디버거를 위한 symbol 이 포함됨
.line	디버거를 위한 것으로서 object code 의 위치를 source code 위치와 매핑하는 정보를 가짐
.comment	문서화를 위한 문자열을 포함하고 있음(예를 들면 version control number)
.hash	symbol hash table

p_vaddr : physical address 와 virtual address 가 같을 수 있는 데, 이때 physical address 는 진짜 physical address 가 아니다. Executable object 파일에서 physical address 가 명시되어 있다고 해도, 나중에 메모리에 접근할 때는 MMU 를 거쳐서 가기 때문에 동일하지 않을 수 있다.

Linker 는 위와 같이 여러개의 소스 파일을 컴파일해서 나온 각각의 relocatable object 파일을 executable object 파일로 만들어 준다.
컴파일시에 특정 ld 파일을 따로 지정해서 컴파일 할 수도 있다.

object 파일을 합침(merge) : 여러 개의 relocatable(.o) object 파일을 하나의 executable object 파일로 합쳐, loader 에 의해서 load 되고 실행되어지게끔 한다.
symbol resolution : 현재 소스에 없는 함수나 변수들(external reference) 을 다른 object 파일의 정의된 symbol 에서 참조한다. 정의되지 않은(undefine) symbol 을 찾기 위해서 라이브러리들을 찾는다.
relocates symbol : .o 파일에서 관계있는 symbol 들끼리, 새로운 절대적인(absolute) executable object 파일에 위치시킨다. symbol 들은 새로운 위치를 반영하기 위해서 모든 참조(references)들은 업데이트 된다.

Modularity : 프로그램이 작은 소스 파일의 모음으로서 쓰여질 수 있고, 오히려 모놀리틱 하다. 함수들을 라이브러리로 빌드할 수 있다.
Efficiency : 시간(하나의 소스 파일이 바뀌면, compile 하고 relink 해야 하지만 다른 소스 파일들은 다시 compile 할 필요가 없다), 공간(함수들을 라이브러리 형태의 하나의 파일로 모을 수 있다. executable 파일과 메모리에서 실행되는 이미지(image) 들은 오직 실제적으로 사용되는 함수를 위한 code 를 포함하고 있다.

위 그림은 각각의 relocatable object 파일의 section 을 합쳐서 하나의 segment 로 만드는 과정을 보여준다.

Linker 는 link script 라는 파일에 의해서 조정(controll) 된다.
이 파일은 input 파일안의 section 들을 어떻게 매핑하여 output 파일로 만들어 내는지에 관한 정보를 가지고 있다.
output 파일의 memory layout 을 조정할 수 있다. 간단한 text 파일의 형태로 되어 있다. Linux 경우, ld-script 라는 이름으로 존재한다.

VMA(Virtual Memory Address) : output 파일이 실행될 때, 각 section 이 가지는 주소
LMA(Load Memory Address) : section 이 로드될 주소

대부분의 경우 LMA 와 VMA 는 동일하며, DATA section 이 FALSH 에 있고 RAM 으로 load 되는 경우는 FLASH 주소가 LMA 가 되고 RAM 주소가 VMA가 된다.
다음은 Linker Script Commands 를 표로 나타낸 것이다.

command	설명
ENTRY(symbol)	entry point 를 설정, 일반적으로 함수 호출과 비슷
INCLUDE filename	filename 의 linker script 를 include 시킴
INPUT(file file…)	link 에서 named file 을 include 시킴
GROUP(file file…)	INPUT 과 비슷하며, archive named file 들은 제외시킴
OUTPUT(filename)	컴파일시에 '-o filename' 옵션을 주는 것과 동일함
STARTUP(filename)	INPUT 명령어와 비슷하고, 링크 될 first input file 이 될 filename 은 제외시킴
SECTION{} command	linker 가 output section 에서 input section 을 어떻게 매핑할 것인지 알려줌

실제로 컴파일 할 때는 자동으로 linker script 가 지정되어 컴파일 되어진다. 만일 따로 linker script 를 지정해주고 싶다면,

#gcc -o test main.c libcl.o -Wl -T default.lds

위와 같이 하면 된다. 여기서는 defaut.lds 라는 파일을 따로 지정했다.

프로그램이 실행되기 전에 프로그램 안에 설치(installed) 되며, 간단히 object 파일의 모음으로 실행된다. 확장자는 .a 이다.

장점 : 재 컴파일하기 위한 코드 없이 프로그램의 link 를 할 수 있다. 재 컴파일 시간을 줄일 수 있다. shared library 에 비해서 실행 속도가 약간 빠르다.(1~5%)
단점 : shared library 보다 용량이 크다.

프로그램이 시작할 때 로드되며, 프로그램 들 사이에서 shared 될 때 사용된다.

장점 : shared library 를 이용한 실행 프로그램은 static library 를 이용한 것보다 크기가 훨씬 작다. library 독립적으로 프로그램을 작성할 수 있다.
단점 : static library 를 이용한 것보다 실행 속도가 조금 느리다.

실행 binary object file 을 메모리에 적재하여 실행할 수 있도록 하는 과정.
현재의 대부분의 OS 에서는 모든 실행 프로그램이 고정적인 주소에 적재되고 그 주소에 대해서 링크될 수 있다.
loading 과정은 다음의 단계를 거친다.

object file 로 부터 header 정보를 읽어 loading 가능한 file 인지 판단한 후 얼마나 많은 주소 공간이 필요한지 찾는다.
주소 공간을 할당한다. 만약 object format 이 개별적인 segment 를 가진다면 각각의 segment 에 대해서 주소 공간을 할당한다.
프로그램을 주소 공간상의 세그먼트로 읽는다.
virtual memory system 이 자동적으로 하지 않는다면 bss 영역을 0 으로 초기화 한다.(초기화 코드)
필요하다면 stack segment 를 생성한다.
program arguments 와 환경 변수와 같은 run-time 정보들을 설정한다.
program 의 시작 번지에서 프로그램을 시작한다.(_start)

Load-time dynamic linking : executable ELF file 은 디스크 에서 메모리로 읽고, 아직 결정되지 않은 symbol 들을 결정(resolve) 한다.
Run-time dynamic linking(or lazy linking) : executable ELF file 은 디스크 에서 메모리로 읽고, 아직 결정되지 않은 참조들에서 유효하지 않은 것(일반적으로 0)은 버린다.
Program Interpreter(dynamic linker) : dynamic linking 을 이용하도록 executable ELF file 을 생성할 때, linker 는 .interp segment(PT_INTERP type) 에 file 을 실행하는 데 필요한 interpreter 를 추가한다.

GOT 는 Global Offset Table 의 약자로서, .got section 에 있다. shared object 는 GOT 를 가지고 있다. linker 는 shared object 에서 참조하기 위해 executable ELF file 에 GOT 를 생성한다. ELF executable file 이 실행될 때, dynamic linker 는 GOT 안의 symbol 들을 결정한다.

PLT 는 Procedure Linkage Table 의 약자로서, .plt section 에 있다. shared object 에서 참조하는 것을 찾는 것은 PLT entry 를 생성하고, PLT 에서 jump 함으로서 결정된다.

Linux 에서 loader 의 과정을 보고 싶다면, 아래와 같이 한다.

#export LD_DEBUG=all
#./test > test.debug 2>&1

다음은 http://www.mobilelab.co.kr/programming/content.asp?num=299&tname=study_brew 에서 퍼온 글이다.
컴파일 시에 옵션으로 '-DPIC' 를 주었을 때, 달라지는 점들에 대해서 설명하고 있다.

애플리케이션은 폰의 메모리에 로딩된 후 실행이 됩니다.
 
그럼 메모리의 어느 부분에 로딩이되고 실행이 될까요??
 
답은 아무도 모른다 입니다. 폰도 모릅니다.. -_-; 그때 그때 상황에 따라 달라지니까요..
 
물론 CPU 나 OS 의 특성에 따라 달라지지만 일반적으로 OS 는 프로그램을 로딩하고 실행할 때 그 프로그램을 위한 고유의 가상메모리를 만든후 프로그램을 실행 시키죠.
 
예를들어 쉽게 얘기하면 프로그램의 입장에서 보면 프로그램의 가장 첫 부분의 address 는 0000 이 된다는 말입니다.
 
이렇게 해야 프로그램내에서 변수 또는 함수의 Address 를 쉽게 찾을 수 있기 때문입니다.
 
그런데, BREW 는 불행하게도 프로그램에 어떠한 고유 Address 를 주지 않습니다.
 
이런 상황에서 프로그램이 정상적으로 실행이 되려면, 프로그램은 자신이 로딩되는 위치에 상관 없이 동작 할 수 있도록 코드가 구성 되어야 합니다.
 
이런 방식을 Position Independent Code (PIC) 라고 합니다.
 
ADS 에서 MAKEFILE 을 살펴보신 분들은 아시겠지만, ropi 라는 옵션을 사용합니다.
 
이것이 PIC 를 만들어주는 옵션입니다.
 
그런데, ADS 의 PIC 는 조금 문제가 있습니다.
 
ADS 에서 사용하는 PIC 방식은 PC Relative Adressing 방식입니다.
 
이 방식은 PC ( Program address Counter : 현재 실행되는 instruction 의 위치를 가지는 레지스터 ) 를 기준으로 "+/- 얼마" 이런 방식으로 Function 의 실제 Address 를 구해내는 방식입니다.
 
이 방식은 Function 을 엑세스 하는데는 빠르지만, 변수를 엑세스 하기에는 굉장히 어려운 방식입니다.
 
그런 이유로 ADS 를 사용하면 전역 변수를 사용할 수가 없는 것입니다. ( 그런데 지금도 그런가요?? )
 
그럼 GCC 는 어떨까요?
 
GCC 도 타겟 CPU 에 따라 조금씩 다르기는 하지만, 기본적으로 GOT ( Global Offset Table ) 라는 테이블을 사용하여 변수및 함수의 주소를 찾는 방식으로 되어있습니다.
 
GOT 에 대해서 잠시 설명 드리겠습니다.
 
GOT는 프로그램에서 사용하는 모든 Function 또는 변수의 상대적 주소를 가지고 있습니다.
 
즉 프로그램이서 어떤 변수 또는 함수를 엑세스 하려고 할때, 직접 그 어드레스를 엑세스하지 않고, GOT 의 값을 참고해서 엑세스 하는 방식을 말합니다.
 
GOT 방식을 사용할 경우, 프로그램이 메모리에 로딩된 이후에 GOT 의 모든 값을 실제 Address 로 치환해 주어야 합니다. 
물론 이것은 프로그램이 로딩된 주소를 안다면 아주 쉽습니다.
프로그램이 시작주소 + GOT 의 값을 다시 써넣어 주기만 하면 되니까요.
 
이해하기 쉽게 PC Relative 방식과 GOT 방식을 C 코드로 적어보면 다음과 같습니다.
 
주소는 그냥 임의의 값입니다.
 
1) 원래 코드
절대주소 상대주소 
00123000 00000000 void Func1(void) {}
00123010 00000010 void Func2(void) {}
00123020 00000020 void main(void) {
00123030 00000030 Func1();
00123040 00000040 Func2();
}
 
2) PC Relative 방식
00123000 00000000 void Func1(void) {}
00123010 00000010 void Func2(void) {}
00123020 00000020 void main(void) {
00123030 00000030 (PC-30)(); // PC = 00123030
00123040 00000040 (PC-30)(); // PC = 00123040
}
 
3) GOT 방식 ( 로딩전(GOT치환전) )
00123000 00000000 void Func1(void) {}
00123010 00000010 void Func2(void) {}
00123020 00000020 void main(void) {
00123030 00000030 GOT[0]();
00123040 00000040 GOT[1]();
}
GOT[] = { 00000000, 00000010 };
 
GOT 방식 ( 로딩후(GOT치환후) )
00123000 00000000 void Func1(void) {}
00123010 00000010 void Func2(void) {}
00123020 00000020 void main(void) {
00123030 00000030 GOT[0]();
00123040 00000040 GOT[1]();
}
GOT[] = { 00123000, 00123010 }; 
 
이해가 되시죠??
 
GOT 방식을 사용하면, Function 과 변수가 모두 GOT를 통해 접근이 되므로 속도가 조금 느려질 수 밖에 없습니다.
 
그러나 눈에 띄일 정도는 아니니 걱정 안하셔도 됩니다.
 
그럼 우리가 앞으로 GCC 를 사용하기 위해서 어떤 일을 해야 하는지 대충 감이 잡히시나요?
 
네.. 단 한가지 입니다.
 
프로그램이 폰으로 로딩되면 GOT 만 실제 Address 로 치환해 주는 일만 하면 됩니다.
 
그러자면 프로그램이 로딩되는 Address 를 알아야 겠죠?
 
BREW 에서 프로그램이 메모리에 로딩이 되면, 로딩된 Address ( 상대주소 = 0 ) 에 위치하는 함수를 곧바로 호출합니다.
 
이 함수가 바로 AEEMod_Load(...) 입니다.
 
GCC 를 사용하기 위해서 손봐야할 부분이 바로 이 AEEMod_Load 입니다.
 
AEEMod_Load(...) 를 수정해서 실제 프로그램이 로딩되 주소를 알아내야 하고, 그 주소를 기반으로 GOT 를 변경해 주어야 합니다.
 
오늘은 여기 까지만 하겠습니다. 
 
아마도 대충 감이 잡히셨을 것이라고 생각됩니다.

컴파일러는 뭐지?

GNU Tool-Chain

GCC (GNU Compiler Collection)

Linker

Linker 의 기능

왜 Linker 를 사용하나

ELF Linking

Linker Script

Library

Static Library

Shared Library

Loader

Dynamic linking

GOT and PLT

추가 사항

Position Independent Code