Linuxis kompileerimine puust ja punaseks
Enamus programme teevad nn "päringuid" (calls) operatsioonisüsteemi teenuste suunas. Näiteks: "ütle mulle jooksev kellaaeg" või "mis kasutajad on sisse loginud".
Kuna programeerijatele oleks tüütu neid käske teostavaid koodijuppe uuest ja uuesti kirjutada on tehtud neist eraldi funktsioonid mis koondatud teekide nimelistesse kogumikesse (ingliskeeles "libraries"). Nii peavad programeerijad kirjutama algkoodi neile funktsioonidele vaid viiteid (function calls).
Sedamoodi funktsioone kasutava inimloetaval tekstikujul asetseva programmifaili kompileerimine toimub järgnevalt.
- Kompilaator programm loeb algkoodiks olevat faili ja mätsib selle tulemusel kokku asja mida kutsutakse object tüüpi failiks. Tegemist on binaarse (masinloetava) versiooniga programmeerija algkoodist kus märgitud viited teekides asuvatele funktsioonidele.
- Järgmine samm on "linkimine" ehk siis käivitatakse programm nimega linker mis loeb läbi kompilaatori objektifailid, teegid ja asendab programeerija viited teekidest pärineva koodiga. Peale seda asendust on tulemuseks käivitatav koodifail.
Linuxis tegeleb make nimeline käsurea programm nii kompileerimise kui ka linkimisega.
Seda protsessi iseloomustab hästi allolev skeem:
Ehk siis meil on näiteks koodifail nimega main.c, kompilaatoriga genereeritakse sellest main.o ning linker loob main.o failist omakorda lõpliku käivitatava main binaarfaili.
TODO
On olemas kaks põhilist linkimise viisi:
- Staatilise linkimise puhul toimub sümbolite lahendamine vahetult pärast programmi kompileerimist; kõik viidatud teegiosad kopeeritakse samasse binaarfaili koos programmi enda koodiga.
- Dünaamilse linkimise puhul toimub sümbolite lahendamine programmi käivituse vői töö ajal. Mällu laetakse eraldi programmi binaarfail kui ka teegifailid, ning programmis kasutatud sümbolite viidad suunatakse teegifailile. Windows operatsioonisüsteemidel tunneb ära dünaamilised teegifailid nende laiendi ".DLL" järgi; Unix-laadsetes operatsioonisüsteemides kasutatakse eesliidet "lib" ning laiendit ".so".
ldd käsk
# ldd /usr/bin/mail linux-vdso.so.1 => (0x00007fff4d1ff000) libc.so.6 => /lib64/libc.so.6 (0x00007fb58cd9f000) /lib64/ld-linux-x86-64.so.2 (0x00007fb58d12b000)
Linuxis
ldconfig -p
BSD's
ldconfig -r
Praktiliselt kõikjal on linuxis kasutusel dünaamiline linkimine, s.t. elf sisaldab viiteid libradele. Kernel otsib enne elf-i käivitamist vajalikud librad ja mätsib kõik funktsioonide väljakutsed sümbolite järgi, vt ntx
$ readelf -s /usr/sbin/postfix ... 1: 0000000000000000 0 FUNC GLOBAL DEFAULT UND getenv@GLIBC_2.2.5 (2) 2: 0000000000000000 0 FUNC GLOBAL DEFAULT UND free@GLIBC_2.2.5 (2) ...
Ja
$ readelf -s /lib64/libc.so.6 ... 1295: 000000000003a920 213 FUNC GLOBAL DEFAULT 12 getenv@@GLIBC_2.2.5 2209: 0000000000082850 136 FUNC GLOBAL DEFAULT 12 free@@GLIBC_2.2.5 ...
Lõpus olev GLIBC_2.2.5 tähendab siin sümboli versiooni, mida uuendatakse ainult siis, kui funktsiooni käitumine muutub. Tegelikult siin /lib64/libc.so.6 pärit näiteks pakist glibc-2.19.
Kui glibc värskendamisel versioonihüpe pole väga suur, võib juhtuda, et kogu opsüsteem kasutab juba viimase versiooni sümboleid ja siis pole teiste programmide uuendamine ehk userlandi vajalik.
Ingliskeelsed viited
Eestikeelsed viited