Termipankki
  1. A
    1. Abstraktio
    2. Alias
    3. Alustaminen
    4. Ankkatyypitys
    5. Argumentti
    6. Arvo
    7. Asetuslippu
    8. Avainsana
  2. B
    1. Binääriluku
    2. Binääritiedosto
    3. Bitti
    4. Bittinegaatio
    5. Bittioperaatio
  3. C
    1. C-funktio
    2. C-kirjasto
    3. C-muuttuja
  4. E
    1. Ehtolause
    2. Ehtorakenne
    3. Esikääntäjä
    4. Esikääntäjädirektiivi
    5. Esittely
    6. Etumerkitön
  5. H
    1. Heksadesimaali
  6. I
    1. Iteroitava
  7. K
    1. Kirjasto
    2. Kokonaisluku
    3. Kommentti
    4. Komplementti
    5. Konekieli
    6. Koodilohko
    7. Käskykanta
    8. Kääntäjä
  8. L
    1. Lause
    2. Liukuluku
    3. Looginen operaatio
  9. M
    1. Makro
    2. Merkki
    3. Merkkijono
    4. Metodi
    5. Muisti
    6. Muuntumaton
    7. main-funktio
  10. O
    1. Objekti
    2. Ohjausrakenne
    3. Optimointi
    4. Osoitin
    5. Otsikkotiedosto
    6. Otsikkotiedot
  11. P
    1. Paikanpidin
    2. Paluuarvo
    3. Parametri
    4. Poikkeus
    5. Prototyyppi
    6. Python-for
    7. Python-format
    8. Python-funktio
    9. Python-import
    10. Python-konsoli
    11. Python-lista
    12. Python-muuttuja
    13. Python-pääohjelma
    14. Python-tulkki
    15. Pääfunktio
    16. printf
  12. R
    1. Resurssi
  13. S
    1. Staattinen tyypitys
    2. Syntaksi
  14. T
    1. Taulukko
    2. Tavu
    3. Terminaali
    4. Tietorakenne
    5. Tyyppi
    6. Tyyppimuunnos
  15. V
    1. Varoitusviesti
    2. Virheviesti
  16. W
    1. while
Ratkaistu: / tehtävää

Assembly-kieli

Osaamistavoitteet: Tämän materiaalin luettuaan opiskelija tuntee y86-assembly-kielen syntaksin ja keinoja miten ylemmän tason ohjelmointikielten toiminnallisuutta voidaan toteuttaa assemblyllä.
Kurssilla opetellaan ensin y86-assembly- ja konekieli, joita sitten käytetään havainnollistamaan käskyn suoritusta prosessorissa ja esitellään suorittimen sisäiset osat jotka liittyvät käskyn suorittamiseen. Lisäksi y86-assembly-kieltä käytetään kurssin harjoitustehtävien ja -työn tekemisessä assembly-kääntäjän (engl. assembler) ja -simulaattorin avulla.
y86-64:sen assemblyn syntaksi ja käskykanta ovat perusteiltaan ja käytännössä hyvin samankaltaisia kuin x86 assembly. Näin olen itseasiassa pienillä muutoksilla ohjelmia voi käyttää molemmissa suorittimissa! Toki on huomattava merkittävä ero käskykannan laajuudessa, koska y86 on opetuskäyttöön kehitetty hyvin yksinkertaistettu suoritin. Lähellekään kaikkia toista tuhatta x86-suoritinperheen assembly-käskyjä ole toteutettu y86-64-suorittimeen.

Yleistä

Nyt y86-assemblyllä ohjelmoidessa pelaamme tietysti edellisessä materiaalissa esittelyn y86-suoritinarkkitehtuurin pohjalta. Meillä on siis käytössä:
Huomataan, että y86-assemblykäskyt päättyvät usein kirjaimeen q, joka tarkoittaa sitä että käskyn käsittelemä operandi on 64-bittinen (quad). Yleisesti 32-bittistä operandia merkitsee kirjain l (long word) ja 16-bittistä operandia kirjain w (word), mutta y86:sessa on siis käytössä vain 64-bittiset luvut.
Näillätiedoin lähdetäänpä katsomaan y86-assemblyn syntaksia..

Siirto-operaatiot

Aloitimme JTKJ-osuudessa C-kielen ohjelmoinnin opettelun ottamalla muuttujat käyttöön ohjelmassamme, joten tehdään nyt sama y86-assemblyllä. Yleisesti assembly-kielissä ei ole käytössä loogisia nimiä muuttujille, tyyliin uint8_t kalansaalis = 3;, vaan sen sijaan käytämme muuttujina suorittimen rekistereitä ja muistia suoraan muistiosoitteiden kautta.
Muistamme arkkitehtuurikuvasta, että ALU tekee operaatiot suorittimen sisäisessä muistissa (=rekistereissä) oleville operandeille. Joten,
Siirtokäskyjä y86-assemblyssä on neljä. Yleinen käsky on movq, jonka eteen tarvitaan kaksi kirjainta ilmaisemaan molempien operandien tyypit, eli mi(s)tä siirretään ja minne. Käskyt ottavat tyypin mukaan kaksi operandia, eli juurikin mistä arvo siiretään ja minne.
Huomioitavaa y86-assemblyssä on, ettei siirtoja voi tehdä muistiosoitteesta toiseen tai vakioarvoa ei voi viedä suoraan muistiin. Aina pitää mennään jonkin rekisterin kautta. Selitys tähän tulee myöhemmässä materiaalissa..
Koodiesimerkki.
#.pos 0               
   irmovq $4,%rax      # Suora osoitus: sijoitus %rax = 4 
   rrmovq %rax,%rcx    # Rekisteriosoitus: sijoitus %rcx = %rax
   mrmovq (%rdi), %r10 # Epäsuora osoitus: haetaan arvo %rdi:n osoittamasta muisti-
                       # paikasta ja sijoitetaan se rekisteriin %r10
   rmmovq %rsi,8(%rdx) # Epäsuora osoitus: sijoitetaan %rsi:n arvo
                       # muistiosoitteeseen, joka on %rdx:n arvo + 8
#  halt               
Siirto-operaatioissa kaikki aiemmassa materiaalissa esitetyt muistin osoitustavat ovat käytössä, mutta palataan niihin hetken päästä tarkemmin..

Aritmeettiset operaatiot

Aritmeettisiä operaatiota on käytössä vain neljä erilaista, tarkoittaen että monimutkaisemmat operaatiot kuten kerto- tai jakolasku tulee toteuttaa itse aliohjelmina!
Käskyt ottavat kaksi rekisterioperandia, jotka voivat olla mitä tahansa rekistereitä (alla esimerkin vuoksi satunnaisia rekistereitä).
Lisäksi tietysti suorittimen tilabitit asettuvat operaation tuloksen mukaan.
Koodiesimerkki.
#.pos 0                
   irmovq $4,%rax      # 1. operandi luku 4
   irmovq $3,%rbx      # 2. operandi luku 3
   addq   %rbx,%rax    # %rax = %rax + %rbx = 4 + 3 = 7

   irmovq $7, %rbx     # 2. operandi luku 7
   subq   %rbx,%rax    # %rax = %rax - %rbx = 7 - 7 = 0
                       # Nyt ZF-lippu asettui
#  halt                
Hox! Vakioarvoja (=numeroita) ei voi operandeina käyttää, koska muistetaan jälleen että ALU operoi aina rekisterien kanssa.

Ehdolliset siirto-operaatiot

Jahas, emme päässeetkään siirto-operaatioista eroon ihan niin helposti.. assemblykielessä on myös suorien siirto-operaatioiden lisäksi ehdollisia siirto-operaatioita, joiden toiminta riippuu tilalippujen tiloista. Ehdolliset siirto-operaatiot ovatkin kätevä (=joskus ainut) tapa toteuttaa ohjelmaan korkean tason kieliä vastaavia ehto- ja ohjausrakenteita.
Ehdolliset siirtokäskyt ottavat operandeikseen rekistereitä. Ehdollisuus käskyssä toteutuu siten, että ennen sen suoristusta tarkistetaan käskykohtaisen tilalipun tila, ja jos se on haluttu, suoritetaan siirtokäsky.
Ehdolliset siirtokäskyt, jossa r1 ja r2 sen operandirekisterit:
Ehdollisten siirtokäskyjen toteutuksen takana on idea saada ALUn digitaalilogiikan toteutus mahdollisimman yksinkertaiseksi. Seurauksena tästä sitten assembly-ohjelmoijan täytyykin itse miettiä vertailuoperaatiot tilabittien näkökulmasta, eikä totutusti helppolukuisina vertailuoperaatioina.. Tämä toimintatapa ei ole mitenkään riippuvainen suorittimen käskykannasta vaan on yleisesti käytössä kaikissa assemblykielissä.
Koodiesimerkki. C-kielen ehtolauseke..
if (a == 10) {
   b = a;
}
..toteutettuna y86-assemblyllä:
#.pos 0                
   irmovq $10,%rax     # a = 10
   irmovq $10,%rcx     # Vakio vertailuarvo 10 
   subq %rax,%rcx      # "vertailu"operaatio
   cmove %rax,%rbx     # jos ZF=1, sijoitus %rbx = %rax, eli tässä b = a
#  halt 
Ehdolliset siirtokäskyt voivat optimoida prosessorin toimintaa, josta lisää myöhemmin..

Hyppykäskyt

Hyppykäskyjä y86-assemblyssä onkin käytössä laajempi valikoima eli kokonaista seitsemän erilaista. Vastaavasti kuten ehdollisissa siirto-operaatioissa, hyppykäskyssä ei itsessään vertailla mitään, vaan ne tekevät hyppypäätöksen tilabittien perusteella. Operandiksi hyppykäskylle annetaan muistiosoite / muistiosoitteen looginen nimi, mihin hypätään.
Koodiesimerkki. C-kielen kuvitteellinen silmukkarakenne..
a = 10;
while(a > 0) {
   a--;
} 
..toteutettuna y86-assemblyllä.
#.pos 0
    irmovq $10,%rax    # silmukkamuuttuja
    irmovq $1,%r8      # Vakio 1 
loop:
    subq %r8,%rax      # %rax = %rax - 1
    jg loop            # hyppy takaisin, jos %rax > 0 (ZF=0)
#   halt 
Koodiesimerkki. C-kielen ehtolauseke..
a = 9;
if (a > 10) {
   b = 1;
} else {
   b = 0;
}
..toteutettuna y86-assemblyllä:
#.pos 0  
   irmovq $9,%rax      # a = 9
   irmovq $10,%r8      # Vakio vertailuarvo 10 
   subq %r8,%rax       # if (a > 10)
   jg suurempi         # ehtolause totta, hypätään "suurempi"
   irmovq $0,%rbx      # muutoin b = 0
   jmp ohitus          # ohitetaan "suurempi"
suurempi:
   irmovq $1,%rbx      # b = 1
ohitus:                # ohjelman suoritus jatkuu 
#  halt  

Muita käskyjä

Lisäksi y86-assemblyssä on muitakin ohjelman suoritukseen liittyviä käskyjä.
Käsky nop ei tee mitään paitsi kasvattaa PC-rekisteriä. Oikeissa prosessoreissa käskyllä on silti useita käyttötarkoituksia, mm. ajan mittaaminen ja koodin ryhmitys muistiin. Asiasta lisää myöhemmin, suorittimen toiminnan optimoinnissa käskyllä, joka ei tee mitään, on tärkeä rooli..
Käsky halt pysäyttää ohjelman suorituksen. Ohjelman suorituksen tilarekisteri muuttuu tilaan STAT=HLT.
Hox! Yllä esimerkkiohjelmissa halt-käsky oli kommentoitu pois, jos ajatte esimerkkejä emulaattorissa niin käsky on syytä ottaa pois kommenteista.

Pinon käyttö

Yleisesti pinomuisti, eli ohjelmien ajonaikainen muisti, on integroitu (lähes) kaikkiin moderneihin suorittimiin. Pinomuistiin tallennetaan sellaisia tietoa, jota tarvitaan lähitulevaisuudessa ohjelmassa ja jonka tallennukseen ei haluta käyttää rekistereitä. Esimerkkinä aliohjelmien paluuosoitteet ja argumentit, joista lisää hetken päästä..
Pinomuisti on LIFO (Last in, First out) -tyyppinen muisti, eli nimensämukaisesti pino johon kirjaimellisesti pinoamme tietoa aina toistensa päälle. Pino kasvaa näin ylöspäin ja vastaavasti pino tyhjennetään alaspäin eli päältä alkaen ylimmäinen tieto ensin.
Jotta pinon käyttö ei olisi yksinkertaista, itseasiassa muistissa taas pino kasvaa alaspäin. Toisinsanoen, pinon ensimmäinen muistipaikka on sen ylimmässä muistiosoitteessa. Kun pinoon lisätään tavaraa, viedään se aina edelliseen muistipaikkaan. (Tähän käytäntöön on lähinnä historiallisia syitä, pino usein sijoitettiin alkamaan koko muistialueen lopusta joten liikkumavaraa ei ollut kuin alaspäin tai muinaisen suorittimen käskykannassa indeksointi oli helpompaa alaspäin.)
Pinon käyttöön on kone/assemblykielissä omat käskynsä, eli y86:sessa:
Lisäksi pinon hallintaan tarvitaan avuksi rekistereitä:
Nyt siis pinokäskyt ensin automaattisesti katsovat muistiosoitteen %rsp-rekisteristä ja päivittävät rekisteriarvoa suorituksensa jälkeen.
Jokaisessa y86-assemblyohjelmassa meidän tulee ensin määrittää pinomuistin paikka. Ok, kirjaimellisesti ihan välttämätön se ei ole, pystymme toteuttamaan pieniä ohjelmia ilmankin. Kurssilla käytämme ohjelmissa aina pinoa, koska ilman pinoa aliohjelmat eivät toimi, kts alla.
y86-assemblyohjelmassa pinon alustus tapahtuu seuraavasti, asettamalla piorekisterit viittaamaan haluttuun pinon alkuosoitteeseen (tässä 0x400). Sen jälkeen voimme ohjelmassa käyttää pinoa:
.pos 0
    irmovq pino,%rbp # pinon alkuosoite 
    irmovq pino,%rsp # pinon ylimmän muistipaikan osoite 
main:
    irmovq $1,%rax   # pinoon talletettava arvo
    pushq %rax       # rekisteriarvoon pinoon
    irmovq $2,%rax
    pushq %rax
    irmovq $3,%rax
    pushq %rax       
    popq %rax        # pinon päällimmäinen arvo rekisteriin
    popq %rax
    popq %rax        # tallennettiin 3 arvoa, joten poistetaan ne kaikki
    halt
    
.pos 0x400
pino:
Hox! Esimerkkikoodia voi ajaa y86-simulaattorissa niin näkee miten pinorekisterit ja pino muistissa käyttäytyy.
Hox2! Kurssilla tyypillinen virhe on aluksi jättää pino alustamatta ja sitten ihmetellä miksi aliohjelmakutsut eivät toimi.
Hox3! Koska pino sijaitsee samassa muistissa kuin koodi ja data, pitää olla tarkkana ettei pinoon viedyt arvot ylikirjoita koodia tai muuta dataa!

Aliohjelmat

Assembly-kielissä voidaan toki luodaan ohjelmaan aliohjelmia (ts. funktioita), mutta niiden kirjoittamiseen ja käyttöön liittyy monta huomioitavaa seikkaa.

Aliohjelma muistissa

Aliohjelman paikka muistissa on täysin ohjelmoijan päätettävissä. Käyttäen direktiiviä .pos ja muistiosoitteen loogista nimeä, ohjelmoija voi sijoittaa aliohjelmansa minne tahansa ohjelman käytettävissä olevaan muistiin.
Esimerkki. Sijoitetaan aliohjelma/funktio nimeltä yhteenlasku alkamaan muistiosoitteesta 0x100.
.pos 0x100
yhteenlasku:
   addq %rax,%rbx
   ret

Aliohjelman suoritus

Aliohjelman suoritetaan hypyllä muistiosoitteeseen, mutta se tehdään omalla call-käskyllään. Aliohjelmasta kutsuvaan ohjelmaan palataan myös erityisellä ret-käskyllä. Lisäksi pitää ohjelmassa esitellä sen pinomuisti, jotta nämä käskyt toimisivat oikein.
Esimerkki. Sijoitetaan aliohjelma/funktio nimeltä yhteenlasku alkamaan muistiosoitteesta 0x100 ja pino alkamaan osoitteesta 0x400.
.pos 0
   irmovq pino,%rsp    # pino-osoitin
   irmovq pino,%rbp    # pinon alkuosoite
   call yhteenlasku    # aliohjelmakutsu
   halt                # ohjelman suoritus seis

.pos 0x100
yhteenlasku:           # aliohjelma alkaa tästä
   addq %rsi,%rdi
   ret                 # paluu aliohjelmasta
   
.pos 0x400
pino:                  # pinon alkuosoite   
Ok.. mutta miksi aliohjelmien kutsumiseen tarvitaan omat käskyt ja pino, eivätkä pelkät hyppykäskyt käy? Vastaus ei ilmene yo. esimerkeistä, mutta kyse on siitä että ennen aliohjelmaan hyppyä, suoritin itseasiassa tallentaa nykyisen tilansa, esimerkiksi yleiset rekisterit ja PC, pinomuistiin jotta täsmälleen sama suorittimen tila voidaan palauttaa aliohjelmasta paluun jälkeen.
Tähän on yksi hyvin oleellinen syy, nimittäin nyt voidaan uudelleenkäyttää samoja rekistereitä aliohjelmissa. Kun nk. pääohjelmassa talletetaan rekisterien arvot pinoon, rekisteri vapautuu aliohjelman käyttöön, ja aliohjelman lopttua pinosta saadaan palautettua "vanhat" rekisterien arvot. Kätevää varsinkin laajemmissa ohjelmissa ja kun rekistereitä on vähäinen määrä käytössä. Myöskin itseasiassa keskeytyksen käsittelijät (ja jotkut laiteohjelmiston kutsut) toimivat samalla tavoin, mutta tästä lisää myöhemmin..
Nyt, y86-assemblyssä siis:

Aliohjelman argumentit

Myös assembly-kielissä voidaan välittää aliohjelmille argumentteja sekä rekisterien että pinomuistin avulla. Kuten arvata saattaa, niin tässäkin joutuu assembly-ohjelmoija vääntämään enemmän koodia.. mutta onneksi tässä on yleisesti sovittuja periaatteita.
1. Argumenttien välittäminen rekisterien kautta. Nyt x86-suoritinarkkitehtuureissa (kyllä, x86) on sovittu mitä rekistereihin yleensä tulisi käyttää argumenttien tallentamiseen. Kun asia on sovittu, on koodin / yleiskäyttöisten funktion uudelleenkäyttö astetta helpompaa, kun ei tarvitse alkaa miettimään rekistereiden käyttöä.
Esimerkki. Rekisterien %rdi ja %rsi käyttö kahden argumentin ja palautusarvon (rekisterissä %rdi) välittämiseen.
.pos 0
   irmovq $100,%rdi    # 1. argumentti
   irmovq $200,%rsi    # 2. argumentti
   call yhteenlasku    # aliohjelmakutsu
   halt                # ohjelma seis

.pos 0x100
yhteenlasku:           # aliohjelman toiminnallisuus
   addq %rsi,%rdi      # nyt %rdi:ssä on laskun tulos eli palautusarvo
   ret                 # paluu aliohjelmasta
2. Argumentit voidaan myös tallentaa pinoon ennen aliohjelmakutsua ja lukea pinosta aliohjelman suorituksen aikana. Näin saadaan välitettyä enemmän kuin 6 parametriä. Tämä on varsin kätevä tapa, mutta huomatkaa että myös aliohjelmasta paluuosoite menee pinoon. Joten tällöin joudutaan arvojen lukemiseen pinosta käyttää epäsuoraa osoitusta.
.pos 0
   irmovq pino,%rsp      # pino-osoitin
   irmovq pino,%rbp      # pinon alkuosoite
   irmovq $10,%rax        # 3 argumenttia (10,20 ja 30) pinoon 
   pushq %rax
   irmovq $20,%rax
   pushq %rax
   irmovq $30,%rax
   pushq %rax
   call yhteenlasku      # aliohjelmakutsu
   popq %rax             # tyhjennetään pino,
   popq %rax             # jotta ei jää ylimääräistä tavaraa
   popq %rax
   halt                  # ohjelman suoritus seis
                         # ilman lopetusta ohjelman suoritus jatkuisi
                         # aliohjelman koodista! 

.pos 0x100
yhteenlasku:             # aliohjelma alkaa tästä
   mrmovq 8(%rsp),%rax
   addq %rax,%rbx
   mrmovq 16(%rsp),%rax
   addq %rax,%rbx
   mrmovq 24(%rsp),%rax
   addq %rax,%rbx
   ret                   # paluu aliohjelmasta
   
.pos 0x400
pino:                  # pinon alkuosoite   
Tarkastellaanpa tässä ohjelmassa pinomuistia y86-64-emulaattorista kaapatun kuvan avulla.
Kuvan vasemmassa laidassa siis muistiosoitteet, joista huomataan että pinon alku reisterissä %rbp on tosiaan asetettu muistipaikkaan 0x400. Seuraavaksi ohjelmassa viedään argumentit 1, 2 ja 3 pinoon yksi kerrallaan pushq-käskyillä. Pinoon tavaraa viedessä pino-osoitin %rsp muuttuu (=kasvaa ylöspäin) aina talletetun arvon koon (tässä 64-bittiä = 8 tavua) verran. Eli alussa %rsp:llä on arvo 0x400 ja kun ensimmäinen argumentti (1) on viety muistiin, siirtyy pino-osoitin yhden muistipaikan verran ylöspäin ja osoittaa nyt muistiosoitteeseen 0x3f8. Samoiten kun 2 ja 3 viedään muistiin, kasvaa pino-osoitin taas vastaavasti muistipaikan verran ja lopuksi osoittaa muistipaikkaan 0x3e8. Tämän jälkeen ohjelmassa tehdään call-kutsu ja sitä suorittaessa paluuosoite, eli halt-käskyn osoite (0x41) tallentuu pinoon. Nyt aliohjelmaan mennessä siis pinossa on neljä muistipaikkaa käytössä.
Aliohjelmassa käytämme pinoa seuraavasti.
Ohjelman lopuksi meidän tulee vielä tyhjentää pinosta sinne talletetut arvot, joka tapahtuu siis popq-käskyllä. Aina pinoa käyttäessä pitää huolehtia, että pinosta haetaan täsmälleen sama määrä dataa, kun mitä sinne tallennettiin.
Hox! Pinosta voi myös itseasiassa varata muistia käsittelemällä %rsp-rekisterin arvoa suoraan. Esimerkiksi jos tarvitsee aliohjelmassa paikallisia muuttujia niin siirtämällä pino-osoitinta eteenpäin riittävä määrä muistipaikkoja, voi epäsuoralla osoituksella käsitellä näitä ikäänkuin varattuja muistipaikkoja epäsuoralla muistiosoituksella. Tosimaailman assembly-ohjelmoinnissa pino tyypillisesti jaetaankin osiin joilla on oma käyttötarkoituksensa esimerkiksi juuri aliohjelman yhteydessä.

Kääntämistä ohjaavat käskyt

Kääntämistä ohjaavat käskyt ovat seuraavat:
Nimet eivät ole millään tavoin pakollisia, niitä voidaan käyttää auttamaan koodin jäsentämisessä. Ohjelmoijalla on tässä vapaat kädet. Yhtähyvin alla voisi lukea oa_juttu eikä main. Esimerkissä alla varataan muistiosoitteet main:lle ja kahdelle funktiolle:
main:
    ...
funktio1:
    ...
funktio2:
    ...
.pos 0 # Pääohjelma (ts. main-funktio) alkaa osoitteesta 0
main: 
    ...
.pos 0x100 # funktio1 alkaa muistiosoitteesta 0x100
funktio1:
    ...
Ohjelman muistiosoitteiden ei tarvitse olla peräkkäin, välissä voi olla "tyhjää" tilaa.. tämä on varsin hyödyllistä, jos halutaan myöhemmin esim. päivittää aliohjelmaa, niin ei tarvitse siirtää koko koodia tai sen muistiosoitteita.
Esimerkki. Ensin .pos-käskyllä voidaan asettaa haluttu muistipaikka, .align käskyllä saadaan haluttu tasaus ja .quad-käskyllä viedään muistipaikkaan dataa.
.pos 0x80
.align 8 # ryhmitellään muisti 8:n tavun mittaisiin osoitteisiin
.quad 0x1234 # 2-tavuinen luku
.quad 0x5678 # 2-tavuinen luku
Muisti näyttää seuraavalta, koska luku tasataan sanan pituuteen.
...
0x80: 0x3412000000000000
0x88: 0x7856000000000000
...

Muistin käytöstä ohjelmissa

Lopuksi vielä pari kätevää vinkkiä miten y86-assembly-ohjelmissa voi käyttää muistia muuttujien kanssa pelaamiseen.

Omat muuttujat

Kuten aiemassa materiaalissa opimme, muuttujahan on vain muistipaikka tietokoneen muistissa. Joten assemblykielissä voidaan käyttää ohjelman muistia vapaasti (mutkan kautta) myös omien muuttujien esittelyyn ja käyttöön.
Esimerkki. Esitellään kaksi omaa muuttujaa oma1 ja oma2 muistipaikoissa 0x300 ja 0x308 ja tallennetaan ja luetaan niistä arvoja.
.pos 0
   irmovq $1,%rax      # muistipaikkaan tallennettava arvo        
   irmovq oma1, %rbx   # muistipaikan osoite rekisteriin
   rmmovq %rax, (%rbx) # rekisterin arvo muistiin (epäsuora osoitus)
   irmovq $2, %rax     # muistipaikkaan tallennettava arvo        
   irmovq oma2, %rbx   # muistipaikan osoite rekisteriin
   rmmovq %rax, (%rbx) # rekisterin arvo muistiin (epäsuora osoitus)

   irmovq oma1, %rcx   # muistipaikan osoite rekisteriin
   mrmovq (%rcx), %rdi # luetaan muistipaikan arvo rekisteriin
   
.pos 0x300             # muistipaikka   
oma1:                  # muuttujan oma1 "esittely"

.pos 0x308             # muistipaikka   
oma2:                  # muuttujan oma2 "esittely"

Taulukkomuuttujat

Vastaavasti voimme tietenkin esitellä ja käyttää assemblyohjelmassa taulukoita, kuten korkeamman tason kielissä, mutta niiden käytössä tarvitsee myös hallita eri muistin osoitusmuotoja indeksoinnin toteuttamiseksi.
Nyt, epäsuora muistiosoitus on tässä erittäin kätevä, koska voimme käyttää valittua rekisteriä (=indeksirekisteri) muistiosoitteella operointiin. Ts. kirjoitamme taulukon indeksia vastaavan muistiosoitteen rekisteriin ja päivitämme osoitetta aina liikkuessamme taulukossa.
taulukko[0] # 1. alkion muistipaikka 0x300
taulukko[1] # 2. alkion muistipaikka 0x308
taulukko[2] # 3. alkion muistipaikka 0x310
...
# Miksi osoite kasvaa aina 8 (tavua)? 
# Koska arkkitehtuuri on 64-bittinen
Esimerkki. Taulukko alkaa osoitteesta 0x300, johon sijoitamme muuttujanarvoja
.pos 0
   irmovq taulukko, %rdi  # indeksirekisteri, taulukon alku
   irmovq $8, %rcx        # Vakio 8, indeksi kasvaa/pienenee 8 tavua
   
   irmovq $1, %rax        # 1. alkioon tallennettava arvo
   rmmovq %rax, (%rdi)    # sijoitus 1. alkion muistipaikkaan
   addq %rcx, %rdi        # seuraavan (2.) alkion osoite +8 tavua
   irmovq $2, %rax        # 2. alkioon tallennettava arvo
   rmmovq %rax, (%rdi)    # sijoitus 2. alkion muistipaikkaan
   addq %rcx, %rdi        # seuraavan (3.) alkion osoite +8 tavua
   irmovq $3, %rax        # 3. alkioon tallennettava arvo
   rmmovq %rax, (%rdi)    # sijoitus 3. alkion muistipaikkaan
   
.pos 0x300
taulukko:
Vastaavasti taulukosta alkion arvon lukemiseen tarvitsee nyt vain muuttaa indeksinä käytettävän rekisterin (tässä) %rdi arvoa. Esimerkiksi toisen alkion osoite olisi taulukko + 16 ja neljännen taulukko + 32, jne.

Assemblyohjelman rakenne

Alla oppikirjasta (Bryant, s. 403) ja simulaattorista löytyvä esimerkkikoodi, josta näemme y86-assemblykielisen ohjelman rakenteen pääpiirteissään.
  1. Alustus: Tässä riittää pinon muistiosoitteen asetus
  2. Pääohjelma main
    • Vastaa ikäänkuin C-kielen funktiota main()
  3. Aliohjelmat
    • Tässä sum, C-kielellä funktio (long *array, long count)
  4. Muistialueiden varaus
    • Tässä taulukko, jossa 4 alkiota
# Ohjelma alkaa muistiosoitteesta 0 
.pos 0
# Alustukset
    irmovq pino, %rbp   # Pinon alustus
    irmovq pino, %rsp   # Pino-osoitin
# Pääohjelma    
main:   
    irmovq array,%rdi   # Aliohjelman argumentit
    irmovq $4,%rsi      # 
    call sum            # kutsutaan aliohjelma sum(array, 4)
    halt                # lopetetaan pääohjelma

# Aliohjelma sum(long *array, long count)
# start in %rdi
# count in %rsi
sum:    
    irmovq $8,%r8        # Vakio 8
    irmovq $1,%r9        # Vakio 1
    xorq %rax,%rax       # sum = 0
    andq %rsi,%rsi       # Liput pois päältä
    jmp     test         # Hypätään test-lohkoon
loop:   
    mrmovq (%rdi),%r10   # Taulukon alku (*array)
    addq %r10,%rax       # Lisää alkio summaan
    addq %r8,%rdi        # Seuraavan alkio osoite (array=..)
    subq %r9,%rsi        # Taulukon pituus (count--)
test:   
    jne    loop          # Silmukka palaa alkuun jos count != 0
    ret                  # Paluu aliohjelmasta

# Pinon paikka muistissa
.pos 0x200
pino:

# Taulukko: 4 alkiota
.pos 0x300
.align 8
array:  
    .quad 0x000d000d000d
    .quad 0x00c000c000c0
    .quad 0x0b000b000b00
    .quad 0xa000a000a000

Lopuksi

Kuten materiaalista nähdään, assemblyä ohjelmoidessa täytyy ohjelmoijan mennä todella lähelle suoritinta ja näin ollen monen C-kielessäkin tavanomaisen asian toteuttaminen täytyy pohtia matalan tason konekielen käsky kerrallaan ja lisäki täytyy osata joukko tekniikoita esimerkiksi muistin käyttöön.
Kurssilla y86-assembly-ohjelmointia varten löytyy kätevästi simulaattorin verkkoversio. Mutta lukekaa ensin lisätietoa assemblyohjelmoinnista harjoitustehtävämateriaalissa.
?
Abstraktiolla tarkoitetaan sitä kun raa'an konekielen käskyt "piilotetaan" korkeamman tason ohjelmointikielen käskyjen alle. Abstraktiotasosta riippuu miten laajaa tämä piilotus on - mitä korkeampi taso, sitä vaikeampi on suoraan sanoa miten monimutkaiseksi koodirakennelma muuttuu kun se kääntyy konekielelle. Esim. Pythonin abstraktiotaso on huomattavasti korkeampi kuin C:n (itse asiassa Python on tehty C:llä...).
Alias on esikääntäjävaiheessa käsiteltävä korvaus, jolla tietty merkkijono koodissa korvataan toisella. Toiminta vastaa siis tekstieditorin replace-toimintoa. Aliaksia määritellään #define-direktiivillä. Esim #define PI 3.1416
Muuttujan alustamisella tarkoitetaan sitä, kun sille asetetaan koodissa jokin alkuarvo. Hyvin yleinen esimerkki tästä on lukumuuttujien alustaminen nollaan. Alustus voidaan tehdä muuttujan esittelyn yhteydessä: int laskuri = 0; tai erikseen. Jos muuttujia ei alusteta, niiden sisältönä on mitä ikinä muistipaikkaan on aiemmin jäänyt.
Pythonin käyttämää tapaa käsitellä arvojen tyyppiä kutsutaan dynaamiseksi tyypitykseksi eli ankkatyypitykseksi. Nimitys perehtyy lauselmaan "Jos se ui kuin ankka, kävelee kuin ankka ja ääntelee kuin ankka, se on ankka." Toisin sanoen arvon kelvollisuus määritellään sen ominaisuuksien perusteella. Tämä eroaa staattisesta tyypityksestä, jossa arvon kelvollisuus määritellään sen tyypin perusteella.
Argumentti on funktiokutsussa käytettävä arvo, joka välitetään kutsuttavalle funktiolle. Funktion sisällä argumentit sijoitetaan parametreiksi kutsuttuihin muuttujiin. Esimerkiksi printf("%c", merkki); -lauseessa argumentteja ovat "%c"-tulostusmäärittely sekä merkki-muuttujan sisältö.
Alkeiskurssilla arvo-termiä käytettiin kaikista ohjelman käsittelemistä arvoista, oli kyse sitten muuttujista, lauseiden tuloksista tai mistä tahansa. Arvo on siis käytännössä tietokoneen muistissa olevaa dataa, johon muuttujat voivat viitata. C:ssä muuttujan ja sen arvon suhde on Pythonia tiiviimpi, koska muuttuja vastaa suoraan sitä muistialuetta johon arvo on talletettu.
Asetuslippuja käytetään kun suoritetaan ohjelmia komentoriviltä. Ne ohjaavat ohjelman toimintaa. Asetuslippu kirjoitetaan yleensä joko yhdellä viivalla ja sitä seuraavalla kirjaimella (esim. -o) tai kahdella viivalla ja kokonaisella sanalla (tai sanoilla, sanojen välissä viiva) (esim. --system. Jotkut liput ovat ns. boolean lippuja eli ne ovat vain päällä tai pois, toisille annetaan lisäksi parametri. Parametri on tyypillisesti lipun perässä joko välilyönnillä tai =-merkillä erotettuna (esim. -o hemuli.exe).
Avainsanat ovat ohjelmointikielessä kielen käyttöön valittuja sanoja, joilla on erityinen merkitys. Hyvät tekstieditorit tyypillisesti merkitsevät avainsanat muista nimistä eroavalla tavalla (esim. lihavointi). Avainsanat ovat yleensä suojattuja, eli samannimistä muuttujaa ei voi luoda. Yleisiä avainsanoja ovat esim ohjausrakenteisiin kuuluvat if ja else. Avainsanat ovat siis osa ohjelmointikielen kielioppia.
Binääriluku on luku, joka muodostuu biteistä, eli arvoista 0 ja 1. Tämä tekee siitä 2-kantaisen lukujärjestelmän. Binäärilukujen tulkintaa voit tutkailla lukujärjestelmiä käsittelevässä lisämateriaalissa.
Binääritiedosto on tiedosto, joka sisältää konekielisiä käskyjä binäärinä. Ne on tarkoitettu ainoastaan tietokoneen luettavaksi, ja tyypillisesti jos niitä avaa vahingossa esim. tekstieditorilla tuloksena on merkkisotkua editorin yrittäessä tulkita tiedoston sisältämiä bittejä merkeiksi. Useimmat tekstieditorit myös varoittavat asiasta erikseen.
Bitti on pienin informaation yksikkö, joka voi saada arvot 0 ja 1. Tietokoneen sisällä kaikki tapahtuu bitteinä. Tyypillisesti muistissa on bittijonoja, jotka muodostuvat useista biteistä.
Bittinegaatio on operaatio jossa bittijonon bitit käännetään siten, että nollat muutetaan ykkösiksi ja ykköset nolliksi. Operaattori on ~
Bittioperaatiot ovat oma operaatioluokkansa joiden yhteispiirre on se, että niissä käsitellään bittijonojen yksittäisiä bittejä. Kääntöoperaatiossa yhden jonon bitit käännetään nollista ykkösiksi ja toisin päin. Osa operaatioista suoritetaan kahden bittijonon välillä siten, että jonoissa samassa kohdassa olevat bitit vaikuttavat toisiinsa. Näitä ovat and (&), or (|) sekä xor (^). Lopuksi on vielä siirto-operaatiot (<< ja >>), joissa yhden bittijonon bittejä siirretään oikealle tai vasemmalle N askelta.
C:n funktiot ovat Pythonin funktioita staattisempia. Funktiolla voi olla vain yksi paluuarvo, jonka tyyppi määritellään funktion määrittelyssä. Samoin määritellään kaikkien parametrien tyypit. Funktiota kutsuttaessa argumenttien arvot sijoitetaan parametreille varattuihin muistipaikkoihin, joten funktio käsittelee eri arvoja kuin sitä kutsuva koodi.
Ulkopuolinen koodi sijaitsee C:ssä kirjastoissa (library), josta niitä voidaan ottaa käyttöön #include-direktiivillä. C:ssä on mukana sisäiset kirjastot sekä lisäksi voidaan käyttää ulkoisia kirjastoja - ne täytyy kuitenkin koodissa käyttöönoton lisäksi kertoa kääntäjälle käännösvaiheessa. Tyypillisesti kirjasto koostuu c-kooditiedostosta sekä otsikkotiedostosta (.h), joka kertoo mitä funktioita kirjastossa on.
C:n muuttujat ovat staattisesti tyypitettyjä, eli niiden tyyppi kiinnitetään esittelyn yhteydessä. Lisäksi C:ssä muuttuja on sidottu sille varattuun muistialueeseeen. Muuttuja ei voi myöskään muuttaa tyyppiään jälkikäteen.
Ehtolause on yksittäisen ehdon määrittelevä rivi koodissa, jota seuraa aaltosulkeilla merkitty koodilohko, joka määrittää miten ehdon toteutuessa tulee toimia. Varsinaisia ehtolauseita ovat if-lauseet, joka voi esiintyä myös else-avainsanan kanssa else if. Toisiinsa liitetyt ehtolauseet muodostavat ehtorakenteita.
Ehtorakenne on yhdestä tai useammasta toisiinsa liitetystä ehtolauseesta muodostuva rakenne, joka haarauttaa ohjelman suoritusta. Useimmissa ehtorakenteissa on vähintään kaksi haaraa: if ja else. Näiden välissä voi olla myös N kpl else if-lauseilla aloitettuja haaroja. On myös mahdollista, että ehtorakenteessa on pelkkä if-lause. Ehtorakenteessa kussakin haarassa on suoritettavaa koodia, joka kuvaa miten ohjelman tulee ehdon määrittelemässä tilanteessa toimia. Jokainen haara on oma koodilohkonsa, joka merkitään siis aaltosulkeilla.
Esikääntäjä on värkki joka käy koodin läpi suorittaen kaikki esikääntäjädirektiivit ennen varsinaista kääntämistä. Näihin kuuluvat mm. include-lauseet joilla koodiin lisätään siihen liitetyt kirjastot sekä define-lauseet joilla voidaan määritellä vakioita ja makroja.
Esikääntäjädirektiivit ovat ohjeita, jotka on tarkoitettu esikääntäjälle. Ne puretaan koodista pois ennen varsinaista kääntämistä. Esikääntäjädirektiivit alkavat #-merkillä. Yleisin näistä on include, joka vastaa Pythonin importia. Toinen yleinen on define, jolla tällä kurssilla määritetään vakioita.
Muuttujan esittely tarkoittaa sitä kun muuttujan olemassaolosta kerrotaan ensimmäistä kertaa. Tällöin määritetään muuttujan tyyppi ja nimi, esim. int luku;. Kun muuttuja esitellään, sille varataan paikka muistista, mutta muistiin ei vielä kirjoiteta mitään - muuttujassa on siis muistiin jäänyt arvo. Tästä syystä muuttujat on usein myös hyvä alustaa esittelyn yhteydessä.
Etumerkitön kokonaislukumuuttuja on kokonaisluku jonka kaikki arvot ovat positiivisia. Koska etumerkille ei tarvitse varata bittiä, etumerkittömällä kokonaisluvulla voidaan esittää itseisarvoltaan 2x suurempi luku kuin etumerkillisellä. Etumerkitön kokonaisluku määritetään lisäämällä kokonaislukumuuttujan esittelyyn unsigned-avainsana: unsigned int laskuri;
Heksadesimaaliluvut ovat 16-kantaisia lukuja, joita käytetään erityisesti muistiosoitteiden sekä muistin bittisisällön esittämiseen. Heksadesimaaliluvun edessä on tyypillisesti 0x, ja numeroiden lisäksi käytössä ovat kirjaimet A-F jotka vastaavat numeroja 10-15. Heksadesimaalilukuja käytetään koska yksi numero vastaa aina tasan neljää bittiä, joten muunnokset binääriin ja takaisin ovat helppoja.
Iteroitava objekti on sellainen, jonka voi antaa silmukalle läpikäytäväksi (Pythonissa for-silmukalle). Tähän joukkoon kuuluvat yleisimpinä listat, merkkijonot ja generaattorit. C:ssä ei ole silmukkaa, joka vastaisi Pythonin for-silmukan toimintaa, joten taulukoiden yms. läpikäynti tehdään indeksiä kasvattavilla silmukoilla.
Kirjasto on tyypillisesti yhteen rajattuun tarkoitukseen tehty työkalupakki, joka yleensä sisältää nipun funktioita. Kirjastot otetaan käyttöön include-esikääntäjädirektiivillä. Jos kirjasto ei kuulu C:n sisäänrakennettuihin, sen käyttöönotto täytyy myös kertoa kääntäjälle.
Kokonaisluvut itsessään ovat tuttuja varmaan tässä vaiheessa, mutta C:ssä niitä on monenlaisia. Kokonaisluvuille nimittäin määritellään kuinka monella bitillä ne esitetään sekä se, onko luvussa etumerkkiä. Koska tietyllä bittimäärällä voidaan esittää vain rajallinen määrä eri lukuja (2 ^ n), etumerkillisissä luvuissa maksimiarvo on yhden bitin verran pienempi (2 ^ (n - 1)). Pienin kokonaisluku on 8-bittinen.
Kommentti on kooditiedostossa olevaa tekstiä, joka ohitetaan kun koodia suoritetaan. Kussakin kielessä on oma tapansa sille miten rivi merkitään kommentiksi. Pythonissa se on #-merkki, C:ssä //. Lisäksi C:ssä voi merkitä useita rivejä kommenteiksi kerralla - kommentti aloitetaan tällöin /*-merkkiparilla ja päätetään */-merkkiparilla. Kaikki näiden välissä tulkitaan kommentiksi.
Komplementti on negatiivisten lukujen esitystapa, jossa luvun etumerkki muutetaan kääntämällä sen kaikki bitit. Kahden komplementissa, jota tällä kurssilla käytetään, käännön jälkeen lisätään tulokseen 1. Tarkempaa tietoa löydät lukujärjestelmiä käsittelevästä oheismateriaalista.
Konekieli muodostuu käskyistä jotka laitteen prosessori ymmärtää. Konekieltä kutsutaan yleensä Assemblyksi ja se on alin taso jolla ihmisen on mielekästä antaa ohjeita tietokoneelle. Konekieltä käytetään tällä kurssilla loppuossa, joten siihen ei johdatuskurssia suorittavien tarvitse perehtyä.
Koodilohko on joukko koodirivejä, jotka kuuluvat jollain tavalla yhteen eli ne ovat samassa kontekstissa. Esimerkiksi ehtorakenteessa kunkin ehdon alla on oma koodilohkonsa. Samoin funktion sisältö on oma koodilohkonsa. Koodilohkot voivat sisältää muita koodilohkoja. Pythonissa koodilohkot erotetaan toisistaan sisennyksellä; C:ssä koodilohkon alku ja loppu merkitään aaltosulkeilla {}
Käskykanta määrittää mitä käskyjä laitteen prosessori osaa. Nämä käskyt muodostavat prosessoriarkkitehtuurin konekielen.
Kääntäjä on ohjelma, joka kääntää C-kielisen koodin konekieliseksi binääritiedostoksi, jonka tietokoneen prosessori osaa suorittaa. Kääntäjä myös tutkii koodin ja ilmoittaa siinä olevista virheistä sekä antaa varoituksia potentiaalisista ongelmista koodissa. Kääntäjän toimintaa voi ohjata lukuisilla asetuslipuilla.
Lause on ohjelmointikielessä nimitys yksittäiselle suoritettavalle asialle, joka on yleensä yksi koodirivi.
Liukuluku (engl. floating point number, lyh. float) on tietokoneiden käyttämä desimaaliluvun approksimaatio. Tietokoneet eivät arkkitehtuurinsa vuoksi pysty käsittelemään oikeita desimaalilukuja, joten niiden tilalla käytetään liukulukuja. Liukuluvut saattavat aiheuttaa pyöristysvirheitä - tämä on hyvä pitää mielessä niitä käyttäessä. C:ssä liukulukuja on yleensä kahta eri tarkkuutta: float ja double, joista jälkimmäisessä on nimensä mukaisesti 2 kertaa enemmän bittejä.
Looginen operaatio viittaa Boolen algebran operaatiohin, joissa käsitellään totuusarvoja. Tyypillisiä loogisia operaatioita ovat ehtolauseista tutut and, not ja or. C:ssä tunnetaan myös bittikohtaiset loogiset operaatiot jotka toimivat samalla logiikalla, mutta vaikuttavat jokaiseen bittiin erikseen.
Makro on alias, jolla määritetään tietty avainsana korvattavaksi koodinpätkällä. Hyvin käytettynä tällä voidaan joissain tilanteissa saada aikaan parempaa luettavuutta, mutta helposti käy toisin. Makroilla ei kannata tämän kurssin puitteissa leikkiä, kunhan tietää mistä on kyse jos niihin joskus törmää.
Merkki on nimensä mukaisesti yksi merkki. Merkki voidaan tulkita ASCII-merkkinä mutta sitä voidaan käyttää koodissa myös kokonaislukuna, koska se on pienin esitettävissä oleva kokonaisluku. Merkin koko on 1 tavu. Merkki merkitään yksinkertaisilla lainausmerkeillä, esim. 'c'.
Pythonissa kaikki teksti käsiteltiin merkkijonoissa, eikä siinä esim. ollut erillistä muuttujatyyppiä yksittäiselle merkille. C:ssä puolestaan ei ole varsinaista merkkijonomuuttujatyyppiä lainkaan - on ainoastaan merkeistä koostuvia taulukoita, joille on oma määrittelytapansa. Näillä taulukoilla on ennaltamäärätty pituus. "Merkkijonon" voi määritellä C:ssä char elain[5] = "aasi"; jossa numero kertoo merkkitaulukon koon ja on merkkien määrä + 1, koska lopetusmerkki '\0' lisätään tässä alustustavassa automaattisesti loppuun.
Metodi on funktio, joka on osa objektia eli objektin ominaisuus, jolla objekti usein muuttaa omaa tilaansa. Metodia kutsuttaessa käsiteltävä objekti tulee kutsun eteen: arvosanat.sort().
Kaikki suoritettavien ohjelmien käsittelemä data on tietokoneen muistissa ajon aikana. Tietokoneen muisti muodostuu muistipaikoista, joilla on muistiosoite sekä sisältö. Kaikki muistipaikat ovat saman kokoisia - jos talletettava tietomäärä on tätä suurempi, varataan useampi (peräkkäinen) muistipaikka.
Pythonissa objektit eroteltiin muuntuviin ja muuntumattomiin. Muuntumaton arvo oli sellainen, jonka sisältö ei voi muuttua - kaikki operaatiot jotka näennäisesti muuttavat arvoa tosiasiassa luovat siitä uuden kopion, joka yleensä sijaitsee uudessa muistipaikassa. Esimerkiksi merkkijonot olivat tyypillinen muuntumaton tyyppi Pythonissa. C:ssä tätä erottelua ei tarvita, koska muuttujien ja muistipaikkojen suhde on tiiviimpi - sama muuttuja osoittaa koko ohjelman suorituksen ajan tiettyyn muistipaikkaan.
Objekti, joskus myös olio, on Pythonissa yleistä terminologiaa. Kutsuimme objekteja pääasiassa arvoiksi alkeiskurssilla, mutta Pythonissa kaikkea voi käsitellä objekteina - tämä tarkoittaa, että mihin tahansa voidaan viitata muuttujilla (esim. funktion voi sijoittaa muuttujaan). Objekti-termiä käytetään tyypillisesti oliopohjaisissa kielissä (kuten Python). C ei kuulu tähän joukkoon.
Ohjausrakenne on yleisnimitys koodirakenteille, jotka hallitsevat jollain tavalla ohjelman suorituksen kulkua. Näihin rakenteisiin lukeutuvat ehtorakenteet sekä toistorakenteet. Myös poikkeusten käsittely voidaan lukea tähän joukkoon.
Koodin optimointi tarkoittaa sitä, että sen suorituskykyä parannetaan tyypillisesti joko vähentämällä aikaa, joka sen suoritukseen kuluu tai vähentämällä muistin käyttöä. Optimoinnista on hyvin tärkeää ymmärtää, että sitä ei koskaan kannata tehdä jos ei ole pakko - optimointia siis tehdään vasta kun koodi oikeasti toimii hitaasti tai kuluttaa liikaa muistia. Optimointia ei myöskään kannata tehdä sokkona - koodista tulee ensin tunnistaa mitkä ovat sen pullonkaulat eli ne osat jotka tuhlaavat eniten resursseja.
Osoitin (pointer) on C:ssä erityinen muuttujatyyppi. Osoitinmuuttuja sisältää muistiosoitteen, josta varsinainen arvo löytyy - ne toimivat siis tietyllä tapaa kuin Pythonin muuttujat. Muuttuja määritellään osoittimeksi lisäämällä tyypin perään * esittelyrivillä, esim. int* luku_os luo luku_os-muuttujan, joka on osoitin int-tyyppiseen arvoon. Osoittimen osoittaman muistialueen sisällön voi hakea käyttöön merkinnällä *luku_os ja vastaavasti jonkin muuttujan muistipaikan osoitteen saa merkinnällä &luku. Osoittimille on omistettu kokonainen materiaali (4).
Otsikkotiedosto on .h-päätteellä merkitty tiedosto, joka sisältää otsikkotiedot (funktioiden prototyypit, tietotyyppien määrittelyt yms) saman nimiselle .c-tiedostolle.
Otsikkotiedot ovat C-koodissa ja erityisesti kirjastojen yhteydessä eräänlainen muotti koodista. Tyypillisen otsikkotieto on funktion prototyyppi, jolla kerrotaan mitä funktio palauttaa ja mitä argumentteja sille annetaan. Rivi on sama kuin funktion varsinainen määrittely. Muita otsikkotietoja ovat mm. tietotyyppien ja vakioiden määrittelyt. Otsikkotiedot voivat sijaita kooditiedoston alussa, mutta erityisesti kirjastojen osalta ne ovat yleensä erillisessä .h-tiedostossa.
Paikanpidin on merkkijonojen muotoilussa käytetty termi, jolla esitetään kohta merkkijonossa, johon sijoitetaan esim. muuttujan arvo ohjelman suorituksen aikana. Pythonissa format-metodia käytettäessä paikanpitimiä merkittiin aaltosulkeilla (esim. {:.2f}). C:ssä käytetään %-merkkiä jota seuraa paikanpitimen määrittely, josta erityisen tärkeä osa on muuttujatyypin määrittely. Esimerkiksi "%c" ottaa vastaan char-tyyppisen muuttujan.
Paluuarvo on nimitys arvolle tai arvoille jotka funktio palauttaa kun sen suoritus päättyy. C:ssä funktioilla voi olla vain yksi paluuarvo, Pythonissa niitä voi olla useita. Koodia lukiessa paluuarvoa voi käsitellä päässään siten, että funktiokutsun paikalle sijoitetaan funktion paluuarvo sen jälkeen kun funktio on suoritettu.
Parametri on funktion määrittelyssä nimetty muuttuja. Parametreihin sijoitetaan funktion saamat argumentit. Parametri on siis nimitys jota käytetään kun puhutaan arvojen siirtymisestä funktion näkökulmasta. Tätä erottelua ei aina tehdä, vaan joskus puhutaan pelkästään argumenteista.
Poikkeus on ohjelmointikielessä määritelty virhetilanne. Poikkeuksella on tyyppi (esim. TypeError), jota voi käyttää poikkeuksen käsittelyssä ohjelman sisällä sekä myös apuna virhetilanteen ratkaisussa. Tyypillisesti poikkeukseen liitetään myös viesti, joka kertoo mistä ongelmassa on kyse.
Prototyyppi määrittelee funktion paluuarvon tyypin, nimen sekä kaikki argumentit ennen funktion varsinaista esittelyä. Kunkin funktion prototyypin tulisi löytyä joko kooditiedoston alusta tai erillisestä otsikkotiedostosta (.h). Prototyypin määrittely on kopio funktion varsinaisesti määrittelyrivistä.
Pythonin for-silmukka vastaa toiminnaltaan useimmissa kielissä olevaa foreach-silmukkaa. Se käy läpi sekvenssin -esim. listan - jäsen kerrallaan, ottaen kulloinkin käsittelyssä olevan jäsenen talteen silmukkamuuttujaan. Silmukka loppuu, kun iteroitava sekvenssi päättyy.
Merkkijonojen format-metodi on Pythonissa tehokas tapa sisällyttää muuttujien arvoja tulostettavaan tai tallennettavaan tekstiin. Merkkijonoon määritetään paikanpitimiä (esim: {:.2f}) joihin sijoitetaan format-metodin argumentit.
Python-funktiolla voi olla valinnaisia parametreja, joilla on asetettu oletusarvo. Argumenttien arvot siirtyvät parametreihin viittauksen kautta, joten funktion sisällä käsitellyt arvot ovat samoja kuin sen ulkopuolella käsitellyt - niillä on vain eri nimet. Python-funktiolla voi olla useita paluuarvoja.
Pythonin import-lauseella otettiin käyttöön moduuleja/kirjastoja - joko Pythonin mukana tulevia, muualta ladattuja tai itsekirjoitettuja. Pythonin import-lauseelle erityistä on, että oletuksena tuotuihin funktioihin ym. päästään käsiksi moduulin nimen kautta (esim. math.sin. C:ssä importia vastaa include, ja se tuo nimet suoraan ohjelman omaan nimiavaruuteen.
Interaktiivinen Python-tulkki tai Python-konsoli on ohjelma, johon voi kirjoittaa Python-koodirivejä. Nimitys "interaktiivinen" tulee siitä, että koodirivi suoritetaan välittömästi sen syöttämisen jälkeen, ja ohjelma näyttää käyttäjälle koodirivin tuottaman paluuarvon (esim. matemaattisen operaation tuloksen).
Pythonin lista osoittautui Ohjelmoinnin alkeissa hyvin tehokkaaksi työkaluksi. Se on järjestetty kokoelma arvoja. Listan monikäyttöisyys johtuu siitä, että sen koko on dynaaminen (eli suorituksen aikana muuttuva) minkä lisäksi se voi sisältää mitä tahansa arvoja - myös sekaisin. Samassa listassa voi siis olla useita erityyppisiä arvoja. Listat voivat tietenkin sisältää myös listoja tai muita tietorakenteita jne.
Kuten Ohjelmoinnin alkeissa opittiin, Python-muuttuja on viittaus arvoon, eli yhteys muuttujan nimen ja tietokoneen muistissa olevan arvon välillä. Python-muuttujilla ei ole tyyppiä, mutta arvoilla on. Arvon kelpaavuus kokeillaan koodia suorittaessa tilannekohtaisesti. Tässä suhteessa ne siis eroavat toiminnaltaan C:n muuttujista, ja niiden toiminta muistuttaa usein enemmän C:n osoittimia.
Pythonissa pääohjelma on se osa koodia, joka suoritetaan kun ohjelma käynnistetään. Pääohjelma sijaitsee tyypillisesti koodin lopussa, ja useimmiten if __name__ == "__main__":-lauseen alla. C:ssä ei ole varsinaista pääohjelmaa, siinä suoritus aloitetaan oletuksena main-nimisestä funktiosta.
Python-tulkki on ohjelma, joka muuttaa Python-koodin tietokoneelle annettaviksi ohjeiksi. Se vastaa niin kooditiedostojen kuin myös interaktiiviseen Python-tulkkiin kirjoitettujen komentojen suorittamisesta. Tällä kurssilla sanalla tulkki viitataan kuitenkin useimmiten nimenomaan interaktiiviseen Python-tulkkiin.
Pääfunktio on C:ssä ohjelman aloituspiste ja se korvaa Pythonista tutun pääohjelman. Oletuksena pääfunktion nimi on main ja se määritellään yksinkertaisimmillaan int main().
Resurssi viittaa laitteiston käytössä olevaan prosessoritehoon, muistiin, oheislaitteet jne. Se käsittää siis kaikki rajoitteet sille millaista ohjelmakoodia voidaan ajaa sekä sen, mitä ohjelmakoodilla voidaan tehdä. Tietokoneilla resurssit ovat ohjelmointiopiskelijan näkökulmasta aika rajattomat, mutta sulautetuilla järjestelmillä rajat voivat hyvinkin tulla vastaan.
C käyttää staattista tyypitystä. Se tarkoittaa sitä, että muuttujien tyypit määritellään kun ne luodaan ja muuttujaan ei voida sijoittaa erityyppistä arvoa. Lisäksi arvon kelvollisuus määritellään koodia suorittaessa sen tyypin perusteella (tai oikeastaan tämä tehdään jo käännösvaiheessa). Pythonissa taas käytetään dynaamista eli ankkatyypistystä.
Syntaksi (engl. syntax) on koodin kielioppi. Esimerkiksi Pythonin syntaksi määrittää, millainen teksti on tulkittavissa Python-koodiksi. Jos teksti ei noudata koodin syntaksia, sitä ei voida suorittaa tai C:n tapauksessa kääntää. Syntaksi antaa myös koodaajalle tietoa siitä, missä muodossa halutunlainen ohje tulee antaa.
Taulukko (array) on ohjelmointikielissä yleinen tietorakenne, joka sisältää useita (yleensä) samantyyppisiä arvoja. C:n taulukot ovat staattisia - niiden koko tulee määritellä taulukon esittelyn yhteydessä - ja taulukossa voi olla vain samantyyppisiä muuttujia (myös tyyppi määritellään esittelyssä).
Yhden muistipaikan koko on yksi tavu (byte) - tyypillisesti 8 bittiä. Tavu on siis pienin yksikkö joka voidaan osoittaa tietokoneen muistista. Muuttujien tyyppien varaamat muistialueet lasketaan tavuissa.
Terminaali, komentokehote ja komentorivi ovat eri nimiä käyttöjärjestelmän tekstipohjaiselle käyttöikkunalle. Windowsissa komentoriville pääsee kun kirjoittaa suorita...-ikkunaan cmd. Komentorivillä annetaan tekstikomentoja käyttöjärjestelmälle. Tällä kurssilla pääasiassa siirrytään cd-komennolla hakemistosta toiseen ja käytetään kääntäjää kooditiedostojen kääntämiseen sekä suoritetaan käännettyjä koodeja.
Tietorakenne on yleisnimitys kokoelmille jotka sisältävät useita arvoja. Pythonissa näitä olivat mm. lista, monikko ja sanakirja. C:ssä taas yleisimmät tietorakenteet ovat taulukot (array) ja tietueet (struct).
Tietokoneen muistissa oleva data on pelkästään bittejä, mutta muuttujilla on tyyppi. Tyyppi kertoo millä tavalla muistissa olevat bitit pitää tulkita. Se kertoo myös kuinka suuresta määrästä bittejä muuttujan arvo muodostuu. Tyyppejä ovat esim int, float ja char.
Tyyppimuunnos on operaatio jossa muuttuja muutetaan toisentyyppiseksi. Alkeiskurssilla tätä tehtiin pääasiassa int- ja float-funktioilla. C:ssä tyyppimuunnos merkitään hieman toisin: liukuluku = (float) kokonaisluku. Huomioitavaa on myös, että operaation tulos voidaan tallentaa ainoastaan muuttujaan jonka tyyppi on kohdetyyppiä (esimerkissä float). Pythonissa nähdyt luku = int(luku)-temput eivät siis onnistu.
Varoitusviesti on ilmoitus siitä, että ohjelman suorituksessa tai - erityisesti tällä kurssilla - sen kääntämisessä kohdattiin jotain epäilyttävää, joka saattaa johtaa virhetilanteisiin, mutta ei suoraan estä ohjelman käyttöä. Yleisesti ottaen kaikki varoitukset on syytä korjata ohjelman toiminnan vakauttamiseksi.
Virheviestiksi kutsutaan tietokoneen antamaa virheilmoitusta joko koodia kääntäessä tai ohjelmaa suorittaessa. Virheviesti tyypillisesti sisältää tietoa kohdatusta ongelmasta ja sen sijainnista.
C:ssä main-funktio on ohjelman suorituksen aloituspiste kun ohjelma käynnistetään. Ohjelman komentoriviargumentit tulevat main-funktiolle (mutta niitä ei ole pakko vastaanottaa), ja sen palautusarvon tyyppi on int. Lyhimmillään main-funktion voi siis määritellä: int main().
C:ssä yksi tulostustapa on printf-funktio, joka muistuttaa pääasiassa Pythonin print-funktiota. Sille annetaan tulostettava merkkijono, sekä lisäksi merkkijonoon sijoitettavat arvot mikäli on käytetty paikanpitimiä. Toisin kuin Pythonin print, printf ei automaattisesti lisää rivinvaihtoa, joten loppuun on yleensä syytä lisätä \n.
Silmukoista while pohjautuu toistoon ehdon tarkastelun kautta - silmukan sisällä olevaa koodilohkoa suoritetaan niin kauan kuin silmukalle annettu ehto on tosi. Ehto määritetään samalla tavalla kuin ehtolauseissa, esim: while (summa < 21).