Termipankki
  1. A
    1. Abstraktio
    2. Alias
    3. Alustaminen
    4. Ankkatyypitys
    5. Argumentti
    6. Arvo
    7. Asetuslippu
    8. Avainsana
  2. B
    1. Binääriluku
    2. Binääritiedosto
    3. Bitti
    4. Bittinegaatio
    5. Bittioperaatio
  3. C
    1. C-funktio
    2. C-kirjasto
    3. C-muuttuja
  4. E
    1. Ehtolause
    2. Ehtorakenne
    3. Esikääntäjä
    4. Esikääntäjädirektiivi
    5. Esittely
    6. Etumerkitön
  5. H
    1. Heksadesimaali
  6. K
    1. Kirjasto
    2. Kommentti
    3. Komplementti
    4. Konekieli
    5. Koodilohko
    6. Käskykanta
    7. Kääntäjä
  7. L
    1. Lause
    2. Looginen operaatio
  8. M
    1. Makro
    2. Merkki
    3. Merkkijono
    4. Metodi
    5. Muisti
    6. Muuntumaton
    7. main-funktio
  9. O
    1. Objekti
    2. Ohjausrakenne
    3. Optimointi
    4. Osoitin
    5. Otsikkotiedot
  10. P
    1. Paikanpidin
    2. Paluuarvo
    3. Parametri
    4. Poikkeus
    5. Prototyyppi
    6. Python-format
    7. Python-funktio
    8. Python-import
    9. Python-konsoli
    10. Python-lista
    11. Python-muuttuja
    12. Python-pääohjelma
    13. Python-tulkki
    14. Pääfunktio
    15. printf
  11. R
    1. Resurssi
  12. S
    1. Staattinen tyypitys
    2. Syntaksi
  13. T
    1. Taulukko
    2. Tavu
    3. Terminaali
    4. Tietorakenne
    5. Tyyppi
    6. Tyyppimuunnos
  14. V
    1. Varoitusviesti
    2. Virheviesti
  15. W
    1. while
Ratkaistu: / tehtävää

y86-64 Arkkitehtuuri

Osaamistavoitteet: y86-64 prosessorin assembly-kieltä käytetään kurssilla havainnollistamaan käskyn suoritusta prosessorissa. Lisäksi sitä käytetään simulaattorin avulla harjoitustehtävien ja -työn ohjelmoinnissa. Tämän materiaalin luettuaan opiskelija tuntee y86-64-prosessorin ohjelmoijalle näkyvän arkkitehtuurin ja sen assembly-kielen syntaksin sekä osaa laatia pienimuotoisia assembly-kielisiä ohjelmia.
y86-64 prosessoriarkkitehtuuri on siis 64-bittinen, josta seuraa että muistipaikat ja rekisterit ovat 64-bittisiä. Näin ollen sanan pituus on 8 tavua. Lukuesitys on 2-komplementti ja bittijärjestys on big endian, eli MSB-bitti on merkkibitti. Tavujärjestys taas on little endian, eli vähiten merkitsevä tavu tulee ensin.

Rekisterit

Prosessorissa on useita rekistereitä, joista osalle on määritelty käyttötarkoitus:
Assembly-kielessä %-merkki ilmaisee, että kyse on ohjelmallisesti käytettävästä rekisteristä.

Prosessorin tila

Prosessorin tila on oleellinen asia ohjelmien suoritusta, koska konekielen käskyt muuttavat ja reagoivat prosessorin tilaan. Tila esitetään tilabittejä, joita varten on varattu erillinen tilarekisteri. Suoritin asettaa tilabitin kun se saa keskeytyksen, Käsky voi asettaa tilabitin huomattuaan virheellinen toiminnon, joihin kontrolliyksikkö reagoi. Myös konekielisen ohjelman ehdollinen toiminta (vertailuoperaattorit jne) perustuvat tilarekisterin arvoon.
y86:sessa on kolme tilabittiä (lippua, Condition codes, CC):
Esimerkiksi positiivisen ja positiivisen luvun vähennyslasku
  01111111
- 01111111
  --------
  00000000 ZF=1, koska tulos on 0
Esimerkiksi positiivisen ja negatiivisen luvun yhteenlasku
  00001111
  10000001
  --------
  10010000 Nyt MSB on 1, tulos on negatiivinen -> SF=1
Lasketaan yhteen kaksi positiivista lukua ja tulos on negatiivinen:
  01111111
  01111111
  --------
  11111110 Tulos ei mahdu positiiviseen lukualueeseen, vaan on negatiivinen luku -> OF=1
           Lisäksi -> SF=1

Lasketaan yhteen kaksi negatiivistiä lukua ja tulos on positiivinen:
  10000001
+ 10000001
  --------
 100000010 MSB leikkautuu pois
  00000010 Tulos on positiivinen luku -> OF=1 
Oikeissa prosessoreissa tilabittejä on useita, esimerkkinä 8086:n 16-bittinen tilarekisteri.
Osana tilarekisteria on y86:n ohjelman suorituksen tila (status code, STAT), joka voi olla:

Osoitusmuodot

Assembly-kielessä voidaan käskyn operandeilla osoittaa muistia eri tavoin. Käskyn suorituksen yhteydessä prosessori tulkitsee osoitusmuodosta mistä sen tarvitsema data löytyy.
y86:sessa on kolme osoitusmuotoa:

Pino-muisti

Pino (engl. stack) on keskusyksikölle käyttömuistista varattu muistialue, johon varastoidaan tietoa LIFO-periaatteella (Last in -> First out). Pinoon push-käskyllä viedyt arvot päätyvät aina sen päällimäisiksi, josta nimitys pino. Pinosta luetaan pop-käskyllä arvoja aina päällimmäinen arvo edellä, jolloin se häviää pinosta. Toisinsanoen pinoon viedyt arvot luetaan sieltä käänteisessä järjestyksessä. Nyt, muistissa pino kasvaa alaspäin, eli päällimmäisellä arvolla on aina pienin muistiosoite.
Ohjelmoija voi päättää assembly-kielisen ohjelman pinon koon. Pino-muistia käytetään yleisesti tiedon varastointipaikkana, esimerkiksi aliohjelmia suorittaessa tai taulukkomuuttujia käsitellessä (ja joskun rekisterit loppuvat..).
Pino-muistin osoittamiseen on varattu ylläkuvatut kaksi rekisteriä %rbp ja %rsp. Ohjelman alussa asetetaan pinomuistin alkupään osoite. Pino-muistin nykyisen muistipaikan osoittimen arvo muuttuu käskyn suoritusten mukaan.
Hox! Koska pino sijaitsee samassa muistissa kuin koodi ja data, pitää olla tarkkana ettei se sotkeudu niiden kanssa päällekäin!

Muisti

Lisäksi prosessorissa on muistia 8-tavun muistipaikkoina. Simulaattorissa muistia on käytössä pari kiloa.

y86-64 Assembly-kieli

y86-64:sen sybtaksi ja käskykanta ovat perusteiltaan hyvin samankaltaisia kuin x86. Pienillä muutoksilla ohjelmia voi käyttää molemmissa suorittimissa! Toki on huomattava ettei läheskään kaikkia x86-perheen assembly-käskyjä ole toteutettu y86-64:sessa.
y86-assemblyn käskyt päättyvät usedin kirjaimeen q, joka tarkoittaa sitä että käskyn käsittelemä luku on 64-bittinen (quad). 32-bittistä lukua voisi merkitä kirjain l, jossain toisessa arkkitehtuurissa (lue x86).

Pino

Jokaisessa ohjelmassa meidän tulee ensin määrittää pinon paikka. Ok, kirjaimellisesti ihan välttämätön se ei ole, pystymme toteuttamaan pieniä ohjelmia ilmankin. Kurssilla opettelemme pinon käytön, koska ilman sitä aliohjelmat eivät toimisi.
Pinon hallintaan tarvitaan avuksi rekistereitä, jotka osoittavat mistä pino muistissa alkaa %rbp, sekä osoitinrekisteri %rsp, johon tallennetaan pinon päällimäisen arvon osoite.
Pinon alustus ohjelmamme alussa tapahtuu seuraavasti:
.pos 0
    irmovq Pino,%rbp # Pinon alkuosoite rekistereihin
    irmovq Pino,%rsp # Pinon nykyisen muistipaikan osoite 

.pos 0x100
Pino:
Ohjelman tarkempi toiminta selviää materiaalista alla, mutta ohjelmassa olemme nimenneet muistiosoitteen 0x100 nimellä Pino. Ikäänkuin siis C-kielen #define-esikääntäjäkäsky. Ohjelman ensimmäisissä käskyissä sitten viemme tämän muistiosoitteen pinon rekistereihin. Nyt siis pinomuistin ensimmäinen osoite on 0x100. Muistetaan että pino kasvaa alaspäin, jolloin sen muistiosoite siis pienenee.
Pinoa käsitellään kahdella käskyllä:
  1. Pinoon viemme tavaraa pushq käskyllä, joka ottaa operandikseen sen rekisterin arvon, mistä arvo haetaan. Pino-osoittimen osoittamasta kohtaan muistia tallennetaan rekisterin arvo ja päivitetään pino-osoitinta vastaavasti.
  2. Pinosta haetaan tavaraa popq-käskyllä, joka tallentaa pino-osoittimen osoittamasta kohdasta arvon operandina annettuun rekisteriin.
Esimerkki. Haemme pinomuistista pino-osoittimen (%rsp-rekisteri) osoittamasta paikasta arvon rekisteriin %rsi ja viemme arvon takaisin pinoon.
    irmovq $0xab,%rsi
    pushq %rsi
    ...
    popq %rsi
Pinon käsittelykäskyt päivittävät itse pino-osoitinta, joten sitä ei tarvitse koodissa tehdä.

Aritmeettiset operaatiot

Aritmeettisiä operaatiota on vain! neljä erilaista.. Nämä käskyt ottavat kaksi operandia, joiden tulee olla rekistereitä. Prosessorin tilabitit asettuvat operaation tuloksen mukaan.
Esimerkkejä.
    addq %r10,%rsi # %rsi = %rsi + %r10
    subq %r9,%rsi  # %rsi = %rsi - %r9
    andq %rax,%rbx # %rbx = %rax & %rbx
    xorq %rsp,%rbp # %rbp = %rsp ^ %rbp

Siirtokäskyt

Sijoitusoperaatiota, esimerkiksi C-kielessä arvon sijoittamista muuttujaan, assembly:ssä vastaa siirto-operaatio.
Dataa voidaan siirtää kahdella tavalla: siirtokäskyillä ja ehdollisilla siirtokäskyillä. Siirtokäskyjen operandien tyyppi riippuu käskystä, kaikki osoitusmuodot ovat käytössä. Huomioitavaa on, ettei siirtoja voi tehdä muistiosoitteesta toiseen tai vakioarvoa ei voi viedä suoraan muistiin. Aina mennään jonkin rekisterin kautta.
Siirtokäskyjä on neljä erilaista. Käskyn xxmovq nimessä edessä olevat kaksi kirjainta xx ilmaisevat käskyn operandin tyypin.
Nämä käskyt ottavat kaksi operandia, eli mistä siirretään (source) ja minne siirretään (destination).
Esimerkkejä.
    irmovq $4    , %rsi    # Sijoitetaan numeroarvo 4 rekisteriin %rsi
    rrmovq %rax  , %rsp    # Sijoitetaan %rax:n arvo %rsp:hen
    mrmovq (%rdi), %r10    # Haetaan arvo rekisterin %rdi osoittamasta paikasta ja sijoitetaan %r10:n
    rmmovq %rcx  , 8(%rdx) #  Sijoitetaan %rcx:n arvo osoitteeseen %rdx:n arvo + 8
Ehdollisia siirtokäskyjen toiminta riippuu prosessorin tilabittien arvoista, siitä siis ehdollisuus. Eli, edellisen käskyn suorituksen jälkeisestä tilasta päätellään tehdäänkö siirot vai ei. Käskyt ottavat operandeikseen rekistereitä. Käskyt ensin lukevat operandista arvon ja siirtävät sen toiseen operandiin (rekisteriin) vain jos haluttu ehto on totta tilabittien mukaan.
Ehdollisia siirtokäskyjä ovat.
Kuten huomataan, ehdollisten siirtokäskyjen logiikka on mielenkiintoinen. Esimerkiksi, yhtäsuuruus todetaan aritmeettisellä operaatiolla, jonka lopputulos on 0. Takana tässä on ajatus, että näin suorittimen kombinaatiologiikan toteutus olisi mahdollinen yksinkertainen. Seurauksena sitten assembly-ohjelmoijan täytyykin miettiä esim. vertailuoperaatiot suorittimen näkökulmasta eikä omastaan..
Esimerkki.
.pos 0
main:
    irmovq $3,%rax    # a=3
    irmovq $2,%rbx    # b=2
                      # Testataan a == b ?     
    subq %rax,%rbx    # Vähennyslaskulla rbx = rbx - rax 
                      # Jos rbx > rax, tilaliput eivät muutu
                      # Jos rbx < rax, SF=1 ja OF=1
                      # Jos rbx = rax, ZF=1
    cmove %rax,%rcx   # Nyt jos ZF=1, sijoitetaan rcx = rax
                      # Muutoin ei sijoitusta
Tämä toteutus voidaan tehdä myös pinoa käyttäen niin, että a:n arvo pistetään talteen pinoon.
Ehdolliset siirtokäskyt voivat optimoida prosessorin toimintaa, josta lisää myöhemmin..

Hyppykäskyt

Hyppykäskyjä on seitsemän erilaista. Hyppykäskyssä ei itsessään vertailla mitään, vaan ne tekevät hyppypäätöksen edellisen käskyn asettamien tilabittien perusteella. Operandiksi hyppykäskylle annetaan muistiosoitteen nimi, mihin se ehdon toteutuessa hyppää.
Esimerkki. C-kielen silmukkarakenne:
int64_t rcx = 10;   // Silmukkamuuttuja
int64_t rdx = 1;    // apumuuttuja (jolla vähennetään 1)
while (rcx !=0) {   // Testaus rcx != 0
   tee_jotain();    // Aliohjelmakutsu
   rcx = rcx - rdx; // Vähennyslasku rcx = rcx - rdx
}
Ja sama y86-assemblyllä:
    irmovq $0x10,%rcx # Silmukkamuuttuja
    irmovq $0x1,%rdx  # apumuuttuja (jolla vähennetään 1)
loop:
    call tee_jotain   # Aliohjelmakutsu, kts alla. 
    subq %rdx,%rcx    # Vähennyslasku rcx = rcx - rdx: jos rcx = 0 -> ZF=1
    jne loop          # Testaus rcx != 0: Jos erisuuri, eli ZF=0, hyppää loop
    halt              # Muutoin lopeta ohjelma
(Tietenkään C-kielessä ei tarvita apumuuttujaa rdx, vaan silmukkamuuttujan koodi voisi olla rcx--, mutta y86-assembly-kielessä ei ole vastavaa aritmeettistä operaattoria.)

Aliohjelmat

Assembly-kielessä voidaan toki kutsua ohjelmasta myös aliohjelmia (ts. funktioita). Voimme sijoittaa aliohjelman koodin haluamaamme paikkaan muistissa, mutta meidän pitää lisäksi huomioida seuraavat asiat.
  1. Aliohjelman suoritus tehdään hyppykäskyllä sen muistiosoitteeseen, josta paluu takaisin kutsuvaan koodiin
  2. Muuttujien (ts. parametrien) välitys aliohjelmalle ja aliohjelman paluuarvo
  3. Muistin varaaminen aliohjelman paikallisille muuttujille
Nyt, assembly-kielessä rekistereitä ja/tai pinomuistia käytetään näiden kolmen asian toteutuksessa.
Yleensä on sovittu mihin rekistereihin kutsuparametrit talletetaan. Tällöin ei joka ohjelmassa tarvitse miettiä asiaa uudelleen ja lisäksi koodin uudelleenkäytettävyys paranee. x86:ssä (kyllä, x86) on sovittu, että parametrit tallennetaan rekistereihin seuraavassa järjestyksessä: %rdi, %rsi, %rdx, %rcx, %r8, %r9. Eli maksimissaan kuusi parametriä voidaan välittää rekisterien kautta.

Aliohjelman suoritus

Aliohjelman suoritus assembly- (ja kone)kielessä menee seuraavasti:
  1. Ensiksi, ennen hyppyä aliohjelmaan tallennetaan nykyinen ohjelman tila (rekisterit + PC) pinoon. Tämä siksi, että voimme palata aliohjelmasta samaan tilaan mistä sitä lähdettiin suorittamaan. Jos esimerkiksi käytämme samoja rekistereitä pää- ja aliohjelmassa, niin aliohjelma muuttaisi niiden arvoja eikä kutsuvan suoritus aliohjelman jälkeen enää jatkuisi samasta tilasta mihin jäätiin!
    • Osa rekistereistä on myös määritelty siten, että niissä olevan arvon ylläpitämisestä on vastuussa joko aliohjelman kutsuja tai aliohjelma. Jonka tulee tällöin huolehtia tilan säilymisestä.
  2. Aliohjelman hyppykutsu tallentaa pinoon paluuosoitteen, ts. osoitteen josta kutsuvan ohjelman suoritus jatkuu kun aliohjelman suoritus on loppunut.
  3. Aliohjelman parametrit voidaan välittää joko rekisterien tai pinon kautta. Jos käytetään rekistereitä, niille on sovittu järjestys jota tulisi käyttää. Eli ensimmäinen parametri menee rekisteriin x1 ja toinen parametri rekisteriin x2, jne. Koska rekistereitä on rajallinen määrä, on mahdollista välittää vain muutamia arvoja. Tähän tarjoaa pino apua, eli viemme parametrit pinoon alkaen ensimmäisestä parametristä.
    • Funktion paikallisille muuttujille voidaan ennen funktion kutsua varata muistia siirtämällä pino-osoitinta eteenpäin tarvittava tavumäärä. Luemme arvot sitten pinosta käyttäen epäsuoraa osoitusta.
  4. Aliohjelmassa ja sitä kutsuvassa pitää huolehtia, että pinosta haetaan täsmälleen sama joukko tietoa kun sinne tallennettiin. Aliohjelmakutsussa pino on siis tilapäinen tietovarasto.
  5. Aliohjelmasta poistumiskäsky sitten hakee pinosta kutsuneen ohjelman seuraavan koodirivin osoitteen ja palaa suorittamaan sitä. Tässä yhteydessä prosessorin tila tulee palauttaa entiselleen.
Aliohjelmiin assembly-kielessä hypätään käskyllä call, jolloin operandiksi annetaan aliohjelman nimi, kts. alla. Paluuosoite, mihin aliohjelman suorituksen jälkeen palataan, tallentuu automaattisesti pinoon.
Aliohjelmista palataan ret-käskyllä, joka kaivaa paluuosoitteen pinosta.
Esimerkki yksinkertaisesta aliohjelmasta laske:
.pos 0
init:
    irmovq pino,%rsp  # Pinon alustus (muistiosoitteeseen 0x100)
    irmovq pino,%rbp
main:                 # Pääohjelma
    irmovq $0x11,%rdi # Argumentit rekistereihin
    irmovq $0x11,%rsi
    call laske    
    halt
    
.pos 0x40
laske:
    addq %rsi,%rdi    # Argumentit aliohjelmassa
    ret

.pos 0x100
pino:
Pinon käyttäminen parametrien välitykseen on hieman monimutkaisempaa..
Pinomuistin käyttöjärjestys aliohjelmakutsun yhteydessä, josta alla koodiesimerkki. (Kuvassa pino kasvaa alaspäin.)
Esimerkki. Tässä ei ole huomioitu aliohjelman paluuosoitetta pinossa.
.pos 0
    irmovq Pino,%rsp      # Alustetaan pino
    irmovq Pino,%rbp
main:
    irmovq $0x11,%rax
    pushq %rax            # vie 1. argumentti pinoon
    irmovq $0x22,%rax
    pushq %rax            # vie 2. argumentti pinoon
    pushq %rax            # varataan tilaa funktion paluuarvolle
    call laske            # aliohjelmakutsu
    popq %rax             # haetaan paluuarvo
    popq %rax             # tyhjennetään pino
    popq %rax
    halt

.pos 0x40
laske:
    mrmovq 24(%rsp),%rdx  # haetaan 1. argumentti pinosta
    mrmovq 16(%rsp),%rcx  # haetaan 2. argumentti pinosta
    addq %rcx,%rdx
    rmmovq %rdx,8(%rsp)   # paluuarvo pinoon
    ret

.pos 0x400
Pino:
Kutsuva ohjelma on sitten vastuussa argumenttien ja funktion paluaarvon käsittelystä, eli sen pitää poistaa ne pinosta.
Muistin varaaminen Pinosta menee yksinkertaisesti siten, että siirrämme pino-osoitina tarvittavan tavumäärän eteenpäin.
   subq $32, %rsp # Pino-osoitin siirtyy 4 sanaa x 8 tavua = 32 tavua
                  # Eli varattiin tilaa neljälle sanalle

Muita käskyjä

nop-käsky ei tee mitään, paitsi kasvattaa PC-rekisteriä. Oikeissa prosessoreissa käskyllä on silti useita käyttötarkoituksia, mm. ajan mittaaminen ja koodin ryhmitys muistiin.
halt-käsky pysäyttää prosessorin toiminnan tähän käskyyn. Ohjelma tila STAT asettuu tilaan HLT.

Kääntämistä ohjaavat käskyt

Kääntämistä ohjaavat käskyt ovat seuraavat:
Nimet eivät ole millään tavoin pakollisia, niitä voidaan käyttää auttamaan koodin jäsentämisessä. Ohjelmoijalla on tässä vapaat kädet. Yhtähyvin alla voisi lukea oa_aasi eikä main.
main:
    ...
funktio1:
    ...
funktio2:
    ...
Ohjelman muistiosoitteiden ei tarvitse olla peräkkäin, välissä voi olla tyhjää tilaa..
.pos 0 # Koodi (tässä itse nimetty main-funktio) alkaa muistiosoitteesta 0
main: 
    ...
.pos 0x100 # funktio1:sen koodi alkaa muistiosoitteesta 0x100
funktio1:
    ...
Jos muistiin asetattavan arvon koko on pienempi kuin sana, täytetään sen perään nollia niin kauan että se vastaa sanan pituutta. Tämä on hyödyllinen ominaisuus esimerkiksi taulukkojen yhteydessä.
.align 8 # ryhmitellään muisti 8:n tavun mittaisiin osoitteisiin
Ensin .pos-käskyllä voidaan asettaa haluttu muistipaikka ja .align käskyllä haluttu tasaus.
.pos 0x80
.align 8 # ryhmitellään muisti 8:n tavun mittaisiin osoitteisiin
.quad 0x1234 # 2-tavuinen luku
.quad 0x5678 # 2-tavuinen luku
Muisti näyttää seuraavalta, koska luku tasataan sanan pituuteen.
...
0x80: 0x3412000000000000
0x88: 0x7856000000000000
...

Lopuksi

Nyt kun assembly-kielen syntaksi on jo tuttua, voisi olla hyvä idea palata aiemmassa materiaalissa esitettyyn x86-assembly-ohjelmaan ja käydä se uudelleen läpi.
y86-64:selle löytyy netistä vapaasti käytettävä simulaattori (Vasemmalta menusta Student site ja Chapter 4: Processor Architecture), jolle kurssilla laadimme pieniä assembly-kielisiä ohjelmia. Tämän simulaattorin voitte asentaa omalle koneella ja se onkin jo asennettu työasemaluokissa kurssin virtuaalikoneeseen TKJ_harjoitukset. Tulemme seuraavilla luennoilla käyttämään simulaattoria esimerkeissä.
Myös 32-bittinen verkkoversio on olemassa täällä, mutta siitä on tietenkin eroja 64-bittiseen versioon. Rekisterit ovat 32-bittisiä, nimeltään: %eax, %ebx, jne ja käskyt hieman eri nimisiä: addq -> addl. Tämä johtuu siitä, että tietotyyppi vaihtuu quad:stä long:iin.

Tekstipalaute

Huom, tämä laatikko on vain palautetta varten. Mikäli haluat esittää tehtäviin liittyviä kysymyksiä, ne kannattaa suunnata Slack-kanavalle, esittää assareille harjoituksissa tai kurssin sähköpostiin (computer-systems@lists.oulu.fi).
Käsittelemme palautteita luennoilla sekä tarpeen mukaan vastaamme niihin vastaussivulla.
Voit lähettää niin monta palauteviestiä kuin keksit aiheita!

Varoitus: Et ole kirjautunut sisään. Et voi vastata.
?
Abstraktiolla tarkoitetaan sitä kun raa'an konekielen käskyt "piilotetaan" korkeamman tason ohjelmointikielen käskyjen alle. Abstraktiotasosta riippuu miten laajaa tämä piilotus on - mitä korkeampi taso, sitä vaikeampi on suoraan sanoa miten monimutkaiseksi koodirakennelma muuttuu kun se kääntyy konekielelle. Esim. Pythonin abstraktiotaso on huomattavasti korkeampi kuin C:n (itse asiassa Python on tehty C:llä...).
Alias on esikääntäjävaiheessa käsiteltävä korvaus, jolla tietty merkkijono koodissa korvataan toisella. Toiminta vastaa siis tekstieditorin replace-toimintoa. Aliaksia määritellään #define-direktiivillä. Esim #define PI 3.1416
Muuttujan alustamisella tarkoitetaan sitä, kun sille asetetaan koodissa jokin alkuarvo. Hyvin yleinen esimerkki tästä on lukumuuttujien alustaminen nollaan. Alustus voidaan tehdä muuttujan esittelyn yhteydessä: int laskuri = 0; tai erikseen. Jos muuttujia ei alusteta, niiden sisältönä on mitä ikinä muistipaikkaan on aiemmin jäänyt.
Pythonin käyttämää tapaa käsitellä arvojen tyyppiä kutsutaan dynaamiseksi tyypitykseksi eli ankkatyypitykseksi. Nimitys perehtyy lauselmaan "Jos se ui kuin ankka, kävelee kuin ankka ja ääntelee kuin ankka, se on ankka." Toisin sanoen arvon kelvollisuus määritellään sen ominaisuuksien perusteella. Tämä eroaa staattisesta tyypityksestä, jossa arvon kelvollisuus määritellään sen tyypin perusteella.
Argumentti on funktiokutsussa käytettävä arvo, joka välitetään kutsuttavalle funktiolle. Funktion sisällä argumentit sijoitetaan parametreiksi kutsuttuihin muuttujiin. Esimerkiksi printf("%c", merkki); -lauseessa argumentteja ovat "%c"-tulostusmäärittely sekä merkki-muuttujan sisältö.
Alkeiskurssilla arvo-termiä käytettiin kaikista ohjelman käsittelemistä arvoista, oli kyse sitten muuttujista, lauseiden tuloksista tai mistä tahansa. Arvo on siis käytännössä tietokoneen muistissa olevaa dataa, johon muuttujat voivat viitata. C:ssä muuttujan ja sen arvon suhde on Pythonia tiiviimpi, koska muuttuja vastaa suoraan sitä muistialuetta johon arvo on talletettu.
Asetuslippuja käytetään kun suoritetaan ohjelmia komentoriviltä. Ne ohjaavat ohjelman toimintaa. Asetuslippu kirjoitetaan yleensä joko yhdellä viivalla ja sitä seuraavalla kirjaimella (esim. -o) tai kahdella viivalla ja kokonaisella sanalla (tai sanoilla, sanojen välissä viiva) (esim. --system. Jotkut liput ovat ns. boolean lippuja eli ne ovat vain päällä tai pois, toisille annetaan lisäksi parametri. Parametri on tyypillisesti lipun perässä joko välilyönnillä tai =-merkillä erotettuna (esim. -o hemuli.exe).
Avainsanat ovat ohjelmointikielessä kielen käyttöön valittuja sanoja, joilla on erityinen merkitys. Hyvät tekstieditorit tyypillisesti merkitsevät avainsanat muista nimistä eroavalla tavalla (esim. lihavointi). Avainsanat ovat yleensä suojattuja, eli samannimistä muuttujaa ei voi luoda. Yleisiä avainsanoja ovat esim ohjausrakenteisiin kuuluvat if ja else. Avainsanat ovat siis osa ohjelmointikielen kielioppia.
Binääriluku on luku, joka muodostuu biteistä, eli arvoista 0 ja 1. Tämä tekee siitä 2-kantaisen lukujärjestelmän. Binäärilukujen tulkintaa voit tutkailla lukujärjestelmiä käsittelevässä lisämateriaalissa.
Binääritiedosto on tiedosto, joka sisältää konekielisiä käskyjä binäärinä. Ne on tarkoitettu ainoastaan tietokoneen luettavaksi, ja tyypillisesti jos niitä avaa vahingossa esim. tekstieditorilla tuloksena on merkkisotkua editorin yrittäessä tulkita tiedoston sisältämiä bittejä merkeiksi. Useimmat tekstieditorit myös varoittavat asiasta erikseen.
Bitti on pienin informaation yksikkö, joka voi saada arvot 0 ja 1. Tietokoneen sisällä kaikki tapahtuu bitteinä. Tyypillisesti muistissa on bittijonoja, jotka muodostuvat useista biteistä.
Bittinegaatio on operaatio jossa bittijonon bitit käännetään siten, että nollat muutetaan ykkösiksi ja ykköset nolliksi. Operaattori on ~
Bittioperaatiot ovat oma operaatioluokkansa joiden yhteispiirre on se, että niissä käsitellään bittijonojen yksittäisiä bittejä. Kääntöoperaatiossa yhden jonon bitit käännetään nollista ykkösiksi ja toisin päin. Osa operaatioista suoritetaan kahden bittijonon välillä siten, että jonoissa samassa kohdassa olevat bitit vaikuttavat toisiinsa. Näitä ovat and (&), or (|) sekä xor (^). Lopuksi on vielä siirto-operaatiot (<< ja >>), joissa yhden bittijonon bittejä siirretään oikealle tai vasemmalle N askelta.
C:n funktiot ovat Pythonin funktioita staattisempia. Funktiolla voi olla vain yksi paluuarvo, jonka tyyppi määritellään funktion määrittelyssä. Samoin määritellään kaikkien parametrien tyypit. Funktiota kutsuttaessa argumenttien arvot sijoitetaan parametreille varattuihin muistipaikkoihin, joten funktio käsittelee eri arvoja kuin sitä kutsuva koodi.
Ulkopuolinen koodi sijaitsee C:ssä kirjastoissa (library), josta niitä voidaan ottaa käyttöön #include-direktiivillä. C:ssä on mukana sisäiset kirjastot sekä lisäksi voidaan käyttää ulkoisia kirjastoja - ne täytyy kuitenkin koodissa käyttöönoton lisäksi kertoa kääntäjälle käännösvaiheessa. Tyypillisesti kirjasto koostuu c-kooditiedostosta sekä otsikkotiedostosta (.h), joka kertoo mitä funktioita kirjastossa on.
C:n muuttujat ovat staattisesti tyypitettyjä, eli niiden tyyppi kiinnitetään esittelyn yhteydessä. Lisäksi C:ssä muuttuja on sidottu sille varattuun muistialueeseeen. Muuttuja ei voi myöskään muuttaa tyyppiään jälkikäteen.
Ehtolause on yksittäisen ehdon määrittelevä rivi koodissa, jota seuraa aaltosulkeilla merkitty koodilohko, joka määrittää miten ehdon toteutuessa tulee toimia. Varsinaisia ehtolauseita ovat if-lauseet, joka voi esiintyä myös else-avainsanan kanssa else if. Toisiinsa liitetyt ehtolauseet muodostavat ehtorakenteita.
Ehtorakenne on yhdestä tai useammasta toisiinsa liitetystä ehtolauseesta muodostuva rakenne, joka haarauttaa ohjelman suoritusta. Useimmissa ehtorakenteissa on vähintään kaksi haaraa: if ja else. Näiden välissä voi olla myös N kpl else if-lauseilla aloitettuja haaroja. On myös mahdollista, että ehtorakenteessa on pelkkä if-lause. Ehtorakenteessa kussakin haarassa on suoritettavaa koodia, joka kuvaa miten ohjelman tulee ehdon määrittelemässä tilanteessa toimia. Jokainen haara on oma koodilohkonsa, joka merkitään siis aaltosulkeilla.
Esikääntäjä on värkki joka käy koodin läpi suorittaen kaikki esikääntäjädirektiivit ennen varsinaista kääntämistä. Näihin kuuluvat mm. include-lauseet joilla koodiin lisätään siihen liitetyt kirjastot sekä define-lauseet joilla voidaan määritellä vakioita ja makroja.
Esikääntäjädirektiivit ovat ohjeita, jotka on tarkoitettu esikääntäjälle. Ne puretaan koodista pois ennen varsinaista kääntämistä. Esikääntäjädirektiivit alkavat #-merkillä. Yleisin näistä on include, joka vastaa Pythonin importia. Toinen yleinen on define, jolla tällä kurssilla määritetään vakioita.
Muuttujan esittely tarkoittaa sitä kun muuttujan olemassaolosta kerrotaan ensimmäistä kertaa. Tällöin määritetään muuttujan tyyppi ja nimi, esim. int luku;. Kun muuttuja esitellään, sille varataan paikka muistista, mutta muistiin ei vielä kirjoiteta mitään - muuttujassa on siis muistiin jäänyt arvo. Tästä syystä muuttujat on usein myös hyvä alustaa esittelyn yhteydessä.
Etumerkitön kokonaislukumuuttuja on kokonaisluku jonka kaikki arvot ovat positiivisia. Koska etumerkille ei tarvitse varata bittiä, etumerkittömällä kokonaisluvulla voidaan esittää itseisarvoltaan 2x suurempi luku kuin etumerkillisellä. Etumerkitön kokonaisluku määritetään lisäämällä kokonaislukumuuttujan esittelyyn unsigned-avainsana: unsigned int laskuri;
Heksadesimaaliluvut ovat 16-kantaisia lukuja, joita käytetään erityisesti muistiosoitteiden sekä muistin bittisisällön esittämiseen. Heksadesimaaliluvun edessä on tyypillisesti 0x, ja numeroiden lisäksi käytössä ovat kirjaimet A-F jotka vastaavat numeroja 10-15. Heksadesimaalilukuja käytetään koska yksi numero vastaa aina tasan neljää bittiä, joten muunnokset binääriin ja takaisin ovat helppoja.
Kirjasto on tyypillisesti yhteen rajattuun tarkoitukseen tehty työkalupakki, joka yleensä sisältää nipun funktioita. Kirjastot otetaan käyttöön include-esikääntäjädirektiivillä. Jos kirjasto ei kuulu C:n sisäänrakennettuihin, sen käyttöönotto täytyy myös kertoa kääntäjälle.
Kommentti on kooditiedostossa olevaa tekstiä, joka ohitetaan kun koodia suoritetaan. Kussakin kielessä on oma tapansa sille miten rivi merkitään kommentiksi. Pythonissa se on #-merkki, C:ssä //. Lisäksi C:ssä voi merkitä useita rivejä kommenteiksi kerralla - kommentti aloitetaan tällöin /*-merkkiparilla ja päätetään */-merkkiparilla. Kaikki näiden välissä tulkitaan kommentiksi.
Komplementti on negatiivisten lukujen esitystapa, jossa luvun etumerkki muutetaan kääntämällä sen kaikki bitit. Kahden komplementissa, jota tällä kurssilla käytetään, käännön jälkeen lisätään tulokseen 1. Tarkempaa tietoa löydät lukujärjestelmiä käsittelevästä oheismateriaalista.
Konekieli muodostuu käskyistä jotka laitteen prosessori ymmärtää. Konekieltä kutsutaan yleensä Assemblyksi ja se on alin taso jolla ihmisen on mielekästä antaa ohjeita tietokoneelle. Konekieltä käytetään tällä kurssilla loppuossa, joten siihen ei johdatuskurssia suorittavien tarvitse perehtyä.
Koodilohko on joukko koodirivejä, jotka kuuluvat jollain tavalla yhteen eli ne ovat samassa kontekstissa. Esimerkiksi ehtorakenteessa kunkin ehdon alla on oma koodilohkonsa. Samoin funktion sisältö on oma koodilohkonsa. Koodilohkot voivat sisältää muita koodilohkoja. Pythonissa koodilohkot erotetaan toisistaan sisennyksellä; C:ssä koodilohkon alku ja loppu merkitään aaltosulkeilla {}
Käskykanta määrittää mitä käskyjä laitteen prosessori osaa. Nämä käskyt muodostavat prosessoriarkkitehtuurin konekielen.
Kääntäjä on ohjelma, joka kääntää C-kielisen koodin konekieliseksi binääritiedostoksi, jonka tietokoneen prosessori osaa suorittaa. Kääntäjä myös tutkii koodin ja ilmoittaa siinä olevista virheistä sekä antaa varoituksia potentiaalisista ongelmista koodissa. Kääntäjän toimintaa voi ohjata lukuisilla asetuslipuilla.
Lause on ohjelmointikielessä nimitys yksittäiselle suoritettavalle asialle, joka on yleensä yksi koodirivi.
Looginen operaatio viittaa Boolen algebran operaatiohin, joissa käsitellään totuusarvoja. Tyypillisiä loogisia operaatioita ovat ehtolauseista tutut and, not ja or. C:ssä tunnetaan myös bittikohtaiset loogiset operaatiot jotka toimivat samalla logiikalla, mutta vaikuttavat jokaiseen bittiin erikseen.
Makro on alias, jolla määritetään tietty avainsana korvattavaksi koodinpätkällä. Hyvin käytettynä tällä voidaan joissain tilanteissa saada aikaan parempaa luettavuutta, mutta helposti käy toisin. Makroilla ei kannata tämän kurssin puitteissa leikkiä, kunhan tietää mistä on kyse jos niihin joskus törmää.
Merkki on nimensä mukaisesti yksi merkki. Merkki voidaan tulkita ASCII-merkkinä mutta sitä voidaan käyttää koodissa myös kokonaislukuna, koska se on pienin esitettävissä oleva kokonaisluku. Merkin koko on 1 tavu. Merkki merkitään yksinkertaisilla lainausmerkeillä, esim. 'c'.
Pythonissa kaikki teksti käsiteltiin merkkijonoissa, eikä siinä esim. ollut erillistä muuttujatyyppiä yksittäiselle merkille. C:ssä puolestaan ei ole varsinaista merkkijonomuuttujatyyppiä lainkaan - on ainoastaan merkeistä koostuvia taulukoita, joille on oma määrittelytapansa. Näillä taulukoilla on ennaltamäärätty pituus. "Merkkijonon" voi määritellä C:ssä char elain[5] = "aasi"; jossa numero kertoo merkkitaulukon koon ja on merkkien määrä + 1, koska lopetusmerkki '\0' lisätään tässä alustustavassa automaattisesti loppuun.
Metodi on funktio, joka on osa objektia eli objektin ominaisuus, jolla objekti usein muuttaa omaa tilaansa. Metodia kutsuttaessa käsiteltävä objekti tulee kutsun eteen: arvosanat.sort().
Kaikki suoritettavien ohjelmien käsittelemä data on tietokoneen muistissa ajon aikana. Tietokoneen muisti muodostuu muistipaikoista, joilla on muistiosoite sekä sisältö. Kaikki muistipaikat ovat saman kokoisia - jos talletettava tietomäärä on tätä suurempi, varataan useampi (peräkkäinen) muistipaikka.
Pythonissa objektit eroteltiin muuntuviin ja muuntumattomiin. Muuntumaton arvo oli sellainen, jonka sisältö ei voi muuttua - kaikki operaatiot jotka näennäisesti muuttavat arvoa tosiasiassa luovat siitä uuden kopion, joka yleensä sijaitsee uudessa muistipaikassa. Esimerkiksi merkkijonot olivat tyypillinen muuntumaton tyyppi Pythonissa. C:ssä tätä erottelua ei tarvita, koska muuttujien ja muistipaikkojen suhde on tiiviimpi - sama muuttuja osoittaa koko ohjelman suorituksen ajan tiettyyn muistipaikkaan.
Objekti, joskus myös olio, on Pythonissa yleistä terminologiaa. Kutsuimme objekteja pääasiassa arvoiksi alkeiskurssilla, mutta Pythonissa kaikkea voi käsitellä objekteina - tämä tarkoittaa, että mihin tahansa voidaan viitata muuttujilla (esim. funktion voi sijoittaa muuttujaan). Objekti-termiä käytetään tyypillisesti oliopohjaisissa kielissä (kuten Python). C ei kuulu tähän joukkoon.
Ohjausrakenne on yleisnimitys koodirakenteille, jotka hallitsevat jollain tavalla ohjelman suorituksen kulkua. Näihin rakenteisiin lukeutuvat ehtorakenteet sekä toistorakenteet. Myös poikkeusten käsittely voidaan lukea tähän joukkoon.
Koodin optimointi tarkoittaa sitä, että sen suorituskykyä parannetaan tyypillisesti joko vähentämällä aikaa, joka sen suoritukseen kuluu tai vähentämällä muistin käyttöä. Optimoinnista on hyvin tärkeää ymmärtää, että sitä ei koskaan kannata tehdä jos ei ole pakko - optimointia siis tehdään vasta kun koodi oikeasti toimii hitaasti tai kuluttaa liikaa muistia. Optimointia ei myöskään kannata tehdä sokkona - koodista tulee ensin tunnistaa mitkä ovat sen pullonkaulat eli ne osat jotka tuhlaavat eniten resursseja.
Osoitin (pointer) on C:ssä erityinen muuttujatyyppi. Osoitinmuuttuja sisältää muistiosoitteen, josta varsinainen arvo löytyy - ne toimivat siis tietyllä tapaa kuin Pythonin muuttujat. Muuttuja määritellään osoittimeksi lisäämällä tyypin perään * esittelyrivillä, esim. int* luku_os luo luku_os-muuttujan, joka on osoitin int-tyyppiseen arvoon. Osoittimen osoittaman muistialueen sisällön voi hakea käyttöön merkinnällä *luku_os ja vastaavasti jonkin muuttujan muistipaikan osoitteen saa merkinnällä &luku. Osoittimille on omistettu kokonainen materiaali (4).
Otsikkotiedot ovat C-koodissa ja erityisesti kirjastojen yhteydessä eräänlainen muotti koodista. Tyypillisen otsikkotieto on funktion prototyyppi, jolla kerrotaan mitä funktio palauttaa ja mitä argumentteja sille annetaan. Rivi on sama kuin funktion varsinainen määrittely. Muita otsikkotietoja ovat mm. tietotyyppien ja vakioiden määrittelyt. Otsikkotiedot voivat sijaita kooditiedoston alussa, mutta erityisesti kirjastojen osalta ne ovat yleensä erillisessä .h-tiedostossa.
Paikanpidin on merkkijonojen muotoilussa käytetty termi, jolla esitetään kohta merkkijonossa, johon sijoitetaan esim. muuttujan arvo ohjelman suorituksen aikana. Pythonissa format-metodia käytettäessä paikanpitimiä merkittiin aaltosulkeilla (esim. {:.2f}). C:ssä käytetään %-merkkiä jota seuraa paikanpitimen määrittely, josta erityisen tärkeä osa on muuttujatyypin määrittely. Esimerkiksi "%c" ottaa vastaan char-tyyppisen muuttujan.
Paluuarvo on nimitys arvolle tai arvoille jotka funktio palauttaa kun sen suoritus päättyy. C:ssä funktioilla voi olla vain yksi paluuarvo, Pythonissa niitä voi olla useita. Koodia lukiessa paluuarvoa voi käsitellä päässään siten, että funktiokutsun paikalle sijoitetaan funktion paluuarvo sen jälkeen kun funktio on suoritettu.
Parametri on funktion määrittelyssä nimetty muuttuja. Parametreihin sijoitetaan funktion saamat argumentit. Parametri on siis nimitys jota käytetään kun puhutaan arvojen siirtymisestä funktion näkökulmasta. Tätä erottelua ei aina tehdä, vaan joskus puhutaan pelkästään argumenteista.
Poikkeus on ohjelmointikielessä määritelty virhetilanne. Poikkeuksella on tyyppi (esim. TypeError), jota voi käyttää poikkeuksen käsittelyssä ohjelman sisällä sekä myös apuna virhetilanteen ratkaisussa. Tyypillisesti poikkeukseen liitetään myös viesti, joka kertoo mistä ongelmassa on kyse.
Prototyyppi määrittelee funktion paluuarvon tyypin, nimen sekä kaikki argumentit ennen funktion varsinaista esittelyä. Kunkin funktion prototyypin tulisi löytyä joko kooditiedoston alusta tai erillisestä otsikkotiedostosta (.h). Prototyypin määrittely on kopio funktion varsinaisesti määrittelyrivistä.
Merkkijonojen format-metodi on Pythonissa tehokas tapa sisällyttää muuttujien arvoja tulostettavaan tai tallennettavaan tekstiin. Merkkijonoon määritetään paikanpitimiä (esim: {:.2f}) joihin sijoitetaan format-metodin argumentit.
Python-funktiolla voi olla valinnaisia parametreja, joilla on asetettu oletusarvo. Argumenttien arvot siirtyvät parametreihin viittauksen kautta, joten funktion sisällä käsitellyt arvot ovat samoja kuin sen ulkopuolella käsitellyt - niillä on vain eri nimet. Python-funktiolla voi olla useita paluuarvoja.
Pythonin import-lauseella otettiin käyttöön moduuleja/kirjastoja - joko Pythonin mukana tulevia, muualta ladattuja tai itsekirjoitettuja. Pythonin import-lauseelle erityistä on, että oletuksena tuotuihin funktioihin ym. päästään käsiksi moduulin nimen kautta (esim. math.sin. C:ssä importia vastaa include, ja se tuo nimet suoraan ohjelman omaan nimiavaruuteen.
Interaktiivinen Python-tulkki tai Python-konsoli on ohjelma, johon voi kirjoittaa Python-koodirivejä. Nimitys "interaktiivinen" tulee siitä, että koodirivi suoritetaan välittömästi sen syöttämisen jälkeen, ja ohjelma näyttää käyttäjälle koodirivin tuottaman paluuarvon (esim. matemaattisen operaation tuloksen).
Pythonin lista osoittautui Ohjelmoinnin alkeissa hyvin tehokkaaksi työkaluksi. Se on järjestetty kokoelma arvoja. Listan monikäyttöisyys johtuu siitä, että sen koko on dynaaminen (eli suorituksen aikana muuttuva) minkä lisäksi se voi sisältää mitä tahansa arvoja - myös sekaisin. Samassa listassa voi siis olla useita erityyppisiä arvoja. Listat voivat tietenkin sisältää myös listoja tai muita tietorakenteita jne.
Kuten Ohjelmoinnin alkeissa opittiin, Python-muuttuja on viittaus arvoon, eli yhteys muuttujan nimen ja tietokoneen muistissa olevan arvon välillä. Python-muuttujilla ei ole tyyppiä, mutta arvoilla on. Arvon kelpaavuus kokeillaan koodia suorittaessa tilannekohtaisesti. Tässä suhteessa ne siis eroavat toiminnaltaan C:n muuttujista, ja niiden toiminta muistuttaa usein enemmän C:n osoittimia.
Pythonissa pääohjelma on se osa koodia, joka suoritetaan kun ohjelma käynnistetään. Pääohjelma sijaitsee tyypillisesti koodin lopussa, ja useimmiten if __name__ == "__main__":-lauseen alla. C:ssä ei ole varsinaista pääohjelmaa, siinä suoritus aloitetaan oletuksena main-nimisestä funktiosta.
Python-tulkki on ohjelma, joka muuttaa Python-koodin tietokoneelle annettaviksi ohjeiksi. Se vastaa niin kooditiedostojen kuin myös interaktiiviseen Python-tulkkiin kirjoitettujen komentojen suorittamisesta. Tällä kurssilla sanalla tulkki viitataan kuitenkin useimmiten nimenomaan interaktiiviseen Python-tulkkiin.
Pääfunktio on C:ssä ohjelman aloituspiste ja se korvaa Pythonista tutun pääohjelman. Oletuksena pääfunktion nimi on main ja se määritellään yksinkertaisimmillaan int main().
Resurssi viittaa laitteiston käytössä olevaan prosessoritehoon, muistiin, oheislaitteet jne. Se käsittää siis kaikki rajoitteet sille millaista ohjelmakoodia voidaan ajaa sekä sen, mitä ohjelmakoodilla voidaan tehdä. Tietokoneilla resurssit ovat ohjelmointiopiskelijan näkökulmasta aika rajattomat, mutta sulautetuilla järjestelmillä rajat voivat hyvinkin tulla vastaan.
C käyttää staattista tyypitystä. Se tarkoittaa sitä, että muuttujien tyypit määritellään kun ne luodaan ja muuttujaan ei voida sijoittaa erityyppistä arvoa. Lisäksi arvon kelvollisuus määritellään koodia suorittaessa sen tyypin perusteella (tai oikeastaan tämä tehdään jo käännösvaiheessa). Pythonissa taas käytetään dynaamista eli ankkatyypistystä.
Syntaksi (engl. syntax) on koodin kielioppi. Esimerkiksi Pythonin syntaksi määrittää, millainen teksti on tulkittavissa Python-koodiksi. Jos teksti ei noudata koodin syntaksia, sitä ei voida suorittaa tai C:n tapauksessa kääntää. Syntaksi antaa myös koodaajalle tietoa siitä, missä muodossa halutunlainen ohje tulee antaa.
Taulukko (array) on ohjelmointikielissä yleinen tietorakenne, joka sisältää useita (yleensä) samantyyppisiä arvoja. C:n taulukot ovat staattisia - niiden koko tulee määritellä taulukon esittelyn yhteydessä - ja taulukossa voi olla vain samantyyppisiä muuttujia (myös tyyppi määritellään esittelyssä).
Yhden muistipaikan koko on yksi tavu (byte) - tyypillisesti 8 bittiä. Tavu on siis pienin yksikkö joka voidaan osoittaa tietokoneen muistista. Muuttujien tyyppien varaamat muistialueet lasketaan tavuissa.
Terminaali, komentokehote ja komentorivi ovat eri nimiä käyttöjärjestelmän tekstipohjaiselle käyttöikkunalle. Windowsissa komentoriville pääsee kun kirjoittaa suorita...-ikkunaan cmd. Komentorivillä annetaan tekstikomentoja käyttöjärjestelmälle. Tällä kurssilla pääasiassa siirrytään cd-komennolla hakemistosta toiseen ja käytetään kääntäjää kooditiedostojen kääntämiseen sekä suoritetaan käännettyjä koodeja.
Tietorakenne on yleisnimitys kokoelmille jotka sisältävät useita arvoja. Pythonissa näitä olivat mm. lista, monikko ja sanakirja. C:ssä taas yleisimmät tietorakenteet ovat taulukot (array) ja tietueet (struct).
Tietokoneen muistissa oleva data on pelkästään bittejä, mutta muuttujilla on tyyppi. Tyyppi kertoo millä tavalla muistissa olevat bitit pitää tulkita. Se kertoo myös kuinka suuresta määrästä bittejä muuttujan arvo muodostuu. Tyyppejä ovat esim int, float ja char.
Tyyppimuunnos on operaatio jossa muuttuja muutetaan toisentyyppiseksi. Alkeiskurssilla tätä tehtiin pääasiassa int- ja float-funktioilla. C:ssä tyyppimuunnos merkitään hieman toisin: liukuluku = (float) kokonaisluku. Huomioitavaa on myös, että operaation tulos voidaan tallentaa ainoastaan muuttujaan jonka tyyppi on kohdetyyppiä (esimerkissä float). Pythonissa nähdyt luku = int(luku)-temput eivät siis onnistu.
Varoitusviesti on ilmoitus siitä, että ohjelman suorituksessa tai - erityisesti tällä kurssilla - sen kääntämisessä kohdattiin jotain epäilyttävää, joka saattaa johtaa virhetilanteisiin, mutta ei suoraan estä ohjelman käyttöä. Yleisesti ottaen kaikki varoitukset on syytä korjata ohjelman toiminnan vakauttamiseksi.
Virheviestiksi kutsutaan tietokoneen antamaa virheilmoitusta joko koodia kääntäessä tai ohjelmaa suorittaessa. Virheviesti tyypillisesti sisältää tietoa kohdatusta ongelmasta ja sen sijainnista.
C:ssä main-funktio on ohjelman suorituksen aloituspiste kun ohjelma käynnistetään. Ohjelman komentoriviargumentit tulevat main-funktiolle (mutta niitä ei ole pakko vastaanottaa), ja sen palautusarvon tyyppi on int. Lyhimmillään main-funktion voi siis määritellä: int main().
C:ssä yksi tulostustapa on printf-funktio, joka muistuttaa pääasiassa Pythonin print-funktiota. Sille annetaan tulostettava merkkijono, sekä lisäksi merkkijonoon sijoitettavat arvot mikäli on käytetty paikanpitimiä. Toisin kuin Pythonin print, printf ei automaattisesti lisää rivinvaihtoa, joten loppuun on yleensä syytä lisätä \n.
Silmukoista while pohjautuu toistoon ehdon tarkastelun kautta - silmukan sisällä olevaa koodilohkoa suoritetaan niin kauan kuin silmukalle annettu ehto on tosi. Ehto määritetään samalla tavalla kuin ehtolauseissa, esim: while (summa < 21).