Termipankki
  1. A
    1. Abstraktio
    2. Alias
    3. Alustaminen
    4. Ankkatyypitys
    5. Argumentti
    6. Arvo
    7. Asetuslippu
    8. Avainsana
  2. B
    1. Binääriluku
    2. Binääritiedosto
    3. Bitti
    4. Bittinegaatio
    5. Bittioperaatio
  3. C
    1. C-funktio
    2. C-kirjasto
    3. C-muuttuja
  4. E
    1. Ehtolause
    2. Ehtorakenne
    3. Esikääntäjä
    4. Esikääntäjädirektiivi
    5. Esittely
    6. Etumerkitön
  5. H
    1. Heksadesimaali
  6. I
    1. Iteroitava
  7. K
    1. Kirjasto
    2. Kokonaisluku
    3. Kommentti
    4. Komplementti
    5. Konekieli
    6. Koodilohko
    7. Käskykanta
    8. Kääntäjä
  8. L
    1. Lause
    2. Liukuluku
    3. Looginen operaatio
  9. M
    1. Makro
    2. Merkki
    3. Merkkijono
    4. Metodi
    5. Muisti
    6. Muuntumaton
    7. main-funktio
  10. O
    1. Objekti
    2. Ohjausrakenne
    3. Optimointi
    4. Osoitin
    5. Otsikkotiedosto
    6. Otsikkotiedot
  11. P
    1. Paikanpidin
    2. Paluuarvo
    3. Parametri
    4. Poikkeus
    5. Prototyyppi
    6. Python-for
    7. Python-format
    8. Python-funktio
    9. Python-import
    10. Python-konsoli
    11. Python-lista
    12. Python-muuttuja
    13. Python-pääohjelma
    14. Python-tulkki
    15. Pääfunktio
    16. printf
  12. R
    1. Resurssi
  13. S
    1. Staattinen tyypitys
    2. Syntaksi
  14. T
    1. Taulukko
    2. Tavu
    3. Terminaali
    4. Tietorakenne
    5. Tyyppi
    6. Tyyppimuunnos
  15. V
    1. Varoitusviesti
    2. Virheviesti
  16. W
    1. while
Ratkaistu: / tehtävää

Bitit ja lukujärjestelmät

Osaamistavoitteet: Tämän materiaalin läpikäytyäsi tiedät miten tietokoneen muisti rakentuu biteistä, miten tietokone niitä käsittelee binäärilukuina ja osaat tehdä muunnoksia eri lukujärjestelmien välillä.
Aiemmin ohjelmoinnin kursseilla opimme mitkä ovat tietokoneen ja eri ohjelmointikielten tuntemat lukujärjestelmät: binääri-, kymmen- ja heksadesimaaliluvut. Näistä kymmenjärjestelmä on mukana vain meidän ihmisten, ts. ohjelmoijien ja käyttäjien, takia. Tietokone vaatimattomana laskimena ei tarvitse kuin binääriluvut ja niitä vastaavat bitit. Meidän tulee kuitenkin ymmärtää miten tietokone käsittelee bittejä.
.. tosin joskus eri lukujärjestelmien kanssa laskeminen saa kummallisia käänteitä (http://www.xkcd.com/571)
"Lampaita laskiessa"
Selvitetäänpäs mitä uneton ystävämme oikein laskee ja mitä lampaille yllä tapahtuu..

Bitit tietokoneen muistissa

Bitti on (tietotekniikassa) tietoalkion pienin käsiteltävissä oleva osa. Bitillä on kaksi toisensa poissulkevaa (loogista) tilaa: 0 ja 1, joiden merkitys on ohjelmoijan määriteltävissä. Yksittäinen bitti siis kertoo aika vähän asioita, mutta kun bittejä asetetaan jonoon peräkkäin (esim 11010100) ja tämä bittijono käsitetään binäärilukuna, voidaankin esittää aika monta numeroarvoa eli tietoalkion tilaa.
Sanan, ts. tietoalkion, koko bitteinä kertoo meille sen lukualueen koon.
2 ^ 8 = 256 // 8-bittinen luku
2 ^ 16 = 65536 // 16-bittinen luku
2 ^ 32 = 4294967296 // ...
2 ^ 64 = 1.8446744*10^19 //  ...
2 ^ .. // okei, eiköhän nämä riitä meille
Nyt positiivisen binäärilukun lukualue on siis 0 - 2^n-1, missä n on bittien määrä.
Yhdestä 8 bitin binääriluvusta käytetään nimitystä tavu (engl. byte) ja 16/32 bitin luvusta taas nimitystä sana (engl. word) ja 32/64-bitin luvusta nimitystä englanniksi long word (.. pitkä kokonaisluku). Sanan määritelmä vaihtelee arkkitehtuurista toiseen ja se on nykyään tyypillisesti sulautetuissa joko 16 tai 32 bittiä ja PC-työasemissa 64 bittiä. C:n standardi ei sanan kokoa määrittele, josta lisää kohta..

Pyrkimys säästeliäisyyteen

Edellisellä luennoilla opimme, että suorittimen arkkitehtuuri määrittelee sanan koon bitteinä, joka on samalla myös yhden muistipaikan koko. Näin ollen keskusmuisti on "pätkitty" sananpituuden (ok, yleensä) mukaisesti muistipaikkoihin. Ja kun jokaisella muistipaikalla on osoite, voimme löytää muistista jokaisen yksittäisen tietoalkion ja sen yksittäisen bitin arvon.
Miksi nämä tavut ja sanat kiinnostavat meitä.. eikö riittäisi, että käytetään aina vain 64-bittistä arkkitehtuuria ja muistipaikkaa, kun kerran sinne mahtuu meidän luku ihan varmasti?
Näin voimme tehdä arkkitehtuurin ja muistin määrän asettamissa rajoissa, vaikkapa työasemalla ohjelmoidessa. Mutta, koska sulautetuissa järjestelmissä muistia on yleensä vähän tarjolla verrattuna työasemiin, joudutaan sen käyttöä optimoimaan. yksi oleellinen tapa optimoida on esittää ohjelmassa juuri sopivan kokoisia muuttujia. Kun muistia on vähän, miksi käyttää pitkää kokonaislukua (64-bittinen luku, joka vie 8 tavua muistia) jos kyseisen arvo mahtuu 8-bittiseen muistipaikkaan (eli yhteen tavuun)? Pieni muistin koko on juuri niitä suunnittelupäätöksiä, joilla mikrokontrollerien valmistuskustannuksia saadaan alas verrattuna yleiskäyttöisiin prosessoreihin.
Tarkastellaan asiaa esimerkin kautta. Joissain mikrokontrollereissa (ATtiny-sarja) on muistia jopa alle yhden kilotavun (1024 tavua). Jos kilotavun muistissa yhden muistipaikan koko olisi 32 bittiä (4 tavua x 8 bittiä), muistissa olisi 1024 / (32 / 8) = 256 yksittäistä muistipaikkaa. Jos taas muistipaikan koko on 16 bittiä 1024 / (16 / 8 ) = 512 , muistissa on 512 muistipaikkaa. Jälkimmäiseen muistiin siis mahtuu enemmän yksittäisiä tietoalkioita, mutta niiden koko on pienempi.
Alla esimerkinomaisesti miten erikokoiset tietoalkiot sijoittuisivat muistiin. Kuvan arkkitehtuurissa osoitelinjoja olisi 4 ja datalinjoja sananpituuden 8 bittiä mukaan. Nyt muistin koko 2^4 muistipaikkaa, jos sanan pituus on 8 bittiä. Jos sanan pituus on 16 bittiä, on muistin koko olisi 2^3 muistipaikkaa.
"Muisti eri arkkitehtuureissa"
(kuvassa virhe 16-bittisissä muistiosoitteissa..)

Jonoon järjesty!

Muistipaikassa olevan binääriluvun esittämisessä tietokoneelle (ALUlle) on vielä pari mutkaa matkassa, nimittäin bittijärjestys ja tavujärjestys.

Bittijärjestys

Kymmenjärjestelmän luvuissa olemme sopineet, että merkittävin numero on vasemmanpuoleisin ja siitä oikealle laskevassa järjestyksessä. Esimerkiksi, luvussa 210 isoin painoarvo on luvulla 2, joka kuvaa satasia.
Nyt binääriluku 1011 voidaan lukea kahdella tapaa: 1011 = 1* 2^0 + 0*2^1 + 1*2^2 + 1*2^3 = 13 ja 1011 = 1*2^3 + 0*2^2 + 1*2^1 + 1*2^0 = 11. Suunnasta riippuen binääriluvun arvo on eri. Myös tietokoneiden kanssa meidän pitää sopia mitenpäin binääriluku luetaan. Eli missä on merkittävin numero luvussa?
No, suorittimen arkkitehtuurissa tämän asiat ovat suunnittelijat päättäneet ja siitä kyllä ohjelmoinnin helpottamiseksi kerrotaan suorittimen manuaalissa (ts. datakirjassa). Nyt puhutaan vähiten merkitsevästä (engl. least significant bit, LSB) bitistä, jolla on siis pienin kakkosen potenssi, ja vastaavasti eniten merkitsevästä (engl. most significant bit, MSB) bitistä, jolla on suurin kakkosen potenssi.
"Lampaita laskiessa"

Tavujärjestys

Okei, mutta mutta... jos muistipaikan koko on useita tavuja, mistä tiedämme että missä järjestyksessä sen tavut ovat? Esimerkiksi 32-bittinen sana, joka koostuu neljästä tavusta? tavu0,tavu1,tavu2,tavu3 tai tavu3,tavu2,tavu1,tavu0.
Tämä on ihan samoin arkkitehtuurin suunnittelun yhteydessä päätettävä asia. Tavujärjestys voi olla eniten merkitsevin tavu ensin (engl. big endian) tai vähiten merkitsevin ensin (engl. little endian). Esimerkiksi työasemien x86-64 -prosessoriarkkitehtuuri on little endian, mutta Sun-työasemien 32-bittinen arkkitehtuuri on big endian.
Kurssilla määritellään nyt, että eniten merkitsevä tavu on vasemmanpuoleisin tavu ja eniten merkitsevä bitti (MSB) on luvun vasemmanpuoleisin bitti. Aina liikutaan siis vasemmalta oikealle.

Negatiiviset kokonaisluvut

Aiemmin on esitetty tapa käyttää bittejä ja binäärilukuja positiivisten lukujen esittämiseen, mutta miten negatiiviset luvut esitetään? Seuraavassa kolme tapaa esittää negatiivisia kokonaislukuja binäärilukuina.
1. Suora (engl. signed magnitude). Voimme varata biteistä eniten merkitsevän merkkibitiksi, eli osoittamaan etumerkkiä (+ / -), jossa 0 tarkoittaa positiivista lukua ja 1 negatiivista. Esimerkiksi 0010 olisi 2 ja 1010 olisi -2. Huomataan, että tällöin luvulla nolla on kaksi esitystä, 4-bittisenä 0000 ja 1000. Tämä on huono juttu, koska joudutaan (koodissa) huomioimaan molemmat +0 ja -0.
Kun varaamme yhden bitin etumerkin käyttöön, jää meillä itse lukualueeseen n-1 -bittiä. Esimerkiksi 8-bittisen luvun lukualue tippuu 7:n bittiin, eli positiivinen lukualue olisi enää 0..127. Tilalle saamme etumerkin avulla lisäksi negatiiviset lukualueen -128..-1. Tässä siis lukualue ikäänkuin "siirtyy" negatiiviseen suuntaan!
2. Yhden komplementti Negatiivinen luku saadaan ottamalla positiivisesta negaatio. Esimerkiksi, kun luku 3 on 0011 binäärilukuna, niin -3 olisi 1100. Tässäkin esitystavassa on nollalle kaksi esitystä, 0000 ja 1111.

3. Kahden komplementti

Kolmas esitystapa on kaikkien kiinnostavin ja yleisesti tietotekniikassa käytetty. Joten uhrataan sille hieman enemmän aikaa.
Sovitaan taas, että eniten merkitsevä bitti (MSB) on merkkibitti: 0 positiivinen ja 1 negatiivinen. Nyt positiivisella puolella 2-komplementtiluvuissa ei ole mitään erikoista.
Negatiivisen kokonaisluvun esittämiseen on oma menetelmä:
  1. Positiivisesta binääriluvusta otetaan negaatio: nollat ykkösiksi ja päinvastoin
  2. Lisätään negaatioon 1.
Esimerkkejä 4-bittisillä luvuilla. 

Luku 1    0001       Luku 2    0010       

Negaatio  1110       Negaatio  1101  
            +1                   +1                  
          ----                 ----                
          1111 = -1            1110 = -2 
Takaisin negatiivisesta positiiviseksi mennään samalla menetelmällä.
Luku -1   1111       Luku -2   1110      

Negaatio  0000       Negaatio  0001   
            +1                   +1                  
          ----                 ----                
          0001 = 1             0010 = 2   
Esimerkki. Kuvassa 4-bittiset luvut ilman etumerkkiä ja 2-komplementtiesityksenä.
"Lukualueet"

Muuta jännää

Lisäksi 2-komplementtiesitys on siitä kätevä, että 2-komplementtilukujen yhteenlasku toimii samoin, oli operandi positiivinen tai negatiivinen. Tämä helpottaa merkittävästi ALUn digitaalilogiikan suunnittelua..
Esimerkki. Laske 2-komplementtiluvuilla 2+3 = ? ja 2-3 = 2+(-3) = ?

Luku +2 0010            Luku +2 0010
Luku +3 0011            Luku -3 1101
+       ----            +       ----
        0101 = 5                1111 = -1
(Suorassa menetelmässä ja 1-komplementti-esityksessä tämä ei aina toimi, kokeile löytää esimerkki jossa yhteenlasku ei toimi!)
Ja sitten terveisiä Niksi-Pirkka osastolta.. nyt negatiivisen binääriluvun muunnos kymmenjärjestelmään voidaan tehdä ilman laskinta yksinkertaisella yhteenlaskulla. Idea on, että ajatellaan eniten merkitsevän bitin painoarvo (engl. rank) negatiivisena, kuvassa punaisella. Kun taas muiden bittien arvot pysyvät positiivisina. Nyt, muunnos tapahtuu siten, että lasketaan yhteen bittien painoarvoa vastaavat desimaaliluvut.
Esimerkki. 8-bittiset luvut 99 ja -99. 

01100011 -> 64 + 32 + 2 + 1 = 99
10011101 -> -128 + 16 + 8 + 4 + 1 = -99
"Yhteenlaskua vain"
Muunna 6-bttinen 2-komplementtiluku 101011 kymmenjärjestelmään yhteenlasku-menetelmällä.
Tarvitaan vain vastaus.
Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Heksadesimaaliluvut

Toinen C-kielisessä (ja konekielisessä) sulautettujen ohjelmoinnissa usein käytetty kantalukujärjestelmä on 16. Tällöin puhutaan heksadesimaalinumeroista, jotka käsittävät numerot 0-9 ja 10-15, merkitään kirjaimilla A-F.
"Heksadesimaaliluvut"
Huomataan, että jokainen heksadesimaalinumero voidaan esittää 4:llä bitillä. Tämä onkin yksi hyvä syy miksi heksadesimaalilukuja käytetään, kun nyt voidaan yksi tavu esittää kahdella heksadesimaalinumerolla vs. hankalasti biteiksi tulkittava kymmenjärjestelmän kokonaisluku vs. silmille epämukava binääriluku.
Muunnos heksalukujen ja binäärilukujen välillä on helppo. Tiedäme, että jokaista heksanumeroa siis vastaa 4 bittiä, eli tarvitsee vain muuttaa heksanumerot yksi kerrallaan 4-bittisiksi binääriluvuiksi.
Esimerkki. Muunna heksadesimaaliluku 173A4C binääriluvuksi?
   1    7    3    A    4    C   
0001 0111 0011 1010 0100 1100
Monissa ohjelmointikielissä heksaluvut esitetään käyttäen etuliitettä 0x. Esimerkiksi.
0x0123456789ABCDEF
0xA
0x1000
0x001
0xBEEF
0xC0DE
0xBA5EBA11

Lopuksi

Ok, jänniä juttuja.. mutta entäs uneton ystävämme ja ne seonneet lampaat?
"Lampaita laskiessa"
Nythän meille on selvää, kun vilkaisemme sarjakuvaa uudestaan, että ystävämme laskee lampaita 16-bittisillä 2-komplementtiluvuilla. Nyt yli bitti on varattu merkkibitiksi, jolloin lukualue (merkkibitti + 2^15) on -32768-32767..
Kävi ikävästi unta odotellessa ja positiivinen lukualue loppui kesken, jolloin luvut pyörähti negatiiviselle puolelle merkkibitin vaihtumisen myötä..
0000000000000001 = 1
+1
0000000000000010 = 2
+1
...
0111111111111110 = 32766 
+1
0111111111111111 = 32767 
+1
1000000000000000 = -32768
+1
1000000000000001 = -32767
+1 
1000000000000010 = -32766
...

TKJ-asiaa

Tästä eteenpäin materiaali sivun loppuun asti on TKJ-asiaa ja muille varsin hyvä tietää! Tämä asia käydään läpi TKJ-osuudessa, mutta JTKJ-opiskelijat voivat toki siihen perehtyä.

Liukulukuesitys

Katsotaan ensin miten binääriluvuille esitetään desimaalit? No, ihan vastaavasti desimaalipilkulla kuten kymmenjärjestelmässäkin. Kuvasta huomaamme, että desimaalipisteen vasemmalla puolella olevat kakkosen potenssit ovat positiivisia ja oikealla puolen negatiivisia.
"Desimaaliluku binäärisenä"
Esimerkki.
Binääriluku 10.101 = 1*2^1 + 0*2^0 + 1*2^-1 + 0*2^-2 + 1*2^-3 = 2 + 0 + 1/2 + 0 + 1/8 = 2.625
Binääriluku 101.01 = 4 + 0 + 1 + 0 + 1/4 = 5.25
Binääriluku 1010.1 = 8 + 2 + 1/2 = 10.5
Binääriluku 0.111111 on desimaalilukuna 0 + 1/2 + 1/4 + 1/8 + 1/16 + 1/32 + 1/64 = 63/64 = 0.984375
Johtuen rajallisesta määrästä bittejä, pääsemme binäärisen desimaaliluvun esityksessä vain tiettyyn tarkkuuteen asti. Esimerkissä yllä pienin luku, joka voidaan valitulla bittimäärällä esittää oli joko 1/8 tai 1/64. Ts. pienin esitettävä arvo on LSB:tä vastaavan bitin arvo. Tästä syystä voimme binääriluvuilla esittää vain arvioita desimaaliluvuista.
Esimerkki.
Oletetaan 8-bittinen luku, josta on kokonaislukuosa 4 bittiä ja desimaaliosa myös 4 bittiä. 
Tällöin pienin luku, minkä voimme esittää on 00000001 = 2^-4 = 1/16 = 0.0625
Mutta.. miten esität binääriluvuilla desimaaliluvun, jota ei voi esittää 2:n kokonaislukupotensseilla (2^-n) valitussa tarkkuudessa.. esimerkiksi 1/3? No näissä tapauksissa desimaaliluku on yhtä päättymätön kuin peruskoulun matematiikassakin eli bittiesitykseen tulee toistoa, jolloin 1/3 = 0.01010101010101...
Jos desimaalipisteen paikka on määritelty, eli desimaaleja on aina sovittu määrä, puhutaan fixed-point-aritmetiikasta (suom. kiinteän pilkun aritmetiikka). Sitten taas floating point (liukuva pilkku) -esitys tarkoittaa sitä, että desimaalipisteen paikka "liukuu" tarpeen mukaan bittien välillä. Mutta, edelleen johtuen rajoitetusta bittimäärästä, voimme esittää vain arvion desimaaliluvusta.

Binääriluvun pyöristys

Samoin kuin kymmenjärjestelmän desimaalilukuja, myös binäärilukuja voidaan pyöristää. Syy miksi asia esitetään tässä, johtuu siitä että liukulukumuunnokset tekevät aika karkeita pyöristyksiä...
Tarkastellaan asiaa esimerkin kautta. Pyöristetään binääriluku lähimpään 1/4:n. Nyt pyöristystarkkuus mihin päästään on kaksi bittiä desimaaliosassa .xx (2^-2 = 1/4). Nyt pidetään binäärilukua 100 puolivälinä, jonka mukaan pyöristys ylös- tai alaspäin tehdään.
Pyöristyksessä lähdetään purkamaan lukua pyöristystarkkuutta edeltävistä biteistä:
Esimerkkejä. Pyöristys 1/4 tarkkuuteen, eli .xx
10.00011 // nyt kaksi viimeistä bittiä ovat 11 ja edellä 0, joten pyöristyy alaspäin, eli 10.00 (=2)
10.00110 // pyöristyy ylöspäin, eli 10.01 (=2 1/4)
10.11100 // pyöristyy ylöspäin, eli 11.00 (=3)
10.10100 // pyöristyy alaspäin, eli 10.10 (=2 1/2)

IEEE 754 liukulukustandardi

Yleinen liukulukujen esitys tietokoneen muistissa perustuu IEEE 754-standardiin, jonka esityksen käymme läpi pääpiirteissään seuraavassa. Standardissa määritellään liukulukuja kahta tyyppiä: yksinkertaisen ja kaksinkertaisen tarkkuuden liukuluvut.
Liukuluvun esityksessä siihen kuuluu kolme osaa:
"Liukulukujen esitystapa"
Liukukujen kaksi tyyppiä float (yksinkertaisen tarkkuuden, single precision, 32 bittiä) ja double (kaksinkertaisen tarkkuuden, double precision, 64 bittiä esitetään seuraavasti.
"Liukulukujen esitystapa"
Esimerkki. Muunnetaan desimaaliluku 12345.0 float-tyypin liukuluvuksi.
Luku 12345.0 on binäärilukuna 11000000111001 * 2^0

1. Etsitään M siirtämällä desimaalipistettä vasemmalle:
   (Pilkkua siirtäessä desimaaliluvun pitää pysyä samana!)
   11000000111001  * 2^0 = 12345.0
   1100000011100.1 * 2^1 = 12345.0
   110000001110.01 * 2^2 = 12345.0
   ...
   1.1000000111001 * 2^13 -> E=13
2. Lasketaan murto-osa M:n avulla. Pudotetaan luvun edestä kokonaisosa pois ja
   saadaan 1000000111001,
   johon lisätään 10 0-bittiä, jotta sen pituus on halutut 23 bittiä,
   -> murto-osa frac = 10000001110010000000000
3. Lasketaan exponentti: Kun E=13 ja bias=127, eli exponent = E + bias = 13 + 127 = 140 eli 10001100
4. Lopuksi etumerkki s=0, koska kyseessä on positiivinen luku.
Ylläolevan esimerkin tulos on siis:
"Liukulukujen esitystapa"
Yllämainittu liukuluvun esitys on yleinen, esimerkkinä allaoleva pieni ja söötti (jap. kawaii) esitys 8:lla bitillä. Tässä bias = 7.
"Kawaii"

Erikoistapauksia

Koska IEEE 754-esityksellä ei voi esittää kaikkia lukuja, esimerkiksi nollaa (kokeile itse..), niin joudutaan määrittelemään muutama erikoistapaus.

Liukulukujen tarkkuudesta

Aiemmin todettiin, että liukuluku on aina arvio desimaaliluvusta ja lisäksi siinä on pyöristysvirhettä (engl. rounding error). Tarkastellaanpa asiaa ylläolevan 8-bittisen liukuluvun esityksen kautta, koska pienellä lukualueella asiaa on helpompi visualisoida.
Kuvassa alla lukualue, kun exponentti on 4 bittiä ja murto-osa 3 bittiä. Nähdään että lukualue on tiivis lähellä nollaa, mutta harvenee lukujen suurentuessa. Alemmassa kuvassa tarkemmin lukualue lähellä nollaa.
"4-3"
-> Näinollen tästä esityksestä aiheutuva pyöristysvirhe on iso.
Muutetaan liukulukuesitystä niin, että exponentissa onkin nyt 3 bittiä ja murto-osassa 4 bittiä (bias on nyt 3) ja katsotaan mitä lukualueelle tapahtuu. Havaitaan että lukualue on kapeampi ja alue on tiiviimpi lähellä nollaa.
"3-4"
-> Muutoksen seurauksena pyöristysvirhe pienenee lukualueen sisällä.
Voidaan siis yleistää, että liukuluvun lukualuetta voidaan kasvattaa lisäämällä bittejä exponenttiin ja liukuluvun tarkkuutta (erotuskykyä) kasvattaa lisäämällä bittejä murto-osaan. Mutta aina pitää huomioida aiheutuva pyöristysvirhe.
Hox! Asia voi tuntua vähäpätöiseltä, koska standardoidut float:n ja double:n lukualueet ovat varsin isoja ja tarkkoja, mutta ei ole ensimmäinen kerta kun tieteellisessä laskennassa tarkkuus ei riittäisi tai pyöristysvirheitä ei huomioitaisi..

Lopuksi

Nykyisin löytyy jo 32- ja 64-bittisiä isompia liukulukujen esitystapoja.
Liukuluvun esitys on käyty yksityiskohtaisesti läpi oppikirjassa. Kurssilla riittää, että osaamme muuntaa liukulukuja esitysmuodosta toiseen.
?
Abstraktiolla tarkoitetaan sitä kun raa'an konekielen käskyt "piilotetaan" korkeamman tason ohjelmointikielen käskyjen alle. Abstraktiotasosta riippuu miten laajaa tämä piilotus on - mitä korkeampi taso, sitä vaikeampi on suoraan sanoa miten monimutkaiseksi koodirakennelma muuttuu kun se kääntyy konekielelle. Esim. Pythonin abstraktiotaso on huomattavasti korkeampi kuin C:n (itse asiassa Python on tehty C:llä...).
Alias on esikääntäjävaiheessa käsiteltävä korvaus, jolla tietty merkkijono koodissa korvataan toisella. Toiminta vastaa siis tekstieditorin replace-toimintoa. Aliaksia määritellään #define-direktiivillä. Esim #define PI 3.1416
Muuttujan alustamisella tarkoitetaan sitä, kun sille asetetaan koodissa jokin alkuarvo. Hyvin yleinen esimerkki tästä on lukumuuttujien alustaminen nollaan. Alustus voidaan tehdä muuttujan esittelyn yhteydessä: int laskuri = 0; tai erikseen. Jos muuttujia ei alusteta, niiden sisältönä on mitä ikinä muistipaikkaan on aiemmin jäänyt.
Pythonin käyttämää tapaa käsitellä arvojen tyyppiä kutsutaan dynaamiseksi tyypitykseksi eli ankkatyypitykseksi. Nimitys perehtyy lauselmaan "Jos se ui kuin ankka, kävelee kuin ankka ja ääntelee kuin ankka, se on ankka." Toisin sanoen arvon kelvollisuus määritellään sen ominaisuuksien perusteella. Tämä eroaa staattisesta tyypityksestä, jossa arvon kelvollisuus määritellään sen tyypin perusteella.
Argumentti on funktiokutsussa käytettävä arvo, joka välitetään kutsuttavalle funktiolle. Funktion sisällä argumentit sijoitetaan parametreiksi kutsuttuihin muuttujiin. Esimerkiksi printf("%c", merkki); -lauseessa argumentteja ovat "%c"-tulostusmäärittely sekä merkki-muuttujan sisältö.
Alkeiskurssilla arvo-termiä käytettiin kaikista ohjelman käsittelemistä arvoista, oli kyse sitten muuttujista, lauseiden tuloksista tai mistä tahansa. Arvo on siis käytännössä tietokoneen muistissa olevaa dataa, johon muuttujat voivat viitata. C:ssä muuttujan ja sen arvon suhde on Pythonia tiiviimpi, koska muuttuja vastaa suoraan sitä muistialuetta johon arvo on talletettu.
Asetuslippuja käytetään kun suoritetaan ohjelmia komentoriviltä. Ne ohjaavat ohjelman toimintaa. Asetuslippu kirjoitetaan yleensä joko yhdellä viivalla ja sitä seuraavalla kirjaimella (esim. -o) tai kahdella viivalla ja kokonaisella sanalla (tai sanoilla, sanojen välissä viiva) (esim. --system. Jotkut liput ovat ns. boolean lippuja eli ne ovat vain päällä tai pois, toisille annetaan lisäksi parametri. Parametri on tyypillisesti lipun perässä joko välilyönnillä tai =-merkillä erotettuna (esim. -o hemuli.exe).
Avainsanat ovat ohjelmointikielessä kielen käyttöön valittuja sanoja, joilla on erityinen merkitys. Hyvät tekstieditorit tyypillisesti merkitsevät avainsanat muista nimistä eroavalla tavalla (esim. lihavointi). Avainsanat ovat yleensä suojattuja, eli samannimistä muuttujaa ei voi luoda. Yleisiä avainsanoja ovat esim ohjausrakenteisiin kuuluvat if ja else. Avainsanat ovat siis osa ohjelmointikielen kielioppia.
Binääriluku on luku, joka muodostuu biteistä, eli arvoista 0 ja 1. Tämä tekee siitä 2-kantaisen lukujärjestelmän. Binäärilukujen tulkintaa voit tutkailla lukujärjestelmiä käsittelevässä lisämateriaalissa.
Binääritiedosto on tiedosto, joka sisältää konekielisiä käskyjä binäärinä. Ne on tarkoitettu ainoastaan tietokoneen luettavaksi, ja tyypillisesti jos niitä avaa vahingossa esim. tekstieditorilla tuloksena on merkkisotkua editorin yrittäessä tulkita tiedoston sisältämiä bittejä merkeiksi. Useimmat tekstieditorit myös varoittavat asiasta erikseen.
Bitti on pienin informaation yksikkö, joka voi saada arvot 0 ja 1. Tietokoneen sisällä kaikki tapahtuu bitteinä. Tyypillisesti muistissa on bittijonoja, jotka muodostuvat useista biteistä.
Bittinegaatio on operaatio jossa bittijonon bitit käännetään siten, että nollat muutetaan ykkösiksi ja ykköset nolliksi. Operaattori on ~
Bittioperaatiot ovat oma operaatioluokkansa joiden yhteispiirre on se, että niissä käsitellään bittijonojen yksittäisiä bittejä. Kääntöoperaatiossa yhden jonon bitit käännetään nollista ykkösiksi ja toisin päin. Osa operaatioista suoritetaan kahden bittijonon välillä siten, että jonoissa samassa kohdassa olevat bitit vaikuttavat toisiinsa. Näitä ovat and (&), or (|) sekä xor (^). Lopuksi on vielä siirto-operaatiot (<< ja >>), joissa yhden bittijonon bittejä siirretään oikealle tai vasemmalle N askelta.
C:n funktiot ovat Pythonin funktioita staattisempia. Funktiolla voi olla vain yksi paluuarvo, jonka tyyppi määritellään funktion määrittelyssä. Samoin määritellään kaikkien parametrien tyypit. Funktiota kutsuttaessa argumenttien arvot sijoitetaan parametreille varattuihin muistipaikkoihin, joten funktio käsittelee eri arvoja kuin sitä kutsuva koodi.
Ulkopuolinen koodi sijaitsee C:ssä kirjastoissa (library), josta niitä voidaan ottaa käyttöön #include-direktiivillä. C:ssä on mukana sisäiset kirjastot sekä lisäksi voidaan käyttää ulkoisia kirjastoja - ne täytyy kuitenkin koodissa käyttöönoton lisäksi kertoa kääntäjälle käännösvaiheessa. Tyypillisesti kirjasto koostuu c-kooditiedostosta sekä otsikkotiedostosta (.h), joka kertoo mitä funktioita kirjastossa on.
C:n muuttujat ovat staattisesti tyypitettyjä, eli niiden tyyppi kiinnitetään esittelyn yhteydessä. Lisäksi C:ssä muuttuja on sidottu sille varattuun muistialueeseeen. Muuttuja ei voi myöskään muuttaa tyyppiään jälkikäteen.
Ehtolause on yksittäisen ehdon määrittelevä rivi koodissa, jota seuraa aaltosulkeilla merkitty koodilohko, joka määrittää miten ehdon toteutuessa tulee toimia. Varsinaisia ehtolauseita ovat if-lauseet, joka voi esiintyä myös else-avainsanan kanssa else if. Toisiinsa liitetyt ehtolauseet muodostavat ehtorakenteita.
Ehtorakenne on yhdestä tai useammasta toisiinsa liitetystä ehtolauseesta muodostuva rakenne, joka haarauttaa ohjelman suoritusta. Useimmissa ehtorakenteissa on vähintään kaksi haaraa: if ja else. Näiden välissä voi olla myös N kpl else if-lauseilla aloitettuja haaroja. On myös mahdollista, että ehtorakenteessa on pelkkä if-lause. Ehtorakenteessa kussakin haarassa on suoritettavaa koodia, joka kuvaa miten ohjelman tulee ehdon määrittelemässä tilanteessa toimia. Jokainen haara on oma koodilohkonsa, joka merkitään siis aaltosulkeilla.
Esikääntäjä on värkki joka käy koodin läpi suorittaen kaikki esikääntäjädirektiivit ennen varsinaista kääntämistä. Näihin kuuluvat mm. include-lauseet joilla koodiin lisätään siihen liitetyt kirjastot sekä define-lauseet joilla voidaan määritellä vakioita ja makroja.
Esikääntäjädirektiivit ovat ohjeita, jotka on tarkoitettu esikääntäjälle. Ne puretaan koodista pois ennen varsinaista kääntämistä. Esikääntäjädirektiivit alkavat #-merkillä. Yleisin näistä on include, joka vastaa Pythonin importia. Toinen yleinen on define, jolla tällä kurssilla määritetään vakioita.
Muuttujan esittely tarkoittaa sitä kun muuttujan olemassaolosta kerrotaan ensimmäistä kertaa. Tällöin määritetään muuttujan tyyppi ja nimi, esim. int luku;. Kun muuttuja esitellään, sille varataan paikka muistista, mutta muistiin ei vielä kirjoiteta mitään - muuttujassa on siis muistiin jäänyt arvo. Tästä syystä muuttujat on usein myös hyvä alustaa esittelyn yhteydessä.
Etumerkitön kokonaislukumuuttuja on kokonaisluku jonka kaikki arvot ovat positiivisia. Koska etumerkille ei tarvitse varata bittiä, etumerkittömällä kokonaisluvulla voidaan esittää itseisarvoltaan 2x suurempi luku kuin etumerkillisellä. Etumerkitön kokonaisluku määritetään lisäämällä kokonaislukumuuttujan esittelyyn unsigned-avainsana: unsigned int laskuri;
Heksadesimaaliluvut ovat 16-kantaisia lukuja, joita käytetään erityisesti muistiosoitteiden sekä muistin bittisisällön esittämiseen. Heksadesimaaliluvun edessä on tyypillisesti 0x, ja numeroiden lisäksi käytössä ovat kirjaimet A-F jotka vastaavat numeroja 10-15. Heksadesimaalilukuja käytetään koska yksi numero vastaa aina tasan neljää bittiä, joten muunnokset binääriin ja takaisin ovat helppoja.
Iteroitava objekti on sellainen, jonka voi antaa silmukalle läpikäytäväksi (Pythonissa for-silmukalle). Tähän joukkoon kuuluvat yleisimpinä listat, merkkijonot ja generaattorit. C:ssä ei ole silmukkaa, joka vastaisi Pythonin for-silmukan toimintaa, joten taulukoiden yms. läpikäynti tehdään indeksiä kasvattavilla silmukoilla.
Kirjasto on tyypillisesti yhteen rajattuun tarkoitukseen tehty työkalupakki, joka yleensä sisältää nipun funktioita. Kirjastot otetaan käyttöön include-esikääntäjädirektiivillä. Jos kirjasto ei kuulu C:n sisäänrakennettuihin, sen käyttöönotto täytyy myös kertoa kääntäjälle.
Kokonaisluvut itsessään ovat tuttuja varmaan tässä vaiheessa, mutta C:ssä niitä on monenlaisia. Kokonaisluvuille nimittäin määritellään kuinka monella bitillä ne esitetään sekä se, onko luvussa etumerkkiä. Koska tietyllä bittimäärällä voidaan esittää vain rajallinen määrä eri lukuja (2 ^ n), etumerkillisissä luvuissa maksimiarvo on yhden bitin verran pienempi (2 ^ (n - 1)). Pienin kokonaisluku on 8-bittinen.
Kommentti on kooditiedostossa olevaa tekstiä, joka ohitetaan kun koodia suoritetaan. Kussakin kielessä on oma tapansa sille miten rivi merkitään kommentiksi. Pythonissa se on #-merkki, C:ssä //. Lisäksi C:ssä voi merkitä useita rivejä kommenteiksi kerralla - kommentti aloitetaan tällöin /*-merkkiparilla ja päätetään */-merkkiparilla. Kaikki näiden välissä tulkitaan kommentiksi.
Komplementti on negatiivisten lukujen esitystapa, jossa luvun etumerkki muutetaan kääntämällä sen kaikki bitit. Kahden komplementissa, jota tällä kurssilla käytetään, käännön jälkeen lisätään tulokseen 1. Tarkempaa tietoa löydät lukujärjestelmiä käsittelevästä oheismateriaalista.
Konekieli muodostuu käskyistä jotka laitteen prosessori ymmärtää. Konekieltä kutsutaan yleensä Assemblyksi ja se on alin taso jolla ihmisen on mielekästä antaa ohjeita tietokoneelle. Konekieltä käytetään tällä kurssilla loppuossa, joten siihen ei johdatuskurssia suorittavien tarvitse perehtyä.
Koodilohko on joukko koodirivejä, jotka kuuluvat jollain tavalla yhteen eli ne ovat samassa kontekstissa. Esimerkiksi ehtorakenteessa kunkin ehdon alla on oma koodilohkonsa. Samoin funktion sisältö on oma koodilohkonsa. Koodilohkot voivat sisältää muita koodilohkoja. Pythonissa koodilohkot erotetaan toisistaan sisennyksellä; C:ssä koodilohkon alku ja loppu merkitään aaltosulkeilla {}
Käskykanta määrittää mitä käskyjä laitteen prosessori osaa. Nämä käskyt muodostavat prosessoriarkkitehtuurin konekielen.
Kääntäjä on ohjelma, joka kääntää C-kielisen koodin konekieliseksi binääritiedostoksi, jonka tietokoneen prosessori osaa suorittaa. Kääntäjä myös tutkii koodin ja ilmoittaa siinä olevista virheistä sekä antaa varoituksia potentiaalisista ongelmista koodissa. Kääntäjän toimintaa voi ohjata lukuisilla asetuslipuilla.
Lause on ohjelmointikielessä nimitys yksittäiselle suoritettavalle asialle, joka on yleensä yksi koodirivi.
Liukuluku (engl. floating point number, lyh. float) on tietokoneiden käyttämä desimaaliluvun approksimaatio. Tietokoneet eivät arkkitehtuurinsa vuoksi pysty käsittelemään oikeita desimaalilukuja, joten niiden tilalla käytetään liukulukuja. Liukuluvut saattavat aiheuttaa pyöristysvirheitä - tämä on hyvä pitää mielessä niitä käyttäessä. C:ssä liukulukuja on yleensä kahta eri tarkkuutta: float ja double, joista jälkimmäisessä on nimensä mukaisesti 2 kertaa enemmän bittejä.
Looginen operaatio viittaa Boolen algebran operaatiohin, joissa käsitellään totuusarvoja. Tyypillisiä loogisia operaatioita ovat ehtolauseista tutut and, not ja or. C:ssä tunnetaan myös bittikohtaiset loogiset operaatiot jotka toimivat samalla logiikalla, mutta vaikuttavat jokaiseen bittiin erikseen.
Makro on alias, jolla määritetään tietty avainsana korvattavaksi koodinpätkällä. Hyvin käytettynä tällä voidaan joissain tilanteissa saada aikaan parempaa luettavuutta, mutta helposti käy toisin. Makroilla ei kannata tämän kurssin puitteissa leikkiä, kunhan tietää mistä on kyse jos niihin joskus törmää.
Merkki on nimensä mukaisesti yksi merkki. Merkki voidaan tulkita ASCII-merkkinä mutta sitä voidaan käyttää koodissa myös kokonaislukuna, koska se on pienin esitettävissä oleva kokonaisluku. Merkin koko on 1 tavu. Merkki merkitään yksinkertaisilla lainausmerkeillä, esim. 'c'.
Pythonissa kaikki teksti käsiteltiin merkkijonoissa, eikä siinä esim. ollut erillistä muuttujatyyppiä yksittäiselle merkille. C:ssä puolestaan ei ole varsinaista merkkijonomuuttujatyyppiä lainkaan - on ainoastaan merkeistä koostuvia taulukoita, joille on oma määrittelytapansa. Näillä taulukoilla on ennaltamäärätty pituus. "Merkkijonon" voi määritellä C:ssä char elain[5] = "aasi"; jossa numero kertoo merkkitaulukon koon ja on merkkien määrä + 1, koska lopetusmerkki '\0' lisätään tässä alustustavassa automaattisesti loppuun.
Metodi on funktio, joka on osa objektia eli objektin ominaisuus, jolla objekti usein muuttaa omaa tilaansa. Metodia kutsuttaessa käsiteltävä objekti tulee kutsun eteen: arvosanat.sort().
Kaikki suoritettavien ohjelmien käsittelemä data on tietokoneen muistissa ajon aikana. Tietokoneen muisti muodostuu muistipaikoista, joilla on muistiosoite sekä sisältö. Kaikki muistipaikat ovat saman kokoisia - jos talletettava tietomäärä on tätä suurempi, varataan useampi (peräkkäinen) muistipaikka.
Pythonissa objektit eroteltiin muuntuviin ja muuntumattomiin. Muuntumaton arvo oli sellainen, jonka sisältö ei voi muuttua - kaikki operaatiot jotka näennäisesti muuttavat arvoa tosiasiassa luovat siitä uuden kopion, joka yleensä sijaitsee uudessa muistipaikassa. Esimerkiksi merkkijonot olivat tyypillinen muuntumaton tyyppi Pythonissa. C:ssä tätä erottelua ei tarvita, koska muuttujien ja muistipaikkojen suhde on tiiviimpi - sama muuttuja osoittaa koko ohjelman suorituksen ajan tiettyyn muistipaikkaan.
Objekti, joskus myös olio, on Pythonissa yleistä terminologiaa. Kutsuimme objekteja pääasiassa arvoiksi alkeiskurssilla, mutta Pythonissa kaikkea voi käsitellä objekteina - tämä tarkoittaa, että mihin tahansa voidaan viitata muuttujilla (esim. funktion voi sijoittaa muuttujaan). Objekti-termiä käytetään tyypillisesti oliopohjaisissa kielissä (kuten Python). C ei kuulu tähän joukkoon.
Ohjausrakenne on yleisnimitys koodirakenteille, jotka hallitsevat jollain tavalla ohjelman suorituksen kulkua. Näihin rakenteisiin lukeutuvat ehtorakenteet sekä toistorakenteet. Myös poikkeusten käsittely voidaan lukea tähän joukkoon.
Koodin optimointi tarkoittaa sitä, että sen suorituskykyä parannetaan tyypillisesti joko vähentämällä aikaa, joka sen suoritukseen kuluu tai vähentämällä muistin käyttöä. Optimoinnista on hyvin tärkeää ymmärtää, että sitä ei koskaan kannata tehdä jos ei ole pakko - optimointia siis tehdään vasta kun koodi oikeasti toimii hitaasti tai kuluttaa liikaa muistia. Optimointia ei myöskään kannata tehdä sokkona - koodista tulee ensin tunnistaa mitkä ovat sen pullonkaulat eli ne osat jotka tuhlaavat eniten resursseja.
Osoitin (pointer) on C:ssä erityinen muuttujatyyppi. Osoitinmuuttuja sisältää muistiosoitteen, josta varsinainen arvo löytyy - ne toimivat siis tietyllä tapaa kuin Pythonin muuttujat. Muuttuja määritellään osoittimeksi lisäämällä tyypin perään * esittelyrivillä, esim. int* luku_os luo luku_os-muuttujan, joka on osoitin int-tyyppiseen arvoon. Osoittimen osoittaman muistialueen sisällön voi hakea käyttöön merkinnällä *luku_os ja vastaavasti jonkin muuttujan muistipaikan osoitteen saa merkinnällä &luku. Osoittimille on omistettu kokonainen materiaali (4).
Otsikkotiedosto on .h-päätteellä merkitty tiedosto, joka sisältää otsikkotiedot (funktioiden prototyypit, tietotyyppien määrittelyt yms) saman nimiselle .c-tiedostolle.
Otsikkotiedot ovat C-koodissa ja erityisesti kirjastojen yhteydessä eräänlainen muotti koodista. Tyypillisen otsikkotieto on funktion prototyyppi, jolla kerrotaan mitä funktio palauttaa ja mitä argumentteja sille annetaan. Rivi on sama kuin funktion varsinainen määrittely. Muita otsikkotietoja ovat mm. tietotyyppien ja vakioiden määrittelyt. Otsikkotiedot voivat sijaita kooditiedoston alussa, mutta erityisesti kirjastojen osalta ne ovat yleensä erillisessä .h-tiedostossa.
Paikanpidin on merkkijonojen muotoilussa käytetty termi, jolla esitetään kohta merkkijonossa, johon sijoitetaan esim. muuttujan arvo ohjelman suorituksen aikana. Pythonissa format-metodia käytettäessä paikanpitimiä merkittiin aaltosulkeilla (esim. {:.2f}). C:ssä käytetään %-merkkiä jota seuraa paikanpitimen määrittely, josta erityisen tärkeä osa on muuttujatyypin määrittely. Esimerkiksi "%c" ottaa vastaan char-tyyppisen muuttujan.
Paluuarvo on nimitys arvolle tai arvoille jotka funktio palauttaa kun sen suoritus päättyy. C:ssä funktioilla voi olla vain yksi paluuarvo, Pythonissa niitä voi olla useita. Koodia lukiessa paluuarvoa voi käsitellä päässään siten, että funktiokutsun paikalle sijoitetaan funktion paluuarvo sen jälkeen kun funktio on suoritettu.
Parametri on funktion määrittelyssä nimetty muuttuja. Parametreihin sijoitetaan funktion saamat argumentit. Parametri on siis nimitys jota käytetään kun puhutaan arvojen siirtymisestä funktion näkökulmasta. Tätä erottelua ei aina tehdä, vaan joskus puhutaan pelkästään argumenteista.
Poikkeus on ohjelmointikielessä määritelty virhetilanne. Poikkeuksella on tyyppi (esim. TypeError), jota voi käyttää poikkeuksen käsittelyssä ohjelman sisällä sekä myös apuna virhetilanteen ratkaisussa. Tyypillisesti poikkeukseen liitetään myös viesti, joka kertoo mistä ongelmassa on kyse.
Prototyyppi määrittelee funktion paluuarvon tyypin, nimen sekä kaikki argumentit ennen funktion varsinaista esittelyä. Kunkin funktion prototyypin tulisi löytyä joko kooditiedoston alusta tai erillisestä otsikkotiedostosta (.h). Prototyypin määrittely on kopio funktion varsinaisesti määrittelyrivistä.
Pythonin for-silmukka vastaa toiminnaltaan useimmissa kielissä olevaa foreach-silmukkaa. Se käy läpi sekvenssin -esim. listan - jäsen kerrallaan, ottaen kulloinkin käsittelyssä olevan jäsenen talteen silmukkamuuttujaan. Silmukka loppuu, kun iteroitava sekvenssi päättyy.
Merkkijonojen format-metodi on Pythonissa tehokas tapa sisällyttää muuttujien arvoja tulostettavaan tai tallennettavaan tekstiin. Merkkijonoon määritetään paikanpitimiä (esim: {:.2f}) joihin sijoitetaan format-metodin argumentit.
Python-funktiolla voi olla valinnaisia parametreja, joilla on asetettu oletusarvo. Argumenttien arvot siirtyvät parametreihin viittauksen kautta, joten funktion sisällä käsitellyt arvot ovat samoja kuin sen ulkopuolella käsitellyt - niillä on vain eri nimet. Python-funktiolla voi olla useita paluuarvoja.
Pythonin import-lauseella otettiin käyttöön moduuleja/kirjastoja - joko Pythonin mukana tulevia, muualta ladattuja tai itsekirjoitettuja. Pythonin import-lauseelle erityistä on, että oletuksena tuotuihin funktioihin ym. päästään käsiksi moduulin nimen kautta (esim. math.sin. C:ssä importia vastaa include, ja se tuo nimet suoraan ohjelman omaan nimiavaruuteen.
Interaktiivinen Python-tulkki tai Python-konsoli on ohjelma, johon voi kirjoittaa Python-koodirivejä. Nimitys "interaktiivinen" tulee siitä, että koodirivi suoritetaan välittömästi sen syöttämisen jälkeen, ja ohjelma näyttää käyttäjälle koodirivin tuottaman paluuarvon (esim. matemaattisen operaation tuloksen).
Pythonin lista osoittautui Ohjelmoinnin alkeissa hyvin tehokkaaksi työkaluksi. Se on järjestetty kokoelma arvoja. Listan monikäyttöisyys johtuu siitä, että sen koko on dynaaminen (eli suorituksen aikana muuttuva) minkä lisäksi se voi sisältää mitä tahansa arvoja - myös sekaisin. Samassa listassa voi siis olla useita erityyppisiä arvoja. Listat voivat tietenkin sisältää myös listoja tai muita tietorakenteita jne.
Kuten Ohjelmoinnin alkeissa opittiin, Python-muuttuja on viittaus arvoon, eli yhteys muuttujan nimen ja tietokoneen muistissa olevan arvon välillä. Python-muuttujilla ei ole tyyppiä, mutta arvoilla on. Arvon kelpaavuus kokeillaan koodia suorittaessa tilannekohtaisesti. Tässä suhteessa ne siis eroavat toiminnaltaan C:n muuttujista, ja niiden toiminta muistuttaa usein enemmän C:n osoittimia.
Pythonissa pääohjelma on se osa koodia, joka suoritetaan kun ohjelma käynnistetään. Pääohjelma sijaitsee tyypillisesti koodin lopussa, ja useimmiten if __name__ == "__main__":-lauseen alla. C:ssä ei ole varsinaista pääohjelmaa, siinä suoritus aloitetaan oletuksena main-nimisestä funktiosta.
Python-tulkki on ohjelma, joka muuttaa Python-koodin tietokoneelle annettaviksi ohjeiksi. Se vastaa niin kooditiedostojen kuin myös interaktiiviseen Python-tulkkiin kirjoitettujen komentojen suorittamisesta. Tällä kurssilla sanalla tulkki viitataan kuitenkin useimmiten nimenomaan interaktiiviseen Python-tulkkiin.
Pääfunktio on C:ssä ohjelman aloituspiste ja se korvaa Pythonista tutun pääohjelman. Oletuksena pääfunktion nimi on main ja se määritellään yksinkertaisimmillaan int main().
Resurssi viittaa laitteiston käytössä olevaan prosessoritehoon, muistiin, oheislaitteet jne. Se käsittää siis kaikki rajoitteet sille millaista ohjelmakoodia voidaan ajaa sekä sen, mitä ohjelmakoodilla voidaan tehdä. Tietokoneilla resurssit ovat ohjelmointiopiskelijan näkökulmasta aika rajattomat, mutta sulautetuilla järjestelmillä rajat voivat hyvinkin tulla vastaan.
C käyttää staattista tyypitystä. Se tarkoittaa sitä, että muuttujien tyypit määritellään kun ne luodaan ja muuttujaan ei voida sijoittaa erityyppistä arvoa. Lisäksi arvon kelvollisuus määritellään koodia suorittaessa sen tyypin perusteella (tai oikeastaan tämä tehdään jo käännösvaiheessa). Pythonissa taas käytetään dynaamista eli ankkatyypistystä.
Syntaksi (engl. syntax) on koodin kielioppi. Esimerkiksi Pythonin syntaksi määrittää, millainen teksti on tulkittavissa Python-koodiksi. Jos teksti ei noudata koodin syntaksia, sitä ei voida suorittaa tai C:n tapauksessa kääntää. Syntaksi antaa myös koodaajalle tietoa siitä, missä muodossa halutunlainen ohje tulee antaa.
Taulukko (array) on ohjelmointikielissä yleinen tietorakenne, joka sisältää useita (yleensä) samantyyppisiä arvoja. C:n taulukot ovat staattisia - niiden koko tulee määritellä taulukon esittelyn yhteydessä - ja taulukossa voi olla vain samantyyppisiä muuttujia (myös tyyppi määritellään esittelyssä).
Yhden muistipaikan koko on yksi tavu (byte) - tyypillisesti 8 bittiä. Tavu on siis pienin yksikkö joka voidaan osoittaa tietokoneen muistista. Muuttujien tyyppien varaamat muistialueet lasketaan tavuissa.
Terminaali, komentokehote ja komentorivi ovat eri nimiä käyttöjärjestelmän tekstipohjaiselle käyttöikkunalle. Windowsissa komentoriville pääsee kun kirjoittaa suorita...-ikkunaan cmd. Komentorivillä annetaan tekstikomentoja käyttöjärjestelmälle. Tällä kurssilla pääasiassa siirrytään cd-komennolla hakemistosta toiseen ja käytetään kääntäjää kooditiedostojen kääntämiseen sekä suoritetaan käännettyjä koodeja.
Tietorakenne on yleisnimitys kokoelmille jotka sisältävät useita arvoja. Pythonissa näitä olivat mm. lista, monikko ja sanakirja. C:ssä taas yleisimmät tietorakenteet ovat taulukot (array) ja tietueet (struct).
Tietokoneen muistissa oleva data on pelkästään bittejä, mutta muuttujilla on tyyppi. Tyyppi kertoo millä tavalla muistissa olevat bitit pitää tulkita. Se kertoo myös kuinka suuresta määrästä bittejä muuttujan arvo muodostuu. Tyyppejä ovat esim int, float ja char.
Tyyppimuunnos on operaatio jossa muuttuja muutetaan toisentyyppiseksi. Alkeiskurssilla tätä tehtiin pääasiassa int- ja float-funktioilla. C:ssä tyyppimuunnos merkitään hieman toisin: liukuluku = (float) kokonaisluku. Huomioitavaa on myös, että operaation tulos voidaan tallentaa ainoastaan muuttujaan jonka tyyppi on kohdetyyppiä (esimerkissä float). Pythonissa nähdyt luku = int(luku)-temput eivät siis onnistu.
Varoitusviesti on ilmoitus siitä, että ohjelman suorituksessa tai - erityisesti tällä kurssilla - sen kääntämisessä kohdattiin jotain epäilyttävää, joka saattaa johtaa virhetilanteisiin, mutta ei suoraan estä ohjelman käyttöä. Yleisesti ottaen kaikki varoitukset on syytä korjata ohjelman toiminnan vakauttamiseksi.
Virheviestiksi kutsutaan tietokoneen antamaa virheilmoitusta joko koodia kääntäessä tai ohjelmaa suorittaessa. Virheviesti tyypillisesti sisältää tietoa kohdatusta ongelmasta ja sen sijainnista.
C:ssä main-funktio on ohjelman suorituksen aloituspiste kun ohjelma käynnistetään. Ohjelman komentoriviargumentit tulevat main-funktiolle (mutta niitä ei ole pakko vastaanottaa), ja sen palautusarvon tyyppi on int. Lyhimmillään main-funktion voi siis määritellä: int main().
C:ssä yksi tulostustapa on printf-funktio, joka muistuttaa pääasiassa Pythonin print-funktiota. Sille annetaan tulostettava merkkijono, sekä lisäksi merkkijonoon sijoitettavat arvot mikäli on käytetty paikanpitimiä. Toisin kuin Pythonin print, printf ei automaattisesti lisää rivinvaihtoa, joten loppuun on yleensä syytä lisätä \n.
Silmukoista while pohjautuu toistoon ehdon tarkastelun kautta - silmukan sisällä olevaa koodilohkoa suoritetaan niin kauan kuin silmukalle annettu ehto on tosi. Ehto määritetään samalla tavalla kuin ehtolauseissa, esim: while (summa < 21).