Termipankki
  1. A
    1. Abstraktio
    2. Alias
    3. Alustaminen
    4. Ankkatyypitys
    5. Argumentti
    6. Arvo
    7. Asetuslippu
    8. Avainsana
  2. B
    1. Binääriluku
    2. Binääritiedosto
    3. Bitti
    4. Bittinegaatio
    5. Bittioperaatio
  3. C
    1. C-funktio
    2. C-kirjasto
    3. C-muuttuja
  4. E
    1. Ehtolause
    2. Ehtorakenne
    3. Esikääntäjä
    4. Esikääntäjädirektiivi
    5. Esittely
    6. Etumerkitön
  5. H
    1. Heksadesimaali
  6. I
    1. Iteroitava
  7. K
    1. Kirjasto
    2. Kokonaisluku
    3. Kommentti
    4. Komplementti
    5. Konekieli
    6. Koodilohko
    7. Käskykanta
    8. Kääntäjä
  8. L
    1. Lause
    2. Liukuluku
    3. Looginen operaatio
  9. M
    1. Makro
    2. Merkki
    3. Merkkijono
    4. Metodi
    5. Muisti
    6. Muuntumaton
    7. main-funktio
  10. O
    1. Objekti
    2. Ohjausrakenne
    3. Optimointi
    4. Osoitin
    5. Otsikkotiedosto
    6. Otsikkotiedot
  11. P
    1. Paikanpidin
    2. Paluuarvo
    3. Parametri
    4. Poikkeus
    5. Prototyyppi
    6. Python-for
    7. Python-format
    8. Python-funktio
    9. Python-import
    10. Python-konsoli
    11. Python-lista
    12. Python-muuttuja
    13. Python-pääohjelma
    14. Python-tulkki
    15. Pääfunktio
    16. printf
  12. R
    1. Resurssi
  13. S
    1. Staattinen tyypitys
    2. Syntaksi
  14. T
    1. Taulukko
    2. Tavu
    3. Terminaali
    4. Tietorakenne
    5. Tyyppi
    6. Tyyppimuunnos
  15. V
    1. Varoitusviesti
    2. Virheviesti
  16. W
    1. while
Ratkaistu: / tehtävää

Lukujärjestelmät

Tässä apumateriaalissa esitellään kurssilla tarvittavien lukujärjestelmien perusteet, eli miten eri tavoilla luvut voidaan esittää. Kymmenkantaiset luvut ovat kaikille tuttuja peruskoulumatikasta, mutta muut kannat voivat olla tulleet vastaan vasta yliopistossa tai ei lainkaan. Esimerkit tässä materiaalissa on tehty Pythonilla, jotta niitä voi ajaa helposti
interaktiivisessa tulkissa
.
Osaamistavoitteet: Tämän materiaalin läpikäytyäsi ymmärrät mitä ovat binääri- ja heksadesimaaliluvut sekä osaat muuttaa lukuja kannasta toiseen. Lisäksi tiedät miksi nämä muut kannat ovat kurssilla tarpeellisia. Lisäksi osaat pyöritellä bittioperaatiota Python-tulkissa.

Valitse kantasi

Kuten todettua, ns. normaalit kokonaisluvut joilla on laskettu peruskoulusta lähtien ovat kymmenkantaisia. Olemme oppineet tulkitsemaan kymmenkantaisia lukuja nopealla vilkaisulla: osaamme nopeasti todeta, että 156 on sataviisikymmentäkuusi. Tämän luvun voi kuitenkin muodostaa myös systemaattisesti sen yksittäisistä numeroista käyttämällä kantalukua, joka on siis 10.
>>> 6 * 10 ** 0 + 5 * 10 ** 1 + 1 * 10 ** 2
156
Ylläoleva on matemaattinen kuvaus sille, että kymmenkantaisessa järjestelmässä oikeanpuolimmaisin kertoo ykköset, sitä seuraava kymmenet ja sitä seuraava sadat jne. Purkaminen oikealta vasemmalle on helpompaa, koska silloin voidaan asettaa eksponentti nollaan ja kasvattaa sitä yhdellä kun siirrytään eteenpäin. Lukua ei nyt siis ajatella kokonaisuutena, vaan yksittäisistä numeroista muodostuvana summana. Tällöin kunkin numeron kohdalla kerrotaan numero kantaluvulla, joka on korotettu potenssiin i, jossa i on numeron paikka luvussa (oikealta laskettuna, alkaen nollasta). Sama esitettynä Python-koodilla jos jollekin koodi kertoo enemmän kuin sanallinen selitys:
luku = "156"
summa = 0
for i, numero in enumerate(luku[::-1]):         # [::-1] = käydään läpi oikealta vasemmalle
    summa += int(numero) * 10 ** i              # kasvatetaan summaa
    
print(summa)                                    # tulostaa 156
Tässä koodissa esiintyvä numeroarvo 10 on siis kanta. Se kertoo myös mitkä ovat sallittuja numeroja luvussa: 0, 1, ..., 9. Eli sallittuja ovat toisinsanoen väli [0:kanta-1]. Tämä systemaattinen purkamistapa on tärkeä, koska ihmiset eivät ole hyviä lukemaan muihin kantoihin kuuluvia lukuja silmämääräisesti - ainakaan ilman harjoitusta! Kanta tarkoittaa myös sitä, että jos luvun numeroja siirretään (shift) vasemmalle, saadaan aikaan kertominen kantaluvulla - vastaavasti jos niitä siirretään oikealle saadaan aikaan jakaminen kantaluvulla. Tämä on helppo nähdä jos otetaan luku joka päättyy nollaan ja lisätään lisäksi etunollia:
>>> luku = "00310"
>>> int(luku)
310
>>> luku = "03100"          # siirretty kerran vasemmalle
>>> int(luku)
3100
>>> luku = "00031"          # siirretty kerran oikealle (alkuperäisestä)
>>> int(luku)
31

Binääriluvut

Binääriluvut
ovat keskeisiä kun käsitellään tietokoneita. Tämä johtuu siitä, että tietokone käsittelee pelkkiä
bittejä
- siis nollia ja ykkösiä. Sattumoisin binääriluku on nimitys kaksikantaisille luvuille - kantaluku on siis 2, ja täten edellisen perusteella sallitut numerot ovat 0 ja 1. Binääriluvun suuruus muodostuu samalla idealla kuin yllä esitetty kymmenkantaisen luvun purkaminen. Nyt vain kymppien tilalle tulee 2. Esimerkkilukuna olkoon vaikka 1011.
>>> 1 * 2 ** 0 + 1 * 2 ** 1 + 0 * 2 ** 2 + 1 * 2 ** 3
11
Periaatteessa nollalla kertomisen voi jättää pois, mutta kokonaisuuden ymmärtäisen kannalta on parempi nähdä jokaisen numeron purku. Koodilla tämän voisi purkaa ihan samalla periaatteella:
luku = "1011"
summa = 0
for i, numero in enumerate(luku[::-1]):         # [::-1] = käydään läpi oikealta vasemmalle
    summa += int(numero) * 2 ** i               # kasvatetaan summaa (huom. 10 vaihtunut 2:ksi!)
    
print(summa)                                    # tulostaa 11
Koska tietokoneen sisällä tyypillisesti puhutaan rajallisista bittimääristä, kukin luku myös esitetään tietyllä bittimäärällä. Tämä kertoo miten monta eri arvoa binääriluvulla voidaan esittää. Erillisten arvojen lukumäärä on yksinkertaisesti 2 ** n jossa n on bittien lukumäärä. Aina kun lisätään yksi bitti, esitettävien arvojen määrä kaksinkertaistuu. Huomattavaa on myös, että koska 0 on olemassa, suurin arvo joka voidaan esittää N-bittisillä binääriluvulla on 2 ** n - 1.
Binäärilukuja esittäessä tulee tietää bittien järjestys binääriluvussa. Ts. kun meillä on bittijono 11101, mitenpäin se luetaan?
Miten tulkitaan binääriluku 11101 kymmenjärjestelmän lukuna??
10111 -> 23
11101 -> 29
Kymmenjärjestelmää olemme tottuneet ymmärtämään niin, että ensimmäinen luku ilmaisee suurimman kantaluvun potenssin ja sen kertoimen. Esim. luvussa 156, numero ensimmäinen numero on 1*(10**2). Emmekä käsitä lukua niin, että suurin potenssi olisi oikeanpuolimmaisin luku, eli 6*(10**2).
Samoin tietokoneelle pitää kertoa kummin päin luku luetaan, eli bittijärjestys. Mikä bitti on pienin kakkosen potenssi eli vähiten merkitsevä bitti (engl. least significant bit, LSB)?? Ja vastaavasti suurin kakkosen potenssi eli eniten merkitsevä bitti (engl. most significant bit, MSB)??
No, päätämme asian kurssin osalta tässä ja nyt. Materiaalissa tästä eteenpäin MSB on vasemmanpuoleisin bitti, eli ymmärrämme binääriluvun samoin kuin kymmenjärjestelmän luvut.

On olemassa 10 ihmistyyppiä...

...ne jotka osaavat lukea binääriä ja ne jotka eivät. Ok, vanha vitsi. Selvitetään kuitenkin kumpaan ryhmään sinä kuulut! Tämä tehtävä kannattaa tehdä kynän ja paperin kanssa jolloin se jopa auttaa ymmärtämään binäärilukuja. Alla on muutamia binäärilukuja:
1101111
1011011010
0101010
010
Kirjoittele vastaavat luvut 10-kantaisina tekstilaatikkoon alekkain
Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Heksadesimaaliluvut

Ihmiset ovat siis tottuneet lukemaan kymmenkantaisia lukuja ja tietokoneet kaksikantaisia. Näiden kahden järjestelmän välillä on kuitenkin ongelma: koska 10 ei ole kakkosen potenssisarjassa, kymmenkantaisesta luvusta ei suoraan nähdä montako bittiä sen esittämiseen tarvitaan, eikä siitä ole helppo muuntaa
binäärilukua
- sitä ei myöskään voida helposti jakaa lohkoihin (ei voida suoraan sanoa mitkä
bitit
tuottavat kunkin yksittäisen numeron). Esimerkiksi luvuissa 255 ja 256 ovat näennäisesti samaa suuruusluokkaa, mutta toisen voikin esittää 8 bitillä siinä missä toiseen tarvitaan 9. Toinen ongelma liittyy binäärilukujen vertailuun. Pikakysymys - onko tässä kaksi samaa lukua: 1011001101001011 1011001101101011? Binääriluvut ovat luonnostaan todella pitkiä ja niiden parsinta on silmille hankalaa.
Näistä syistä käytämme kompromissina
heksadesimaalilukuja
. Näissä luvuissa kantana on 16, ja esitystapa muodostuu siten, että numerot 10...15 korvataan kirjaimilla A...F.
Heksadesimaaliluvut
Heksoina esitettynä em. binääriluvut olisivat b34b ja b36b, joista on huomattavasti helpompi nähdä, että kyseessä on kaksi eri lukua. Lisäksi niistä nähdään myös nopeasti, että lukujen erotus on 20 eli 10-kantaisena 2 * 16 ** 1 (32). Vieläkin hyödyllisempää on, että yksi numero heksaluvussa vastaa tasan neljää bittiä:
heksadesimaaliluku ja sen numeroita vastaavat bitit
Heksaluvusta nähdään siis suoraan mitkä bitit ovat muuttuneet kun verrataan kahta arvoa. Tämä on elämää helpottava ominaisuus kun tehdään
bittioperaatiota
.
Muunnos kymmenkantaiseksi menee tuttuun tapaan kunhan muistetaan mitä lukuja kirjaimet vastaavat.
>>> 11 * 16 ** 3 + 3 * 16 ** 2 + 6 * 16 ** 1 + 11 * 16 ** 0
45931

Binäärikirous

Tässä tehtävässä puretaan heksadesimaalilukuja binääreiksi. Alla on siis esitetty nippu 16-kantaisia lukuja ja tehtäväsi on taikoa niistä binäärejä. Homma onnistuu helpoiten yksi numero kerrallaan kun vielä muistaa että 0...f on binäärinä 0000...1111. Muista merkitä myös etunollia vastaavat bitit! Tämäkin tehtävä kannattaa tehdä kynän ja paperin kanssa.
f3c1
0917
aa51
Kirjoittele vastaavat binääriluvut allaolevaan laatikkoon.
Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Muunnokset toiseen suuntaan

Tässä käymme lyhyesti läpi miten 10-kantainen luku muunnetaan binääriksi ja heksadesimaaliksi. Aloitetaan muunnoksella 10-kantaisesta 2-kantaiseen. Menetelmässä tuotetaan bitit oikealta vasemmalle, eli pienin bitti saadaan ensimmäisenä. Menetelmä etenee siten, että luku jaetaan aina kahdella, ja jakojäännös merkitään binäärilukuun kun taas osamäärä jatkaa seuraavalle kierrokselle, missä se puolestaan jaetaan kahdella ja merkitään jälleen jakojäännös ylös. Jatketaan kunnes osamäärä on 0. Olkoon luku 125, jolloin koko prosessi menee:
  1. Jaetaan 125 / 2 -> osamäärä 62, jakojäännös 1 -> binääriluku on nyt '1'
  2. Jaetaan 62 / 2 -> osamäärä 31, jakojäännös 0 -> binääriluku on nyt '01'
  3. Jaetaan 31 / 2 -> osamäärä 15, jakojäännös 1 -> binääriluku on nyt '101'
  4. Jaetaan 15 / 2 -> osamäärä 7, jakojäännös 1 -> binääriluku on nyt '1101'
  5. Jaetaan 7 / 2 -> osamäärä 3, jakojäännös 1 -> binääriluku on nyt '11101'
  6. Jaetaan 3 / 2 -> osamäärä 1, jakojäännös 1 -> binääriluku on nyt '111101'
  7. Jaetaan 1 / 2 -> osamäärä 0, jakojäännös 1 -> binääriluku on nyt '1111101'
Python-silmukkana:
binaari = ""
luku = 125
while luku > 0:
    luku, bitti = divmod(luku, 2)           # Lasketaan osamäärä ja jakojäännös
    binaari = str(bitti) + binaari          # Huom: muista liittää uusi numero luvu *alkuun*
    
print(binaari)
Vähemmän yllättäen prosessi etenee samalla tavalla heksadesimaaliluvuksi muunnettaessa, mutta jakajana on tietenkin kantaluku 16. Otetaan hieman suurempi luku, 4451.
  1. Jaetaan 4451 / 16 -> osamäärä 278, jakojäännös 3 -> heksadesimaaliluku on nyt '3'
  2. Jaetaan 278 / 16 -> osamäärä 17, jakojäännös 6 -> heksadesimaaliluku on nyt '63'
  3. Jaetaan 17 / 16 -> osamäärä 1, jakojäännös 1 -> heksadesimaaliluku on nyt '163'
  4. Jaetaan 1 / 16 -> osamäärä 0, jakojäännös 1 -> heksadesimaaliluku on nyt '1163'
Vastaava Python-silmukka:
heksa = ""
luku = 4451
while luku > 0:
    luku, bitti = divmod(luku, 16)           # Lasketaan osamäärä ja jakojäännös
    heksa = str(bitti) + heksa              # Huom: muista liittää uusi numero luvu *alkuun*
    
print(heksa)

Muunnosrutiini

Debugatessa laiteläheisiä ohjelmia arvot näkyvät monesti heksadesimaalina tai binäärinä. Harjoitellaan siis numeroiden muuntamista binäärin, desimaalin ja heksadesimaalin välillä! Jokainen muunnos pitää saada oikein vain kerran.
Vinkki: Nämä tehtävät voi halutessaan tehdä Pythonilla.

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Muunnokset Pythonissa

Python-tulkki
on kätevä työkalu erikantaisten lukujen pyörittelyyn. Tässä käymme lyhyesti läpi miten sillä muunnetaan lukuja kannasta toiseen.
Binäärilukuja
voi kirjoittaa Python-tulkkiin laittamalla luvun alkuun 0b merkiksi siitä, että luku on tulkittava 2-kantaisena:
>>> 0b1011
11
Samaten Pythonissa saa helposti esiin binääriesityksen kokonaisluvulle bin-funktiolla:
>>> bin(11)
'0b1011'
Python ei suoranaisesti tue muita kuin kymmenkantaisia lukuja, joten nämä esitystavat talletetaan merkkijonoihin. Binääriluvun voi myös lukea merkkijonosta käyttämällä int-funktiota lisäargumentilla, jolla kerrotaan merkkijonossa olevan luvun kanta:
>>> int("1011", 2)
13
Vastaavasti
heksadesimaaliluku
voidaan syöttää Pythoniin 0x-etuliitteellä:
>>> 0xb36b
45931
Tai käyttämällä int-funktiota lisäargumentilla:
>>> int("b36b", 16)
45931
Toiseen suuntaan muunnoksen voi tehdä hex-funktiolla:
>>> hex(45931)
'0xb36b'

Lopuksi

Eipä muuta tältäosin, takaisin itse pääasiaan!
?
Abstraktiolla tarkoitetaan sitä kun raa'an konekielen käskyt "piilotetaan" korkeamman tason ohjelmointikielen käskyjen alle. Abstraktiotasosta riippuu miten laajaa tämä piilotus on - mitä korkeampi taso, sitä vaikeampi on suoraan sanoa miten monimutkaiseksi koodirakennelma muuttuu kun se kääntyy konekielelle. Esim. Pythonin abstraktiotaso on huomattavasti korkeampi kuin C:n (itse asiassa Python on tehty C:llä...).
Alias on esikääntäjävaiheessa käsiteltävä korvaus, jolla tietty merkkijono koodissa korvataan toisella. Toiminta vastaa siis tekstieditorin replace-toimintoa. Aliaksia määritellään #define-direktiivillä. Esim #define PI 3.1416
Muuttujan alustamisella tarkoitetaan sitä, kun sille asetetaan koodissa jokin alkuarvo. Hyvin yleinen esimerkki tästä on lukumuuttujien alustaminen nollaan. Alustus voidaan tehdä muuttujan esittelyn yhteydessä: int laskuri = 0; tai erikseen. Jos muuttujia ei alusteta, niiden sisältönä on mitä ikinä muistipaikkaan on aiemmin jäänyt.
Pythonin käyttämää tapaa käsitellä arvojen tyyppiä kutsutaan dynaamiseksi tyypitykseksi eli ankkatyypitykseksi. Nimitys perehtyy lauselmaan "Jos se ui kuin ankka, kävelee kuin ankka ja ääntelee kuin ankka, se on ankka." Toisin sanoen arvon kelvollisuus määritellään sen ominaisuuksien perusteella. Tämä eroaa staattisesta tyypityksestä, jossa arvon kelvollisuus määritellään sen tyypin perusteella.
Argumentti on funktiokutsussa käytettävä arvo, joka välitetään kutsuttavalle funktiolle. Funktion sisällä argumentit sijoitetaan parametreiksi kutsuttuihin muuttujiin. Esimerkiksi printf("%c", merkki); -lauseessa argumentteja ovat "%c"-tulostusmäärittely sekä merkki-muuttujan sisältö.
Alkeiskurssilla arvo-termiä käytettiin kaikista ohjelman käsittelemistä arvoista, oli kyse sitten muuttujista, lauseiden tuloksista tai mistä tahansa. Arvo on siis käytännössä tietokoneen muistissa olevaa dataa, johon muuttujat voivat viitata. C:ssä muuttujan ja sen arvon suhde on Pythonia tiiviimpi, koska muuttuja vastaa suoraan sitä muistialuetta johon arvo on talletettu.
Asetuslippuja käytetään kun suoritetaan ohjelmia komentoriviltä. Ne ohjaavat ohjelman toimintaa. Asetuslippu kirjoitetaan yleensä joko yhdellä viivalla ja sitä seuraavalla kirjaimella (esim. -o) tai kahdella viivalla ja kokonaisella sanalla (tai sanoilla, sanojen välissä viiva) (esim. --system. Jotkut liput ovat ns. boolean lippuja eli ne ovat vain päällä tai pois, toisille annetaan lisäksi parametri. Parametri on tyypillisesti lipun perässä joko välilyönnillä tai =-merkillä erotettuna (esim. -o hemuli.exe).
Avainsanat ovat ohjelmointikielessä kielen käyttöön valittuja sanoja, joilla on erityinen merkitys. Hyvät tekstieditorit tyypillisesti merkitsevät avainsanat muista nimistä eroavalla tavalla (esim. lihavointi). Avainsanat ovat yleensä suojattuja, eli samannimistä muuttujaa ei voi luoda. Yleisiä avainsanoja ovat esim ohjausrakenteisiin kuuluvat if ja else. Avainsanat ovat siis osa ohjelmointikielen kielioppia.
Binääriluku on luku, joka muodostuu biteistä, eli arvoista 0 ja 1. Tämä tekee siitä 2-kantaisen lukujärjestelmän. Binäärilukujen tulkintaa voit tutkailla lukujärjestelmiä käsittelevässä lisämateriaalissa.
Binääritiedosto on tiedosto, joka sisältää konekielisiä käskyjä binäärinä. Ne on tarkoitettu ainoastaan tietokoneen luettavaksi, ja tyypillisesti jos niitä avaa vahingossa esim. tekstieditorilla tuloksena on merkkisotkua editorin yrittäessä tulkita tiedoston sisältämiä bittejä merkeiksi. Useimmat tekstieditorit myös varoittavat asiasta erikseen.
Bitti on pienin informaation yksikkö, joka voi saada arvot 0 ja 1. Tietokoneen sisällä kaikki tapahtuu bitteinä. Tyypillisesti muistissa on bittijonoja, jotka muodostuvat useista biteistä.
Bittinegaatio on operaatio jossa bittijonon bitit käännetään siten, että nollat muutetaan ykkösiksi ja ykköset nolliksi. Operaattori on ~
Bittioperaatiot ovat oma operaatioluokkansa joiden yhteispiirre on se, että niissä käsitellään bittijonojen yksittäisiä bittejä. Kääntöoperaatiossa yhden jonon bitit käännetään nollista ykkösiksi ja toisin päin. Osa operaatioista suoritetaan kahden bittijonon välillä siten, että jonoissa samassa kohdassa olevat bitit vaikuttavat toisiinsa. Näitä ovat and (&), or (|) sekä xor (^). Lopuksi on vielä siirto-operaatiot (<< ja >>), joissa yhden bittijonon bittejä siirretään oikealle tai vasemmalle N askelta.
C:n funktiot ovat Pythonin funktioita staattisempia. Funktiolla voi olla vain yksi paluuarvo, jonka tyyppi määritellään funktion määrittelyssä. Samoin määritellään kaikkien parametrien tyypit. Funktiota kutsuttaessa argumenttien arvot sijoitetaan parametreille varattuihin muistipaikkoihin, joten funktio käsittelee eri arvoja kuin sitä kutsuva koodi.
Ulkopuolinen koodi sijaitsee C:ssä kirjastoissa (library), josta niitä voidaan ottaa käyttöön #include-direktiivillä. C:ssä on mukana sisäiset kirjastot sekä lisäksi voidaan käyttää ulkoisia kirjastoja - ne täytyy kuitenkin koodissa käyttöönoton lisäksi kertoa kääntäjälle käännösvaiheessa. Tyypillisesti kirjasto koostuu c-kooditiedostosta sekä otsikkotiedostosta (.h), joka kertoo mitä funktioita kirjastossa on.
C:n muuttujat ovat staattisesti tyypitettyjä, eli niiden tyyppi kiinnitetään esittelyn yhteydessä. Lisäksi C:ssä muuttuja on sidottu sille varattuun muistialueeseeen. Muuttuja ei voi myöskään muuttaa tyyppiään jälkikäteen.
Ehtolause on yksittäisen ehdon määrittelevä rivi koodissa, jota seuraa aaltosulkeilla merkitty koodilohko, joka määrittää miten ehdon toteutuessa tulee toimia. Varsinaisia ehtolauseita ovat if-lauseet, joka voi esiintyä myös else-avainsanan kanssa else if. Toisiinsa liitetyt ehtolauseet muodostavat ehtorakenteita.
Ehtorakenne on yhdestä tai useammasta toisiinsa liitetystä ehtolauseesta muodostuva rakenne, joka haarauttaa ohjelman suoritusta. Useimmissa ehtorakenteissa on vähintään kaksi haaraa: if ja else. Näiden välissä voi olla myös N kpl else if-lauseilla aloitettuja haaroja. On myös mahdollista, että ehtorakenteessa on pelkkä if-lause. Ehtorakenteessa kussakin haarassa on suoritettavaa koodia, joka kuvaa miten ohjelman tulee ehdon määrittelemässä tilanteessa toimia. Jokainen haara on oma koodilohkonsa, joka merkitään siis aaltosulkeilla.
Esikääntäjä on värkki joka käy koodin läpi suorittaen kaikki esikääntäjädirektiivit ennen varsinaista kääntämistä. Näihin kuuluvat mm. include-lauseet joilla koodiin lisätään siihen liitetyt kirjastot sekä define-lauseet joilla voidaan määritellä vakioita ja makroja.
Esikääntäjädirektiivit ovat ohjeita, jotka on tarkoitettu esikääntäjälle. Ne puretaan koodista pois ennen varsinaista kääntämistä. Esikääntäjädirektiivit alkavat #-merkillä. Yleisin näistä on include, joka vastaa Pythonin importia. Toinen yleinen on define, jolla tällä kurssilla määritetään vakioita.
Muuttujan esittely tarkoittaa sitä kun muuttujan olemassaolosta kerrotaan ensimmäistä kertaa. Tällöin määritetään muuttujan tyyppi ja nimi, esim. int luku;. Kun muuttuja esitellään, sille varataan paikka muistista, mutta muistiin ei vielä kirjoiteta mitään - muuttujassa on siis muistiin jäänyt arvo. Tästä syystä muuttujat on usein myös hyvä alustaa esittelyn yhteydessä.
Etumerkitön kokonaislukumuuttuja on kokonaisluku jonka kaikki arvot ovat positiivisia. Koska etumerkille ei tarvitse varata bittiä, etumerkittömällä kokonaisluvulla voidaan esittää itseisarvoltaan 2x suurempi luku kuin etumerkillisellä. Etumerkitön kokonaisluku määritetään lisäämällä kokonaislukumuuttujan esittelyyn unsigned-avainsana: unsigned int laskuri;
Heksadesimaaliluvut ovat 16-kantaisia lukuja, joita käytetään erityisesti muistiosoitteiden sekä muistin bittisisällön esittämiseen. Heksadesimaaliluvun edessä on tyypillisesti 0x, ja numeroiden lisäksi käytössä ovat kirjaimet A-F jotka vastaavat numeroja 10-15. Heksadesimaalilukuja käytetään koska yksi numero vastaa aina tasan neljää bittiä, joten muunnokset binääriin ja takaisin ovat helppoja.
Iteroitava objekti on sellainen, jonka voi antaa silmukalle läpikäytäväksi (Pythonissa for-silmukalle). Tähän joukkoon kuuluvat yleisimpinä listat, merkkijonot ja generaattorit. C:ssä ei ole silmukkaa, joka vastaisi Pythonin for-silmukan toimintaa, joten taulukoiden yms. läpikäynti tehdään indeksiä kasvattavilla silmukoilla.
Kirjasto on tyypillisesti yhteen rajattuun tarkoitukseen tehty työkalupakki, joka yleensä sisältää nipun funktioita. Kirjastot otetaan käyttöön include-esikääntäjädirektiivillä. Jos kirjasto ei kuulu C:n sisäänrakennettuihin, sen käyttöönotto täytyy myös kertoa kääntäjälle.
Kokonaisluvut itsessään ovat tuttuja varmaan tässä vaiheessa, mutta C:ssä niitä on monenlaisia. Kokonaisluvuille nimittäin määritellään kuinka monella bitillä ne esitetään sekä se, onko luvussa etumerkkiä. Koska tietyllä bittimäärällä voidaan esittää vain rajallinen määrä eri lukuja (2 ^ n), etumerkillisissä luvuissa maksimiarvo on yhden bitin verran pienempi (2 ^ (n - 1)). Pienin kokonaisluku on 8-bittinen.
Kommentti on kooditiedostossa olevaa tekstiä, joka ohitetaan kun koodia suoritetaan. Kussakin kielessä on oma tapansa sille miten rivi merkitään kommentiksi. Pythonissa se on #-merkki, C:ssä //. Lisäksi C:ssä voi merkitä useita rivejä kommenteiksi kerralla - kommentti aloitetaan tällöin /*-merkkiparilla ja päätetään */-merkkiparilla. Kaikki näiden välissä tulkitaan kommentiksi.
Komplementti on negatiivisten lukujen esitystapa, jossa luvun etumerkki muutetaan kääntämällä sen kaikki bitit. Kahden komplementissa, jota tällä kurssilla käytetään, käännön jälkeen lisätään tulokseen 1. Tarkempaa tietoa löydät lukujärjestelmiä käsittelevästä oheismateriaalista.
Konekieli muodostuu käskyistä jotka laitteen prosessori ymmärtää. Konekieltä kutsutaan yleensä Assemblyksi ja se on alin taso jolla ihmisen on mielekästä antaa ohjeita tietokoneelle. Konekieltä käytetään tällä kurssilla loppuossa, joten siihen ei johdatuskurssia suorittavien tarvitse perehtyä.
Koodilohko on joukko koodirivejä, jotka kuuluvat jollain tavalla yhteen eli ne ovat samassa kontekstissa. Esimerkiksi ehtorakenteessa kunkin ehdon alla on oma koodilohkonsa. Samoin funktion sisältö on oma koodilohkonsa. Koodilohkot voivat sisältää muita koodilohkoja. Pythonissa koodilohkot erotetaan toisistaan sisennyksellä; C:ssä koodilohkon alku ja loppu merkitään aaltosulkeilla {}
Käskykanta määrittää mitä käskyjä laitteen prosessori osaa. Nämä käskyt muodostavat prosessoriarkkitehtuurin konekielen.
Kääntäjä on ohjelma, joka kääntää C-kielisen koodin konekieliseksi binääritiedostoksi, jonka tietokoneen prosessori osaa suorittaa. Kääntäjä myös tutkii koodin ja ilmoittaa siinä olevista virheistä sekä antaa varoituksia potentiaalisista ongelmista koodissa. Kääntäjän toimintaa voi ohjata lukuisilla asetuslipuilla.
Lause on ohjelmointikielessä nimitys yksittäiselle suoritettavalle asialle, joka on yleensä yksi koodirivi.
Liukuluku (engl. floating point number, lyh. float) on tietokoneiden käyttämä desimaaliluvun approksimaatio. Tietokoneet eivät arkkitehtuurinsa vuoksi pysty käsittelemään oikeita desimaalilukuja, joten niiden tilalla käytetään liukulukuja. Liukuluvut saattavat aiheuttaa pyöristysvirheitä - tämä on hyvä pitää mielessä niitä käyttäessä. C:ssä liukulukuja on yleensä kahta eri tarkkuutta: float ja double, joista jälkimmäisessä on nimensä mukaisesti 2 kertaa enemmän bittejä.
Looginen operaatio viittaa Boolen algebran operaatiohin, joissa käsitellään totuusarvoja. Tyypillisiä loogisia operaatioita ovat ehtolauseista tutut and, not ja or. C:ssä tunnetaan myös bittikohtaiset loogiset operaatiot jotka toimivat samalla logiikalla, mutta vaikuttavat jokaiseen bittiin erikseen.
Makro on alias, jolla määritetään tietty avainsana korvattavaksi koodinpätkällä. Hyvin käytettynä tällä voidaan joissain tilanteissa saada aikaan parempaa luettavuutta, mutta helposti käy toisin. Makroilla ei kannata tämän kurssin puitteissa leikkiä, kunhan tietää mistä on kyse jos niihin joskus törmää.
Merkki on nimensä mukaisesti yksi merkki. Merkki voidaan tulkita ASCII-merkkinä mutta sitä voidaan käyttää koodissa myös kokonaislukuna, koska se on pienin esitettävissä oleva kokonaisluku. Merkin koko on 1 tavu. Merkki merkitään yksinkertaisilla lainausmerkeillä, esim. 'c'.
Pythonissa kaikki teksti käsiteltiin merkkijonoissa, eikä siinä esim. ollut erillistä muuttujatyyppiä yksittäiselle merkille. C:ssä puolestaan ei ole varsinaista merkkijonomuuttujatyyppiä lainkaan - on ainoastaan merkeistä koostuvia taulukoita, joille on oma määrittelytapansa. Näillä taulukoilla on ennaltamäärätty pituus. "Merkkijonon" voi määritellä C:ssä char elain[5] = "aasi"; jossa numero kertoo merkkitaulukon koon ja on merkkien määrä + 1, koska lopetusmerkki '\0' lisätään tässä alustustavassa automaattisesti loppuun.
Metodi on funktio, joka on osa objektia eli objektin ominaisuus, jolla objekti usein muuttaa omaa tilaansa. Metodia kutsuttaessa käsiteltävä objekti tulee kutsun eteen: arvosanat.sort().
Kaikki suoritettavien ohjelmien käsittelemä data on tietokoneen muistissa ajon aikana. Tietokoneen muisti muodostuu muistipaikoista, joilla on muistiosoite sekä sisältö. Kaikki muistipaikat ovat saman kokoisia - jos talletettava tietomäärä on tätä suurempi, varataan useampi (peräkkäinen) muistipaikka.
Pythonissa objektit eroteltiin muuntuviin ja muuntumattomiin. Muuntumaton arvo oli sellainen, jonka sisältö ei voi muuttua - kaikki operaatiot jotka näennäisesti muuttavat arvoa tosiasiassa luovat siitä uuden kopion, joka yleensä sijaitsee uudessa muistipaikassa. Esimerkiksi merkkijonot olivat tyypillinen muuntumaton tyyppi Pythonissa. C:ssä tätä erottelua ei tarvita, koska muuttujien ja muistipaikkojen suhde on tiiviimpi - sama muuttuja osoittaa koko ohjelman suorituksen ajan tiettyyn muistipaikkaan.
Objekti, joskus myös olio, on Pythonissa yleistä terminologiaa. Kutsuimme objekteja pääasiassa arvoiksi alkeiskurssilla, mutta Pythonissa kaikkea voi käsitellä objekteina - tämä tarkoittaa, että mihin tahansa voidaan viitata muuttujilla (esim. funktion voi sijoittaa muuttujaan). Objekti-termiä käytetään tyypillisesti oliopohjaisissa kielissä (kuten Python). C ei kuulu tähän joukkoon.
Ohjausrakenne on yleisnimitys koodirakenteille, jotka hallitsevat jollain tavalla ohjelman suorituksen kulkua. Näihin rakenteisiin lukeutuvat ehtorakenteet sekä toistorakenteet. Myös poikkeusten käsittely voidaan lukea tähän joukkoon.
Koodin optimointi tarkoittaa sitä, että sen suorituskykyä parannetaan tyypillisesti joko vähentämällä aikaa, joka sen suoritukseen kuluu tai vähentämällä muistin käyttöä. Optimoinnista on hyvin tärkeää ymmärtää, että sitä ei koskaan kannata tehdä jos ei ole pakko - optimointia siis tehdään vasta kun koodi oikeasti toimii hitaasti tai kuluttaa liikaa muistia. Optimointia ei myöskään kannata tehdä sokkona - koodista tulee ensin tunnistaa mitkä ovat sen pullonkaulat eli ne osat jotka tuhlaavat eniten resursseja.
Osoitin (pointer) on C:ssä erityinen muuttujatyyppi. Osoitinmuuttuja sisältää muistiosoitteen, josta varsinainen arvo löytyy - ne toimivat siis tietyllä tapaa kuin Pythonin muuttujat. Muuttuja määritellään osoittimeksi lisäämällä tyypin perään * esittelyrivillä, esim. int* luku_os luo luku_os-muuttujan, joka on osoitin int-tyyppiseen arvoon. Osoittimen osoittaman muistialueen sisällön voi hakea käyttöön merkinnällä *luku_os ja vastaavasti jonkin muuttujan muistipaikan osoitteen saa merkinnällä &luku. Osoittimille on omistettu kokonainen materiaali (4).
Otsikkotiedosto on .h-päätteellä merkitty tiedosto, joka sisältää otsikkotiedot (funktioiden prototyypit, tietotyyppien määrittelyt yms) saman nimiselle .c-tiedostolle.
Otsikkotiedot ovat C-koodissa ja erityisesti kirjastojen yhteydessä eräänlainen muotti koodista. Tyypillisen otsikkotieto on funktion prototyyppi, jolla kerrotaan mitä funktio palauttaa ja mitä argumentteja sille annetaan. Rivi on sama kuin funktion varsinainen määrittely. Muita otsikkotietoja ovat mm. tietotyyppien ja vakioiden määrittelyt. Otsikkotiedot voivat sijaita kooditiedoston alussa, mutta erityisesti kirjastojen osalta ne ovat yleensä erillisessä .h-tiedostossa.
Paikanpidin on merkkijonojen muotoilussa käytetty termi, jolla esitetään kohta merkkijonossa, johon sijoitetaan esim. muuttujan arvo ohjelman suorituksen aikana. Pythonissa format-metodia käytettäessä paikanpitimiä merkittiin aaltosulkeilla (esim. {:.2f}). C:ssä käytetään %-merkkiä jota seuraa paikanpitimen määrittely, josta erityisen tärkeä osa on muuttujatyypin määrittely. Esimerkiksi "%c" ottaa vastaan char-tyyppisen muuttujan.
Paluuarvo on nimitys arvolle tai arvoille jotka funktio palauttaa kun sen suoritus päättyy. C:ssä funktioilla voi olla vain yksi paluuarvo, Pythonissa niitä voi olla useita. Koodia lukiessa paluuarvoa voi käsitellä päässään siten, että funktiokutsun paikalle sijoitetaan funktion paluuarvo sen jälkeen kun funktio on suoritettu.
Parametri on funktion määrittelyssä nimetty muuttuja. Parametreihin sijoitetaan funktion saamat argumentit. Parametri on siis nimitys jota käytetään kun puhutaan arvojen siirtymisestä funktion näkökulmasta. Tätä erottelua ei aina tehdä, vaan joskus puhutaan pelkästään argumenteista.
Poikkeus on ohjelmointikielessä määritelty virhetilanne. Poikkeuksella on tyyppi (esim. TypeError), jota voi käyttää poikkeuksen käsittelyssä ohjelman sisällä sekä myös apuna virhetilanteen ratkaisussa. Tyypillisesti poikkeukseen liitetään myös viesti, joka kertoo mistä ongelmassa on kyse.
Prototyyppi määrittelee funktion paluuarvon tyypin, nimen sekä kaikki argumentit ennen funktion varsinaista esittelyä. Kunkin funktion prototyypin tulisi löytyä joko kooditiedoston alusta tai erillisestä otsikkotiedostosta (.h). Prototyypin määrittely on kopio funktion varsinaisesti määrittelyrivistä.
Pythonin for-silmukka vastaa toiminnaltaan useimmissa kielissä olevaa foreach-silmukkaa. Se käy läpi sekvenssin -esim. listan - jäsen kerrallaan, ottaen kulloinkin käsittelyssä olevan jäsenen talteen silmukkamuuttujaan. Silmukka loppuu, kun iteroitava sekvenssi päättyy.
Merkkijonojen format-metodi on Pythonissa tehokas tapa sisällyttää muuttujien arvoja tulostettavaan tai tallennettavaan tekstiin. Merkkijonoon määritetään paikanpitimiä (esim: {:.2f}) joihin sijoitetaan format-metodin argumentit.
Python-funktiolla voi olla valinnaisia parametreja, joilla on asetettu oletusarvo. Argumenttien arvot siirtyvät parametreihin viittauksen kautta, joten funktion sisällä käsitellyt arvot ovat samoja kuin sen ulkopuolella käsitellyt - niillä on vain eri nimet. Python-funktiolla voi olla useita paluuarvoja.
Pythonin import-lauseella otettiin käyttöön moduuleja/kirjastoja - joko Pythonin mukana tulevia, muualta ladattuja tai itsekirjoitettuja. Pythonin import-lauseelle erityistä on, että oletuksena tuotuihin funktioihin ym. päästään käsiksi moduulin nimen kautta (esim. math.sin. C:ssä importia vastaa include, ja se tuo nimet suoraan ohjelman omaan nimiavaruuteen.
Interaktiivinen Python-tulkki tai Python-konsoli on ohjelma, johon voi kirjoittaa Python-koodirivejä. Nimitys "interaktiivinen" tulee siitä, että koodirivi suoritetaan välittömästi sen syöttämisen jälkeen, ja ohjelma näyttää käyttäjälle koodirivin tuottaman paluuarvon (esim. matemaattisen operaation tuloksen).
Pythonin lista osoittautui Ohjelmoinnin alkeissa hyvin tehokkaaksi työkaluksi. Se on järjestetty kokoelma arvoja. Listan monikäyttöisyys johtuu siitä, että sen koko on dynaaminen (eli suorituksen aikana muuttuva) minkä lisäksi se voi sisältää mitä tahansa arvoja - myös sekaisin. Samassa listassa voi siis olla useita erityyppisiä arvoja. Listat voivat tietenkin sisältää myös listoja tai muita tietorakenteita jne.
Kuten Ohjelmoinnin alkeissa opittiin, Python-muuttuja on viittaus arvoon, eli yhteys muuttujan nimen ja tietokoneen muistissa olevan arvon välillä. Python-muuttujilla ei ole tyyppiä, mutta arvoilla on. Arvon kelpaavuus kokeillaan koodia suorittaessa tilannekohtaisesti. Tässä suhteessa ne siis eroavat toiminnaltaan C:n muuttujista, ja niiden toiminta muistuttaa usein enemmän C:n osoittimia.
Pythonissa pääohjelma on se osa koodia, joka suoritetaan kun ohjelma käynnistetään. Pääohjelma sijaitsee tyypillisesti koodin lopussa, ja useimmiten if __name__ == "__main__":-lauseen alla. C:ssä ei ole varsinaista pääohjelmaa, siinä suoritus aloitetaan oletuksena main-nimisestä funktiosta.
Python-tulkki on ohjelma, joka muuttaa Python-koodin tietokoneelle annettaviksi ohjeiksi. Se vastaa niin kooditiedostojen kuin myös interaktiiviseen Python-tulkkiin kirjoitettujen komentojen suorittamisesta. Tällä kurssilla sanalla tulkki viitataan kuitenkin useimmiten nimenomaan interaktiiviseen Python-tulkkiin.
Pääfunktio on C:ssä ohjelman aloituspiste ja se korvaa Pythonista tutun pääohjelman. Oletuksena pääfunktion nimi on main ja se määritellään yksinkertaisimmillaan int main().
Resurssi viittaa laitteiston käytössä olevaan prosessoritehoon, muistiin, oheislaitteet jne. Se käsittää siis kaikki rajoitteet sille millaista ohjelmakoodia voidaan ajaa sekä sen, mitä ohjelmakoodilla voidaan tehdä. Tietokoneilla resurssit ovat ohjelmointiopiskelijan näkökulmasta aika rajattomat, mutta sulautetuilla järjestelmillä rajat voivat hyvinkin tulla vastaan.
C käyttää staattista tyypitystä. Se tarkoittaa sitä, että muuttujien tyypit määritellään kun ne luodaan ja muuttujaan ei voida sijoittaa erityyppistä arvoa. Lisäksi arvon kelvollisuus määritellään koodia suorittaessa sen tyypin perusteella (tai oikeastaan tämä tehdään jo käännösvaiheessa). Pythonissa taas käytetään dynaamista eli ankkatyypistystä.
Syntaksi (engl. syntax) on koodin kielioppi. Esimerkiksi Pythonin syntaksi määrittää, millainen teksti on tulkittavissa Python-koodiksi. Jos teksti ei noudata koodin syntaksia, sitä ei voida suorittaa tai C:n tapauksessa kääntää. Syntaksi antaa myös koodaajalle tietoa siitä, missä muodossa halutunlainen ohje tulee antaa.
Taulukko (array) on ohjelmointikielissä yleinen tietorakenne, joka sisältää useita (yleensä) samantyyppisiä arvoja. C:n taulukot ovat staattisia - niiden koko tulee määritellä taulukon esittelyn yhteydessä - ja taulukossa voi olla vain samantyyppisiä muuttujia (myös tyyppi määritellään esittelyssä).
Yhden muistipaikan koko on yksi tavu (byte) - tyypillisesti 8 bittiä. Tavu on siis pienin yksikkö joka voidaan osoittaa tietokoneen muistista. Muuttujien tyyppien varaamat muistialueet lasketaan tavuissa.
Terminaali, komentokehote ja komentorivi ovat eri nimiä käyttöjärjestelmän tekstipohjaiselle käyttöikkunalle. Windowsissa komentoriville pääsee kun kirjoittaa suorita...-ikkunaan cmd. Komentorivillä annetaan tekstikomentoja käyttöjärjestelmälle. Tällä kurssilla pääasiassa siirrytään cd-komennolla hakemistosta toiseen ja käytetään kääntäjää kooditiedostojen kääntämiseen sekä suoritetaan käännettyjä koodeja.
Tietorakenne on yleisnimitys kokoelmille jotka sisältävät useita arvoja. Pythonissa näitä olivat mm. lista, monikko ja sanakirja. C:ssä taas yleisimmät tietorakenteet ovat taulukot (array) ja tietueet (struct).
Tietokoneen muistissa oleva data on pelkästään bittejä, mutta muuttujilla on tyyppi. Tyyppi kertoo millä tavalla muistissa olevat bitit pitää tulkita. Se kertoo myös kuinka suuresta määrästä bittejä muuttujan arvo muodostuu. Tyyppejä ovat esim int, float ja char.
Tyyppimuunnos on operaatio jossa muuttuja muutetaan toisentyyppiseksi. Alkeiskurssilla tätä tehtiin pääasiassa int- ja float-funktioilla. C:ssä tyyppimuunnos merkitään hieman toisin: liukuluku = (float) kokonaisluku. Huomioitavaa on myös, että operaation tulos voidaan tallentaa ainoastaan muuttujaan jonka tyyppi on kohdetyyppiä (esimerkissä float). Pythonissa nähdyt luku = int(luku)-temput eivät siis onnistu.
Varoitusviesti on ilmoitus siitä, että ohjelman suorituksessa tai - erityisesti tällä kurssilla - sen kääntämisessä kohdattiin jotain epäilyttävää, joka saattaa johtaa virhetilanteisiin, mutta ei suoraan estä ohjelman käyttöä. Yleisesti ottaen kaikki varoitukset on syytä korjata ohjelman toiminnan vakauttamiseksi.
Virheviestiksi kutsutaan tietokoneen antamaa virheilmoitusta joko koodia kääntäessä tai ohjelmaa suorittaessa. Virheviesti tyypillisesti sisältää tietoa kohdatusta ongelmasta ja sen sijainnista.
C:ssä main-funktio on ohjelman suorituksen aloituspiste kun ohjelma käynnistetään. Ohjelman komentoriviargumentit tulevat main-funktiolle (mutta niitä ei ole pakko vastaanottaa), ja sen palautusarvon tyyppi on int. Lyhimmillään main-funktion voi siis määritellä: int main().
C:ssä yksi tulostustapa on printf-funktio, joka muistuttaa pääasiassa Pythonin print-funktiota. Sille annetaan tulostettava merkkijono, sekä lisäksi merkkijonoon sijoitettavat arvot mikäli on käytetty paikanpitimiä. Toisin kuin Pythonin print, printf ei automaattisesti lisää rivinvaihtoa, joten loppuun on yleensä syytä lisätä \n.
Silmukoista while pohjautuu toistoon ehdon tarkastelun kautta - silmukan sisällä olevaa koodilohkoa suoritetaan niin kauan kuin silmukalle annettu ehto on tosi. Ehto määritetään samalla tavalla kuin ehtolauseissa, esim: while (summa < 21).