1. Tämän kurssin a, b, ... ( •_•)>⌐■-■ ...C¶
Tällä sivulla otetaan ensiaskelet Ohjelmoinnin alkeiden tutusta ja turvallisesta Pythonista kohti uusia valloituksia: C-ohjelmointikieltä. Samalla kerrotaan hieman tästä kurssista ja sen suhteesta ohjelmoinnin alkeisiin sekä tietenkin C-kieleen työkaluna.
Oppimistavoitteet¶
Tällä kertaa tarkoitus on oppia miten C-kieli liittyy tähän kurssiin ja miksi ylipäätään on katsottu tarpeelliseksi vaihtaa kieltä. Keskeistä opittavaa ovat näiden kielten periaatteelliseet erot, jotka vaikuttavat vahvasti ohjelmointikokemukseen. Lisäksi opimme ensimmäiset erot näiden kahden kielen
syntaksien
välillä. C-ohjelmointi tällä kurssilla¶
Ennen kielten väliseen vertailuun ryhtymistä on tarpeen kertoa hieman lisää siitä mikä on tämän kurssin, ohjelmoinnin ja C-kielen suhde.
Tämä ei ole ohjelmoinnin peruskurssi¶
Ihan alkuun on hyvä korostaa, että tämä kurssi jatkaa siitä mihin Ohjelmoinnin alkeet jäi. Oletuksena on siis, että ohjelmoinnin perusasiat ovat jo kunnossa eikä niitä ole tarkoitus käydä uudestaan läpi. Kertausta materiaaliin on jonkin verran päätynyt, mutta pääasiassa sen tarkoitus on palautella mieliin miten asiat toimivat Pythonissa, jotta voidaan sitä kautta korostaa miten C-kielessä niitä käsitellään eri tavalla. Jos siis jokin osa-alue tuntuu täysin vieraalta, kertausta kannattaa hakea Ohjelmoinnin alkeiden materiaalista. Asiakokonaisuuksien etenemisjärjestys on suurinpiirtein sama, ja joka käänteessä keskitytään siihen miten ennestään tutut asiat kääntyvät C-kielelle.
Tämä ei ole C-ohjelmointikurssi¶
Toinen tärkeä korostus on se, että tällä kurssilla C toimii työvälineenä jota tarvitaan, jotta päästään kiinni kurssin varsinaiseen sisältöön. C:tä opetetaan siis nimenomaan laiteläheisen ohjelmoinnin näkökulmasta. Kurssilla siis sivuun paljon sellaisia asioita C-kielestä, jotka ovat lähinnä relevantteja kun ohjelmoidaan suuria ohjelmistoja tietokoneille. C-kielen standardeja materiaalissa sivutaan, silloin kun se on tarkoituksemukaista.
Tämä on laiteläheisen ohjelmoinnin kurssi¶
Tämä kurssi yhdistää kaksi vanhaa kurssia: Laiteläheinen ohjelmointi ja Tietokonetekniikka - näistä osista jälkimmäinen tosin näkyy vain 8 opintopisteen version suorittajille. Osio jota luet juuri nyt kuuluu 5 opintopisteen osaan, eli menee kokonaan tuon vanhan Laiteläheinen ohjelmointi -otsikon alle. Luennoilla puhutaan tästä laiteläheisyydestä paljon tarkemmin, mutta todettakoon tässä pikaselityksenä: tällä kurssilla puljataan selkeästi ohjelmoinnin alkeita syvemmällä ja vieläpä siten, että keskitytään pieniin laitteisiin, joissa on rajallisesti prosessoritehoa ja muistia (toki tietokoneissakin on rajallisesti, mutta käytännössä kuitenkin resursseja on niin paljon, että niistä ei tarvitse huolehtia). C tarjoaa työkalut joilla voimme paremmin hallita järjestelmän
resurssien
käyttöä ja päästä tarpeen mukaan työntämään sorkat suoraan tietokoneen muistiin
ja matalan tason toimintaan. Se mitä tämä tarkempi hallinta ja muistin sörkkiminen käytännössä tarkoittavat ja miten ne tapahtuvat selviää vähitellen materiaalin edetessä. Tässä vaiheessa voidaan lähinnä muistuttaa eräästä peukalosäännöstä: mitä tarkemman hallinnan jokin työkalu tarjoaa, sitä enemmän sen kanssa joutuu likaamaan käsiään.
Pythonista C-kieleen¶
Tässä osiossa käydään läpi kielten välisiä perusteellisia eroja. Tarkoitus ei ole vielä tässä vaiheessa täysin sisäistää mitä nämä erot tarkoittavat käytännön ohjelmointikokemuksen kannalta, mutta niiden olemassaolo on hyvä tiedostaa heti alkuun. On myös hyvä muistaa, että vaikka erot saattavat kuulostaa jokseenkin semanttisilta, niillä on pääasiassa - erityisesti laiteläheisessä ohjelmoinnissa - hyvin vahva vaikutus siihen miten ohjelmia kirjoitetaan. Nämä eroavaisuudet myös toivon mukaan avaavat näkemystä siihen miksi Python valikoitui alkeiskurssin kieleksi, mutta vaihtuu nyt C:hen. Äärimmäisen tiivistettynä Pythonissa on paljon ohjelmointia mukavoittavaa automaatiota, jolloin likaisten yksityiskohtien kanssa joutuu räpeltämään vähemmän. Hintana on kuitenkin suorituskyky (jolla ei nykytietokoneiden kanssa ole juuri merkitystä) ja tarkemman hallinnan puute (jolle ei tietokoneille ohjelmoitaessa yleensä ole tarvetta).
Käännetty kieli vs tulkattu kieli¶
Ohjelmoinnin alkeissa puhuttiin toistuvasti
Python-tulkista
, ohjelmasta joka suorittaa Python-koodia. Tällä kurssilla ei tämän osion jälkeen erityisemmin tulkista puhuta, koska C-kieltä ei tulkata - sitä käännetään
. Oli kieli mikä tahansa, ennen pitkää kaikki koodi päätyy tavalla tai toisella konekieliseen
muotoon. Tämä kieli muodostuu käskyistä, jotka löytyvät prosessorin käskykannasta
. Tämä käskykanta on ihmisen näkökulmasta varsin rajallinen, mutta silläkin on ohjelmoitu - ja ohjelmoidaan erikoistapauksissa edelleen, mistä kurssin jälkipuoliskolle osallistuvatkin pääsevät nauttimaan. Ohjelmointikielet ovat käytännössä konekielen päälle rakennettuja abstraktioita
, jotka tarjoavat ihmisystävällisemmän kokoelman käskyjä. Sekä kääntäminen että tulkkaaminen ovat kumpikin prosesseja, joilla ohjelmointikielellä kirjoitettu koodi käännetään prosessorille lähettävälle konekielelle. Sanavalinnat eivät ole sattumaa - niiden analogiset vastineet kuvaavat hyvin prosessien eroja. Kuten oikeassakin elämässä, kun kieltä käännetään, koko teksti käännetään kerralla jonka jälkeen kääntäjä
lähettää valmiin tuotoksen eteenpäin. Vastaavasti tulkkaaminen tapahtuu reaaliajassa - käännettävät lauseet tulkataan yksi kerrallaan sitä mukaa kun niitä tulee ulos. Tulkkauksen luonne ilmenee erityisen hyvin kun käytetään Pythonin
interaktiivista tulkkia
: jokaisen kirjoitetun koodirivin lopputulos saadaan heti: >>> 5 + 5
10
>>>
Toinen selkeä ilmenemistapa on se, että virheellinen Python-ohjelma usein suorittuu johonkin pisteeseen asti ennen kaatumista - siis toimii osittain. Erityisesti aloittelijan näkökulmasta tämä on hyödyllistä, koska viallisen ohjelman toimintaa voi tutkia helposti. Tulkkaamisen varjopuolena on kuitenkin se, että koska konekieltä tuotetaan ns. lennosta, siihen kuluu
resursseja
suorituksen aikana. Toiseksi tulkatessa täytyy varautua siihen, että seuraava koodirivi voi olla ihan mitä tahansa. Myös tämä varautuminen vaatii resursseja. Testiajossa alla oleva äärimmäisen yksinkertainen Python-ohjelma kulutti 8 megatavua muistia
: input(": ")
Parikymmentä vuotta sitten 8 megatavua olisi ollut tietokoneen koko keskusmuistin koko. Melkein kaikki tästä muistista menee Pythonin omaan käyttöön - siis sen arkkitehtuurin ylläpitämiseen, joka tulkkaa koodia. Tästä osoituksena voidaan todeta, että esimerkkimiinaharava ei vie oikeastaan yhtään enempää muistia. Pythonin suorituskykyä voidaan toki
optimoida
erilaisilla työkaluilla (esim. PyPy), mutta se ei kuulu varsinaisesti tämän kurssin aihepiiriin. Kääntäjän
kanssa elämä on erilaista. Tällöin ohjelman suorittaminen on kaksivaiheinen prosessi: ensimmäisessä vaiheessa ohjelmakoodi ajetaan kääntäjän läpi jolloin saadaan ulos binäärikooditiedosto
, joka sisältää varsinaisen suoritettavan ohjelman. Käännös tehdään vain kerran. Ohjelmaa suorittaessa se on jo valmiiksi sellaisessa muodossa, joka voidaan tunkea suoraan prosessorille. Suorituksen aikana ei siis tarvitse kuluttaa resursseja kääntämiseen. Samaten suorituksen aikana tulee vähemmän yllätyksiä, sillä kääntäjä on jo käynyt koko koodin läpi. Kääntäjät tyypillisesti tekevätkin optimointia - käytyään koko koodin läpi ne pystyvät valitsemaan tehokkaimman tavan suorittaa haluttu toimintalogiikka. Tämä on mahdollista ainoastaan sen takia, että koko koodi tunnetaan ennen suoritusta. Ylläolevaa Python-esimerkkiä vastaava C-ohjelma kulutti 640 kilotavua muistia kirjoittajan virtuaali-Ubuntussa ajettuna. Sen koodia voidaan katsoa hieman myöhemmin. Kääntäjän kanssa virheiden etsintä ja ratkominen muuttuu oleellisesti. Useimmiten viallista koodia ei voi lainkaan suorittaa, koska se hylätään jo käännösvaiheessa. Tällöin virhe ja tapa jolla se korjataan täytyy osata lukea kääntäjän antamista
virheviesteistä
. Se, että ohjelma kääntyy ei kuitenkaan tarkoita etteikö se voisi mennä rikki myös käytössä. Virheviestien lisäksi kääntäjä antaa varoitusviestejä
potentiaalisista ongelmista. Yleensä myös nämä on syytä korjata ennen ohjelman suoritusta, mutta sekään ei takaa ohjelman toimivuutta. Loppujen lopuksi koodia siis täytyy joka tapauksessa testata myös kääntämisen jälkeen. Tällöin testaamiseen tulee aina ylimääräinen työvaihe, kun koodi pitää jokaisen muutoksen jälkeen kääntää uudestaan. Jos ohjelma on suurempi kokonaisuus, kääntämiseen kuluu havaittava määrä aikaa. Yhden asian voi tässä vaiheessa sanoa varmuudella: kaikkeen tähän tutustutaan kurssin aikana useaan otteeseen. Staattinen tyypitys vs dynaaminen tyypitys¶
Python on monien asioiden suhteen varsin avoin. Kuten toivoin mukaan muistamme, Pythonille ominainen tapa käsitellä
virhetilanteita
oli "kokeile ensin, kadu myöhemmin". Myös Pythonin tapa käsitellä muuttujia on hyvin vapaamielinen. Useimmissa tilanteissa muuttujan tyyppiä ei tarkisteta - sen sijaan ainoastaan kokeillaan sattuuko muuttujan
sisältämä arvo toimimaan meneillään olevassa tilanteessa. Tämä on dynaamista tyypitystä
, joka tunnetaan myös termillä duck typing - jos eläin kävelee kuin ankka, ui kuin ankka ja ääntelee kuin ankka, sitä voidaan pitää ankkana riippumatta siitä onko se oikeasti ankka. Jos meillä on vaikkapa matemaattinen funktio
, sitä kiinnostaa ainoastaan voiko sille annetuilla argumenteilla laskea - ei numeroiden tarkka tyyppi. Kaikkein tarkimmat saattavat vielä muistaa, että Pythonissa muuttujilla ei oikeastaan edes ole tyyppiä - ainoastaan niiden arvoilla on. Muuttujaan voidaan heittämällä sijoittaa yhdessä kohdassa merkkijono ja toisessa vaikka lista:>>> rivi = "aasi,svengaa,5,10.0"
>>> rivi = rivi.split(",")
C taas on
staattisesti tyypitetty
. Tämä tarkoittaa sitä, että kaikkien muuttujien tyyppi määritetään koodissa erikseen. Tämä pätee myös funktioiden
parametreihin
että niiden paluuarvoihin!
. Kääntäjä
varmistaa, että missään vaiheessa ei yritetä tunkea pyöreää palikkaa nelikulmaiseen reikään - ei vaikka se olisi niin pieni että mahtuisi. Jos muuttujien tyyppiä täytyy vaihtaa lennosta, se täytyy erikseen merkitä koodissa - muuten operaatio on laiton. Tavallisten muuttujien kohdalla tämä ero ei ole sinänsä yhtä merkittävä kuin edellinen, koska muuttujien käyttö on vain vähän kankeampaa ja vaatii vain hieman enemmän lisätyötä. Löytyy ohjelmoijia jotka ovat ehdottomasti tämän tiukemman tyypityksen kannalla ja heillä on siihen syynsäkin: se estää tietynlaiset mysteerivirheet joita syntyy, kun jotain luullaan alustavaksi ankaksi mutta myöhemmin osoittautuu että se olikin hanhi (ts. muuttujan sisältämällä arvolla olikin vain osa tarvituista ominaisuuksista - esimerkiksi monikko toimii joissain tilanteissa kuin lista, mutta ei kaikissa). Alla pari esimerkkiä muuttujan määrittelystä C:ssä, jossa näkyy tyypin määrittäminen.int jalkojen_lkm = 4;
float korvien_vali = 30.15;
Asia kuitenkin mutkistuu kun siirrytään yksinkertaisista tietotyypeistä
rakenteisiin
. Pythonin kätevin yleistyökalu, lista
, loistaa nimittäin poissaolollaan. Toki C:ssä on oma rakenteensa johon voidaan laittaa nippu arvoja jonoon. Tätä rakennetta kutsutaan taulukoksi
(array). Taulukko on kuitenkin merkittävästi jähmeämpi tuttavuus. Taulukolle täytyy määrittää sen esittelyssä
kuinka monta alkiota siihen voidaan laittaa sekä näiden alkioiden tyyppi - taulukon pituus siis ei voi muuttua ohjelman suorituksen aikana, eikä sinne voi laittaa sekaisin erityyppisiä arvoja. Toki näihinkin ongelmiin voi C:ssä kehittää ratkaisuja, mutta ihan triviaaleja ne eivät ole, eivätkä tyypillisesti silti ylety Pythonin listojen monipuolisuuteen. Meidän onneksemme niiden tarve tällä kurssilla on kuitenkin verrattain vähäistä. Tyypitykseen liittyy vielä yksi ero: Python-kurssilla painotettiin jatkuvasti, että
muuttuja
ei sisällä arvoa, ainoastaan osoittaa siihen. Kaikki muuttujat toimivat siis samalla tavalla. C:ssä sen sijaan erotellaan toisistaan muuttujat
jotka sisältävät arvon, ja muuttujat jotka sisältävät osoittimen
arvoon. Tämä erottelu on yksi hankalimpia asioita oppia C-ohjelmoinnissa, koska sillä voi saada aikaan todella mystisiä virheitä kun käsitellään tietokoneen muistia suoraan, eikä muuttujien arvojen kautta. Siksipä paneudumme asiaan kunnolla sille varatussa materiaalissa. Syntaksierot¶
Kenties vähäpätöisin ero ainakin ongelmanratkaisun kannalta on se, että C näyttää hieman erilaiselta kuin Python. Lähdetään helpoimmasta: C:ssä
lauseet
- eli yleensä yksittäiset koodirivit - päättyvät aina puolipisteeseen siinä missä Pythonissa ne yksinkertaisesti päättyivät rivinvaihtoon. Kääntäjä
osaa huomautella puuttuvista puolipisteistä varsin innokkaasti. Toinen ero liittyy koodilohkojen
merkitsemiseen. Pythonissa koodilohkot eroteltiin toisistaan sisennystason avulla. C:ssä sisennyksellä ei ole syntaksin kannalta merkitystä, ja koodilohkot merkitään sen sijaan aaltosulkeilla – eli kaikki aaltosulkeiden sisällä oleva kuuluu samaan lohkoon. Luonnollisesti lohkon sisällä voi olla uusia lohkoja. Aaltosulkeita käytetään funktioiden
sekä ohjausrakenteiden
yhteydessä. Se, että sisennys ei ole merkitsevä ei tosin tarkoita etteikö sitä kannattaisi käyttää - Pythonista opitut sisennyskäytännöt tekevät C-koodista nimittäin huomattavasti luettavampaa. Muita hyvin pieniä eroja ovat mm. se, että ehtolauseissa ja vastaavissa ehdon ympärille tulee sulut ja että jotkut symbolit vaihtuvat. C:ssä ei myöskään ole
pääohjelmaa
samalla tavalla kuin Pythonissa. Sen sijaan C:ssä on erityinen main-funktio
, josta ohjelman suoritus oletuksena alkaa. Yksinkertaisessa C-ohjelmassa on tästä syystä hieman enemmän tavaraa: #include <stdio.h>
int main() {
printf("aasisvengaa!\n");
return 0;
}
Vastaava ohjelma Pythonissa olisi ollut…
print("aasisvengaa")
Esimerkissä näkyy pari muutakin eroa.
#include <stdio.h>
vastaa käyttötarkoitukseltaan Pythonin importia. Sitä tarvitaan, koska printf-funktio löytyy stdio-kirjastosta
(standard input/output). Vastaavasti int main()
on funktiomäärittely. Erillistä avainsanaa
kuten Pythonin def
ei C:ssä ole. Funktion määrittely tunnistetaan funktion määrittelyksi nimen perässä olevista suluista - muuten rivi näyttää samalta kuin muuttujan
määrittely - funktioiden määrittelyssä nimittäin kuuluu määrittää myös niiden paluuarvon
tyyppi. C-ajokortti käteen¶
Ennen syvemmälle sukeltamista tähän esittelysivun loppuun on hyvä katsoa perusteet C-ohjelman suorituksesta. Kuten oli puhetta, Pythoniin verrattuna koodin "käynnistykseen" tulee uusi välivaihe: se paljon puhuttu kääntäminen. Työkaluna tässä on siis
C-kääntäjä
, joka tässä vaiheessa pitäisi olla asennettuna. Tässä materiaalissa kääntäjää ja ohjelmia suoritetaan alkeista tutussa terminaalissa
. Esimerkkinä olkoon vaikka ylläoleva svengauskoodi. Tuttuun tapaan terminaalissa navigoidaan hakemistoon, jossa koodi sijaitsee. Sen jälkeen lausutaan tämä perusloitsu (Windowsissa):C:\polku\johonkin>gcc -Wall -o svengaa.exe svengaa.c
…tai Linuxissa:
opiskelija@tietokone:~$ gcc -Wall -o svengaa svengaa.c
Tässä rimpsussa gcc on yksinkertaisesti kääntäjän nimi. Loput ovat sille annettuja komentoriviparametreja, joista viimeinen on lähdekooditiedoston nimi. Kolmas ja neljäs eli
-o svengaa.exe
kuuluvat yhteen: -o kertoo, että sitä seuraava parametri määrittää nimen joka käännetylle ohjelmalle annetaan. Linuxissa loitsu on muuten sama, mutta kohdetiedoston nimestä jätetään .exe pois - Linuxissa suoritettavilla tiedostoilla ei tyypillisesti ole lainkaan päätettä. Tämän jälkeen ohjelma voidaan suorittaa (Windowsissa):C:\polku\johonkin>svengaa.exe
aasisvengaa!
…tai Linuxissa:
opiskelija@tietokone:~$ ./svengaa
aasisvengaa!
Kääntäjä on todella monimutkainen värkki ja -o on vain yksi sen todella lukuisista
asetuslipuista
. Tällä kurssilla kääntäjän sielunelämään ei perehdytä kovinkaan tarkasti, mutta kuitenkin jonkin verran muitakin asetuslippuja nähtäneen käytössä. Loppuyhteenveto¶
Tällä kertaa lähinnä käytiin läpi C-kieltä hyvin yleisellä tasolla. Alleviivasimme joitain periaatteellisia tapoja joilla se eroaa Pythonista. Tarkoitus oli pääasiassa valmistautua tulevaan, ja näiden erojen merkitys avautuu paremmin kun päästään yksityiskohtiin. Kuitenkin näin aluksi on hyvä tiedostaa ylipäätään, että kyseessä todellakin on hieman erilainen eläin. Eipähän tule täysin yllätyksenä se, että asioita tehdään hieman eri tavalla. C-ohjelmoinnissa koodari joutuu hieman enemmän säätämään yksityiskohtien kanssa. Vastavuoroisesti koodari saa toisaalta myös lisää supervoimia, joilla hallita tietokoneen toimintaa.
Anna palautetta
Kommentteja materiaalista?