Assembly-kielen Harjoitustehtävät¶

Tässä materiaalissa katsomme ensin miten y86-assembly-kääntäjää ja simulaattoria käytetään. Sitten esitämme miten harjoitustehtävien vastaukset tulee Lovelaceen palauttaa ja lopuksi itse harjoitustehtävät.

Simulaattori netissä¶

Netistä löytyy kätevästi y86-64-assembly-ohjelmointia varten simulaattorin verkkoversio.

Verkkoversio tarjoaa kurssille riittävän ympäristön assembly-ohjelmointiin, koskien sekä harjoitustehtävien että harjoitustyön suorittamista. Demo verkkoversion käytöstä löytyy Assembly-kielen luentokappaleesta. Hox! Muistakaa ottaa koodi talteen backuppeihin.

Myös muita y86-simulaattoriversioita löytyy verkosta, mutta ne saattavat olla esim. 32-bittiselle suoritinversiolle. Joten ne eivät suoraan käy kurssilla.

Simulaattori omalla tietokonella¶

Simulaattorin asennus unixeille¶

Virallista simulaattoria ei ole tarpeen asentaa kotikoneelle, eikä siitä ole erityistä hyötyä, mutta ohjelmiston voi halutessaan asentaa.

Simulaattorin (ja oppikirjan) kotisivu täällä. Mene vasemmalta menusta Student site -> Chapter 4: Processor Architecture).

Käännösprosessi Ubuntu:lle on seuraava.

Esivalmistelut

Tarvitaan flex-kirjasto, joka asentuu komennolla sudo apt-get install flex
Tarvitaan TCL/TK-kirjasto, joka asentuu komennolla sudo apt-get install tk8.5-dev
Simulaattorin Makefileen täytyy muuttaa kirjastojen nimet (tk ja tcl) muotoon tk8.5 ja tcl8.5, eli rivillä TKLIBS=-L/usr/lib -ltk8.5 -ltcl8.5
Joissain koneissa pitää myös asentaa bison-ohjelma, eli sudo apt-get install bison.

Valmisteluiden jälkeen simulaattorin manuaalista (kts. kotisivu) löytyy ohjeet simulaattorin kääntämiseen.

Assembly-ohjelman käännösprosessi¶

Assemblykääntäjää käytetään käskyllä yas.

ubuntu:~$ ./yas ohjelma.ys

Kääntäjä tuottaa objektitiedoston ohjelma.yo, joka sitten annetaan simulaattorille. Objektitiedosto on myös tekstimuotoinen, joten sen sisälle kannattaa vilkaista! Sieltä näkyy mm. vastaava konekielen toteutus.

Ohjelmien suoritus¶

Simulaattoripaketin mukana tulevat molemmat versiot: sekventiaalinen ja liukuhihnasuoritin. Molempien versioiden manuaali löytyy oppikirjan kotisivuilta täältä. Mutta liukuhihnasuoritinta ei kurssilla tarvita.

Sekventiaalisen simulaattorin käyttäminen tapahtuu seuraavasti ssim-käskyllä.

ubuntu:~$ ssim ohjelma.yo

Jonka jälkeen simulaattori ajaa ohjelman komentotulkissa ja näyttää mitä jokaisessa käskyssä tehdään ja miten muistialueet sekä rekisterit muuttuivat.

Nyt simulaattorissa on oletuksena assembly-ohjelmille 10.000 suoritettavan käskyn raja. Tätä voi muuttaa komentoriviparametrillä -l n, jossa n on maksimikäskyjen määrä. Esimerkissä alla suoritetaan max. 50.000 käskyä.

ubuntu:~$ ssim ohjelma.yo -l 50000

Tehtävät¶

Assembly-tehtävien koodit pitää palauttaa tietyssä muodossa, kuten alla kerrotaan. Tämä sen takia, että Lovelace pystyisi automaattisesti ne tarkistamaan eri syötteillä.

0. Kooditiedoston nimi päättyy päätteeseen .ys
1. Palautettavan koodin ensimmäinen rivi pitää olla main-koodilohkon esittely:

main:
    ...

Tässä ei sijoiteta koodia muistiosoitteeseen .pos eikä tehdä muitakaan alustuksia. Tarvittavat alustukset voidaan tehdä main-lohkossa sisällä, mutta ei siis ennen sitä.
main-lohkon esittelyn jälkeen koodissa voi olla kaikki tarvittava: aliohjelmia, pinon alustuksia, jne. Mutta ei ennen sitä!
Omassa testikoodissa ennen palautusta voitte toki tehdä alustukset miten haluatte, mutta poistakaa ne palautettavasta koodista.

2. Tehtävässä annetaan syöte- ja tulos-rekisterit, joita on tehtävän koodissa käytettävä mainittuun tarkoitukseen. Muuten ei mene vastaus tarkistimesta läpi.
3. Jos tehtävässä on muita ohjeita, esim. maksimiarvo tai pinon alustus tiettyyn osoitteeseen, ne pitää olla kohdillaan.
4. Ohjelma päättyy aina halt-käskyyn.
5. Muistakaa, että y86-kääntäjä olettaa että jokainen käsky päättyy aina rivinvaihtoon! (ts. koodin loppuun ylimääräinen rivi). Muutoin koodi ei mene tarkistimesta läpi.

Simulaattorin yas-kääntäjä valittaa kyllä virheestä, mutta se ei näy Lovelacessa.

Esimerkki. Oletetaan tehtävä: Laske yhteen rekisterien %rax ja %rbx arvot ja palauta tulos %rbx-rekisterissä. Tällöin testikoodi voi olla seuraavanlainen:

.pos 0
   irmovq $2,%rax
   irmovq $3,%rbx   
main:
   addq %rax,%rbx
   halt

Tehtävän vastauksena palautetaan kuitenkin vain koodit main-lohkosta alkaen, eli:

main:
   addq %rax,%rbx
   halt

Tällöin Lovelace voi testata vastauskoodia alustamalla rekistereihin omat testisyötteet.

Tärkeää!! y86-simulaattori (Lovelacessa) pystyy käsittelemään vain alle 10000 konekielen käskyä, huomatkaa tämä koodatessa. Tehtävät on laadittu siten, ettei niitä suorittaessa menisi montaa tuhatta käskyä.

Ok, aloitetaan..

Kertolasku (1p)¶

Toteuta assembly-kielellä kertolasku niin, että kerrottavat luvut ovat rekistereissä %rdi ja %rsi. Vie laskun lopputulos rekisteriin %rax.

VINKKI: Kertoaksesi x * y sinun tulee lisätä x y kertaa.

Toteuta kertolasku: %rax = %rdi x %rsi

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Jakolasku (1p)¶

Toteuta jakolasku niin että jaettava annetaan rekisterissä %rdi ja jakaja rekisterissä %rsi, ja lopputulos kokonaislukuna rekisteriin %rax.

Tehtävässä voidaan desimaalit unohtaa, eli vastaukseen riittää kokonaisosa. Pyöristä tulos alaspäin, eli 5/2 = 2.

VINKKI: Jakolasku a / b on kuinka monta kertaa sinun täytyy vähentää b luvusta a saadaksesi 0

Suorita toimenpide %rax = %rdi / %rsi.

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Merkkijonon pituus (1p)¶

Laske muistissa (osoitteesta 0x400) olevan merkkijonon pituus ja palauta se %rax-rekisterissä.

Merkit ovat ASCII-koodeja ja merkkijonon tässä (samoin kuin C-kielessä) päättää arvo 0.

Esimerkki. Merkkijono ABCD muistissa (heksadesimaalilukuina):

0400: 4100000000000000
0408: 4200000000000000
0410: 4300000000000000
0418: 4400000000000000	
0420: 0000000000000000

jolloin merkkijonossa on 4 merkkiä ja lopetusmerkki.Huomioi, että jokainen merkki vie 64 bittiä (1 muistipaikka).

Vinkki. Katso luentomateriaalista esimerkki .quad-käskystä, miten viedä dataa muistiin. Tarvitset
myös .pos- ja .align-käskyt testausta varten.

Keskiarvo (1p)¶

Laadi ohjelma, joka laskee pinossa olevien lukujen keskiarvon ja palauttaa sen %rax-rekisterissä. Jätä tehtävävastauksesta pois pinon paikan määrittely ja alustus, tarkistin tekee sen itse.

Vinkki. Sinun on käytettävä joko pinorekistereitä %rsp ja %rbp tai pushq- ja popq-komentoja.

Tallenna pinon keskiarvo rekisteriin %rax.

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

MaxMin (1p)¶

Toteuta y86-assembly-kielinen ohjelma, joka etsii pinossa olevista luvuista pienimmän ja suurimman ja tallentaa pienimmän luvun %rsi rekisteriin ja suurimman %rdi-rekisteriin. Jätä tehtävävastauksesta pois pinon paikan määrittely ja alustus, tarkistin tekee sen itse.

Tallentaa pienimmän pinon luvun %rsi rekisteriin ja suurimman %rdi-rekisteriin

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

"Assembling" Valoisuus (1p)¶

SensorTagin valoisuussensorin mittausarvon laskemiseksi 16-bittisestä rekisteristä piti rekisterin arvosta erottaa kaksi osaa E[3:0] ja R[11:0] käyttäen bittimaskia ja shiftausta.

Toteuta y86-assemblyllä ohjelma, joka tekee samat bittioperaatiot rekisterissä %r13 olevalle 16-bittiselle arvolle. Palauta bitit E[3:0] rekisterissä %r14 ja bitit R[11:0] rekisterissä %r13.

Referenssiksi valoisuussensorin rekisterikuvaus löytyy materiaalista ''' Harjoitus: Funktiot C-kielessä.

HOX:

Biitisiirto oikealle (kohti LSB:tä) toimii kyllä jakolaskulla, mutta miten sitä voisi optimoida niin ettei tarvitse tehdä ziljoona vähennyslaskua?. Saatat joutua suurentamaan jakajaa päästäksesi alle 10 000 konekielisen käskyn.
Bittisiirto vasemmalle (kohti MSB:tä) toimii toki kertolaskulla, mutta isoilla luvuilla se ei ole tehokasta. (Tässä saa ja kannattaa googlata jos ei keksi.)

INPUT REGISTER: %r13 OUTPUT REGISTERS: %r13 = R[11:0] and %r14 = E[3:0]

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Neliöjuuri (3p)¶

Laske neliöjuuri toteuttaen y86-assemblyllä ao. algoritmi.

Luku, jonka neliöjuuri lasketaan (koodiesimerkissä muuttuja num), annetaan rekisterissä r12 ja palauta tulos rcx-rekisterissä (koodiesimerkissä muuttuja res). Voit olettaa laskettavien lukujen olevan 16-bittisiä ja ainoastaan positiivisia.

// num is the number which square root is calculated
// res is the result
int32_t res = 0;
int32_t bit = 1 << 16; 

while (bit > num) {
   bit >>= 2;
   }
   
while (bit != 0) {
   if (num >= res + bit) {
      num -= res + bit;
      res = (res >> 1) + bit;
   } else {
      res >>= 1;
   }
   bit >>= 2;
}

Mikäli tulos ei mene "tasan", esitä tulos ilman desimaaleja alaspäin pyöristäen. Esimerkiksi sqrt(2345) = 48.425200051.. -> 48.

Hox! Voit toteuttaa algoritmin paremmin, jos ymmärrät sen toimintaperiaatteen. Muista, että jakolaskussa jakajan arvo voi olla suurempi kuin kaksi.

Hox 2! Algoritmia voidaan optimoida käyttämällä lookuptables, vaikka emme suosittele sitä tässä tehtävässä

%rcx = sqrt(%r12)

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Tehokkaampi kertolasku (2p)¶

Aikaisemmin toteutettiin kertolasku tyylillä summaa kertoja rekisteriin kerrottavan verran, joka on ilmeisen tehoton tapa toteutta kertolaskuja. Esimerkiksi laskutoimitus 8000*8000 vie 8000+ käskyä, kun sen toteuttaa summaussilmukalla.

Noo... miten kertolasku voitaisiin tehdä tehokkaammin? Yksi vastaus on Peasant binary-algoritmi.

Olet törmännyt tähän laskutapaan käydessäsi ala-astetta ja laskiessasi kertolaskuja allekkainlaskuna. Lähdetään siis samalla tavoin laskemaan esimerkkiämme kertomalla allekkain binääriluvut 101101 (45) ja 110010 (50).

      110010 
x     101101
------------
      110010
     000000  (kertoja 0)
    110010
   110010
  000000     (kertoja 0)
+110010
------------
100011001010

Havaitaan, että yksi iso kertolasku muuttuu bittisiirretyn kerrottavan summaamiseksi.

Käydäänpä kyseinen lasku läpi vaihe vaiheelta toisen esimerkin avulla, kun kerrotaan samat binääriluvut 101101 (45) ja 110010 (50) keskenään.

1. Binäärilukujen esitystapa.

(101101) * (110010) = ?

101101 = 1x2^5 + 0x2^4 + 1x2^3 + 1x2^2 + 0x2^1 + 1x2^0 = 45
       = 1x2^5 + 1x2^3 + 1x2^2 + 1x2^0
110010 = 1x2^5 + 1x2^4 + 0x2^3 + 0x2^2 + 1x2^1 + 0x2^0 = 50
       = 1x2^5 + 1x2^4 + 1x2^1

Koska jälkimmäisessä luvussa on vähemmän termejä, valitaan se tällä kertaa kertojaksi..

2. Huomataan, että kun kertojan bitti on nolla, sitä ei tarvitse huomioida koska 0 * n = 0. Nyt kertolasku saadaan muotoon:

(110010) x (101101) = (1x2^5 + 1x2^4 + 1x2^1) x (101101) = ?

3. Kertolaskussa sitten lasketaan jokainen termi yksi kerrallaan ja summataan ne:

(1x2^5) => 100000 x 101101 = 1440
              + 
(1x2^4) => 010000 x 101101 = 720
              + 
(1x2^1) => 000010 x 101101 = 90

Nyt  45 * 50 = 1440 + 720 + 90 = 2250

4. Yksittäiset termit voidaan vielä laskea kätevästi bittisiirron avulla. Esimerkiksi:

101101 x 100000 = (101101 << 5) = 10110100000

Tehokkaampi kertolasku voidaan siis toteuttaa seuraavasti:
1. Tarkastele kertojan bittejä yksitellen osatulojen laskemiseksi.
2. Kertojan bitin ollessa nolla on myös sitä vastaava osatulo nolla.
3. Kertojan bitin ollessa ykkönen, laske vastaava kertolasku kyseisen yksittäisen bitin ja kerrottavan välillä hyödyntäen bittisiirtoa.
3. Lopputulos osatulot summaamalla.

Toteuta ohjelma, joka laskee kertolaskun ylläkuvatulla menetelmällä. Kerrottavat luvut ovat rekistereissä %r11 ja %r12. Ohjelma palauttaa tuloksen %rax-rekisterissä.

%rax}} = {{{%r11 x {{{%r12}}. Kaikki luvut ovat aina positiivisia. Käytä vain tehtävän ohjeissa annettua algoritmia.

Syötä tiedostosi tänne:

Varoitus: Et ole kirjautunut sisään. Et voi vastata.

Anna palautetta

Kommentteja harjoituksista?