Introduction à l'assembleur RiscV

Cours de 15h initialement donné pour les 4èmes années mobilité et objets connecté de l'ESGI en 2019 et 2020.

Dans ce cours, nous allons découvrir les bases de l'assembleur RiscV, il s'agit d'un jeu réduit il y a peu d'instructions comparé à Intel nous verrons que cela n'est pas un problème en soit.

Par exemple comment le processeur, charge des données de la mémoire, les traite à l'aide d'instructions et les écrit dans la mémoire.

Note : Nous verrons plus tard que nos ordinateurs modernes Exploitent le concept du programme «stocké» en mémoire. Le programme peut donc être vu comme une donnée en mémoire.

Nous verrons en ouverture la mémoire virtuelle, les entrées/sorties avec les périphériques très succinctement et le pipelining.

Préambule

Afin de se préparer et de commencer avec un support sympa je vous recommande très fortement le Crash Course Computer Science de Carrie Anne Philbin disponnible sur Youtube, les chapitres 1 The Mechanics of How Computers Work et 3 Computer Hardware donnent une bonne introduction des concepts du cours.

Je vous encourage à regarder le reste par curiosité.

Exercices - Notes

Dans ce cours il est indispensable de faire les exercices, je demanderais donc que vous forkiez ce dépot et réalisiez quotidiennement les exercices.

Il y aura aussi un qcm et des devoirs maisons raisonnables. Concernant projet ou examen avec le confinnement je dois contacter la direction pédagogique pour décider.

Contexte

Assembleur c'est quoi

Nos ordinateurs ne mangent pas de JavaScript, ni de C, ni du Rust directement, ils executent de l'assembleur et soit vous compilez vers l'assembleur comme en Rust, C, C++ soit vous utilisez un compilateur Juste à Temps (JIT), soit vous interpretez un jeu d'instruction haut niveau. Mais au final votre processeur lui ne vois que du code machine.

L'assembleur, sous la forme de code machine est ce que nos processeurs executent, des séries de 0 et de 1 organisé sous la forme d'un mot machine d'un nombre de bit définit. Dans notre cas pour le RiscV les mots seront de 32 bits, certains jeux d'Instructions tel Intel x86_64 ont des jeux à taille de mot variable et beaucoup plus d'instructions.

Nous manipuleront une forme textuelle de l'assembleur qui sera traduit en code machine par un programme dit assembleur.

Ces mots permettent de manipuler la mémoire, les registres qui sont l'unité de mémoire du processeur, dans ces mots les bits sont organisé pour avoir un sens, plusieurs formats existent pour pouvoir encoder différentes choses, comme de la manipulation de mémoire, une addition ou une comparaison ou un saut.

Mise en pratique

Dans ce le cadre de ce cours nous allons utilisers le logiciel Rars RISC-V Assembler and Runtime Simulator, afin de visualiser ce qui se passe. Malheureusement nous n'aurons pas de hardware RiscV ce sera plus l'année prochaine, mais il existe des cartes de developpement avec un processeur RiscV.

Rars est un simulateur permetant d'executer du RiscV comme si il y avait un OS sout-jacent, l'interet de Rars est de pouvoir visualiser toutes les interactions avec la mémoire de façon visuelle. Nous utiliseront la version 1.4 il vous faudra OpenJDK version égale ou supérieur à 8 ou Java de Oracle.

Prise en main de Rars

Voici un exemple concret et notre premier programme, ce premier programme additionne deux nombre et sauvegarde le résultat dans un registre.

Ici on veux additionner 32 avec 10 et à la fin le résultat sera dans le registre t0 voici deux façons naives de faire en C, Rust et RiscV.

En Rust on aurait fait:

let mut a = 32;
a += 10;

En C:

int a = 32;
a += 10;

Et en RiscV

mon-code:
#        / 32 est un immédiat c'est à dire on encode 32 dans l'instruction.
li   t0, 32
#     \ t0 est un registre
addi t0, t0, 10  # Puis additionne l'immédiat 10 à ce registre.

Dans le programme ci-dessus on voit des éléments typiques d'un assembleur:

Des instructions : li et add
Des immédiats : 32 et 10 ce sont des entiers directement encodés dans l'instruction finale
Un registre : t0, manipule en lecture et écriture.
Un labels : mon_code qui permettent de nommer une adresse dans le programme ici il pointe sur notre li.

Dans Rars ça devrait donner ça: .

Instructions présentées au dessus.

li: Pseudo instruction qui charge dans son registre de destination un immédiat sur 12 bit si signé ou 32 bits si non signé addi: Additionne son registre de source à un immédiat sur 12 bits et assigne le résultat dans son registre de destination.

Une fois que vous aurrez assemblé votre programme vous devriez voir ça: .

Question: À la fin du programme quelle valeur contiens le registre t0 ?

Architecture RiscV

Dans ce cours nous allons utiliser le jeu d'instruction Risc-V, il s'agit d'une architecture d'ordinateur à jeu d'instruction ISA Instruction Set Architecture dite _Reduced Instruction Set Computer (RISC) _, c’est-à-dire à un processeur avec un jeu d'instruction réduit et régulier avec peu de formats.

A titre d'exemple l'architecture externe des processeurs est de type Complex Instruction Set Computer (CISC).

Note: Pour votre curiosité dans la réalisation interne d'un processeur x86_64 les concepteurs s'arrangent pour obtenir un jeu interne RISC car c'est plus facile à optimiser et maintenir.

Registres

En assembleur RiscV, on manipule explicitement des petites unités de mémoire disposées dans le processeur nommé des registres, il y en a 32 accessibles dans le jeu d'instruction de base.

Note: Les registres ont pour double but de contourner la «hiérarchie des temps d'accès à la mémoire» et aussi de facilité la réalisation hardware du processeur.

Numéro	Nom	Description	Sauvegarde
x0	zero	Vaut toujours 0
x1	ra	Adresse de retour	Appelant
x2	sp	Pointeur de pile	Appelée
x15	gp	Pointeur global
x4	tp	Pointeur de thread
x5	t0	Temporaire	Appelant
x6-x7	t1-t2	Temporaire	Appelant
x8	s0/fp	Registre à sauvegarder / ancien sommet de pile	Appelée
x9	s1	Registre à sauvegarder	Appellée
x10-x11	a0-a1	Arguments de fonction ou valeur de retour	Appellant
x12-x17	a2-a7	Arguments de fonctions	Appellant
x18-x27	s2-s11	Registre sauvegarder	Appellée
x28-x31	t3-t6	Vaut toujours 0	Appellant

Le tableau ci-dessus est inspiré par la page wikipédia riscV et le chapitre 18 sur les conventions d'appel de la spécification du jeu d'instruction.

Certains registres ont un usage particulier tel que: ra, sp, gp tp on ne les utilisera pas dans la majorité des cas directement. Le registre zero à toujours la valeur 0.

On vera que certains doivent être sauvegardé si besoin lors des appels de fonctions par la fonction qui appelle une autre, et la fonction qui est appelée.

Aller Plus loin: D'autres jeux de registres sont accessibles dans des extensions du jeu d'instructions RiscV notamment pour les calculs en virgule flottante ou bien le jeu privilégié utile quand on réalise un OS ou programme pour des microcontrôleurs.

Instructions

Comme nous l'avons vu en RiscV on utilise des instructions pour manipuler les registres et la mémoire, les instructions sont représentées sous la forme de valeurs binaires sur par exemple 32 bit.

Par exemple le programme suivant:

li   t0, 32     # Ce programme charge 32 dans le registre t0
addi t0, t0, 10 # Puis additionne 10 à ce registre.

Ce petit programme assembleur une fois en code machine équivaut aux mots de 32bits,0x02000293 et 0x00a28293 si on décompose ça donne ça :

Format	31-28	27-24	23-20	19-16	15-12	11-8	7-4	3-0
Hex	0	2	0	0	0	2	9	3
Bin	0000	0010	0000	0000	0000	0010	1001	0011
Hex	0	0	a	2	8	2	9	3
Bin	0000	0000	1010	0010	1000	0010	1001	0011

Note: C'est le concept du programme stocké ou "stored program concept", cette suite de valeur binaire qui forme un programme est stocké dans la mémoire.

Aller plus loin : C'est une simplification pour aller plus loin je vous recommande de lire sur la mémoire virtuelle, je vous recommande le livre "Operating System : Principles and Practice" Thomas Anderson and Michael Dahlin.

Il existe des instructions pour faire différentes opérations nous allons en voir une partie ensemble

Certaines des instructions que nous avons manipulées tel que mv qui copie un registre dans un autre et li qui charge un immédiat, ou la qui charge une adresse sont des pseudo-instructions, c’est-à-dire qu’elles ne sont pas réalisées par le hardware, elles ont vocations à être décomposé en instructions plus élémentaires.

Par exemple mv t1, t0 est décomposé en un add t1, zero, t0.

On verra dans la partie Formatage binaire des instructions pourquoi mv et li ne sont pas réalisés par notre jeu d'instruction.

Mémoire

Comme vu l'avez peut-être vu en C on représente la mémoire comme un espace, allant de l'adresse 0x0000_0000 jusque à l'adresse 0xFFFF_FFFF pour un programme 32 bits.

Voici d'ailleurs une vue d'ensemble mémoire et code d'un programme assembleur: .

Segments

Dans nos programmes on décompose cet espace en segments par exemple pour le code est le segment: .text pour les données du programme connues avant l'exécution c'est le segment .data.

Aller plus loin : Il existe d'autres segments tel que .bss beaucoup sont liée au système d'instruction plus que au jeu d'instruction.

Par exemple la pile est un segment particulier, qu'on utilise pour stocker des variables locales et conserver la valeur des registres entre les appels de fonctions ou appel au système d'exploitation.

Adresses en l'assembleur

Dans nos programmes assembleurs on manipulera des adresses souvent. Les labels nous servirons à marquer une adresse particulière pour sauter dessus ou pour charger une valeur dans le segment .data.

Ou alors on utilisera le registre, sp qui marque le sommet de la pile pour sauvegarder la valeur de nos registres. Le registre gp ou ra sont utilisés calculer des jumps relatifs dans le programme. Il existe aussi le programme counter qui contiens l'addresse de l'instruction courante.

Instruction arithmétique et logique

Comming soon.

Instructions Mémoire

Pour faire un programme sur une machine de Turing tel que notre processeur, il nous faut une mémoire, nos registres sont une forme de mémoire mais c'est assez limitant 32 mots de 32bits.

Notre processeur a donc besoin d'instructions pour manipuler la mémoire de notre ordinateur. C'est le but des instructions de stockage (store) et de chargement (load) mémoire.

Note : En riscV la mémoire est toujours alignée sur un multiple de 4 et on ne peut pas accéder sur autre chose que un multiple de 4.

Charger une adresse dans un registre

la registre_destination, label

Pseudo-instruction permettant de charger l'adresse d'un label dans un registre.

Elle se décompose en l'instruction aiupc et souvent un add, l'idée est de construire une adresse relative au pointeur de code pc, c'est pour des questions de praticité dans la réalisation du hardware et des compilateurs.

Exemple:

la t0, my_address # t0 contiendra l'adresse pointé par my_address

Load instructions

lw registre_destination, offset(registre_source)

Cette instruction charge dans un registre de destination le contenu dans la mémoire à l'adresse contenue dans le registre source un offset peut être additionné à l'addresse dans le registre source.

Équivalent en C:

int a[2] = { 42, 1 }; // On réserve un array de 2 mot de 32bits.
int b = a[0];         // On récupère 42
int c = c[1];         // On récupère 1

.data
myInt: .word 42, # On réserve un mot de 32 bits pour stocker un entier.

.text
la t0, myInt # On charge dans t0 l'adresse de myInt.
lw t1, 0(t0) # On charge la valeur pointée par t0 dans t1 donc 42.
lw t2, 4(t0) # On récupère ici 1.

Pour incrémenter un sur un tableau de mots de 32bits on avance de 4 en 4.

lh registre_destination, offset(registre_source)

Comme lw mais on charge et adresse des demis mots de 32 bits donc 16 bits.

Pour incrémenter sur un tableau de mot de 16bits on avance de 2 en 2.

lb registre_destination, offset(registre_source)

Comme lw mais on charge et adresse des quarts de mots de 32 bits donc 8bits, c'est très utilisé pour manipuler des chaines de caractères ASCII.

Pour être concret voici un C :

char s = "chat"; // On déclare une chaine de caractère.
char c = s[0];   // on récupère le c.
char b = s[2]    // on récupère le a.

Il peut lieu à un schéma de compilation comme celui-là:

.data
s: .string "chat"

.text
la t0, s     # t0 contient l'adresse de base de notre chaine!
lb t1, 0(t0) # t1 contient 'c'
lb t2, 2(t0) # t2 contient 'a'

Note: Pour l'incrémentation sur un tableau de mots de 8bits (char) on avance de 1 en 1.

Store instructions

sw lb registre_destination, offset(registre_source)

Permet de d'écrire dans la mémoire un mot de 32 bit contenu dans votre registre de destination à l'adresse contenue dans le registre source plus un offset.

La mémoire est adressable de de 4 en 4.

Exemple de code pour stocker un mot

.data
myInt .word 0

.text
la t1, myInt # t1    <- myInt
li t0, 42    # t0    <- 42
sw t0, 0(t1) # M[t1] <- t0

sh lb registre_destination, offset(registre_source)

Écrire un 16 bits un demi-mot dans la mémoire c'est utile pour gérer du hardware. La mémoire est addressable de 2 en 2.

sb lb registre_destination, offset(registre_source)

Cette instruction permet d'écrire un byte 8bits dans la mémoire c'est utile pour gérer des caractères ou du hardware.

la mémoire est adressable de 1 en 1.

Instruction de Branchements

Pour pouvoir écrire des programmes en fonctions de résultats de vos calculs, il faut pouvoir «choisir» quel code executer selon un résultat, il s'agit des instructions de branchement. Dans nos langages hauts niveaux ont fait ça avec des boucles, for, loop, if, else, des appels de fonctions voir des exceptions.

Cas particulier: le match de Rust ou swift ou le switch-case en C, Javascript etc. Est un peu différent en terme de comment on le compile par rapport à un if.

Pour réaliser cela nous avons à notre disposition des instructions de branchement conditionnelles et non conditionnelles, l'idée générale est de sauter en fonction d'un test sur plusieurs registres à une adresse via son label ou à un registre.

Branchements non conditionnels (Jumps)

Pour faire des sauts inconditionnel il existe la pseudo instruction:

j label

li t0, 42
j my_exit # On saute à my_exit directement

# Ici cette instruction ne sera jamais executé :(
add t0, t0, 1

my_exit:
# t0 vaut donc 42 ici.

jal jump and link, instruction qui sauvegarde l'addresse ou on était et saute au label, très utile pour lorsque nous feront des fonctions.

jal reg_save_addr, label

Not: En réalité j est réalisé par un jal x0 label on sauvegarde pas l'addresse courante avant le saut et on saute! ;)

Branchements conditionnels

Format	Signification
beq	Branch if equal
bge	Branch if greater than or equal
bgeu	Branch if greater than or equal (unsigned)
blt	Branch if less than
bltu	Branch if less than (unsigned)
bne	Branch not equal

Ici le format est très régulier entre toutes ces instructions vous aurrez toujours:

branch_instruction op1 op2 label

Ça permet de réaliser les branchements utiles pour faire des programmes.

Affectation conditionnelles

Comming Soon

Appel systèmes

Un appel système ou syscall est une sorte de fonction spéciale que propose le système d'exploitation, cet appel s'exécutera en suspendant l'exécution du programme courant.

Pour les appeler on utilise l'instruction :

ecall

ecall est l'instruction qui permet de déclencher une exception, qui force le processeur à interrompre ce qu'il fessait pour sauter dans le code de gestion des exceptions du noyau de notre système d'exploitation.

Pour passer des arguments aux appels systèmes syscalls, on les passe par les registres a0, a1, a2 à a3, on charge dans le registre a7 le numéro qui renseigne l'appel système désiré et ensuite on utilise ecall.

Exemple:

li  a7, 1 # le syscall 1 permet d'afficher un entier
li a0, 42
ecall     # On peut lire 42 dans la console de Rars.

Note : Dans nos programmes C, JavaScript, etc. bien souvent on passera par l'abstraction de la libC pour faire appel aux services du noyau au lieu de directement faire des ecall.

Note : Cette convention d'appel avec le noyau dépends de l'OS !

Aller plus loin: Pourquoi avoir une instruction pour «appeller» le système d'exploitation? Car il s'execute avec des droits étendus sur l'ordinateur et a access à des instructions privilégiées: https://content.riscv.org/wp-content/uploads/2017/05/riscv-privileged-v1.10.pdf

Formatage binaire des instructions

En RiscV les instructions sont divisées en 6 formats:

Format R : Instructions de manipulation registre à registre ex: add, sub, sll, slt, sltu, xor
Format I : Instructions avec un immédiat 11 bit ex: lw, lh, lb, jalr
Format S : Instructions d'écriture mémoire ex: sw, sh, sb
Format SB : Instructions de branchement relatifs ex: beq, bne, bge, blt, bltu, bgeu
Format U : Instruction avec le haut d'un immédiat sur [31:12] ex: aiupc, lui
Format UJ : Instructions de branchement sur un registre ex: jal

Référence: Si vous voulez en savoir plus je vous recommande le chapitre 7 du cours «cs61c» de l'université Berkley par Steven Ho ~45 min de lecture à tête reposée.

Fonctions et conventions d'appels

Une fonction c'est juste un ensemble d'instructions «regroupé», pour l'utiliser on «saute» à son adresse de début puis on en revient une fois fini. Pour sauter, facilement au début de ce bloc, on nomme les entrées d'un suite d'instructions à l'aide de label/étiquette.

Les fonctions peut être écrite par des personnes différentes directement en assembleur, ou même résulter des compilations sous format de fichier objet .o provenant de compilateurs différent.

Il n'est pas possible de seulement définir pour 2 personnes une convention pour communiqué, notamment car il n'y pas forcément de relation/communication entre les différents programmeur, par exemple dans le cas de librairie de code.

Pour résoudre ce problème, une convention stardard, appellé Aplication Binary Interface est défini selon au moins :

jeux d'instruction
format du binaire
système d'exploitation
des détails hardware par exemple la gestion des flottants.

Nous concrétement en RiscV on utilise l'ABI riscv-elf-linux.

Pour revenir à notre fonction somme son code pourrais ressembler de façon optimiser :

# a0: Addresse d'itération sur le tableau
# a1: Taille du tableau
somme:
    mv   t2, zero     # sum <- 0
    beqz a1, end_loop # size == 0?

    slli a1, a1, 2    # size <- (size * 4)
    mv   t0, a0       # @fin <- @base
    # Calcul adresse de fin du tableau
    # @fin <- @base + (size * 4)
    add  t0, a0, a1 # @Fin <- @base + size

# Notre boucle qui fait la somme.
loop:
    lw   t1, 0(a0)    # val <- *iterateur
    addi a0, a0, 4    # @iterateur + 4
    add  t2, t2, t1   # somme += val
    bne  t0, a0, loop # @iterateur == @fin

end_loop:
    mv   a0, t2  # On copie sum dans le registre de retour
    jr   ra, 0   # On retourne dans la fonction qui avait appellée somme

Et le code pour appeller somme à:

array: .word 1, 1, 1

.text

# On charge les paramètres pour appeller somme
# a0: contiens l'adresse du tableau
# a1: contiens la somme
la a0, array
li a1, 3
jal somme

# print result of sum contained in a0.
li a7, 1
ecall

# call exit pour terminer le programme.
li a7, 10
ecall

somme ici est une fonction dite terminale, elle n'appelle pas d'autres fonctions donc on à pas besoin de sauvegarder le contenu des registres et on à utiliser que des registres temporaires et à sauvegarder par l'appellant dans le corps de somme.

Cependant il s'agit d'une optimisation un compilateur C sans aucune optimisation aurait produit un code avec une sauvegarde des registres sur la pile.

highclaws/esgi-riscv