Tekst kan gedigitaliseerd worden door elk teken een bepaald nummer te geven.
Er is een afspraak gemaakt over die nummering, zodat iedereen dezelfde nummering gebruikt, dat is geregeld door de
ISO (International Organization for Standardization).
Die organisatie heeft een heleboel afspraken geregeld, ook over
natuurkundige eenheden, enz. Dat noem je standaardisering.
Die standaard nummering staat in een tabel die de ASCII-tabel wordt genoemd. ASCII staat voor American Standard Code for
Information Interchange.
Toen de ASCII-code werd afgesproken werden er 7 bits gebruikt voor de codering, zodat er maar 128 verschillende tekens konden worden
gecodeerd.
Dat bleek genoeg te zijn voor de tekens uit het standaard Engels en de andere symbolen die op een
toetsenbord aanwezig zijn.
Maar andere talen maken van andere tekens gebruik, daarom werden er 8-bits ASCII-tabellen gemaakt zodat er 256 tekens konden
worden gecodeerd.
Dat noemde men onder DOS Extended ASCII, en bij Windows de ANSI-code (American National Standards Institute), maar die twee zijn
jammer genoeg niet gelijk.
Er bestaat dus geen standaard voor die laatste 128 tekens, maar voor de eerste 128 gelukkig wel.
De eerste 32 tekens van standaard ASCII zijn zogenaamde stuurtekens, en die worden meestal met een
afkorting aangeduid.
Een paar bekende stuurtekens zijn: 10 = LF (Line Feed), 13 = CR (Carriage Return), 7 = BELL (piepje), 27=ESC
Wanneer woorden door een computer worden gesorteerd, gebeurt dit volgens het ASCII alfabet.
Dus hoofdletters vóór kleine letters, en kleine letters staan voor geaccentueerde
letters, en de spatie komt allereerst.
Als je onder windows een teken nodig hebt dat niet op het toetsenbord staat, dan kun je dat krijgen door op het
numerieke toetsenbord
de decimale ASCII-code in te tikken, terwijl je de Alt-toets ingedrukt houdt.
Je krijgt dan een teken uit de Extended ASCII tabel, maar als je de ASCII-code laat voorafgaan door een 0 krijg je de ANSI code.
Zo maak je een ç met alt+135 en een € met alt+0128.
Elk teken heeft dus een ASCII-code, dat is een getal van 0 tot en met 255, en er wordt dus één byte per teken
gebruikt.