Een tekenset is een verzameling letters, cijfers, leestekens en symbolen. Meestal spreekt men ook van karakterset, een verbastering van de engelse term character set.
Vroeger maakten computers gebruik van de ASCII tekenset, die alleen letters, cijfers en enkele leestekens bevatte. Later kwamen er tekensets die ook bijvoorbeeld accenten en griekse tekens bevatten.
Er zijn veel verschillende tekensets, zoals ISO-8859-15, Windows-1252, UTF-8, UTF-16.
Op het ogenblik is UTF-8 de meest gebruikte tekenset. Deze tekenset bevat ruim tienduizend tekens waaronder Arabische, Chinese, Griekse en Russische (Cyrillische) tekens; een keur aan letters met accenten, valutatekens en kleine tekeningen.
Enkele tekens uit de tekenset UTF-8 zijn:
£ ¥ ƒ €
Omdat met de UTF-8 karakterset bijna alle tekens kunnen worden getoond, is het aan te raden webpagina's hierop in te stellen. Dat gaat als volgt:
Strikt genomen is dit niet nodig, UTF-8 is de standaard tekenset in HTML5. Maar deze regel geeft een extra zekerheid dat alle tekens juist worden weergegeven in de browser.
Opmerking:
Als de editor per ongeluk staat ingesteld op een andere karakterset zie je waarschijnlijk dat letters met accenten en andere bijzondere tekens in de browser onjuist worden weergegeven.
In Notepad++ is dat als volgt op te lossen:
Hoe kunnen al die tekens worden ingetikt? Het toetsenbord heeft maar ongeveer 100 toetsen.
Dat is opgelost door elk teken een code te geven. Sommige tekens hebben ook een entiteit (zeg aar een 'naam'). Door de code of entiteit in te tikken plaats je het teken.
Aan de hand van de onderstaande tabel met 69 van de 10.000 tekens wordt e.e.a. uitgelegd.
De kolommen in de tabel stellen het volgende voor:
Voor een overzicht van alle beschikbare tekens zie de HTML UTF-8 referentie van W3-schools.
teken | decimaal | hexadecimaal | entiteit | omschrijving |
---|---|---|---|---|
  | 160 | 00A0 | | harde spatie (houdt woorden bijeen) noot 1 |
173 | 00AD | ­ | afbreekstreepje (alleen zichtbaar als een woord daar afgebroken wordt) noot 2 | |
‑ | 8209 | 2011 | hard streepje (hier wordt niet afgebroken) noot 3 | |
£ | 163 | 00A3 | £ | engels pond |
¥ | 165 | 00A5 | ¥ | japanse yen |
ƒ | 402 | 0192 | ƒ | gulden |
€ | 8364 | 20AC | € | euro |
α | 945 | 03B1 | α | alfa |
β | 946 | 03B2 | β | beta |
φ | 966 | 03C6 | φ | phi |
← | 8592 | 2190 | ← | pijl naar links |
↑ | 8593 | 2191 | ↑ | pijl omhoog |
→ | 8594 | 2192 | → | pijl naar rechts |
↓ | 8595 | 2193 | ↓ | pijl omlaag |
↔ | 8596 | 2194 | ↔ | pijl links-rechts |
↕ | 8597 | 2194 | pijl omhoog-omlaag | |
⇄ | 8644 | 21C4 | pijl rechts boven pijl links | |
⇐ | 8656 | 21D0 | ⇐ | dubbele pijl naar links |
⇑ | 8657 | 21D1 | ⇑ | dubbele pijl omhoog |
⇒ | 8658 | 21D2 | ⇒ | dubbele pijl naar rechts |
⇓ | 8659 | 21D3 | ⇓ | dubbele pijl omlaag |
⇔ | 8660 | 21D4 | dubbele pijl links-rechts | |
⇕ | 8661 | 21D5 | dubbele pijl omhoog-omlaag | |
▲ | 9650 | 25B2 | zwarte driehoek omhoog | |
△ | 9651 | 25B3 | witte driehoek omhoog | |
▶ | 9654 | 25B6 | zwarte driehoek naar rechts | |
▷ | 9655 | 25B7 | witte driehoek naar rechts | |
▼ | 9660 | 25BC | zwarte driehoek naar omlaag | |
▽ | 9661 | 25BD | witte driehoek naar omlaag | |
◀ | 9664 | 25C0 | zwarte driehoek naar links | |
◁ | 9665 | 25C1 | witte driehoek naar links | |
☎ | 9742 | 260E | telefoon (zwart) | |
☏ | 9743 | 260F | telefoon (wit) | |
☑ | 9745 | 2611 | vinkje | |
☚ | 9754 | 261A | zwarte hand wijst naar links | |
☛ | 9755 | 261B | zwarte hand wijst naar rechts | |
☜ | 9756 | 261C | witte hand wijst naar links | |
☝ | 9757 | 261D | witte hand wijst omhoog | |
☞ | 9758 | 261E | witte hand wijst naar rechts | |
☟ | 9759 | 261F | witte hand wijst naar omlaag | |
☰ | 9776 | 2630 | teken voor menu | |
☺ | 9786 | 263A | lachebekje | |
♫ | 9835 | 266B | muzieknoten | |
♠ | 9824 | 2660; | ♠ | schoppen |
♣ | 9827 | 2663 | ♣ | klaver |
♥ | 9829 | 2665 | ♥ | harten |
♦ | 9830 | 2666 | ♦ | ruiten |
♔ | 9812 | 2654 | schaken: witte koning | |
♕ | 9813 | 2655 | schaken: witte koningin | |
♖ | 9814 | 2656 | schaken: witte toren | |
♗ | 9815 | 2657 | schaken: witte loper | |
♘ | 9816 | 2658 | schaken: wit paard | |
♙ | 9817 | 2659 | schaken: witte pion | |
♚ | 9818 | 265A | schaken: zwarte koning | |
♛ | 9819 | 265B | schaken: zwarte koningin | |
♜ | 9820 | 265C | schaken: zwarte toren | |
♝ | 9821 | 265D | schaken: zwarte loper | |
♞ | 9822 | 265E | schaken: zwart paard | |
♟ | 9823 | 265F | schaken: zwarte pion | |
✉ | 9993 | 2709 | envelop |
Er zijn drie manieren om een teken uit de tabel in een tekst op te nemen, met de entiteit, met het decimale nummer en met het haxadecimale nummer.
Hieronder worden de 3 manieren uitgewerkt voor het teken ♥ (entiteit:
Als het teken een entiteteit heeft is dit de gemakkelijkste manier. Geef gewoon de entiteit op:
Geef achtereenvolgens op:
Geef achtereenvolgens op:
Letters met accenten kan je op een Windows machine intikken zoals bij de meeste tekstverwerkers: tik het accent, gevolgd door de letter:
Als deze methode niet werkt kan je de letters met accent altijd opgeven met de entiteit.
De entiteit van een letter bestaat uit & letter accentnaam ;.
De accentnamen zijn: ´ acute, ` grave, ¨ uml. ˆ circ, ˜ tillde.
Als twee woorden worden gescheiden door een harde spatie zullen de woorden bij elkaar blijven op dezelfde regel. De regel zal daar niet worden afgebroken.
In HTML worden verschillende spaties achter elkaar gecomprimeerd tot één spatie. Bij harde spaties is dat niet het geval.
Een afbreekstreepje of zacht streepje (
Degene die de entiteitnaam ­ (verlegen) heeft bedacht had humor!
Het getal kan worden afgebroken op elke plaats waar het teken ­ staat, bijvoorbeeld zoals hier: Eenentwintigmiljoenachtenzestigduizenddriehonderdvijfenzeventig.
(Maak het venster smaller om te zien hoe de plaats waar wordt afgebroken verandert.)
Een hard streepje (‑) wordt altijd getoond en de regel wordt er nooit afgebroken.
Op de plaats van het streepje zal de regel niet worden afgebroken.