Hoofdstuk 1: Werken met tekst
Voor woordbetekenissen, zie Glossary.
Karaktersets
Als het gaat om karakters, kan er onderscheid gemaakt worden op de dimensies vorm en inhoud.
De vorm van karakters is de manier waarop een gebruiker het karakter ziet. Zo kan de t worden
weergegeven als T, t of T. De betekenis (inhoud) van het letter, verandert niet als de vorm verandert.
Wanneer we alleen kijken naar de inhoud van een karakter en niet naar de vorm, spreken we van
een abstract karakter.
Om een tekst digitaal weer te geven, is het noodzakelijk een manier te vinden om abstracte karakters
om te zetten in waarden die kunnen worden opgeslagen in een computer. We kunnen alleen
patronen van bits opslaan.
Combinaties van bits vormen getallen. Door aan een geval een betekenis toe te kennen, wordt het
mogelijk om een computer informatie te laten begrijpen. In het geval van karakters wordt elk
karakter vertegenwoordigd door en eigen getal. De verzameling getallen die samen alle karakters
beschrijven, noemt men een karakterset.
Om tekst weer te geven en er bijvoorbeeld bepaalde zoekacties op uit te voeren. Hoeft een
karakterset niet gestructureerd te zijn. De karakters moeten corresponderen met een willekeurig
uniek getal.
Toch heeft het voordelen om met meer structuur of standaarden te werken. Het is beter werkbaar
voor de computer als de getallen niet al te groot zijn. Daarnaast kan het bepaalde (sorteer)taken
vergemakkelijken als opeenvolgende karakters ook opeenvolgende getallen toegewezen krijgen.
Standaarden
Standaardisering van karaktersets is van belang om ze uitwisselbaar te maken tussen verschillende
systemen en platformen.
ASCII en EBCDIC
Begin jaren 60 ontwikkelde IBM een eigen standaard, de EBCDIC. Deze standaard werd vooral
gebruikt voor besturingssystemen en servers. Bij EBCDIC zijn 256 karakters gedefinieerd, in een
8-bitscodering. Dit betekent dat elk karakter uit een reeks van 8 bits bestaat. Veel bedrijven met
legacy-applicaties hebben nog met deze standaard te maken.
Sinds de jaren 70 is ASCII (American Standard Code for Information Interchange) de meest gebruikte
karaktersetstandaard.
Bij ASCII zijn de getallen 0 – 31 en 127 toegewezen aan bewerkingskarakters zoals knippen/plakken
en delete. De andere getallen staan voor printbare getallen zoals het alfabet. Er zijn verschillende
varianten voor verschillende landen, omdat er ook bijv. symbolen in talen kunnen zitten. Dit zorgt
ervoor dat een tekst in de standaard voor Amerikaans Engels niet geheel correct overkomt in Brits
Engels.
Een manier om dit te ondervangen is door de 7-bits ASCII, die de range van 0 – 127 aankan, te
vervangen door een 8-bits variant, die van 0-255 aankan.
Daarbij wordt de 0-127 range toegewezen aan de ASCII zoals die in de bijlage, de range 128-255
wordt dan gebruikt voor alle denkbare leestekens, symbolen en accenten, zodat 1 variant volstaat
voor alle landen die dat alfabet gebruiken.
,De 256 codepunten blijken overigens niet genoeg om alle talen te bedienen.
Ondanks deze standaardisatie worden karakters nog steeds verschillend toegewezen door
platformen, waardoor de compabiliteit tussen Windows en Mac moeilijk blijft.
Unicode en ISO 10646
De enige echte oplossing hiervoor is om meer dan 8-bit te gebruiken voor elke waarde. Een 16-bits
karakterset heeft 65.536 codepunten en kan daarmee 256 varianten van een 8-bit karakterset
tegelijkertijd aan. Een 24-bits karakterset kan 256 16-bits karaktersets aan, etc. Zo ontstaan er
enorme, meer dimensionale karaktersets met subsets, zoals de ISO 10646.
Daarnaast wordt Unicode veel gebruikt. Deze is 16-bits en heeft 65.536 codepunten. Dit is niet
genoeg om ook alle Chinese, Japanse en Koreaanse tekens erbij te betrekken. Dit is opgelost door
alle karakters in deze talen (die dezelfde oorsprong hebben) die er hetzelfde uitzien ook hetzelfde
getal toe te wijzen, ongeacht de betekenis.
Daarmee omvat Unicode alle tekens die de belangrijkste talen gebruiken, evenals klassieke varianten
daarvan. Het is wel beperkt tot tekst, muzieknotaties of andere symbolische schriftvormen zijn er
niet in meegenomen.
Het is wel mogelijk om de Unicode-standaard nog verder aan te passen, zodat er meer karakters
aangeboden kunnen worden. Daarnaast kan het helemaal aansluiten bij de ASCII-codering voor alle
ASCII-karakters. Hiervoor worden UTF’s (UCS Transformation Formats) gebruikt. Vooral UTF-8, dat
voor alle ASCII-karakters exact dezelfde codering gebruikt is bekend. Deze karakterset wordt
standaard gebruikt op internet.
Lettertypen
Om tekst te kunnen weergeven, moet elk opgeslagen karakter worden omgezet in een visuele
weergave. Deze kan verschillende verschijningsvormen hebben. Een set van letters in een bepaalde
verschijningsvorm wordt een lettertype genoemd. Deze kunnen zakelijk, maar ook sierlijk zijn.
Terminologie
De grootte van een letter wordt doorgaans weergegeven in punten, ofwel pt. Een punt is 1/72 inch,
wat gelijk staat aan 0,3528 mm. Voor de afstand tussen lijnen van een tekst wordt pica (pc) gebruikt.
Dit staat gelijk aan 12 pt.
Digitale tekst wordt net als in een schrift op een (denkbeeldige) lijn geschreven. Dit heet de baseline.
De ruimte tussen de baseline wordt de leading genoemd. Een standaard die wordt genomen. Is de
afstand tussen de baseline en de bovenkant van de kleine x.
Letters met uitsteeksels boven de x-hoogte, zoals bijvoorbeeld de h, worden ascenders (stijgers)
genoemd. Letters die aan de onderkant uitsteken, zoals de p, worden descenders genoemd (dalers).
De hoogte van hoofdletters wordt de capheight genoemd.
Soms zijn er extra maatregelen nodig om te zorgen dat opeenvolgingen van letters er goed uit komen
te zien, dat wil zeggen om ervoor te zorgen dat het lijkt of de witruimte tussen de letters goed
verdeeld is. Hierdoor is het nodig om tussen twee smalle letters de witruimte te verkleinen, zoals bij
de i. Het aanpassen van witruimte in een proportioneel lettertype om letters beter te verdelen heet
kerning.
,Soms is het niet mogelijk om in een lettertype vast te leggen hoe de witruimte geregeld moet
worden; voor dat soort gevallen worden ligaturen gebruikt. Dat zijn opeenvolgingen van letters die
als 1 karakter in een font zijn opgenomen, bijvoorbeeld bij letters die in elkaar overlopen.
Soorten lettertypen
Er zijn duizenden lettertypen die ieder een eigen karakter hebben. Toch zijn er classificatie
eigenschappen.
Monospaced font en proportioneel font
Een belangrijk onderscheid is dat tussen monospaced lettertpen, waarbij de afstand tussen elke
letter even groot is (bijv Courier) en de proportionele lettertypen, waarbij de afstand tussen letters
wordt aangepast om een mooi en prettig lezend geheel te krijgen (Times New Roman).
Serif en sans serif
Een ander onderscheid is dat tussen serif en sans serif (met of zonder schreef). Daarmee worden
kleine streepjes aan de uiteinden van de letters bedoeld. Er is geen eenduidig bewijs welke van de
twee leesbaarder is.
Recht en cursief
Elk lettertype kan cursief gemaakt worden, maar hier worden lettertypen die standaard naar rechts
hellen bedoeld, zoals Monotype Corsiva.
Display fonts en text fonts
Een lettertype kan ook subjectief ingedeeld worden op basis van het type toepassing waar het
lettertype het meest voor geschikt is. Een boodschap die speciale aandacht moet trekken, gebruikt
een ander lettertype dan een zakelijke brief.
Lettertypen die geschikt zijn voor lange stukken tekst zijn text fonts. Lettertypen geschikt voor
posters, folders, etc. noemen we display fonts.
Technologie van lettertypen
Er zijn een aantal factoren die beïnvloeden of je als mediaproducent daadwerkelijk grip hebt op de
manier waarop de gemaakte tekst aan gebruikers wordt getoond.
Beeldscherm of drukwerk
Tekst voor mediadoeleinden wordt vaaks opgemaakt met dezelfde middelen die gebruikt worden
voor desktoppublishing (DTP). Tekst die geprint wordt op papier moet andere eigenschappen hebben
dan die op een beeldscherm.
Houd het medium waarvoor je ontwerpt altijd in gedachten. Houd er ook rekening mee dat de tekst
er voor de gebruiker misschien heel anders uit kan zien voor de ontwerper, door bijvoorbeeld
schermresolutie en beschikbaarheid van het lettertype.
Sommige teksten worden in 1 lettertype en stijl weergegeven. Dit is monostyled tekst. Teksten in
verschillende stijlen of lettertypen, noemen we multistyled.
Bitmap of vector
Een digitale letter kan als bitmap of vector opgeslagen worden. Er wordt dan gesproken over
bitmaplettertypen en outline-lettertypen. Het nadeel van bitmaplettertypen is dat letters statisch
zijn, ze kunnen niet soepel vergroot of verkleind worden. Dit kan problemen geven bij verandering in
resolutie.
Vectorlettertypen hebben dit probleem niet en zijn hierdoor beter uitwisselbaar tussen platforms. De
meest gebruikte zijn Type 1, Truetype en OpenType.
, Als tekst bestaat uit een outline-lettertype, kan hij worden behandeld als een vector. Alle letters
kunnen gedraaid, geschaald, etc worden.
Door tekst te behandelen als een bitmapafbeelding kunnen er hele andere resultaten worden
behaald. Nadat tekst in pixels is omgezet, kunnen alle bewerkingen van een tekenprogramma
worden gedaan: verdraaien, vervagen, vervormen en toepassing van alle denkbare filters.
Afhankelijk van het doel kan er een keuze gemaakt worden voor de meest geschikte methode.
Fonts met het web
Als je in je productie specificeert dat tekst met een bepaald lettertype moet worden getoond, maar
de gebruiker heeft het lettertype niet, valt de weergave terug op het standaard lettertype. De tekst
wordt dus wel getoond, maar niet op de gewenste manier. Het is belangrijk om ervoor te zorgen dat
er geen lettertypen gebruikt worden die je zelf wel hebt, maar de eindgebruiker niet. Hier zijn
verschillende manieren voor.
Websafe fonts
Je weet nooit zeker wat voor lettertypen de eindgebruiker heeft, maar te voorspellen is het wel. Er
zijn een aantal lettertypen die zeer veel worden gebruikt. Zulke lettertypen zijn veilig en heten
daarom websafe fonts. Er zijn verschillende soorten, dus er is een keuze te maken die bij het doel
past. Voorbeelden hiervan zijn Times New Roman, Arial, Courier en Helvetica.
Embedden van fonts
Er zijn ook fonts die niet standaard voor elke gebruiker beschikbaar zijn. Dat zijn web fonts. Eén van
de manieren om ervoor te zorgen dat de gebruiker beschikking heeft over het gebruikte lettertype, is
door deze lettertypen op te nemen in de productie. Dit wordt embedden genoemd. Dit kan je doen
in bijvoorbeeld een PDF bestand van een website. Het voordeel van deze methode is dat je zeker
weet dat de gebruiker ziet wat je bedoeld.
Deze methode is voornamelijk populair bij bijzondere lettertypen, bedoeld als maatwerk voor de
huisstijl van een bedrijf. Een nadeel hiervan is dat de extra informatie, dus ook de extra lettertypen,
ervoor zorgt dat bestanden groter zijn. PDF bestanden zullen groter en minder makkelijk te
verzenden zijn. Een website doet er langer over om te laden.
Stylesheets
Soms wil je verschillende stukken tekst op dezelfde manier opmaken, maar niet voor ieder stuk tekst
de definitie van de opmaak herhalen. In dat geval zijn er stylesheets. Stylesheets zijn bestanden
waarin je specificeert hoe bepaalde stukken tekst of andere media moet worden opgemaakt. Je
beschrijft een type opmaak en wat de opmaak moet doen. Het HTML bestand en de stylesheet
werken samen, deze worden gekoppeld aan elkaar. De wijziging hoeft echter alleen in de stylesheet
doorgevoerd te worden.
Een groot voordeel van stylesheets is dat deze je in staat stellen reeksen lettertypen te gebruiken. Je
kan tot vijf lettertypen aangeven, waarbij het eerste lettertype de voorkeur heeft en de rest wordt
gebruikt als de gebruiker het eerst gekozen lettertype niet heeft.
Font-formaten
Naast codering worden fonts opgeslagen in een bepaald bestandsformaat. Meestal wordt hierbij
gebruik gemaakt van outline fonts. De bekendste bestandsformaten zijn Postscript, TTF en OTF.
Postscript is een fontformaat die in begin jaren 80 is ontwikkeld door Adobe. Dit formaat is vanaf het
begin specifiek geschikt voor printers en werd daarom met name gebruikt voor drukwerk.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Sliien. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.99. You're not tied to anything after your purchase.