IT Infrastructure Architecture - Infrastructure Building
Blocks and Concepts Third Edition
Sjaak Laan , 2017
1.1 Invoering
Architectuur is nodig om de infrastructuur te controleren wanneer deze is ontworpen, in gebruik,
en wanneer het wordt veranderd
Welk Type management hangt samen met laas?
Infrastructure management
Welke virtualisatiedienst valt binnen laaS?
Virtual networking
1.2 What is IT infrastructure?
Wat is IT infrastructuur?
Infrastructuur komt van het Latijns en betekent "onder de structuur". Zoals in steden onder de
structuur van de stad heb je de riolering, stroomkabels, waterleidingen etc. Het perspectief
bepaalt ook wat je infrastructuur kan noemen zoals bijvoorbeeld: Een systeem beheerder gebruikt
het gebouw en stroom als zijn infrastructuur om zijn servers in te installeren en een applicatie
gebruiker gebruikt de server, het gebouw en stroom als zijn infrastructuur.
2.1 IT building blocks
Wat zijn de IT bouwblokken van het infrastructuur model?
Het infrastructuur model bestaat uit 4 bouwblokken:
Functioneel beheer: Processen en informatie
Applicatie beheer: Applicaties
Platform beheer: Applicatie platform (bv .net)
Infrastructuur beheer: Operating Systeem, eindgebruiker apparaten, opslag, netwerken,
datacenters
Noem de 3 kernwaardes/disciplines die in elke infrastructuur laag voorkomt?
Security, beschikbaarheid en performance.
2.2 Processes / information building block
Organisaties implementeren bedrijfsprocessen om hun missie en visie te vervullen.
Wat is functioneel beheer?
Functioneel beheer is het soort systeem beheer dat er voor zorgt dat het systeem zo is
geconfigureerd dat je er business functies mee kunt uitvoeren.
, 2.3 Applications building block
Toepassingen management is verantwoordelijk voor de configuratie en de technische werking
van de applicaties.
Welke type applicaties heb je in de applicaties bouwblok?
client-applicaties: die meestal gedraaid worden op pc's en laptops zoals web browsers,
tekstverwerkers en email programma's.
kantoor applicaties: standaard bedrijfssoftware van servers geladen zoals mail servers,
portals en samenwerking tools.
Speciale bedrijfssoftware (bedrijfsspecifieke software): Op maat gemaakte software zoals
CRM's (Customer Relations Management) of ERP's (Enterprise Resource Planning).
2.4 Application platform building block
Welke platforms of services heb je er voor de applicatie platform bouwblok?
Front-end servers: Die servers geven de gebruiker de gelegenheid om met een applicatie
te werken via een web browser. Apache HTTP Server en Microsoft Internet Information
Services (IIS) zijn voorbeelden.
Applicatie servers: Deze servers fungeren als containers waarin de applicaties in draaien.
Connectivity: zoals FTP servers en Extraction, transformation and load (ETL) servers.
Database: ook wel bekend als Database Management Systems (DBMS's)
2.5 Infrastructure building block
Noem de 6 infrastructuur bouwblokken:
Eindgebruiker apparaten: zoals pc's, laptop, mobieltjes, thin clients
Operating systemen: een verzameling programma's dat er voor zorgt dat er met het
geheugen, processor, geïnstalleerde apparaten en bestandssysteem gewerkt kan
worden.
Computer: dat zijn de fysieke en virtuele computers in een datacenter, beter bekend als
servers.
Opslag (storage): zijn systemen die gegevens opslaan zoals hdd's, tapes, DAS, NAS en
SAN's.
Netwerken: verbind alle componenten. Hieronder vallen routers, switches, firewalls,
VPN's, WAN's en LAN's, maar ook services als DNS en DHCP.
Datacenters: dat zijn de locaties die de IT infrastructuur hardware faciliteren. Hieronder
vallen UPS's, verwarming, ventilatie en airco, computer racks en fysiek
beveiligingsmaatregelen.
Servers hebben bv zowel netwerk- en storage, en beide zijn even belangrijk.
Infrastructuur management omvat processen zoals ITIL en DevOps en tools zoals monitoring en
back-up.
2.6 Non-functional attributes
Wat zijn de essentiële niet-functionele attributen van het infrastructuur model?
Security, availability en performance. Beveiliging, beschikbaarheid en prestatie.
, 3.1 Invoering
Enkele voorbeelden van niet-functionele kenmerken zijn:
Beschikbaarheid
schaalbaarheid
Betrouwbaarheid
Stabiliteit
testbaarheid
herstelbaarheid
De belangrijkste niet-functionele kenmerken voor de meeste IT-infrastructuren zijn:
veiligheid, prestatie, en beschikbaarheid.
Niet-functionele eigenschappen zijn erg belangrijk voor de succesvolle implementatie en het
gebruik van een IT-infrastructuur, maar zelden krijgen ze dezelfde aandacht als de functionele
diensten.
Dus, niet-functionele eigenschappen zijn zeer functioneel, maar ze zijn niet direct gerelateerd aan
de primaire functies van een systeem.
3.2 Niet-functionele vereisten
Het is de taak van de IT-architect of eisende engineer om impliciete vereisten te vinden
over niet-functionele kenmerken.
De meeste belanghebbenden hebben geen idee hoe moeilijk het kan zijn om een bepaalde
niet-functionele eisen te realiseren.
Daarom is het belangrijk om te onthouden dat de acceptatie van een systeem grotendeels
afhankelijk is van de geïmplementeerde niet-functionele eisen. Een website kan heel mooi en
functioneel zijn, maar als het laden van de site (performance, een niet-functionele eis) 30
seconden duurt, zijn de meeste klanten weg!
Veel van de niet-functionele kenmerken van een toepassing worden geleverd door de
infrastructuur.
Als de IT-infrastructuur niet ontworpen is om schaalbaar te zijn, kunnen de daarop
gebouwde applicaties geen schaalbaarheid introduceren.
Het is niet ongebruikelijk om tegenstrijdige niet-functionele vereisten in een systeem te hebben.
Het is de verantwoordelijkheid van de infrastructuur architect om deze tegenstrijdige
niet-functionele eisen in evenwicht te brengen. De architect moet deze tegenstrijdige eisen en de
gevolgen daarvan aan de stakeholders presenteren, zodat ze goed geïnformeerde beslissingen
kunnen nemen.
4.2 Calculating availability
In het algemeen kan de beschikbaarheid niet worden berekend, noch gegarandeerd vooraf. Het
kan alleen achteraf worden gerapporteerd, wanneer een systeem een looptijd van enkele jaren
heeft.
Noem een aantal ontwerppatronen ( of ontwerp beslissingen) die zorgen voor een hogere
beschikbaarheid:
Failover
redundancy (overtolligheid)
gestructureerd programmeren
het voorkomen van Single Points of Failures (SPOF's)
het implementeren van een goed systeembeheer.
, 4.2.1 Availability percentages and intervals
De beschikbaarheid van een systeem wordt meestal uitgedrukt als een percentage van uptime in
een bepaalde periode (meestal een jaar of één maand).
Wat zijn de meest voorkomende beschikbaarheid niveaus in procenten van een systeem?
De meest voorkomende zijn 99,8% of 99,9% beschikbaarheid van een it-systeem in een
maand. Onderliggende systemen moeten dan een hogere beschikbaarheid hebben zoals
99,99% of hoger. 99,999% komt ook voor maar dan als carrier-grade.
4.2.2 MTBF and MTTR
Wat betekent de MTBF en MTTR?
Mean Time Between Failure: Gemiddelde tijd tussen falen (van een systeem of stuk
hardware)
Mean Time To Repair: Gemiddelde tijd tot gerepareerd (na falen)
Hoe bereken je de MTBF?
Totaal aantal testuren = aantal stuks (hardware of systemen) x aantal testuren per stuk
MTBF = Totaal aantal testuren / aantal gefaalde stuks = .... uur/faal
Wat kun je gebruiken om de MTTR laag te houden?
Automatische redundancy en failover
4.2.3 Some calculation examples
De MTBF wordt uitgedrukt in uren (hoeveel uren zal de component of de dienst werken zonder
falen).
Eigenlijk zegt MTBF alleen iets over de kans op falen in de eerste maanden van het gebruik.
Wat is de formule van beschikbaarheid?
Beschikbaarheid = MTBF / (MTBF + MTTR) x 100%
4.2.2.2 Mean Time To Repair (MTTR)
De beste manier om de MTTR laag te houden is om geautomatiseerde redundantie(overbodig
overtollig) en failover te introduceren
4.2.3 Enkele rekenvoorbeelden
Wanneer een defect van één deel in een systeem een storing van het systeem als geheel
veroorzaakt, wordt de beschikbaarheid seriële beschikbaarheid genoemd. Om de
beschikbaarheid van een dergelijk complex systeem of apparaat te berekenen, vermenigvuldigt je
de beschikbaarheid van alle onderdelen.
Seriële beschikbaarheid is lager dan de beschikbaarheid van een enkele component in het
systeem. Dus, hoe meer componenten een systeem omvat hoe lager de totale beschikbaarheid
wordt.
Om de beschikbaarheid te vergroten, kunnen systemen (samengesteld uit verschillende
componenten) parallel ingezet worden. Dit verhoogt aanzienlijk de beschikbaarheid, omdat de
gecombineerde systeem niet langer een Single Point Of Failure bevat. Als een component niet
meer beschikbaar is, valt het getroffen systeem uit, maar het andere systeem kan dit overnemen.
, 4.3.1 Human errors
Hoeveel procent van de uitvallen in een IT-systeem is direct of indirect door menselijk toedoen?
80% van de uitvallen is direct of indirect de schuld van mensen en slecht ontworpen
processen.
50% van die fouten worden door onder veroorzaakt door wijziging / configuratie / release
integratie en overdrachtsproblemen.
Noem bronnen van slechte beschikbaarheid?
Fouten van mensen (meestal systeem beheerders)
Software bugs (falende software)
Gepland onderhoud
Fysieke defecten (falende hardware)
Omgevingsomstandigheden (storm, wateroverlast)
Complexiteit van de infrastructuur
Veel van deze fouten kunnen worden voorkomen door de juiste systemen procedures voor het
beheer te gebruiken, zoals het hebben van een standaard template voor het creëren van nieuwe
servers, met behulp van formele implementatiestrategieën met de juiste hulpmiddelen, het
gebruik van administratieve accounts alleen als het echt nodig is, enz.
4.3.2 software bugs
Na menselijke fouten, zijn software bugs de nummer twee reden van onbeschikbaarheid.
Vanwege de complexiteit van de meeste software is het bijna onmogelijk (en zeer dure) om
bug-vrije software te maken. Softwarefouten in applicaties of systeem stuurprogramma's kunnen
een heel systeem stoppen (zoals het beruchte Blue Screen of Death op Windows-systemen)
4.3.4 Physical defects
Volgens welke curve loopt de levensspaan van een hardware component?
De badkuip curve geeft het beste de levensspaan weer. In het begin heb je nog veel kans op
falen meestal binnen een maand en daarna zwakt de kans af en blijft laag tot het einde van zijn
technische levensspaan. De kans op falen stijgt plotseling op het einde van de levenscyclus van
een component.
Soms werkt een component niet eens na het uitgepakt, voor de eerste keer. Dit heet een DOA
component - Dead On Arrival.
4.3.5 Milieu problemen
Het effect van deze problemen met de stroomtoevoer kan worden geëlimineerd door het gebruik
van een Uninterruptable Power Supply (UPS).
4.4 Availability patterns
Welke methodes heb je om de kans op downtime van een systeem zo laag mogelijk te houden?
systeem zonder SPOF's, zo min mogelijk enkele punt van falen plekken hebben.
Technieken om de kans op downtime van een systeem zo laag mogelijk te houden:
Redundancy: hiermee kan op een punt in het systeem, een stuk hardware, bij falen
worden overgenomen door een backup stuk hardware.
Failover: bij failover switcht het systeem automatisch naar een standby systeem.
Fallback: is het manueel switchen naar een standby systeem op een andere locatie. Er
zijn drie basisvormen van fallback oplossingen die wordt gebruikt bij wederopbouw na
ramp: hot site, warm site of cold site,.
, Business continuïteit: is het identificeren van bedreigingen die er voor het bedrijf
bestaan en hier op voor te bereiden, zoals een rampenplan en een business
continuiteit plan (BCP)
4.4.1 overtolligheid
Redundantie is de verdubbeling van kritische componenten in één systeem om een SPOF
voorkomen. In IT-infrastructuur componenten, wordt redundantie gewoonlijk uitgevoerd in
voedingen (afzonderlijk onderdeel met twee voedingen, als een faalt, de andere overneemt),
netwerkinterfaces en SAN HBA (hostbusadapters) voor het verbinden opslag.
4.4.3.1 Hot site
Wat is een hot site?
Een hot site is een volledig geconfigureerde fallback datacenter, alles is geïnstalleerd op servers
en alle data is up-to-date (gemirrord). Men kan heel makkelijk binnen paar uur over geswitcht zijn.
Dit type van de site vereist voortdurend onderhoud van de hardware, software, data en
toepassingen om zeker te zijn van de site te allen tijde nauwkeurig de toestand van de
productielocatie weerspiegelt.
4.4.3.2 Warm site
Wat is een warm site?
Warm site is een fallback datacenter met alles behalve de applicaties en data. Deze moeten dan
nog van de backups geïnstalleerd worden en getest voordat mee aan de slag kan. Dit kost
normaal gesproken een dag werk.
Het voordeel van een warme plaats in vergelijking met een hot site is dat het minder aandacht
nodig heeft wanneer niet in gebruik is en is veel goedkoper.
4.4.3.3 Cold site
Wat is een cold site?
Een cold site is een fallback datacenter ruimte met alle faciliteiten behalve de computer hardware,
software en data. Computers moeten ter plaatse worden gebracht en communicatieverbindingen
zijn niet klaar. Laagste en goedkoopste vorm van fallback.
4.4.4 Bedrijfscontinuïteit
Business continuity gaat over het identificeren van bedreigingen voor een organisatie en
doeltreffend optreden. Business Continuity Management (BCM) en Ramp Recovery Planning
(DRP) zijn processen om het effect van rampen te behandelen.
4.4.4.1 Bedrijfszekerheidsmanagement
BCM is niet alleen voor IT. Het omvat het beheer van bedrijfsprocessen en de beschikbaarheid
van mensen en werkplekken in een ramp situaties. Het omvat ramp herstel, business recovery,
crisismanagement, probleembehandeling, beheer van noodsituaties en product recall.
4.4.4.2 Ramp Recovery Planning
Ramp recovery planning (DRP) bevat een aantal maatregelen die genomen moeten worden in
geval van een ramp, wanneer (delen van) de IT-infrastructuur is ondergebracht in een andere
locatie.