Business Intelligence blog - laatste entry 10-01-2012 - Programmeren anno 2012
Oude mensen, zoals ik, herinneren zich nog hoe je in de zeventiger jaren moest programmeren.We kwame ...
Business Intelligence activiteiten
22 mei 2012, Integratieoplossingen voor Applicaties, Gegevens en Processen
22 mei 2012, Moderne Databasetechnologie
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualization voor Agile Business Intelligence Systemen
14 juni 2012, Trends in BPM 2012

Business Intelligence poll
BI-poll Intelligente search-technologie zal van grote invloed zijn op traditionele BI.
 
74%
 
22%
 
5%
Business Intelligence vacatures - Array Jobs
Lees meer

Detail
Rick van der Lans 
Rick van der Lans Rick F. van der Lans is onafhankelijk adviseur, docent, auteur en spreker over datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Hij heeft hij vele grote (inter)nationale bedrijven geadviseerd inzake datawarehouse-architectuur en toolkeuze. Hij is voorzitter van het Independent Analyst Platform en auteur van diverse artikelen in toonaangevende vakbladen en verscheidene boeken, waaronder het populaire SQL Leerboek.

05 november 2010 - Is uw database server wel carefree?

Veel artikelen, lezingen en discussies gaan tegenwoordig over hoe snel bepaalde database servers zijn en hoeveel gegevens ze kunnen beheren. Leveranciers vallen over elkaar om te melden hoe groot de databases zijn die hun producten aankunnen en dat ze immense hoeveelheden query’s razendsnel kunnen verwerken. Alles wordt uit de kast gehaald om aan te geven dat ze de grootste en snelste zijn. Maar zijn grootte en snelheid de enige kwalificaties die belangrijk zijn? En trouwens, hoeveel klanten hebben eigenlijk datawarehouses van vijfhonderd Terabytes groot? En wie verwerkt er honderdduizend query’s per uur? Uiteraard zullen er organisaties met dit soort eisen zijn, maar de massa heeft dergelijke eisen (gelukkig) niet.
Neem als voorbeeld de TPC-H benchmark resultaten. Leveranciers presenteren altijd trots dat ze weer een record gebroken hebben wat betreft het aantal query’s dat ze per uur verwerkt hebben. Maar wat zegt dit nu precies? Wat goed is aan de TPC-H benchmark is dat alleen performancecijfers gepubliceerd mogen worden als daarbij ook aangegeven wordt hoe duur de gehele hardware- en software-opstelling was. De reden is simpel: het is natuurlijk interessant om te weten dat een product honderdduizend query’s kan verwerken en dat het concurrerende product in dezelfde tijdspanne slechts de helft kan verwerken, maar als de configuratie van de eerste tien keer zo duur is als de tweede, dan brengt dat de performancecijfers iets meer in perspectief.
Maar worden bij de berekening van die prijs echt alle kosten meegenomen? Hoeveel tijd is er bijvoorbeeld door de specialisten in het laboratorium gestoken in het tunen en optimaliseren van de machines, de disks, en de database server zelf, plus hoeveel tijd heeft het optimaliseren van de opslagstructuur gekost? Hoeveel tijd is gestoken in het nadenken over de ideale indexen en de perfecte wijze van partitionering? En hoe flexibel is het databaseontwerp dat gebruikt is? Ofwel, hoeveel tijd zou er gaan zitten in de aanpassing van dat ontwerp. En dan hebben we het nog niet eens over backups en monitoring. Dit zijn allemaal activiteiten waar in normale projecten veel tijd in gaat zitten. Een databasebeheerder kan er een dagtaak aan hebben en soms zijn complete afdelingen nodig. Tijd is geld en deze kosten zijn helaas niet bij de TPC-H cijfers opgenomen. Dus het is niet helemaal duidelijk hoe duur alles is geweest.
 
Het is zeker interessant om eigenschappen als databasegrootte, query-verwerkingsnelheid en opslagmodel te bestuderen, maar is het niet net zo belangrijk dat we ook naar eigenschappen als carefreeness en flexibiliteit kijken? Met de mate van carefreeness (zorgeloosheid) geven we aan in hoeverre een database server self-supporting is en met flexibiliteit bedoelen we hoe eenvoudig het is om nieuwe wensen van gebruikers snel te kunnen implementeren.
Als een database server werkelijk honderd procent carefree zou zijn, dan zouden we geen tijd meer hoeven te besteden aan het optimaliseren van de database server, aan het instellen van de bufferparameters, aan het bepalen van welke indexen nodig zijn en hoe de tabellen gepartitioneerd moeten worden. Dit worden lange vakanties voor databasebeheerders.
Het voordeel van een hoge mate van carefreeness is dat veel activiteiten wegvallen, wat een forse hoeveelheid tijd bespaart. En laten we eerlijk zijn, hier besteden we veel meer tijd aan dan we denken. Houd het maar eens bij!
 
Is totale carefreeness toekomstmuziek? Tegenwoordig bestaan er database servers die het predikaat carefree mogen dragen, zoals illuminate, Netezza en SQLite. SQLite is dan wel niet geschikt om een datawarehouse te ondersteunen, maar de eerste twee wel degelijk. Let wel, ze zijn niet voor honderd procent carefree, maar komen in de buurt.
Tevens zal een hoge mate van carefreeness de flexibiliteit verhogen. Voor niet-carefree database servers geldt dat als de behoeftes van gebruikers veranderen en daardoor tabellen en kolommen aangepast moeten worden, de databaseheerder meestal weer opnieuw moet nadenken over de indexen, de parameters en de partities. Als hier niet meer over nagedacht hoeft te worden maar de database server dit zelf automatisch oplost, dan verhoogt dat de snelheid waarmee gebruikersveranderingen geïmplementeerd kunnen worden en dus de flexibiliteit.
 
Dat database servers grote hoeveelheden gegevens kunnen beheren en dat ze enorme hoeveelheden query’s snel kunnen verwerken, is uiteraard belangrijk. Maar laten we ons niet blind staren op deze eigenschappen. De mate van carefreeness heeft een grote invloed op de hoeveelheid kosten die we maken en zou eigenlijk altijd bij aanschaf bestudeerd moeten worden. Het heeft geen zin om een database server aan te schaffen die enorme databases aankan, als we om dat niveau te bereiken een afdeling vol specialisten nodig hebben.
 
Deze column verscheen eerder in Database Magazine 7-2010



Permalink | Trackback | Print | E-mail

Reacties op deze blog
Er zijn nog geen reacties.
Reageer
Wilt U een reactie plaatsen op dit bericht? Log dan in op deze website. Heeft U dat nog niet eerder gedaan? Registreer U dan eerst.
Business Intelligence nieuws || alle items 14-02-2012 - Information Builders opnieuw in leiderskwadrant Business Intelligence Platforms
De evaluatie is gebaseerd op ‘Ability to Execute’ en ‘Completeness of Vision’.
Lees meer
Business Intelligence video || alle items
Data Vault

Tijdens het BI-event 2011 vertelt Hans Hultgren , zakenpartner van Dan Linstedt en directeur van de Genesee Academy, over het succes van Data Vault in Nederland.
 
Database Magazine artikelen || alle items || zoeken
Geen leesweergave beschikbaar27-09-2011 - Plaatjes halen waarde uit data

Een plaatje zegt meer dan duizend woorden. Dankzij onze natuurlijke, visuele geaardheid zijn we in staat complexe materie te begrijpen. Landkaartmakers passen de truc al jaren toe. Nu is het de beurt aan BPM-specialisten om bedrijfsprocessen inzi ... Lees meer

Geen leesweergave beschikbaarIdentificeren, Stimuleren en Organiseren
Geen leesweergave beschikbaarWeb Analytics: een ondergeschoven kind?
Geen leesweergave beschikbaarTrends en ontwikkelingen in Business Analytics
Geen leesweergave beschikbaarHet datawarehouse geen database meer?
Geen leesweergave beschikbaarBezoekerservaringen op maat
Geen leesweergave beschikbaarResultaten Business Analytics Survey
Geen leesweergave beschikbaarTom Davenport on Analytics
Geen leesweergave beschikbaarCertificaat van Onvermogen
BI-Matrix
Categorieën
Organisaties

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
AnalyticsDB-Matrix
Kenmerken
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
ETL-Matrix
Selectiecriteria
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
Business Intelligence vacatures - Array Jobs
Lees meer
BI-blogs categorieënGeen categorieën gevonden.
Business Intelligence agenda
22 mei 2012, Integratieoplossingen voor Applicaties, Gegevens en Processen
22 mei 2012, Moderne Databasetechnologie
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualization voor Agile Business Intelligence Systemen
Lees meer

Klik hier om een evenement op te voeren.
Business Intelligence sponsors
BI in de nieuwste DB/MIn Database Magazine 4 
  • Het Gouden Record
  • Datakwaliteit heeft baat bij government-model
  • Implementatie datakwaliteit met Six Sigma
  • Dataflux pakt probleem bij de bron aan
  • Met Scrum meer grip op BI-projecten
  • Karien Verhagen reageert op artikel van Fons Pieters 
  • Asymmetrische links in Data Vault (slot)
BI opleidingenGeen opleidingen gevonden.

Klik hier om een opleiding te plaatsen.
Business Intelligence foto
Foto's Bi-Event 2010
Op 17 mei 2011 vond in Intres Hoevelaken het
BI-Event 2011 plaats.

Klik hier voor een korte foto-impressie.