Business Intelligence blog - laatste entry 10-01-2012 - Programmeren anno 2012
Oude mensen, zoals ik, herinneren zich nog hoe je in de zeventiger jaren moest programmeren.We kwame ...
Business Intelligence activiteiten
22 mei 2012, Integratieoplossingen voor Applicaties, Gegevens en Processen
22 mei 2012, Moderne Databasetechnologie
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualization voor Agile Business Intelligence Systemen
14 juni 2012, Trends in BPM 2012

Business Intelligence poll
BI-poll Intelligente search-technologie zal van grote invloed zijn op traditionele BI.
 
74%
 
22%
 
5%
Business Intelligence vacatures - Array Jobs
Lees meer

Detail
Rick van der Lans 
Rick van der Lans Rick F. van der Lans is onafhankelijk adviseur, docent, auteur en spreker over datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Hij heeft hij vele grote (inter)nationale bedrijven geadviseerd inzake datawarehouse-architectuur en toolkeuze. Hij is voorzitter van het Independent Analyst Platform en auteur van diverse artikelen in toonaangevende vakbladen en verscheidene boeken, waaronder het populaire SQL Leerboek.

30 september 2010 - Graph analytics

De gebruikers van Business Intelligence systemen kunnen momenteel kiezen uit een breed scala aan producten waarmee ze rapporten kunnen maken en analyses kunnen uitvoeren. Deze producten variëren van rechttoe rechtaan rapportageproducten via interactieve online analytical processing tools tot geavanceerde statistische en datamining producten. De bedoeling van al deze producten is dat ze het beslissingsproces van de gebruikers verbeteren. Ze helpen door gegevens onder andere te filteren, te sommeren, te groeperen en door te voorspellen en de resultaten grafisch te presenteren.
 
Maar er zijn zaken waartoe deze producten niet in staat zijn en dat is, onder andere, het analyseren van gegevens wanneer deze als een graaf of netwerk gestructureerd zijn en wanneer de analyse vereist dat die netwerkstructuur bewandeld moet worden. Stel eens voor dat een manager van een sociaal netwerk website, zoals Facebook of LinkedIn, wil weten wie de centrale leden van het totale netwerk zijn, waarbij de term centraal lid gedefinieerd is als een lid dat de meeste korte paden heeft naar de andere leden. Dit probleem kan niet opgelost worden door simpelweg gegevens bij elkaar op te tellen noch heeft het iets te doen met het voorspellen met behulp van statistische modellen. Nee, wat hier nodig is, is een product dat van lid naar lid door het netwerk kan wandelen. Maar dit is een eigenschap die de meeste bekende analytische en rapportageproducten niet ondersteunen.
 
We geven nog een ander voorbeeld. Met veel rapportageproducten zal een luchtvaartmaatschappij kunnen bepalen hoeveel vluchten per dag vanuit een specifiek vliegveld vertrekken. En als per vlucht de zogenaamde load factor (percentage stoelen verkocht) bekend is, kunnen ze ongetwijfeld de gemiddelde load factor voor vluchten van Amsterdam naar Londen berekenen. Beschikken ze over de geschikte statistische producten, dan kunnen ze zelfs laten voorspellen wat de load factor voor de komende maand zal zijn. Ze kunnen ook dashboards ontwikkelen die live de gemiddelde load factor voor alle vluchten tonen.
 
Maar wat al deze producten niet kunnen is bepalen wat de twee goedkoopste of de vier kortste vluchten van Amsterdam naar New York zijn. En als we weer het voorbeeld van een sociaal netwerk nemen, deze producten kunnen niet bepalen welke andere leden een specifiek lid waarschijnlijk wel kent, maar nog niet mee verbonden is. Het zal ook lastig zijn voor een telefoonmaatschappij om te bepalen welke klanten mogelijkerwijs andere klanten beïnvloeden om bij de huidige provider te blijven of over te stappen.
 
De bovengenoemde problemen behoren tot het domein van graph analytics, ofwel het analyseren van grafen (netwerken). Graph analytics is een speciale vorm van analytics die al lang bestaat. In feite gaat de geschiedenis van graph analytics en de onderliggende grafentheorie terug tot aan de eerste helft van de 18de eeuw. Tegenwoordig bestaan er krachtige producten en databaseservers speciaal ontwikkeld voor graph analytics. Het speciale aan deze producten is dat ze grafen bestaande uit honderden miljoenen nodes kunnen verwerken en ze snel kunnen analyseren. Ze ondersteunen de algoritmes om bepaalde typische graafproblemen op te lossen.
 
De BI-wereld is helaas nog niet zo bekend met het analyseren van grafen. Niet dat het onderwerp nieuw is, maar het wordt nog maar zelden toegepast in Business Intelligence systemen. En dat is jammer, want graph analytics heeft veel te bieden en de producten en databaseservers zijn er klaar voor. Graph analytics kan ook in veel omgevingen toegepast worden. Overheidsinstanties, financiële instellingen, distributie- en transportbedrijven, retailers, telefoonmaatschappijen en eigenaren van websites kunnen allemaal zeer nuttig van deze mogelijkheid gebruik maken.
 
Tamelijk recent is een nieuwe generatie databaseservers geïntroduceerd waar naar gerefereerd wordt met de intrigerende term NoSQL databaseservers. Let wel, dit is niet een homogene groep van producten, maar een groep databaseservers met zeer uiteenlopende mogelijkheden en toepassingsgebieden. Wat ze gemeen hebben is dat ze SQL niet als de primaire databasetaal zien. Sommige ondersteunen SQL geheel niet en andere ondersteunen het slechts als secundaire taal en dan soms slechts een subset van SQL. Enkele van deze NoSQL databaseservers kunnen geclassificeerd worden als graph databaseservers: producten die speciaal voor het ondersteunen van graph analytics ontwikkeld zijn. Voorbeelden hiervan zijn Objectivity’s InfiniteGraph, AllegroGraph RDFStore, Neo4j en vertexdb. Als we de eerstgenoemde als voorbeeld nemen, dit product ondersteunt veel vormen van graph analytics, waaronder single path analysis, shortest path analysis, optimal path analysis, path existence analysis en vertex centrality analysis.
 
Samenvattend; de huidige producten die ontwikkeld zijn voor graph analytics zijn klaar voor het grote werk. Vooral de op databaseservers gebaseerde producten zijn in staat om zeer grote grafen bestaande uit miljoenen nodes te analyseren. Deze vorm van analytics verdient daarom meer aandacht van alle BI-specialisten. De grote uitdaging is om te bepalen waar het binnen een organisatie nuttig ingezet kan worden. Waar kan graph analytics het huidige palet van BI-producten verrijken?

Deze column verscheen eerder in Database Magazine 6-2010
 



Permalink | Trackback | Print | E-mail

Reacties op deze blog
Er zijn nog geen reacties.
Reageer
Wilt U een reactie plaatsen op dit bericht? Log dan in op deze website. Heeft U dat nog niet eerder gedaan? Registreer U dan eerst.
Business Intelligence nieuws || alle items 14-02-2012 - Information Builders opnieuw in leiderskwadrant Business Intelligence Platforms
De evaluatie is gebaseerd op ‘Ability to Execute’ en ‘Completeness of Vision’.
Lees meer
Business Intelligence video || alle items
Data Vault

Tijdens het BI-event 2011 vertelt Hans Hultgren , zakenpartner van Dan Linstedt en directeur van de Genesee Academy, over het succes van Data Vault in Nederland.
 
Database Magazine artikelen || alle items || zoeken
Geen leesweergave beschikbaar27-09-2011 - Tom Davenport on Analytics

Wie wil begrijpen waarom er momenteel zoveel aandacht is voor Analytics kan niet om Competing on Analytics heen, het boek dat Tom Davenport en Jeanne Harris in 2007 publiceerden. De vraag hierbij is in hoeverre organisaties daadwerkelijk al met A ... Lees meer

Geen leesweergave beschikbaarResultaten Business Analytics Survey
Geen leesweergave beschikbaarCertificaat van Onvermogen
Geen leesweergave beschikbaarPlaatjes halen waarde uit data
Geen leesweergave beschikbaarTrends en ontwikkelingen in Business Analytics
Geen leesweergave beschikbaarBezoekerservaringen op maat
Geen leesweergave beschikbaarWeb Analytics: een ondergeschoven kind?
Geen leesweergave beschikbaarIdentificeren, Stimuleren en Organiseren
Geen leesweergave beschikbaarHet datawarehouse geen database meer?
BI-Matrix
Categorieën
Organisaties

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
AnalyticsDB-Matrix
Kenmerken
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
ETL-Matrix
Selectiecriteria
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
Business Intelligence vacatures - Array Jobs
Lees meer
BI-blogs categorieënGeen categorieën gevonden.
Business Intelligence agenda
22 mei 2012, Integratieoplossingen voor Applicaties, Gegevens en Processen
22 mei 2012, Moderne Databasetechnologie
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualization voor Agile Business Intelligence Systemen
Lees meer

Klik hier om een evenement op te voeren.
Business Intelligence sponsors
BI in de nieuwste DB/MIn Database Magazine 4 
  • Het Gouden Record
  • Datakwaliteit heeft baat bij government-model
  • Implementatie datakwaliteit met Six Sigma
  • Dataflux pakt probleem bij de bron aan
  • Met Scrum meer grip op BI-projecten
  • Karien Verhagen reageert op artikel van Fons Pieters 
  • Asymmetrische links in Data Vault (slot)
BI opleidingenGeen opleidingen gevonden.

Klik hier om een opleiding te plaatsen.
Business Intelligence foto
Foto's Bi-Event 2010
Op 17 mei 2011 vond in Intres Hoevelaken het
BI-Event 2011 plaats.

Klik hier voor een korte foto-impressie.