Correcte en consistente gegevens zijn essentieel voor een uniforme en betrouwbare bedrijfsvoering!
Data Quality (DQ), ofwel datakwaliteit, is een veelgebruikte term in business-process & intelligence trajecten. In elk project komen op een bepaald moment wel enige data-issues boven. Deze worden soms snel verholpen, maar het kan ook voorkomen dat deze issues langer spelen. Indien dit laatste het geval is, vormt dit een ernstige bedreiging voor de betrouwbaarheid en het succes van het systeem. Immers, een automatiseringssysteem dat onduidelijke, incomplete, onbetrouwbare of foutieve informatie levert is eigenlijk onbruikbaar.
Iedereen die op een bepaalde manier betrokken is bij business-process projecten heeft wel een bepaalde voorstelling van het begrip data quality. Vaak is dit een vrij technische voorstelling: bronsystemen bevatten foute gegevens, die moeten worden opgeschoond. Omdat het vaak om grote dataverzamelingen gaat, is het verbeteren van de fouten al snel een flinke klus, dus verwacht men hiervoor vanuit de business vaak een technische oplossing van de IT afdeling. Er zijn verschillende tools voorhanden die data issues detecteren, rapporteren en soms ook opschonen. Met z.g. Data Profiling tools is het mogelijk een dataprofiel te maken van een databron. Met dit profiel wordt inzicht verkregen in de kwaliteit van een bron. Met Data Cleansing tools kan men data ontdoen van vervuiling. Verder zijn er de z.g. DQM tools, voor het ondersteunen van een Data Quality Management Proces. Hierover volgt later meer.
Een betere definitie van datakwaliteit is de volgende: “datakwaliteit is de mate waarin data geschikt is voor het doel waarvoor ze gebruikt wordt”. In het geval van business intelligence, betekent dit dus dat de data geschikt moet zijn als informatiebron voor het operationele, tactische en strategische beslissingsproces. Dit betekent meer dan: er mogen geen fouten in zitten. Theoretisch zou het zelfs kunnen betekenen dat de data wel fouten mag bevatten. Indien men weet dat een databron 95% correcte data bevat, kan men besluiten dat dit voldoende is om op basis van deze gegevens bepaalde conclusies te trekken.
Zoals gezegd gaat het bij datakwaliteit om meer dan de aanwezigheid van fouten. Hier volgt een aantal aspecten, die de datakwaliteit (mate van geschiktheid voor een bepaald doel) kunnen bepalen. Als startpunt meten en monitoren we de datakwaliteit om een goed inzicht in de actuele situatie te verkrijgen. Vervolgens kijken we naar onderstaande aspecten in relatie tot de data die voorhanden is:
Tijdig
De gegevens zijn op het juiste moment voorhanden
Volledig
Alle eigenschappen van een entiteit zijn aanwezig
Accuraat
Het betreft de absolute waarheid van een entiteit
Consistent
Uniform binnen het gehele applicatie landschap
Begrijpbaar
De gegevens zijn inzichtelijk en gestructureerd
Uniek
Iedere entiteit komt slechts éénmalig voor
Voor het verbeteren van datakwaliteit is altijd een gedegen samenwerking tussen de business en de IT afdeling vereist. Het is zeker niet een puur technische aangelegenheid. Wel kunnen onze datakwaliteit specialisten en bepaalde tools helpen om fouten te detecteren, of om het proces te ondersteunen waarin een de datakwaliteit wordt verbeterd. Commitment vanuit de business is in ieder geval een vereiste voor het oplossen van dataproblemen. Om dit commitment te verkrijgen is het belangrijk dat men beseft wat datakwaliteit precies inhoudt.
Het proces waarmee datakwaliteitsproblemen structureel aangepakt worden, staat bekend onder de naam Data Quality Management. Wilt u dit structureel inbedden in uw dagelijkse IT-omgeving? Dan is MDM (Master Data Management) de oplossing om over het hele IT-landschap heen correcte en consistente data te realiseren.
Herkent u zich in één of meerdere van de voorgaande aspecten, onze dataspecialisten helpen u graag om het proces in te richten om uw data op orde te krijgen. Wilt u weten wat voor u kunnen betekenen op het gebied van data solutions?
Neem dan contact met ons, wij voorzien u van vrijblijvend advies.