Google Analytics: Een praktische toepassing van Data Science
Al geruime tijd is de term data science aan het rondzingen. In korte tijd is de vraag naar data science enorm toegenomen, daarmee ook de toepassingen op dit gebied. Zo heeft iedereen wel eens gehoord van Artificial Intelligence of Machine Learning, maar weten nog maar weinigen wat nou de mogelijkheden hiervan zijn voor hun bedrijf. Vaak hoor je dat mensen het te ingewikkeld vinden of denken dat hun data er niet geschikt voor is. Het is jammer dat organisaties daardoor waarde laten liggen! Vaak zijn er namelijk al heel veel mogelijkheden met de bestaande data.
Google Analytics
Google Analytics is zo’n voorbeeld van een databron die heel geschikt is voor de toepassing van data science. En het mooie is: ieder bedrijf met een website kan er gebruik van maken. Google Analytics slaat van websitebezoekers enorm veel data op zoals de bezochte pagina’s, hoe lang ze op de website zijn geweest, de locatie en tijd. Al deze gegevens kunnen worden gecombineerd om met een algoritme een profiel op te maken dat kijkt naar verbanden tussen de verschillende bezoekers. Hiermee kun je bijvoorbeeld nieuwe klantsegmenten ontdekken en je marketingacties daar beter op afstemmen.
Wat maakt Google Analytics nou geschikt voor data science?
Om bezoekers goed van elkaar te onderscheiden wordt vaak gebruik gemaakt van een UID (Unique ID), denk hierbij aan een uniek bestelnummer of een tijdsstempel in combinatie met je email adres. Het is de sport om een UID te vinden die je zo goed mogelijk kan onderscheiden van de anderen UID’s. Google Analytics heeft zo’n UID en zodra je op een website komt met Google Analytics in de code geïnstalleerd wordt dit in je cookies opgeslagen middels een speciaal voor jou gemaakt ID. Zo weet het programma of je bijvoorbeeld een nieuwe of herhalende bezoeker bent. Met dit ID kunnen we dus de verschillende soorten bezoekers van je website inzichtelijk maken of segmenteren.
Clustering met data uit Google Analytics
Om meer inzicht te krijgen in het gedrag van de bezoekers van je website is het mogelijk om de websitesbezoekers met een algoritme te clusteren. Eigenlijk doet je brein dit meerdere keren per dag om relaties te ontdekken tussen meerdere objecten. Als we bijvoorbeeld naar een snelweg vol auto’s kijken, vallen de gekleurde auto’s of auto’s die net een beetje anders zijn direct op. Dat komt omdat ze afwijken van het gemiddelde. Op dezelfde manier kan een algoritme ontdekken wat de verschillende clusters zijn in je klantendatabase of je websitebezoekers.
Bij clustering is het de taak van het algoritme om de data in een aantal groepen te verdelen. Het is in feite een verzameling objecten op basis van gelijkenis en ongelijkheid daartussen. Het algoritme kan daarin zelf of je kan vooraf handmatig bepalen hoeveel groepen er moeten worden aangemaakt.
Klantsegmenten ontdekken
Door aan clusters een label toe te voegen kun je meerdere clusters met elkaar combineren, denk hierbij aan ‘High value customers’ in combinatie met ‘Customers shopping at night’. Zo kun je bepaalde klantsegmenten definieren en hen gericht benaderen met specifieke marketingacties. Clustering kun je bijvoorbeeld ook gebruiken om je ‘Most Valued Customers’ te ontdekken. Behalve klanten die eenmalig een duur product kopen, kun je ook je loyale klanten die meerdere keren terugkeren om voor een klein bedrag iets te kopen in kaart brengen. Zodra je dit cluster inzichtelijk hebt kun je deze mensen bijvoorbeeld een mail sturen om hen te bedanken voor hun loyaliteit.
Wanneer bezoekers op je website een account hebben aangemaakt, kunnen ook deze gegevens worden gebruikt om te clusteren. Hierbij kan een algoritme naar de verzamelde data kijken en een samenhang tussen verschillende accounts ontdekken. Webshops kunnen bijvoorbeeld voor marketing doeleinden gegevens nodig hebben van een specifieke doelgroep. Door in het algoritme labels aan clusters te hangen kun je snel gecombineerde clusters aanmaken en daardoor krachtige zoekopdrachten uitvoeren binnen je dataset.
Zo’n label kunnen we toevoegen aan een cluster met daarin bijvoorbeeld meerdere componenten. Neem bijvoorbeeld het volgende cluster van bezoekers met daarin de volgende componenten:
Bezoekers die
- meerdere producten hebben gekocht
- met een bepaalde totale waarde
- minder dan X aantal webpagina’s hebben bezocht
- vanaf een bepaalde geolocatie
- er X aantal minuten over hebben gedaan om af te rekenen.
Bovenstaande bezoekers hebben online meerdere aankopen gedaan en hebben hiervoor minder dan X webpagina’s bezocht. We kunnen hiermee dus onderzoeken hoe gericht een bezoeker op jouw website heeft gezocht naar een product. Mogelijk kwamen ze binnen via een bepaalde zoekmachine of kwamen ze even rondneuzen. Door dit cluster op te slaan worden voortaan alle nieuwe bezoekers die hieraan voldoen, automatisch in dit cluster opgenomen. Zo kunnen we de verhouding bekijken tussen de andere clusters.
Toepassingen
Eigenlijk zijn er enorm veel verschillende toepassingen mogelijk. Zeker als je je dataset uit Google Analytics met andere datasets verbindt. Het is verstandig om deze gegevens allemaal op een centrale plek op te slaan zodat je er gemakkelijk bij kunt en zelf analyses kunt doen. Door de gegevens van je websitebezoekers bijvoorbeeld automatisch door te sturen naar je CRM, zodra een klant een aankoop heeft gedaan, kun je heel gemakkelijk in je CRM-systeem filteren op je clusters. Ook binnen de huidige privacywetgeving zijn er voldoende mogelijkheden om inzicht te krijgen in de kenmerken van je klanten.