Wat is machine learning?
Machine Learning is een vorm van kunstmatige intelligentie (AI). Eigenlijk zegt de naam het al: machines of computers leren zelf van data. Je vertelt een machine dus niet wat het moet doen, maar laat de machine zelf ontdekken wat patronen zijn. Een mooi voorbeeld zijn de aanbevelingen die je in Netflix ziet. Kijk je graag naar actiefilms? Dan zul je zien dat Netflix nieuwe actiefilms aanraadt. Het leert dus wat jouw kijkpatronen zijn en op basis daarvan krijg je nieuwe aanbevelingen te zien.
Hoe werkt machine learning?
Hoewel machine learning een elkaar opvolgend en continu herhalend proces is, kunnen er toch een aantal stappen onderscheiden worden:
- Stap één is het verzamelen en voorbereiden van gegevens. De gegevens worden gecontroleerd op fouten, goed ingedeeld en waar nodig aangepast.
- De tweede stap is het maken van het model. De data wordt gebruikt om het model te trainen, zodat het leert om goede voorspellingen te doen.
- De derde stap is het testen en controleren van het model. Dit wordt gedaan om te controleren hoe goed het model werkt. Hiermee wordt gemeten of het model nauwkeurig is.
- De vierde stap is het bekijken en begrijpen van de resultaten. Zo wordt duidelijk wat de gegevens laten zien en kunnen voorspellingen worden gedaan.
Machine learning in het dagelijks leven
Machine learning kom je ontzettend veel tegen in het dagelijks leven. Eerder noemden we al het voorbeeld van Netflix, maar ook Google Maps werkt met machine learning bij de realtime verkeersvoorspellingen. Ook webshops (‘Je hebt X bekeken, wellicht is artikel Y ook wat voor jou?’) en banken (voor risicobeoordeling en fraudedetectie) werken met machine learning. Tot slot komt het ook voor in de gezondheidszorg, door bijvoorbeeld op basis van symptomen een ziekte te herkennen.
De vier vormen van Machine Learning
Grofweg zijn er vier soorten machine learning te onderscheiden: supervised machine learning, unsupervised machine learning, semi-supervised machine learning en reinforcement learning.
Supervised machine learning
Supervised machine learning word het vaakst gebruikt in de machine learning. Bij supervised learning voer je gelabelde data in. Je geeft de machine bijvoorbeeld 100 foto’s van katten met daarbij het label ‘dit is een kat’. Op basis van de gelabelde data gaat de machine de patronen herkennen. Hiermee leer je dus eigenlijk de machine welke conclusies getrokken moeten worden. Dit wordt gebruikt bij zaken als een spamfilter of fraudedetectie bij banken.
Unsupervised machine learning
Bij unsupervised machine learning zoekt het systeem zelf patronen in data zonder dat je labels gebruikt. Dit wordt bijvoorbeeld gebruikt bij klantsegmentatie. Je geeft daar een grote dataset in met eigenschappen van jouw klanten en de machine gaat zelf patronen ontdekken. Bijvoorbeeld dat mensen in Amsterdam altijd meer uitgeven dan mensen in Rotterdam.
Semi-supervised machine learning
Semi-supervised machine learning zit tussen supervised en unsupervised in. Je gebruikt een kleine hoeveelheid gelabelde data en een grote hoeveelheid ongelabelde data. Stel dat je 1000 foto’s hebt, maar alleen 100 daarvan zijn gelabeld als ‘kat’ of ‘geen kat’. Met semi-supervised learning leert het systeem eerst van die gelabelde voorbeelden en gebruikt daarna de patronen die het ontdekt heeft om ook de rest van de data te analyseren.
Reinforcement learning
Bij reinforcement learning leert een model door proberen en fouten maken. Het neemt acties in een bepaalde omgeving en krijgt op basis van het resultaat beloningen of straffen. Op die manier leert het systeem zelf welke acties tot het beste resultaat leiden. Dit wordt bijvoorbeeld toegepast bij zelfrijdende auto’s of robots, die moeten leren hoe ze in verschillende situaties moeten reageren.
De voordelen van machine learning
Er zijn meerdere voordelen van machine learning:
- Sommige computersystemen zijn zo slim dat ze zelf leren van voorbeelden. Ze hebben geen uitgebreide lijst met regels nodig. In plaats daarvan kijken ze naar grote hoeveelheden informatie en leren ze daar iets van. Een programmeur kan hier niet tegenop werken.
- De systemen kunnen steeds slimmer worden, zolang ze regelmatig opnieuw getraind worden met nieuwe gegevens. Denk aan een app die steeds beter weet welke films jij leuk vindt, gewoon doordat jij blijft kijken.
- Soms zijn er taken die te veel tijd kosten voor mensen. Bijvoorbeeld duizenden berichten bekijken of gesprekken terugluisteren. Een slim systeem kan dat automatisch doen.
De nadelen van machine learning
Uiteraard zijn er ook nadelen aan machine learning:
- Een belangrijke kanttekening die gemaakt moet worden is dat machine learning geen magie is. Het is geen toverstafje waarmee je in één klap een perfecte analyse kan doen. Machine learning kent zo zijn grenzen. Zo is het bijvoorbeeld enkel zo goed als de data die het krijgt: garbage in, garbage out. Geef je de machine slechte data, dan krijg je slechte output.
- Daarnaast vereist het ook een continue evaluatie. Het model moet onderhouden, bijgestuurd en soms opnieuw getraind worden. Dat is dan ook de reden waarom we bij onze AI-chatbots standaard elke maand evalueren en bijsturen.
- Bovendien zijn er inhoudelijke beperkingen. Een veelvoorkomend probleem is overfitting: het model past zich zó goed aan, dat het moeite heeft om goed te presteren op nieuwe of onverwachte situaties. Het gevolg? Onbetrouwbare voorspellingen en foutieve beslissingen.
- Een ander belangrijk aandachtspunt is de beperkte verklaarbaarheid van sommige modellen. Ze werken als een soort ‘black box’, waardoor het lastig – of zelfs onmogelijk – is om te begrijpen waarom een beslissing is genomen.
- Tot slot is er nog het risico op culturele bias. Omdat modellen leren van data die door mensen is gemaakt en ingevoerd, nemen ze soms ook onbedoeld menselijke vooroordelen over. Dit kan leiden tot oneerlijke uitkomsten, zoals het bevoordelen van bepaalde groepen bij kredietbeoordelingen.
Nieuwsgierig geworden? Laten we eens een kop koffie drinken!