NLP Verkenning bij een internationaal havenbedrijf
Over de waarde van alle inkomende informatie via e-mail en de rol van NLP om dit te structureren en ordenen voor verdere verwerking.
Software selectie
Na een oriënterend gesprek met betrekking tot de wensen van de klant en een eerste indruk van de data, hebben we gekeken naar welke NLP-softwareleverancier de beste oplossing zou kunnen bieden voor deze uitdaging. Op basis van de verschillende vereisten hebben we drie leveranciers met elkaar vergeleken:
- Microsoft Cognitive Services
- Google Cloud Services
- Amazon Webservices
Door de RPA Quickscan te gebruiken kwamen we er al snel achter waar de pijnpunten in het proces zaten en waar de robots dus de meeste waarde zouden toevoegen.
Data analyse en informatiestroom
Om naast de software ook te analyseren hoe de inputstroom eruit ging zien doken we de data in. Temeer om een beter beeld te krijgen van het type informatie en de datakwaliteit. De informatie kon in de e-mail zelf zitten of in verschillende soorten bijlagen zoals Excel bestanden, pdf-documenten en/of afbeeldingen.
Op basis van een set met voorbeeld data zijn we gestart met de structuur en sleutelwoorden te herkennen en te markeren. Dit is een belangrijke stap om inzicht te krijgen in de waarde van de data.
De volgende stap van deze NLP-verkenning betrof het creëren van een dataset op basis waarvan de verschillende tools getoetst konden worden. Hiervoor was het noodzakelijk dat er een ‘datasample’ beschikbaar werd gesteld die typerend was voor de uitdaging van de klant. In dit geval een flinke hoeveelheid e-mailberichten voortkomend uit het inkomende e-mailverkeer.
Conclusie
Op basis van de software selectie i.c.m. de test en validatie van de datastromen hebben we het voor de klant inzichtelijk gemaakt waar en op welke manier een NLP gerelateerde software bij kan dragen aan de oplossing van haar probleem. Tevens hebben we duidelijk gemaakt dat de inzet van dergelijke tooling goed overwogen moet worden. Het is immers duidelijk geworden dat de structurering van data van groot belang is voor het succesvol kunnen toepassen van NLP (Crap in is Crap out).
Tot slot heeft de klant het inzicht gekregen dat zij op een schat van data zit en heeft tot in de top van de organisatie gesprekken over de bredere toepassing van deze innovatieve vorm van Machine Learning.