Print:

Text mining: wat kun je ermee en wat is er mogelijk in de toekomst?

Irene Post , Freelance Copywriter

LinkedIn profiel

Snel enorme hoeveelheden artikelen doorzoeken en relaties leggen tussen informatie uit die verschillende teksten? Dat is handig voor bijvoorbeeld business intelligence of concurrentieanalyses, maar tot nu toe niet vanzelfsprekend. “Een computer begrijpt geen teksten. Hij kan wel indexeren, maar niet redeneren”, stelt Piek Vossen, hoogleraar computationele lexicologie aan de Vrije Universiteit Amsterdam. Vossen spreekt over text mining op de conferentie AI voor financial services.  “Als we begrijpen hoe taal in elkaar zit, kunnen computers steeds diepere en rijkere analyses maken.”

AI voor financial services | IIR

 

Waardevolle informatie voor business intelligence of supply chain management

De hoeveelheid data die een computer verwerkt is vele malen groter dan die een mens kan lezen, ook kan hij veranderingen beter signaleren. Text mining wordt op sommige plaatsen al gebruikt, al noemt Vossen deze systemen ‘oppervlakkig’. “Financieel analysten hebben bijvoorbeeld een dashboard om sentiment of bedrijfsnamen in het nieuws te herkennen. Als dit dashboard rood of groen kleurt, is het nieuws bij de meeste mensen al bekend en dan is het te laat. Door text-miningtechnieken te verfijnen, kun je dingen te weten komen voordat ze tot problemen leiden.” Dat kan waardevolle informatie opleveren voor bijvoorbeeld business intelligence, inkopers of supply chain management. Denk aan het beter beoordelen of een leverancier betrouwbaar is, door informatie uit het verleden te analyseren. Juist die verfijning is het werk van Vossen. “We hebben op dit moment een systeem dat miljoenen nieuwsartikelen kan lezen en hier alle informatie uit kan halen: gebeurtenissen, wie erbij betrokken is, in welk land en in welke bronnen dit wordt beschreven.”

Problemen voorkomen door informatie sneller te signaleren

De onderzoeksgroep van Vossen paste het systeem toe op de autoindustrie. Een industrie met honderdduizenden spelers en miljoenen stukjes informatie. Denk aan rechtzaken en overnames. Vossen geeft een voorbeeld van wat text mining hiermee kan doen: “Een bepaald auto-onderdeel van BMW wordt gemaakt door Bosch. Het aluminium kastje dat daarvoor nodig is, is specialistisch werk en wordt geproduceerd door een Italiaans familiebedrijf. Met dit bedrijf ging het niet zo goed. Dit werd pas bekend toen BMW niet meer kon leveren. BMW had dit al vele maanden eerder kunnen weten, toen in de Italiaanse kranten een bericht verscheen over ontslagen van werknemers bij het familiebedrijf. Maar niemand was gealarmeerd dat dit gevolgen zou hebben voor BMW. Ons computersysteem kijkt wél naar dat soort afhankelijkheden. En legt relaties die vele stappen verder gaan dan de relaties die we als mensen kunnen leggen. Daarmee had BMW een probleem met de levering veel eerder kunnen aanpakken.”

Relaties en gebeurtenissen als visuele structuur

De computer clustert de nieuwstopics en maakt hier een kennisstructuur van, verbeeld in een graaf. Dit is een soort kaart, waarin met pijlen de relaties tussen personen of bedrijfsnamen worden weergegeven. De relaties die belangrijker zijn, zijn dikkere pijlen. Gebeurtenissen worden op tijdlijnen weergegeven. “Hiermee kun je zien hoe zich iets heeft ontwikkeld in het verleden, wanneer er iets gebeurt en welke bedrijven erbij betrokken zijn. Een soort verhaalstructuur”, legt Vossen uit.

Steeds abstracter taalgebruik interpreteren

De software ontwikkeld door Vossen werkt in 4 talen: Engels, Nederlands, Spaans en Italiaans. “Hiermee zie je de crosslink tussen verschillende landen, die vaak een andere visie hebben op wat er gebeurt. Zoals dat Italiaanse pers laat zien dat een familiebedrijf failliet ging, en het Duitse perspectief is geïnteresseerd in hoe het zit met BMW”, zegt Vossen. Text mining is nu toe te passen op concrete teksten en gebeurtenissen. Het maakt diepere analyses, begrijpt bijvoorbeeld eigenschaps- of werknemerschapsrelaties en abstracte concepten zoals die vaak in artikelen worden gebruikt: dingen nemen toe, verbeteren, of nemen af. De toekomst is dat computers ook complexere teksten kunnen begrijpen. Vossen: “Voor de Financial Times verwerkte ons systeem 3 jaargangen van artikelen over Brexit. Deze waren zo complex dat er niets nuttigs uit kwam. De bedoeling is dat software steeds abstracter taalgebruik kan interpreteren. Nu herkent sommige software bijvoorbeeld wel ironie of sarcasme, maar kan dit niet interpreteren.

Toekomst voorspellen met text mining

De verfijning van text mining leidt tot steeds grotere en rijkere databases met enorme hoeveelheden kennis en informatie over bedrijven en personen. Vossen verwacht dat dit uitgebreide profielen oplevert. “Hiermee kan een verwachting naar de toekomst worden gemaakt voor risicoanalyses, of om innovaties op het spoor te komen. Wat kunnen we verwachten als een CEO bepaalde uitspraken doet, of welk soort samenwerkingen leiden tot nieuwe succesvolle activiteiten? Decision-support-tools leveren dan beredeneerd advies op grond van de ervaringen, en kunnen uitleggen waarom. Een mooie uitdaging voor de toekomst!”

Meer informatie?

Laat uw e-mail achter en ontvang de brochure direct in uw mailbox.

Wij gebruiken cookies om IIR.nl gemakkelijk te maken. Bezoekt u onze website, dan gaat u akkoord met deze cookies meer informatie

De cookie-instellingen op deze website zijn ingesteld op 'toestaan cookies "om u de beste surfervaring mogelijk. Als u doorgaat met deze website te gebruiken zonder het wijzigen van uw cookie-instellingen of u klikt op "Accepteren" hieronder dan bent u akkoord met deze instellingen.

Sluiten