Technologen voorspellen TIME's Person of the Year met computermodel

Date: 11 December 2013

Introduction: Al sinds 1927 verkiest het tijdschrift TIME jaarlijks een Person of the Year. Woensdag 11 december maakt TIME bekend wie de Person of the Year 2013 is. Taaltechnologen doen een voorspelling met de hulp van een computermodel.

Een internationale groep taaltechnologen afkomstig van de Universiteit Antwerpen, de Radboud Universiteit Nijmegen, het Meertens Instituut en de University of Illinois heeft nu een computermodel ontwikkeld waarmee ze de uitkomst voor 2013 heeft voorspeld. Dit model maakt gebruik van de artikels die tijdens de voorafgaande jaargang door het blad zelf zijn gepubliceerd.

Mike Kestemont (UAntwerpen) licht toe: “Via kwantitatieve methodes uit de computertaalkunde kan men de culturele impact van personen in teksten meten. Bijvoorbeeld: als iemand gedurende lange tijd wordt vermeld in een onafgebroken reeks nummers van TIME, is dat veelzeggend. In plaats van louter frequentie-informatie te gebruiken, past het model Learning to rank toe, een geavanceerde technologie die vaak door online zoekmachines wordt toegepast. Het model maakt bovendien handig gebruik van informatie op Wikipedia voor dubbelzinnige persoonsnamen. Een computer weet immers niet onmiddellijk over welke ‘Clinton’ het gaat in een tekst.”

29% procent bij het rechte eind

De onderzoekers hebben hun model getest op eerdere Persons of the Year. Voor de periode 1923-2006 stond de Person of the Year in maar liefst 78% van de gevallen in de top tien van het model. Bij 29% kon het model de juiste persoon op de eerste plaats rangschikken. Dit zijn uitmuntende scores omdat het magazine in elke jaargang vaak meer dan 5000 verschillende personen vermeld. Soms kiest het tijdschrift ook abstracte groepen zoals The American Soldier in 2003 of You in 2006. “Op dergelijke keuzes bijt het model, begrijpelijk, haar tanden stuk”, stelt Kestemont.

Folgert Karsdorp (Meertens Instituut, Amsterdam / Radboud Universiteit Nijmegen) vult aan: “Het is verrassend dat deze beslissing in veel gevallen vrij goed te modelleren is. Misschien hebben we het voor 2013 bij het rechte eind, misschien niet. De redactie van TIME heeft steeds het laatste woord en zij deinst er niet voor terug om helemaal op het einde nog voor een aardige verrassing te zorgen. We zien wel.” Deze resultaten spreken boekdelen wat betreft de belangrijke rol die computers nog zullen spelen in geesteswetenschappelijk onderzoek, in het bijzonder de Digital Humanities of eHumanities.

Voor 2013 voorspelde het model onderstaande rangschikking, met Barack Obama in eerste positie en een opvallende derde plaats voor actrice Miley Cyrus. De zopas overleden Mandela valt in deze lijst net buiten de top 10. Voor de onderzoekers is het nu nieuwsgierig wachten op de officiële bekendmaking door TIME woensdag. Binnenkort zullen zij hun methode voor peer review indienen bij een vooraanstaand vaktijdschrift.

1 Barack Obama
2 Vladimir Putin
3 Miley Cyrus
4 George W. Bush
5 Angelina Jolie
6 Katie Couric
7 David Bowie
8 Rush Limbaugh
9 John Kerry
10 Hamid Karzai