UAntwerpen detecteert fiscale fraude met data science

Datum: 4 maart 2019

Inleiding: Jellis Vanhoeyveld gebruikt data science om via belastingaangiften en demografische gegevens fiscale fraude op te sporen.

De omvang, impact en diversiteit van de fiscale fraudeproblematiek en de beperkte huidige controlecapaciteit zorgen ervoor dat overheden steeds meer geïnteresseerd zijn in geavanceerde fraudedetectiemethoden. Kersvers doctor Jellis Vanhoeyveld (UAntwerpen, Faculteit Bedrijfswetenschappen en Economie) ontwikkelde nieuwe dataminingtechnieken voor het detecteren van fiscale fraude, gestaafd met gevalstudies in de domeinen van btw-fraude en douanefraude. Met datamining kunnen op een geautomatiseerde wijze fraudepatronen worden geïdentificeerd op basis van o.a. belastingaangiften, financiële transacties en sociodemografische gegevens. Op die manier vermindert datamining het verlies aan fiscale inkomsten en creëert het een afschrikeffect voor fraudeurs.

Bedrijven (douaneoperatoren) die goederen willen importeren in België moeten via een online applicatie een douaneaangifteformulier invullen. Malafide bedrijven kunnen fraude plegen door bijvoorbeeld smokkel, de onderwaardering van goederen of de import van namaakgoederen. Op basis van een database van aangiftes met gekende fraude en legale gevallen (bekomen via douanecontroles) construeerden de onderzoekers van UAntwerpen dataminingmodellen die toelaten douanefraude te detecteren uitsluitend op basis van de gegevens in de aangifte.

“Op het aangifteformulier wordt namelijk klassieke informatie zoals de massa en de eenheidsprijs, maar ook fijnmazige informatie zoals de goederencode, de betrokken bedrijven en het land van oorsprong ingevoerd”, legt Vanhoeyveld uit. “Onze nieuwe algoritmes laten toe dergelijke fijnmazige gegevens te integreren in een fraudedetectiesysteem. De resultaten tonen aan dat deze integratie een significante verbetering in fraudedetectie teweegbrengt omdat de logistieke keten wordt blootgelegd.

Kristian Vanderwaeren, administrateur-generaal van de Belgische douane, is opgetogen over het systeem. “De samenwerking met UAntwerpen stelt de Algemene Administratie van Douane en Accijnzen (AADA) in staat om bepaalde databronnen te integreren. Met deze modellen zouden we op termijn een aantal relatief uitzonderlijke overtredingen in productveiligheid, gezondheid en milieu, kunnen voorspellen.”

Algoritme vindt tot 100 keer meer fraudegevallen

Een andere gevalstudie kaderde in het domein van de btw, waar fraude bijvoorbeeld mogelijk is door het registreren van fictieve aankopen, het niet aangeven van verkopen of het hanteren van valse facturen. Op basis van kennis van btw-recht werden een aantal vermoedelijke fraude-indicatoren (variabelen) opgesteld. Deze werden vervolgens aangewend in een sectoranalyse op basis van geanonimiseerde data uit 2014, waarbij bedrijven met afwijkend gedrag worden gesignaleerd.  Afhankelijk van de sector konden, in vergelijking met een willekeurige steekproef, op die manier 5 tot 100 keer meer fraudegevallen blootgelegd worden.

"Dit was een uitstekende samenwerking tussen de overheid en de universiteit, waarbij wij onze algoritmes hebben kunnen valideren op een domein met enorme maatschappelijke en economische implicaties”, vertellen promotoren prof. David Martens en prof. Bruno Peeters. “Buitenlandse administraties toonden alvast interesse in dit onderzoek."

Decaan prof. Koen Vandenbempt: "Binnen UAntwerpen vinden we het belangrijk dat ons onderzoek niet enkel een meerwaarde is voor de maatschappij – wat hier duidelijk het geval is –, maar ook dat het niet losstaat van ons onderwijs. Jellis zal dan ook binnenkort zijn onderzoek toelichten aan onze masterstudenten TEW en handelsingenieur.”