Onderzoeksgroep
Expertise
Ontwikkeling en studie van geavanceerde methoden voor Data Mining, Big Data Analytics, Recommender Systemen, Data Cleaning, en tal van andere technologieën gerelateerd aan het verwerken en analyseren van grote hoeveelheden data.
Fundamenten van bandit algoritmes voor aanbevelingssystemen.
Abstract
Aanbevelingssystemen gebaseerd op multi-armed bandit-algoritmen worden steeds vaker gebruikt. Echter, hun evaluatiemethoden weerspiegelen vaak niet goed de dynamische aard van aanbevelingsscenario's in de echte wereld en verwaarlozen aspecten zoals, rechtvaardigheid, diversiteit en gebruikerstevredenheid op lange termijn. Dit belemmert de ontwikkeling van algoritmen die goed presteren in de praktijk en heeft invloed op verschillende sectoren, waaronder nieuws, e-commerce en streamingdiensten. In dit project pakken we deze kritieke kwesties aan door een uitgebreid kader te creëren voor het evalueren van bandit-algoritmen in diverse aanbevelingsscenario's en het ontwikkelen van nieuwe algoritmen om huidige tekortkomingen aan te pakken. We stellen voor om de state-of-the-art bandit-algoritmen te beoordelen, hun beperkingen te identificeren en nieuwe methoden te introduceren die zich op die beperkingen richten. Het project zal gebruikmaken van publieke datasets en een nieuw simulatie-omgeving om realistische en reproduceerbare resultaten te waarborgen. Ons onderzoek zal leiden tot fundamentele tools en inzichten, waardoor de ontwikkeling mogelijk wordt van effectievere en verantwoordelijke aanbevelingssystemen die de tevredenheid van gebruikers verbeteren.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Daniëls Noah
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Vlaams Artificiële Intelligentie Onderzoeksprogramma (VAIOP) – tweede cyclus.
Abstract
Het Vlaams Artificiële Intelligentie Onderzoeksprogramma is een strategisch basisonderzoeksprogramma met een consortium van elf partners: de vijf Vlaamse universiteiten (KU Leuven, Universiteit Gent, Universiteit Antwerpen, Universiteit Hasselt, Vrije Universiteit Brussel) en zes onderzoekscentra (imec, Flanders Make, VIB, VITO, Sirris en ILVO). Het programma brengt 300+ onderzoekers samen op het gebied van nieuwe AI-methoden die kunnen worden gebruikt in innovatieve toepassingen in gezondheid, industrie, planeet en energie en samenleving. Op die manier draagt het programma bij tot een succesvolle adoptie van AI in Vlaanderen. De ambitie is dat Vlaanderen een sterke internationale positie inneemt op het vlak van strategisch basisonderzoek in AI, en dit binnen een sterk en duurzaam Vlaams ecosysteem. Er zijn vijf focusonderzoeksthema's geselecteerd: verantwoorde AI, mensgerichte AI, duurzame AI (energie-efficiënt en performant), productieve en data-efficiënte AI (systemen die weinig data nodig hebben, die presteren door data te combineren met domeinkennis en ervaring van experts) en veerkrachtige en performante AI (robuust tegen veranderingen in de omgeving). De beschrijving van de werkpakketten en hun onderzoekstaken definieert de aspecten binnen deze thema's die in het programma zullen worden onderzocht. De AI-oplossingen worden gedemonstreerd in real-life use cases. Deze resultaten tonen niet alleen de effectiviteit aan, maar inspireren ook bedrijven voor adoptie en onderzoekers voor verder onderzoek. Het Vlaams Artificiële Intelligentie Onderzoeksprogramma maakt deel uit van het Vlaams AI-beleidsplan. Meer info: www.flandersairesearch.beOnderzoeker(s)
- Promotor: Mannens Erik
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Famaey Jeroen
- Co-promotor: Goethals Bart
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Mets Kevin
- Co-promotor: Oramas Mogrovejo José Antonio
- Co-promotor: Sijbers Jan
- Co-promotor: Van Leekwijck Werner
- Co-promotor: Verdonck Tim
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Interpreteerbare regelgebaseerde aanbevelingssystemen.
Abstract
Aanbevelingssystemen helpen om de meest relevante items uit een enorme verzameling te identificeren. In recente onafhankelijke evaluatiestudies is aangetoond dat regelgebaseerde modellen even accuraat zijn dan complexere state-of-the-art modellen. Bovendien hebben op regels gebaseerde algoritmen interessante eigenschappen, zoals het potentieel van interpreteerbaarheid, het vermogen om lokale patronen te identificeren en de ondersteuning van context attributen. Ten eerste willen we bestaande aanbevelingsalgoritmen met verschillende biases en voorspellingsstrategieën onderzoeken en onafhankelijk evalueren. Naast nauwkeurigheid bestuderen we daarbij ook de diversiteit en structuur van de resulterende modellen, die belangrijk zijn voor het kaderen van de interpreteerbaarheid van de resultaten. Ten tweede slagen we een brug tussen aanbevelingssystemen en recente multi-label classificatie methoden die een optimale set van regels leren m.b.t. een verliesfunctie. We onderzoeken of een besluitvormingstheorie de identificatie van de optimale set van regels kan garanderen m.b.t. een verliesfunctie die rekening houdt met nauwkeurigheid, complexiteit en diversiteit. We houden daarbij ook rekening met de karakteristieken van aanbeveling datasets, zoals de ongelijke distributie, impliciete feedback en schaal. Ten slotte gebruiken we nieuwe, op regels gebaseerde algoritmen die nauwkeuriger zijn dan momenteel mogelijk voor intensive care monitoring en online voor e-commerce en nieuws.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Feremans Len
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoek naar vergeetmethoden om de privacy, veiligheid en bruikbaarheid van aanbevelingssystemen te waarborgen.
Abstract
De voorbije jaren zijn machine learning-algoritmen zijn zeer effectief gebleken bij het analyseren van grote hoeveelheden gegevens en het vinden van complexe patronen. Een toepassing van machine learning die veel aandacht heeft gekregen, zijn aanbevelingssystemen, dit zijn algoritmen die gebruikersgedrag en andere gegevens analyseren om inhoud voor te stellen waarin een gebruiker mogelijk geïnteresseerd is. Deze systemen kunnen echter onbedoeld gevoelige, verouderde of foutieve informatie bevatten. Dit vormt een risico voor hun privacy, beveiliging en bruikbaarheid. In dit voorstel willen we deze problemen aanpakken door "vergeetmethoden" te onderzoeken, waardoor informatie efficiënt kan worden "vergeten" door een model. Het hoofddoel van dit voorstel is het leggen van de basis voor toekomstige vergeetmethoden. We evalueren eerst de huidige vergeetmethoden en verkennen nieuwe vijandige aanvallen op de verifieerbaarheid, efficiëntie en nauwkeurigheid van deze methoden. Met behulp van onze verzamelde inzichten proberen we nieuwe vergeetmethoden te creëren die verifieerbaar en efficiënt zijn en niet leiden tot een sterke verslechtering van de accuraatheid van een model. Met dit voorstel proberen we een belangrijke bijdrage te leveren aan de theoretische grondslagen van "unlearning", terwijl we ook vergeetmethoden ontwikkelen die kunnen worden toegepast op reële problemen.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Leysen Jens
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Serendipity Engine: naar een verrassende en interessante stadsbeleving.
Abstract
Er wordt steeds vaker gewaarschuwd voor het sturende en beperkende karakter van aanbevelingssystemen. Hierbij wordt verwezen naar de trend om voornamelijk voorspelbare, populaire en homogene inhoud te promoten, ook wel bekend als "filter bubbels". In een stedelijke context heeft dit tot gevolg dat mensen niet meer worden blootgesteld aan de diversiteit van steden en van hun inwoners, wat negatieve gevolgen heeft voor het open en democratisch karakter van de stad. Dit actueel probleem heeft dringend aandacht nodig en er is dan ook een maatschappelijke vraag voor een transitie naar informatiesystemen die serendipiteit in de stad bevorderen. Vandaag mist er echter een duidelijk begrip van de betekenis en waarde van serendipiteit in stedelijke omgevingen en hoe digitale toepassingen kunnen ontwikkeld worden volgens dit principe. In dit project wordt de betekenis en waarde van serendipiteit uitgeklaard en wordt naar een beleidskader gewerkt om lokale besturen en beleidsmakers te ondersteunen in deze transitie. Daarnaast zal het project onderzoeken hoe ontwikkelaars dergelijke toepassingen kunnen ontwerpen op het vlak van data, algoritmes en design. Deze benadering is geïnspireerd op de theorie van de affordances en de bevindingen dat (digitale) omgevingen kunnen worden ontworpen om serendipiteit te stimuleren. Deze affordances (op het vlak van data, algoritmes en design) zullen worden ontworpen, ontwikkeld en getest aan de hand van de Living Lab methode in drie stedelijke pilootprojecten. Om deze methode te ondersteunen, wordt er tevens een nieuwe onderzoeksmethode ontwikkeld, specifiek gericht op het onderzoeken van de gebruikerservaring van serendipiteit.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoeksprogramma Artificiële Intelligentie.
Abstract
Het Vlaams AI-onderzoeksprogramma concentreert zich op generieke AI-methodologieën die algemeen inzetbaar zijn voor talloze toepassingen in de gezondheidszorg, de industrie en door de overheid. De noden zijn aangegeven door gebruikers uit deze toepassingsdomeinen.Onderzoeker(s)
- Promotor: Mannens Erik
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Goethals Bart
- Co-promotor: Latré Steven
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Sijbers Jan
- Co-promotor: Steckel Jan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoeksprogramma Artificiële Intelligentie.
Abstract
Het Vlaams AI-onderzoeksprogramma heeft als doel om het strategisch basis onderzoek omtrent AI aan de Vlaamse universiteiten en kenniscentrums te stimuleren. Dit onderzoek moet toepasbaar en relevant zijn voor de Vlaamse industrie. Concreet werden er 4 grote uitdagingen, met toenemende complexiteit, gedefinieerd: 1. Het ondersteunen van complexe beslissingen: focus op het nemen van complexe beslissingen door AI-systemen gebaseerd op datasets die mogelijks onvolledige of foutieve informatie kunnen bevatten. 2. Het verzamelen en verwerken van informatie in de edge: focus op het gebruik van AI-systemen in de egde i.p.v. de cloud door de integratie van software en hardware en de ontwikkeling van algoritmen die minder energie en andere hulpbronnen nodig hebben. 3. De autonome interactie met andere beslissingsentiteiten: focus op samenwerking tussen verschillende AI-systemen die onafhankelijk van elkaar opereren. 4. Het naadloos communiceren en samenwerken met mensen: focus op de natuurlijke interactie tussen mensen en AI-systemen en de ontwikkeling van AI-systemen die complexe omgevingen kunnen begrijpen en menselijke redeneringen kunnen toepassen.Onderzoeker(s)
- Promotor: Hellinckx Peter
- Promotor: Latré Steven
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Goethals Bart
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Sijbers Jan
- Co-promotor: Steckel Jan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Contextual anomaly detection for complex industrial assets (CONSCIOUS).
Abstract
CONSCIOUS (Contextual aNomaly deteCtIon for cOmplex indUstrial aSsets) focust op het detecteren van contextuele anomalieën in industriële machines en processen. In deze complexe omgevingen blijft het detecteren van anomalieën een grote uitdaging omwille van de zeer dynamische omstandigheden waarin deze assets opereren. De algemene doelstelling van dit voorstel bestaat erin effectieve oplossingen te vinden om anomalieën op een meer nauwkeurige, robuuste, tijdige en interpreteerbare wijze te detecteren in complexe, heterogene data uit industriële assets, waarbij rekening wordt gehouden met contextuele factoren die tot verwarring kunnen leiden. De resultaten zullen worden gevalideerd aan de hand van meerdere concrete use cases in verschillende domeinen. Voor dit project zal Sirris samenwerken met Skyline Communications, Duracell Batteries, I-care, Yazzoom, KU Leuven en de Universiteit Antwerpen.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Kwalitatieve Evaluatie van Automatisch Geleerde Modellen.
Abstract
Een veelvoorkomend en recent algemeen geaccepteerd probleem op het gebied van automatisch leren, is de black box-aard van veel algoritmen. In de praktijk kunnen deze algoritmen bekeken worden in termen van hun invoer en uitvoer, maar zonder enige kennis van hun interne werking. De meest beruchte voorbeelden in deze context, zijn artificiële neurale netwerken en deep learning technieken, maar ze zijn zeker niet de enige technieken die aan dit probleem lijden. Matrixfactorisatie modellen voor gepersonaliseerde aanbevelingen lijdt bijvoorbeeld aan hetzelfde gebrek aan interpreteerbaarheid. Ons onderzoek focust zich op het toepassen en aanpassen van pattern mining technieken om betekenisvolle inzichten te krijgen in big data algoritmen door hun invoer en uitvoer te analyseren, wat ons ook toestaat om verschillende algoritmen te vergelijken en de verborgen fenomenen te vinden die tot de verschillen leiden.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: De Pauw Joey
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Interpreteerbare kwalitatieve evaluatie van online aanbevelingssystemen.
Abstract
Individuen vertrouwen vaak op aanbevelingen van anderen bij het nemen van routinematige, dagelijkse beslissingen. Aanbevelingsalgoritmen die dit gedrag nabootsen, zijn essentieel voor het succes van e-commerce. Een open vraag is waarom algoritmen deze aanbevelingen doen. Dit is problematisch gezien dat de meest nauwkeurige algoritmen voor machine learning black-box-modellen zijn en we een dynamische omgeving hebben waarin mogelijk meerdere modellen worden geïmplementeerd en periodiek opnieuw worden getraind. Aangezien elke organisatie menselijk toezicht en besluitvorming nodig heeft, is er behoefte aan inzicht in gebruikersgedrag en interacties met aanbevelingen van black-box machine learning-algoritmen. Traditioneel worden twee aanbevelingssystemen vergeleken op basis van één statistiek, zoals de click-through-rate na een A/B-test. We zullen de prestaties van online aanbevelingssystemen kwalitatief beoordelen door patronen bloot te leggen die kenmerkend zijn voor de verschillen in beoogde gebruikers en items. We stellen voor om interpreteerbare machine learning toe te passen, waarbij het doel is om verklaringen te produceren die kunnen worden gebruikt om menselijk begrip en beslissingen te ondersteunen. Aan de hand van ontdekte interpreteerbare associatieregels en, mogelijk gegroepeerde, counterfactual verklaringen, genereren we waarom aanbevelingssysteem A beter (of slechter) presteert dan aanbevelingssysteem B.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Feremans Len
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Francqui Leerstoel 2019-2020 Prof. Luc De Raedt (KULeuven).
Abstract
Op voorstel van de Universiteit, kent de Francqui-Stichting elk jaar twee Francqui-Leerstoelen toe aan de UAntwerpen. Deze zijn bedoeld om de uitnodiging mogelijk te maken van een Professor van een andere Belgische Universiteit of uit het buitenland, voor een reeks van tien lesuren. De Francqui-Stichting betaalt aan de titularis van een Francqui-Leerstoel het honorarium voor deze tien lessen.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoeksprogramma Artificiële Intelligentie.
Abstract
Het Vlaams AI-onderzoeksprogramma heeft als doel om het strategisch basis onderzoek omtrent AI aan de Vlaamse universiteiten en kenniscentrums te stimuleren. Dit onderzoek moet toepasbaar en relevant zijn voor de Vlaamse industrie. Concreet werden er 4 grote uitdagingen, met toenemende complexiteit, gedefinieerd: 1. Het ondersteunen van complexe beslissingen: focus op het nemen van complexe beslissingen door AI-systemen gebaseerd op datasets die mogelijks onvolledige of foutieve informatie kunnen bevatten. 2. Het verzamelen en verwerken van informatie in de edge: focus op het gebruik van AI-systemen in de egde i.p.v. de cloud door de integratie van software en hardware en de ontwikkeling van algoritmen die minder energie en andere hulpbronnen nodig hebben. 3. De autonome interactie met andere beslissingsentiteiten: focus op samenwerking tussen verschillende AI-systemen die onafhankelijk van elkaar opereren. 4. Het naadloos communiceren en samenwerken met mensen: focus op de natuurlijke interactie tussen mensen en AI-systemen en de ontwikkeling van AI-systemen die complexe omgevingen kunnen begrijpen en menselijke redeneringen kunnen toepassen.Onderzoeker(s)
- Promotor: Latré Steven
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Goethals Bart
- Co-promotor: Hellinckx Peter
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Sijbers Jan
- Co-promotor: Steckel Jan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Patroon gebaseerde aanbevelingssystemen
Abstract
Het doel van dit project is om nieuwe algoritmes te onderzoeken voor aanbevelingssystemen die in het Froomle platform gebruikt kunnen worden. Meer specifiek zal men zich toeleggen op onderzoek naar nieuwe methodes die gebruik maken van recente ontwikkelingen in pattern mining.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Gepersonaliseerde zoekmachines.
Abstract
Het is onze ambitie om een fundamentele bijdrage te leveren aan state-of-the-art gepersonaliseerde zoekmachines - met een focus op e-commerce, e-news en video - door het bestuderen en ontwikkelen van nieuwe gepersonaliseerde zoek-algoritmes die zowel de gebruikte zoektermen alsook de volledige online en offline gebruikerservaring van de bezoeker in rekening nemen. Concreet zullen we dit doen door volgende onderzoeksthema's te behandelen: Eerst, in de context van gepersonaliseerde zoekmachines, hoe meten en evalueren we succes? Gepersonaliseerde zoekmachines zijn een relatief recent onderzoeksdomein en aldus bestaat er nog geen gestandaardiseerd kader en een benchmark dataset op basis waarvan succes gemeten kan worden. In andere, meer mature, onderzoeksdomeinen bestaan deze wel, e.g. LETOR (learning-to-rank) of MovieLens (recommender systems). Het is ons doel om zulk een gestandaardiseerd kader en een benchmark dataset te ontwikkelen die kan gebruikt worden om de prestaties van verschillende algoritmes met elkaar te vergelijken. Concreet is het ons doel om een live test uit te voeren voor retail, voor video en voor nieuws, waarbij we de resultaten evalueren volgens de ontwikkelde KPI's voor het corresponderende domein. Ten tweede, hoe kan gedrag-gebaseerde relevantie en op zoektermen gebaseerde relevantie gecombineerd worden om een optimale ordening van items te bepalen die gepersonaliseerd is voor elk individu? Om de gebruiker relevante zoekresultaten te tonen gerangschikt volgens hun persoonlijke voorkeuren dienen we (minstens) twee "maten" voor relevantie te combineren: relevantie op basis van de zoekterm en relevantie voor de gebruiker als persoon. Beiden kunnen opnieuw samengesteld zijn uit verschillende delen, e.g. pagina's bezocht, items gekocht, etc. als we spreken over persoonlijke relevantie en overeenkomst met de zoekterm, autoriteit of "versheid" van elk van de zoekresultaten voor zoek-gerelateerde relevantie. Het is ons doel te identificeren welke van de voornoemde delen (of "features" in de terminologie) relevant kunnen zijn in het aanbieden van een optimale gepersonaliseerde zoekervaring, bv. bezochte pagina's en versheid, maar niet autoriteit en gekochte items. Dan behandelen we een volgende probleem: hoe moeten we deze scores nu combineren? Dit is allesbehalve een triviaal probleem en statische combinatie van persoonlijke en zoek-gerelateerde relevantie is niet genoeg. Om dit probleem op te lossen dienen we ten minste één ordenings-algoritme te ontwikkelen die verschillende inputs kunnen vertalen in een optimale ranking, gepersonaliseerd op het niveau van het individu. Dit vereist dan ook dat we nieuwe objectieven moeten definiëren die dit persoonlijke aspect van een ordening in rekening kunnen brengen. Ten derde, kunnen we een geïntegreerde ordenings-oplossing ontwikkelen die het gepersonaliseerde zoekprobleem herleidt tot het optimaal bepalen van de intentie van de gebruiker, eerder dan het optimaal combineren van de zoekterm met historisch gedrag? Dit alles leidt dan tot de laatste onderzoeksvraag. In plaats van verder te bouwen op het bestaande kader binnen het learning-to-rank onderzoeksdomein - i.e. een tweestaps aanpak voor ordening: eerst ophalen, dan ordenen -, kunnen we in de plaats hiervan het probleem kaderen als een aanbevelings probleem, waar een zoekterm niet meer is dan een extra indicatie van het onderliggende doel van de gebruiker? Het ontwikkelen van deze nieuwe algoritmes voor gepersonaliseerde zoekmachines en een kader voor evaluatie zal Froomle toestaan om gepersonaliseerde zoekmachines toe te voegen aan hun bestaande aanbod aan aanbevelingssystemen. Dit is een belangrijke stap voorwaarts in het dichten van de kloof tussen de grote technologie giganten en meer traditionele offline bedrijven.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Fundamenten van aanbevelingssystemen.
Abstract
Aanbevelingssytemen zijn algoritmes die vooral bekend zijn voor hun toepassingen in e-commerce. Gegeven een specifieke klant en een groot aantal producten, vinden zij automatisch de meest relevante producten voor die specifieke klant. Hun mogelijkheden gaan echter veel verder. Zo kunnen ze bijvoorbeeld ook genen aanbevelen die met een grote waarschijnlijkheid verantwoordelijk zijn voor bepaalde ziektes, of woorden die relevant zijn voor bepaalde documenten, tags voor een foto, cursussen voor een student, etc. Huidig onderzoek naar aanbevelingssystemen wordt bijna volledig gestuurd door de (publiek) beschikbare datasets. Daarom blijft de volgende fundamentele vraag grotendeels onbeantwoord:"Gegeven twee datasets, hoe kunnen we bepalen dewelke van de twee kwalitatief de beste aanbevelingen genereert?" Daarenboven is de hoeksteen van aanbevelingssystemen onderzoek de evaluatie van de aanbevelingen die gegenereerd worden. Het meeste bestaande onderzoek is volledig afhankelijk van historische data om de kwaliteit van de aanbevelingen te meten. Er is echter geen overtuigend bewijs dat de performantiemeting van de aanbevelingen op historische data een goede plaatsvervanger is voor hun performantie in real-life situaties. Een tweede fundamentele vraag blijft dus ook tot nu toe onbestudeerd:"In hoeverre zijn real-life performantiemetingen van aanbevelingssystemen gecorreleerd met de metingen die berekend kunnen worden op historische data?" Met dit projectvoorstel willen wij deze twee fundamentele vragen bestuderen en kunnen beantwoorden.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Karimi Mozhgan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Datamining en continue spraak: Het modelleren van spraakverwerving bij kinderen door het blootleggen van bouwstenen en patronen in gesproken taal
Abstract
Complex gebruik van taal, en met name spraak, is een van de bepalende kenmerken van mensen, waardoor we ons onderscheiden van dieren. In de afgelopen decennia heeft spraakherkenning veel toepassingen gevonden en is nu bijvoorbeeld een standaardfunctie op moderne smartphones. De flexibele en krachtige leercapaciteiten van menselijke baby's zijn echter nog steeds niet geëvenaard door een machine. Jonge kinderen vinden een manier om alle spraak die ze horen te begrijpen en te generaliseren op een manier dat de patronen in de spraakklanken kunnen worden ontward, begrepen en herhaald. In een aparte onderzoekslijn, op het gebied van machine learning en datamining, zijn algoritmen ontwikkeld om patronen in data te ontdekken. De informatie die uit alle beschikbare gegevens kan worden gehaald, is een belangrijk aspect van het bedrijfsleven geworden, als we kijken naar video-aanbevelingssystemen of de financiële sector. Het idee van mijn onderzoek is het ontwikkelen en bestuderen van technieken die zijn geïnspireerd door deze datamining-algoritmen, om patronen uit spraak te halen. De inherente problemen van continue en luidruchtige spraak moeten worden overwonnen, omdat het niet alleen op dezelfde manier kan worden verwerkt als discrete en exacte gegevens. Na het aanpassen van deze methoden en het toepassen ervan op spraak, zal ik ze gebruiken in het wetenschappelijk onderzoek naar de bouwstenen van spraak, waarbij ze hun relevantie en validiteit evalueren. Verder zal ik, met behulp van deze, onderzoeken welke aspecten van spraak kinderen nodig hebben en vervolgens gebruiken om meer te weten te komen over deze bouwstenen.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Sturing van lot netwerken, interactie tussen datascience en modellering.
Abstract
Netwerken van onderling verbonden autonome rekeneenheden ondersteunen hoe langer hoe meer onze maatschappij, en interageren en beinvloeden mekaar in complexe en op soms onverwachte manieren. Voorbeelden hiervan zijn smart grids, intelligente verkeerslichten, of meer algemeen het zogenaamde Internet of Things. Het bestuderen en verstaan van de karakteristieken en dynamiek van deze systemen, zowel op lokale als op globale schaal, is cruciaal om ze te kunnen sturen in de richting van een gewenste toestand. De partners in dit WOG voorstel bestuderen elk cruciale eigenschappen van zulke complexe systemen, of ze zijn experts in gerelateerde gebieden die complementaire technieken aanbieden om de gigantische hoeveelheden data die gegenereerd worden te analyseren. Het samenbrengen van deze orthogonale expertisegebieden in een onderzoeksgemeenschap belooft tal van opportuniteiten te creëren voor kruisbestuiving en de ontwikkeling van nieuwe analyse en controle technieken.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
City of Things
Abstract
Steden maken gebruik van het Internet of Things om een slimme infrastructuur te bekomen en dit door gebruik te maken van sensoren en controle toestellen, met als doel het leven in de stad te verbeteren. Analyse van de verzamelde data zal op een geautomaseerde wijze een meer efficiënte controle van de verschillende processen in een stad mogelijk maken (bv. mobiliteit). Om de slimme stad infrastuktuur te bekomen beschouwen we drie lagen: de network/sensor laag, i.e. een stedelijk communicatienetwerk gebaseerd op een variëteit aan technologiëen en bijhorende protocol stacks waaraan sensoren zijn gekoppeld die de ruwe data verzamelen; een data laag die de continue stroom data opslaat en verwerkt (bv. toepassen van datamining technieken); een applicatie laag verantwoordelijk voor de interpretatie van de verwerkte data teneinde te komen tot een meer optimale controle van de stad. De network/sensor laag wordt behandeld door de MOSAIC onderzoekgsgroep (Dept. Wiskunde en Informatica, Chris Blondia and Steven Latré); de data laag is de verantwoordelijkheid is van de ADREM onderzoeksgroep (Dept. Wiskunde en Informatica, Bart Goethals); de applicatie laag wordt door de onderzoeksgroep Transport en Regionale Economie behandeld (Dept. Transport en Regionale Economie, Eddy Van de Voorde and Thierry Vaneslander). Het uiteindelijk doel van dit project is de expertise aanwezig aan de Universiteit Antwerpen op elk van deze drie lagen samen te brengen, met als bedoeling het onderzoek te bundelen en via intensieve samenwerking te komen tot een globaal raamwerk voor deze drie lagen. In het bijzonder wordt er gestreefd naar een smart city platform, gericht op mobiliteit, dat toelaat de smart city data in het algemeen en m.b.t. mobiliteit in het bijzonder, te capteren, te verwerken, te analyseren en te interpreteren. Als eindresultaat bekomen we een proof-of-concept waar de verschillende resultaten worden gecombineerd in een demonstrator.Onderzoeker(s)
- Promotor: Blondia Chris
- Co-promotor: Goethals Bart
- Co-promotor: Latré Steven
- Co-promotor: Van de Voorde Eddy
- Co-promotor: Vanelslander Thierry
Onderzoeksgroep(en)
Project website
Project type(s)
- Onderzoeksproject
De Slimme Stad
Abstract
Meer en meer alledaagse toestellen worden verbonden met het internet. Deze evolutie, die het internet der dingen (IoT) genoemd wordt, heeft een recente boost gegeven aan onderzoek naar grootschalige draadloze sensor netwerken. Meer specifiek worden steden met IoT technologie uitgerust maar echte grootschalige installaties van draadloze sensornetwerken geven nog erg grote onderzoeksuitdagingen. Tegelijkertijd is de stad ook een schat aan belangrijke data indien dit op een goeie manier kan gemonitord worden. Testbeds worden vaak gebruikt om onderzoeksresultaten te valideren maar een grootschalige en multi-technologie slimme stad infrastructuur is momenteel nog onbestaand. De City of Things onderzoeksinfrastructuur wil een multi-technologie en multi-niveau testbed bouwen in de stad van Antwerpen. 100 locaties, verdeeld over de stad, zullen voorzien worden van sensor basisstations. Deze basisstations worden vervolgens verbonden met een reeks van sensoren die informatie verzamelen omtrent mobiliteit, geluid, luchtkwaliteit, enz.Onderzoeker(s)
- Promotor: Blondia Chris
- Co-promotor: Blust Ronny
- Co-promotor: De Backer Charlotte
- Co-promotor: Goethals Bart
- Co-promotor: Hellinckx Peter
- Co-promotor: Latré Steven
- Co-promotor: Poels Karolien
- Co-promotor: Samson Roeland
- Co-promotor: Vandebosch Heidi
- Co-promotor: Vanelslander Thierry
- Co-promotor: Walrave Michel
- Co-promotor: Weyn Maarten
Onderzoeksgroep(en)
Project website
Project type(s)
- Onderzoeksproject
Validatie van de ADReM personaliseringsalgoritmes als basis van een spin-off.
Abstract
Personaliseringstechnologie laat een bedrijf toe om aan elke individuele klant een gepersonaliseerde selectie van relevante producten te tonen uit een gigantische catalogus. Als gevolg van hun onderzoek in het domein van recommender systemen, heeft de ADReM onderzoeksgroep kennis en expertise verzameld over personaliseringstechnologie. Dit project is gericht op het oprichten van een spin-off bedrijf om deze kennis en expertise te valoriseren.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Verstrepen Koen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Declaratieve methoden in de informatica.
Abstract
Om tegemoet te komen aan de nood om steeds grotere en complexere software systemen te bouwen is er een groeiende vraag naar declaratieve methoden, die abstractie maken van onnodige details en zich toespitsen op de functionaliteit van de systemen. De onderzoeksgemeenschap heeft als doel de ontwikkeling van declaratieve methoden te bevorderen, in het bijzonder deze die voortspruiten uit onderzoek in gegevensbanken en functioneel en logisch programmeren.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Hypermodelling strategies on multi-stream time-series data for operational optimization (HYMOP).
Abstract
Het doel van het HYMOP project is de optimalisatie van de operaties en het onderhoud (O&M) van een vloot van industriele machines. Daarbij worden innovatieve modellerings-, dataverwerkings- en analysetechnieken gerealiseerd die in staat zijn om met grote hoeveelheden complexe data om te gaan in reële tijd. Dit zal toelaten om de steeds toenemende hoeveelheid sensors en communicatie tussen industriële toestellen beter te benutten.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Datamining en continue spraak: Het modelleren van spraakverwerving bij kinderen door het blootleggen van bouwstenen en patronen in gesproken taal;
Abstract
Het complexe gebruik van taal, en in het bijzonder spraak, is een van de bepalende kenmerken van de mens, waardoor we ons onderscheiden van dieren. In de afgelopen decennia heeft spraakherkenning veel toepassingen gevonden en is nu bijvoorbeeld een standaardfunctie op moderne smartphones. De flexibele en krachtige leercapaciteiten van menselijke zuigelingen zijn echter nog steeds niet door een machine geëvenaard. Jonge kinderen vinden een manier om een alle spraak die ze horen te ordenen en te generaliseren op een manier dat de patronen in de spraakgeluiden kunnen worden onderscheiden, begrepen en herhaald. In een aparte lijn van onderzoek, het veld van machine leren en data mining, werden algoritmes ontwikkeld om patronen in data te ontdekken. De informatie die uit alle beschikbare gegevens kan worden geëxtraheerd, is uitgegroeid tot een belangrijk aspect van het bedrijfsleven, als we kijken naar videorecommandation systems of de financiële sector. Het idee van mijn onderzoek is het ontwikkelen en bestuderen van technieken die geïnspireerd zijn door deze data mining algoritmes, om patronen uit spraak te extraheren. De inherente moeilijkheden van voortdurende en lawaaierige spraak moeten overwonnen worden, omdat het niet alleen kan worden verwerkt als discrete en exacte gegevens. Nadat deze methoden zijn aangepast en toegepast op spraak, zal ik ze gebruiken in het wetenschappelijk onderzoek over de bouwstenen van spraak, waarbij hun relevantie en validiteit worden beoordeeld. Daarnaast zal ik, met behulp hiervan, onderzoeken welke aspecten van spraak kinderen nodig hebben en vervolgens gebruiken om te leren over deze bouwstenen.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoek in het domein van de pattern mining.
Abstract
Verder bouwend op mijn expertise, en die van mijn onderzoeksgroep wil ik samen met de onderzoeksgroep van Geoff Webb de principes bestuderen van verschillende conditional pattern set mining technieken. Karakteristiek voor bestaande pattern mining technieken is dat men zoekt naar lokale patronen, wat betekent dat elk patroon onafhankelijk getest wordt van alle andere patronen, en dat het resultaat van de zoekopdracht vaak een (grote, ongestructureerde) verzameling patronen is. Voor gebruikers van datamining systemen is deze situatie alles behalve ideaal, omdat veel tijd en moeite gestopt moet worden in het naverwerken van de patronen om tot een kleinere verzameling patronen te komen die de verworven kennis interpreteerbaar samenvat, en toegepast kan worden voor clustering of voorspellingstechnieken. Veel hedendaagse data mining technieken bieden echter te weinig ondersteuning voor deze naverwerkingstaak.Het onderzoek dat ik wil opstarten tijdens dit project heeft als doel verbetering te brengen in deze situatie door nieuwe technieken te ontwikkelen en te bestuderen voor conditional pattern set mining.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Integratie van patroonherkenning in een bedrijf-gerelateerde omgeving.
Abstract
In dit project willen we het prototype van MIME, een tool voor interactieve patroonanalyse die werd ontwikkeld aan de Universiteit Antwerpen, verder ontwikkelen tot een professioneel inzetbare tool. Op deze manier willen we pattern mining toegankelijk maken voor bedrijven, die door middel van de tool op een snelle manier op zoek kunnen gaan naar interessante patronen die nuttig zijn bij het maken van belangrijke stategische beslissingen.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Moens Sandy
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Datafusie en gestructureerd input- en output- machinaal leren technieken voor geautomatiseerde klinische codering.
Abstract
Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds IWT. UA levert aan IWT de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.Onderzoeker(s)
- Promotor: Goethals Bart
- Promotor: Van den Bulcke Tim
- Co-promotor: Daelemans Walter
- Co-promotor: Luyten Leon
- Mandaathouder: Scheurwegs Elyne
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Exascience Life Pharma.
Abstract
Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds Janssen. UA levert aan Janssen de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.Onderzoeker(s)
- Promotor: Goethals Bart
- Promotor: Van den Bulcke Tim
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Fraudedetectie met behulp van data mining.
Abstract
Met behulp van data mining technieken zal getracht worden om patronen te ontdekken in fraude data. De data bevat onder meer geanonimiseerde transacties en fraude-labels. Hierbij zullen reeds ontworpen technieken getoetst worden aan grote datasets.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Een geïntegreerd informatica-platform voor op massaspectrometrie gebaseerde eiwitanalyse (InSPECtor).
Abstract
Verschillende computationele uitdagingen verhinderen momenteel de ruime inzetbaarheid van proteoomanalyses in een industriële en klinische omgeving. De doelstellingen van dit project bestaan uit het aanpakken van deze uitdagingen door het ontwikkelen van nieuwe data-analyse methoden en data mining algoritmen zodat massaspectrometrie gebaseerde eiwitanalyse een volwaardige analytische discipline kan worden.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Laukens Kris
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Evoluerende netwerk patronen.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Laukens Kris
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Ontwikkeling van een geautomatiseerd software platform voor ondersteuning en kwaliteitsverhoging van het coderen van klinische informatie.
Abstract
In dit project ontwikkelen we algoritmes en software om de kwaliteit van het coderen van klinische informatie in ziekenhuizen te verhogen en werken we een valorisatieplan uit. De algoritmes gebruiken state-of-the-art machine learning om inconsistenties te identificeren en codes te suggereren. We ontwerpen een business development strategie, trekken potentiële klanten aan en zoeken vervolgfinanciering.Onderzoeker(s)
- Promotor: Van den Bulcke Tim
- Co-promotor: Goethals Bart
- Co-promotor: Luyckx Kim
- Co-promotor: Luyten Leon
- Co-promotor: Smets Koen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Verifieerbare uitzonderingen vinden.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Müller Emmanuel
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Ontwikkeling van de BioGraph-technologie voor valorisatie in de levenswetenschappen.
Abstract
BioGraph is een aan de Universiteit Antwerpen ontwikkelde dataminingtechnologie voor ongesuperviseerde biomedische kennisvergaring via het geautomatiseerd ontdekken van hypothesen in geïntegreerde kennisdatabanken. We onderzoeken business-development-mogelijkheden en werken deze technologie uit naar een specifieke off-the-shelf-toepassing voor de interpretatie van microarraystudies.Onderzoeker(s)
- Promotor: Del-Favero Jurgen
- Co-promotor: De Rijk Peter
- Co-promotor: Goethals Bart
- Co-promotor: Liekens Anthony
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Instant Interactieve Data Exploratie.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Tatti Nikolaj
- Co-promotor: Vreeken Jilles
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
BIOMINA
Abstract
Biomina (Biomedical Informatics Expertise Centre Antwerpen) is een interdisciplinaire onderzoekssamenwerking tussen UA en UZA. Het project heeft tot doel innovatieve technieken te ontwikkelen voor de analyse en interpretatie van heterogene biomedische gegevens. Biomina situeert zich op het integratiepunt van klinische data en 'omics gegevens (genoom, transcriptoom, proteoom, …). Het structureren, integreren en analyseren van deze data vormt de kernactiviteit. Als centraal expertisecentrum en onderzoeksplatform, maakt het systeem biologie en translationele systeem geneeskunde onderzoek mogelijk.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Data mining voor privacy in sociale netwerken.
Abstract
Online sociale netwerken en het uitwisselen van informatie zijn een onderdeel geworden van het dagelijkse leven, wat resulteert in een groot aantal mensen die de meest intieme details van hun privéleven delen op social networking sites zoals Facebook, Netlog of Twitter. Hoewel het onderzoek over Social Network Analysis en privacy aanzienlijk gegroeid is in de afgelopen jaren, blijven veel fundamentele computationele vragen onbeantwoord. Specifiek: Sociale netwerken worden over het algemeen gemodelleerd als grafen waarvan de knopen natuurlijke personen voorstellen, en waarvan de zijden "vriendschap" links vertegenwoordigen. Privacy wordt verondersteld te worden gerespecteerd wanneer bepaalde informatie niet toegankelijk is of indien die kan worden overgedragen tussen knopen zonder verder onthuld te worden. Dit eenvoudige model voldoet echter niet, zowel conceptueel als algoritmisch, het houdt geen rekening met de onderlinge afhankelijkheden tussen individuen als een kernelement van het Social Web, en houdt geen rekening met informatie van derden. Dit project beoogt deze lacune te vullen. We bestuderen: (1) privacy design types, (2) lokaal-globaal dynamiek; (3) intelligente micro-identity management, en (4) privacy voor groepen. We zullen de ontwikkeling van nieuwe technieken voor (i) verkeersanalyse om social-network-gebaseerde interacties en gebruikersgedrag te analyseren; (ii) metrieken om lekken van prive-informatie te meten; (iii) pattern mining om realistische resultaten te identificeren op basis van simulatiemodellen gevalideerd in het toepassingsgebied van web-gebaseerde sociale netwerken.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Karakteristieke patroonverzamelingen vinden via compressie.
Abstract
Bestaande patroonvorsingsalgoritmen genereren met gemak zeer grote aantallen patronen, waardoor de resultaten onhandelbaar en niet te interpreteren zijn. In dit project stellen wij voor om theorie te ontwikkelen om via compressie karakteristieke patroongroepen uit eender welke databank te extraheren. Dit opdat resultaten voor de gebruiker direct te interpreteren en vooral zeer bruikbaar zijn.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Vreeken Jilles
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Database Summarizatie
Abstract
In dit onderzoek beogen we de ontwikkeling van verschillende technieken om databanken samen te vatten, gebruik makende van de patronen die in de databank voorkomen. Aan de hand van state of the art data mining technieken trachten we kleine verzamelingen patronen te vinden die de data zo goed mogelijk karakteriseert.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Mampaey Michael
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Theoretische fundamenten van het vinden van significanten patronen in data mining.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Tatti Nikolaj
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Analyse van high-throughput data door middel van support vector machines en kernel-gebaseerde technieken: feature selectie en adaptieve modelbouw.
Abstract
In vele real-life toepassingen is informatie afkomstig van metingen onmisbaar om de kwaliteit van eindproducten te garanderen en controle uit te oefenen op het productieproces. Deze metingen zijn veelal afkomstig van online hardware analysers (bijvoorbeeld thermometers, stroommeters . . . ). Er zijn echter vele karakteristieken die men niet met online apparatuur kan verkrijgen en waarvoor tijdrovende en/of computationeel intensieve analyse noodzakelijk is. Voor die karakteristieken worden vaak modellen gehanteerd om de resultaten van de analyse te voorspellen vanuit de proces variabelen. De analyse wordt nadien gebruikt als bevestiging van het gekozen model. Modellen worden soms ook gebruikt om online hardware analysers te voorspellen, deze laatste zijn immers onderhevig aan corrosie of kunnen gaan afwijken van de optimale configuratie. In dit project willen we een aantal onderzoeksproblemen bestuderen die optreden bij de constructie van modellen met behulp van Support Vector Machines. Onze interesse in het bouwen van modellen met SVMs heeft verschillende redenen. - Het is algemeen geweten dat SVMs hoog dimensionale data aankunnen zonder te lijden aan de "curse of dimensionality". - Het inpluggen van kernels laat toe niet-lineaire modellen op te stellen. - SVMs kunnen ongevoelig gemaakt worden voor ruis en outliers. - Ten slotte, de bekwaamheid van SVMs om "abnormale" data punten te identificeren, maakt ze nuttig in detectie van outliers en anomalieën. De problemen die we in dit project willen onderzoeken zijn de volgende. I. Feature selectie en integratie van domeinkennis Het doel is te onderzoeken of we gelijkaardige resultaten kunnen boeken bij Support Vector Regressie (SVR) en hoe goed deze technieken zich laten vertalen naar single-class problemen. II. Adaptieve modelbouw Technieken die het mogelijk maken de inferentie sensor aan te passen in alle mogelijke gevallen van novelty detectie, en voornamelijk wanneer het wiskundige model deels moet worden heropgebouwd, staan nog steeds in de kinderschoenen en vormen het tweede luik van het onderzoek.Onderzoeker(s)
- Promotor: Goethals Bart
- Mandaathouder: Smets Koen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Karakteristieke patroonverzamelingen vinden via compressie.
Abstract
Bestaande patroonvorsingsalgoritmen genereren met gemak zeer grote aantallen patronen, waardoor de resultaten onhandelbaar en niet te interpreteren zijn. In dit project stellen wij voor om algemene technieken te ontwikkelen die compressie gebruiken om kleine karakteristieke patroongroepen te vinden die gezamenlijk de te analyseren gegevens goed beschrijven, en door de gebruiker direct te interpreteren zijn.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Fundamenten van Pattern Set Mining voor Gestructureerde data.
Abstract
In dit project stellen we voor algemene technieken te ontwikkelen en te bestuderen voor het direct zoeken naar verzamelingen van patronen. Zulke verzamelingen moeten alleen hogekwaliteitspatronen bevatten die van belang zijn voor de gebruiker en de toepassing. Door pattern set mining technieken te ontwikkelen hopen we deze technieken van het lokale naar het globale niveau te brengen, wat bijdraagt aan een beter begrip van de rol van pattern mining techieken in datamining en machine learning.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: De Knijf Jeroen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Intelligente analyse en data-mining van massa-spectrometrische proteoom-gegevens.
Abstract
Massa spectrometrie (MS) is een krachtige analytische techniek om de structuur van moleculen, zoals eiwitten, op te helderen. Tot op heden blijft een aanzienlijke fractie van de gegevens die daaruit voortkomen oninterpreteerbaar. In dit project worden state-of-the-art data mining technieken toegepast op een zeer grote MS dataset, met de bedoeling nieuwe patronen terug te vinden die kunnen wijzen op onbekende structuurmodificaties.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Laukens Kris
- Co-promotor: Lemière Filip
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Machine learning technieken voor datamining en hun toepassingen.
Abstract
De onderzoeksgemeenschap streeft naar de versterking en de coordinatie van het Vlaamse onderzoek op het gebied van machine learning voor datamining in het algemeen, en bepaalde belangrijke toepassingen zoals bioinformatica en tekstmining in het bijzonder. Vlaamse participanten: Computational Modeling Lab (VUB), CNTS (UA), ESAT-SISTA (KU Leuven), DTAI (KU Leuven), ADReM (UA).Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Principes van het ontginnen van patroonverzamelingen.
Abstract
De algemene doelen van dit project zijn 1) het bepalen van een computationeel raamwerk voor pattern set mining, 2) het bestuderen van de computationele eigenschappen van verschillende selectiepredikaten, 3) het ontwikkelen van algoritmen en systemen voor pattern set mining, 4) het onderzoeken van het gebruik van constraint programmeringstechnieken voor pattern set mining, 5) het evalueren van pattern set mining voor het oplossen van standaard datamining en machine learning taken, zowel conceptueel als experimenteel, en 6) het bestuderen van de representatie- en toepassingsaspecten van pattern set mining.Onderzoeker(s)
- Promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Analyse van high-throughput data door middel van support vector machines en kernel-gebaseerde technieken: feature selectie en adaptieve modelbouw.
Abstract
In vele real-life toepassingen is informatie afkomstig van metingen onmisbaar om de kwaliteit van eindproducten te garanderen en controle uit te oefenen op het productieproces. Deze metingen zijn veelal afkomstig van online hardware analysers (bijvoorbeeld thermometers, stroommeters . . . ). Er zijn echter vele karakteristieken die men niet met online apparatuur kan verkrijgen en waarvoor tijdrovende en/of computationeel intensieve analyse noodzakelijk is. Voor die karakteristieken worden vaak modellen gehanteerd om de resultaten van de analyse te voorspellen vanuit de proces variabelen. De analyse wordt nadien gebruikt als bevestiging van het gekozen model. Modellen worden soms ook gebruikt om online hardware analysers te voorspellen, deze laatste zijn immers onderhevig aan corrosie of kunnen gaan afwijken van de optimale configuratie. In dit project willen we een aantal onderzoeksproblemen bestuderen die optreden bij de constructie van modellen met behulp van Support Vector Machines. Onze interesse in het bouwen van modellen met SVMs heeft verschillende redenen. - Het is algemeen geweten dat SVMs hoog dimensionale data aankunnen zonder te lijden aan de "curse of dimensionality". - Het inpluggen van kernels laat toe niet-lineaire modellen op te stellen. - SVMs kunnen ongevoelig gemaakt worden voor ruis en outliers. - Ten slotte, de bekwaamheid van SVMs om "abnormale" data punten te identificeren, maakt ze nuttig in detectie van outliers en anomalieën. De problemen die we in dit project willen onderzoeken zijn de volgende. I. Feature selectie en integratie van domeinkennis Het doel is te onderzoeken of we gelijkaardige resultaten kunnen boeken bij Support Vector Regressie (SVR) en hoe goed deze technieken zich laten vertalen naar single-class problemen. II. Adaptieve modelbouw Technieken die het mogelijk maken de inferentie sensor aan te passen in alle mogelijke gevallen van novelty detectie, en voornamelijk wanneer het wiskundige model deels moet worden heropgebouwd, staan nog steeds in de kinderschoenen en vormen het tweede luik van het onderzoek.Onderzoeker(s)
- Promotor: Goethals Bart
- Promotor: Verdonk Brigitte
- Mandaathouder: Smets Koen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Fundamenten van inductieve databases voor data mining.
Abstract
Het project beoogt de ontwikkeling van een inductief database systeem voor de ondersteuning van het iteratieve data mining proces. Bij de realisatie van dit project identificeren we volgende stappen : 1) De ontwikkeling van een adequate theorie voor data mining in de vorm van een representatietaal om zowel data als inductief verkregen kennis op te slaan. Hierbij willen we focussen op eerste-orde logica fragmenten (bvb. conjunctive queries); 2) Het inpassen van bestaande data mining patroon types in dit model, zoals associatie regels, klassificatie, clustering; 3) Het ontwerpen van efficiënte implementaties van de voorgestelde modellen. Hierbij dient onder andere nagegaan te worden in hoeverre bestaande optimalisatietechnieken voor specifieke data mining probelemen en relationele databases veralgemeend kunnen worden naar inductieve databases.Onderzoeker(s)
- Promotor: Paredaens Jan
- Co-promotor: Calders Toon
- Co-promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Inductive queries for mining patterns and models (IQ).
Abstract
Gelieve aan te vullen a.u.bOnderzoeker(s)
- Promotor: Paredaens Jan
- Co-promotor: Goethals Bart
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject