High Quality Linked Data Generation from Heterogeneous Data

Datum: 14 november 2017

Locatie: UGent, Congrescentrum Het Pand, Vergaderzaal 2.3 - Onderbergen 1 - 9000 Gent

Tijdstip: 16 uur

Organisatie / co-organisatie: Departement Wiskunde-Informatica

Promovendus: Anastasia Dimou

Promotor: Steven Latré & Erik Mannens

Korte beschrijving: Doctoraatsverdediging Anastasia DIMOU - Faculteit Wetenschappen, Departement Wiskunde-Informatica



Abstract

Tegenwoordig werkt het Web als grootste drijvende kracht achter innovatie. Verschillende gegevens samen geven een volledig geïntegreerd zicht van gedistribueerde informatie. De opkomst van het Web was een revolutie voor de toegang tot gegevens. Het is echter niet zeker dat deze revolutie tot stand zou gekomen zijn, als relevante informatie niet kon gevonden en geïntegreerd worden. Het semantische Web is een uitbreiding van het huidige Web. Samen met Linked Data krijgt het tractie als een prominente oplossing voor kennisrepresentatie en integratie op het Web. Zijn echte kracht zal echter pas worden gerealiseerd wanneer een significant aantal softwareagenten bestaan die vertrouwen op informatie verkregen vanuit verschillende databronnen. Maar intelligente softwareagenten hebben nog steeds een beperkte bekwaamheid om verschillende gegevens samen te verwerken. Intelligente softwareagenten hebben niet genoeg gegevens om te verwerken en menselijke agenten willen niet de moeite te doen om Linked Data te voorzien totdat er zijn softwareagenten die het gebruiken.

Dit proefschrift stelt een set van complementaire technieken voor, elk adresseert een deel van de semantische, gerelateerde en geïntegreerde informatie-acquisitie van (semi-)gestructureerde gegevens van verschillende aard. Het uiteindelijke doel is om de generatie van Linked Data van hoge kwaliteit te vergemakkelijken, onafhankelijk van de beschikbare originele gegevens. (i) Wij bieden een oplossing, in de vorm van een mapping taal, RML, die het mogelijk maakt voor agenten om declaratieve mapping regels te definiëren die specificeren hoe gegevens worden gegenereerd; (ii) wij onderzoeken de factoren die alternatieve benaderingen bepalen om regel-gebaseerde Linked Data generatie te executeren; (iii) wij stellen een methodologie voor die toelaat  een kwaliteitsbeoordeling toe te passen op de regels die Linked Data genereren, en om die regels te verfijnen, in plaats van de kwaliteit van de gegenereerde Linked Data te beoordelen; (iv) wij presenteren volledige workflow(s) om Linked Data te genereren.



Url: http://www.uantwerpen.be/wetenschappen