Onderzoek Thomas Avé | Thomas Avé | Universiteit Antwerpen

Onderzoeksgroep

Internet Data Lab (IDLab)

Beleidscompressie voor Versterkend Leren op laag-vermogen Edge Devices. 01/11/2020 - 31/10/2024

Abstract

Versterkend leren is een actief veld in machinaal leren waar een agent leert om een taak uit te voeren door te interageren met de omgeving en het ontvangen van beloningen, afhankelijk van de gekozen actie. Recentelijk heeft versterkend leren veel doorbraken gezien in het verslaan van de beste menselijke spelers in verscheidene taken, zoals het klassiek bordspel Go en het populair videospel StarCraft II. Één van de redenen waarom de architecturen die gebruikt zijn zo succesvol zijn is dat bepaalde onderdelen relationeel kunnen denken, wat hen toelaat om de omgeving te zien in de vorm van objecten en gebruik te maken van relaties tussen deze objecten. Het veld van relationeel versterkend leren bekijkt hoe deze interacties tussen objecten geleerd kunnen worden en gebruikt om gegeven taken optimaal op te lossen. Aangezien dit veld relatief nieuw is, zijn er nog steeds veel open onderzoeksvragen, zoals hoe het beste voorstellingen van de omgeving, gebaseerd op deze objecten en relaties, gemaakt kunnen worden en hoe de efficiëntie van deze netwerken verbeterd kan worden door enkel de belangrijke relaties te leren terwijl irrelevante relaties genegeerd worden. In deze aanvraag introduceren we nieuwe architecturen in dit veld die ons toelaten om efficiënt de omgeving voor te stellen op een relationele manier, de efficiëntie te verbeteren door te focussen op de belangrijke relaties in deze voorstelling en de mogelijkheid om te generaliseren naar ongeziene taken te verhogen.

Onderzoeker(s)

Promotor: Latré Steven
Mandaathouder: Avé Thomas

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project type(s)

Onderzoeksproject