Onderzoeksgroep

Internet Data Lab (IDLab)

Het gebruik van Model-Based Reinforcement Learning met Monte-Carlo Tree Search om Neurale Netwerken te optimalizeren voor Embedded Devices. 01/11/2020 - 31/10/2022

Abstract

Op dit moment draaien de meeste AI systemen in de cloud. Voor sommige systemen, zoals real-time systemen, zorgt dit voor problemen. Voor deze systemen is het belangrijk dat we AI algoritmen op edge devices kunnen draaien. Het doel van mijn onderzoek is om reinforcement learning te gebruiken om neurale netwerken te ontwerpen, die vergelijkbare performantie halen met state-of-the-art netwerken, maar met een resource gebruik dat haalbaar is voor edge devices. Om dit doel te bereiken heb ik mijn werk in 3 onderdelen opgedeeld: multi-objective optimization, hardware embeddings en model-based reinforcement learning (MBRL) met monte carlo tree search (MCTS). In het eerste deel van mijn onderzoek zal ik op zoek gaan naar technieken om een multi-objective functie om te zetten naar een single-objective functie. Dit is nodig voor reinforcement learning systemen, omdat zij een scalaire reward verwachten. Voor het tweede luik van mijn onderzoek zal ik een hardware voorstelling ontwikkelen, die bruikbaar is voor een neuraal netwerk. Dit is nodig om het mogelijk te maken voor ons systeem om ten volle gebruik te kunnen maken van de architectuur van de onderliggende hardware. Tenslotte zal ik het MBRL gebruiken in de context van neural architecture search. In dit deel van mijn onderzoek gebruik ik de ontwikkelde scalarisatie technieken en hardware voorstelling, tesamen met een MBRL systeem om neural netwerken te genereren voor specifieke devices.

Onderzoeker(s)

Onderzoeksgroep(en)