Onderzoek Wout Bittremieux | Wout Bittremieux

Onderzoeksgroep

ADReM Data Lab (ADReM)

Expertise

Dr. Bittremieux onderzoekt hoe geavanceerde machine learning technieken gebruikt kunnen worden om nieuwe kennis te ontrafelen uit proteomics en metabolomics massaspectrometrie data. Naast zijn hoofdfocus op de toepassing van deep learning voor de analyze van massaspectrometrie data is dr. Bittremieux geïnteresseerd in allerlei bioinformatica problemen. Een belangrijk onderdeel van zijn werk betreft het ontwikkelen van computationele technieke voor de kwaliteitscontrole van biologische massaspectrometrie.

Een holistische benadering voor de beoordeling van milieublootstellingen en hun invloed op endocrien-gemedieerde en metabole aandoeningen (EXPOSOME 2.0). 01/01/2026 - 31/12/2031

Abstract

Achtergrond: Het exposoom omvat het geheel van milieublootstellingen van een individu of organisme gedurende het hele leven (inclusief blootstelling gelinkt aan chemicaliën, voeding, levensstijl, klimaatfactoren, stress,..), en hoe deze blootstellingen de biochemische status (bv. metabolieten, hormonen) en de gezondheid beïnvloeden. In het bijzonder is blootstelling aan hormoonverstorende chemicaliën (EDC's), waaronder metabool verstorende chemicaliën (MDC's), geassocieerd met een breed waaier aan niet-overdraagbare ziekten en gezondheidseffecten. Workflows voor het verzamelen en interpreteren van exposoomgegevens zijn nog in de ontwikkelingsfase en richten zich momenteel op het ophelderen van fysiologische routes die blootstelling koppelen aan schadelijke effecten. Uiteindelijk zal dit leiden tot een holistisch begrip over hoe blootstelling leidt naar negatieve gezondheidseffecten met mogelijk grote maatschappelijke, economische en ecologische impact. Doelstellingen: In Exposome2.0 zullen we innovatieve benaderingen gebruiken om het humane exposoom in kaart te brengen vanaf de vroege kindertijd tot op volwassen leeftijd en de associatie ervan met endocriene-gemoduleerde en metabole stoornissen (EMD's), die leiden tot aandoeningen zoals leverziekte, metabool syndroom, diabetes en obesitas, evenals effecten op andere belangrijke fysiologische processen die meestal worden aangestuurd door endocriene en metabole signalering

Onderzoeker(s)

Promotor: Covaci Adrian
Co-promotor: Bervoets Lieven
Co-promotor: Bittremieux Wout
Co-promotor: De Boeck Gudrun
Co-promotor: Hermans Nina
Co-promotor: Jorens Philippe
Co-promotor: Knapen Dries
Co-promotor: Leroy Jo
Co-promotor: van Nuijs Alexander

Onderzoeksgroep(en)

Toxicologie01/01/2026 - 31/12/2031

Financiering

Project type(s)

Onderzoeksproject

Integratie van machinaal leren en proteogenomica om therapeutische doelwitten tegen meerdere kankers te ontdekken. 01/12/2025 - 30/11/2027

Abstract

Dit project legt de basis voor een strategische samenwerking tussen Dr. Wout Bittremieux, een expert in computationele massaspectrometrie en artificiële intelligentie, en het team van Professor Ding Chen aan de Fudan Universiteit, een vooraanstaand centrum voor klinische proteogenomica. We zullen machine learning integreren met multi-omics data om nieuwe therapeutische targets voor alle kankersoorten te ontdekken, met een specifieke focus op het dichten van de kritieke lacune in precisie-oncologie voor Oost-Aziatische populaties. Onze aanpak maakt gebruik van een unieke bron: een diepgaand gefenotypeerde Chinese cohort bestaande uit meer dan 6000 tumorstalen van 27 kankertypen, compleet met genomische, transcriptomische, proteomische en fosfoproteomische data, gekoppeld aan langdurige klinische follow-up. Het project zal geavanceerde computationele methoden ontwikkelen, zoals federated learning voor privacyvriendelijke gedistribueerde analyse en nieuwe deep learning-modellen voor verbeterde peptidesequentiebepaling en spectrale interpretatie. Deze tools zullen worden ingezet om deze dataset te analyseren en zo genen en neoantigenen te identificeren die een belangrijke rol spelen bij de ontwikkeling van kanker en een hoog diagnostisch en therapeutisch potentieel hebben. De meest veelbelovende computationele voorspellingen zullen worden gevalideerd via een robuuste klinische pijplijn, waarbij gebruik wordt gemaakt van patiëntafgeleide xenograft- en celmodellen. De verwachte resultaten zijn: 1) het genereren van de eerste uitgebreide kaart van moleculaire drijfveren voor alle kankersoorten specifiek voor de Chinese bevolking, 2) het identificeren van een shortlist van prioritaire biomarkers en therapeutische targets voor kankers die veel voorkomen in Azië, en 3) het creëren van een nieuw paradigma voor veilige, internationale samenwerking op het gebied van proteogenomica. Dit project zal niet alleen het aanbod aan therapeutische targets verbreden, maar ook een kader creëren voor datagestuurde precisiegeneeskunde in onderbestudeerde populaties.

Onderzoeker(s)

Promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/12/2025 - 30/11/2027

Project type(s)

Onderzoeksproject

Moleculaire ontdekking in niet-doelgerichte metabolomics via geavanceerde datawetenschappen en machine learning. 01/11/2025 - 31/10/2029

Abstract

Hoewel onze capaciteit voor moleculaire ontdekking via kleine molecule massaspectrometrie (MS) sterk is gegroeid, resteert er een fundamentele uitdaging: de meeste MS/MS-spectra blijven ongeannoteerd, wat de mogelijke inzichten van dergelijke studies beperkt. Om deze kloof te overbruggen streeft mijn onderzoek naar een paradigmaverschuiving van heuristiekgestuurde analyses naar een data-gedreven aanpak om nieuwe moleculaire inzichten te onthullen. Om dit te realiseren, stel ik een drievoudige strategie voor om de interpretatie van MS-data te verbeteren. Ten eerste zal ik het zoeken in spectrale bibliotheken verfijnen door semi-gesuperviseerde machine learning en een target-decoy strategie te gebruiken om de sensitiviteit en betrouwbaarheid van annotaties te verhogen. Ten tweede zal ik het probleem van chimerische spectra aanpakken door een deep learning-gebaseerde deconvolutiemethode te ontwikkelen, waardoor overlappende isotopische enveloppen nauwkeurig kunnen worden gescheiden. Ten derde zal ik een aanpak ontwikkelen voor AI-gestuurde moleculaire netwerken op archiefschaal om voorheen niet-gekarakteriseerde moleculaire analogen te ontdekken, wat de capaciteit voor de ontdekking van kleine moleculen zal uitbreiden. Door de schat aan ongeannoteerde MS-data te benutten, zal dit project belangrijke vooruitgangen bieden voor biomedisch en milieugericht onderzoek. Het zal de wetenschappelijke gemeenschap voorzien van de volgende generatie aan tools voor moleculaire ontdekking.

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Heirman Janne

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/11/2025 - 31/10/2029

Financiering

Project type(s)

Onderzoeksproject

Privacy in proteomics: bewaken van persoonlijke identificeerbare informatie in klinische omics data. 01/11/2025 - 31/10/2028

Abstract

De vooruitgang in massaspectrometrie-gebaseerde proteomics heeft de studie van complexe biologische systemen gerevolutionariseerd en de karakterisatie van duizenden eiwitten in één enkel experiment mogelijk gemaakt. Recent zijn er belangrijke vragen aan het licht gekomen over de her-identificeerbaarheid van individuen via hun proteoomdata. In tegenstelling tot genomics en transcriptomics, zijn de risico's rond privacy in proteomics grotendeels ongekend. Geïnspireerd door technieken uit het veld van gezichtsherkenning, stel ik een nieuwe aanpak voor om risico's op inbreuk van privacy in klinische proteoomdata op te sporen. Vervolgens ga ik een methode ontwikkelen om deze data te de-identificeren en zo deze risico's te minimaliseren en de bruikbaarheid van de data te vrijwaren. Hiermee staat dit project aan de basis van een opkomend vakgebied. Het behandelt een probleem dat een belangrijk aandachtspunt zal worden in de nabije toekomst, met een wereldwijde toename aan publiek beschikbare en steeds gedetailleerdere proteoomdata. De resultaten van deze studie zullen bijdragen aan hoe dit veld wetenschappelijke vernieuwing kan blijven voortduwen, terwijl de individuele privacy beschermd blijft. Dit project kan leiden tot nieuwe standaarden in proteomics voor het voeren van privacy-bewust onderzoek en kan de basis vormen voor biomedische wetenschap die zowel impactvol als ethisch duurzaam is.

Onderzoeker(s)

Promotor: Bittremieux Wout
Co-promotor: Laukens Kris
Mandaathouder: Adams Charlotte

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/11/2025 - 31/10/2028

Financiering

Project type(s)

Onderzoeksproject

De novo massaspectrometrie peptide sequencing met een transformer groot taalmodel. 01/11/2025 - 31/10/2027

Abstract

Proteomics heeft als doel biologische systemen te begrijpen door eiwitten en hun modificaties te karakteriseren. Een belangrijke computationele uitdaging in massaspectrometrie (MS) gebaseerde proteomics is het identificeren van peptiden uit tandem-MS-spectra. Conventionele methoden worden beperkt door hun afhankelijkheid van bestaande databases met eiwitsequenties, waardoor een groot deel van de spectra niet geïdentificeerd kan worden. De novo peptide sequencing biedt een oplossing door peptidesequenties rechtstreeks uit spectra te genereren, maar de huidige oplossingen hebben verschillende beperkingen. Ze hebben een lage nauwkeurigheid, beperkte generaliseerbaarheid over verschillende MS instrumenten en hebben moeilijkheden bij het verwerken van complexere peptidenklassen zoals peptiden uit het immuunsysteem. Casanovo pakt deze beperkingen aan door gebruik te maken van recente vooruitgang in deep learning en taalmodellen. Casanovo heeft een transformer-gebaseerde architectuur waarmee het spectra naar aminozuursequenties vertaalt met ongekende nauwkeurigheid, en overtreft daarmee aanzienlijk de bestaande academische en commerciële de novo sequencing modellen. Dit project zal de prestaties van Casanovo verder verbeteren door de meest uitgebreide trainingsdataset tot nu toe samen te stellen, de modelarchitectuur te optimaliseren met een focus op nauwkeurigheid en efficiëntie, en gespecialiseerde strategieën te ontwikkelen voor toepassingen in immunopeptidomics. In het bijzonder zal het werk zich richten op het overwinnen van de unieke uitdagingen van niet-tryptische peptiden en diverse MS instrumenten. Daarnaast zullen nieuwe methoden worden ontwikkeld om de betrouwbaarheid van identificaties te kunnen inschatten, waarmee een statistisch kader wordt vastgesteld voor de interpretatie van de novo identificaties. Door de nauwkeurigheid, robuustheid en toegankelijkheid van de novo sequencing te verbeteren, zal dit project een next-generation AI-framework voor het identificeren van peptiden vestigen, waardoor diepere biologische inzichten mogelijk worden en onderzoek in proteomics wordt versneld, immunologie wordt bevorderd en innovatie in biotechnologie wordt gestimuleerd.

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Dens Ceder

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/11/2025 - 31/10/2027

Financiering

VLAIO

Project type(s)

Onderzoeksproject

AI-gestuurde metadata-annotatie en kwaliteitscontrole voor reproduceerbaar massaspectrometrie-gebaseerd omics-onderzoek. 01/11/2025 - 31/10/2026

Abstract

Massaspectrometrie (MS) is een essentiële technologie in proteomics en metabolomics, die grote hoeveelheden data genereert. Het hergebruik van data wordt echter belemmerd door onvolledige metadata en inconsistente kwaliteitscontrole (QC), waardoor onderzoekers beperkt zijn in het vinden, vergelijken en integreren van datasets. Ik zal deze barrières aanpakken door geavanceerde bioinformatica- en machine learning-oplossingen te ontwikkelen voor geautomatiseerde metadata-extractie en QC-beoordeling in MS-gebaseerde omics. Ten eerste zal ik workflows ontwerpen om metadata te extraheren uit ruwe MS-data en wetenschappelijke literatuur. Deze tools zullen worden geïntegreerd met publieke formaten en opslagplaatsen zoals SDRF-Proteomics en de PRIDE-database, waardoor gestructureerde annotatie van zowel technische parameters als biologische context voor openbare MS-data mogelijk wordt. Ten tweede zal ik een gestandaardiseerd QC-raamwerk implementeren dat zowel identificatievrije als -gebaseerde metrieken biedt, zodat onderzoekers in één oogopslag de betrouwbaarheid van data kunnen beoordelen. Een machine learning-gedreven dashboard zal de dataselectie verder mogelijk maken door afwijkende experimenten te markeren. Door de beschikbaarheid van metadata te verbeteren en transparante QC te garanderen, zal dit project hergebruik van openbare MS-datasets mogelijk maken, waardoor secundaire analyses, metastudies en AI-gestuurde toepassingen in MS-gebaseerde omics worden versneld.

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Mirzadeh Sarcheshmeh Fatemeh

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/11/2025 - 31/10/2026

Financiering

Project type(s)

Onderzoeksproject

Diep reinforcement leren voor massaspectrometriemetingen in metabolomics. 01/10/2025 - 31/07/2026

Abstract

Massaspectrometrie-gebaseerde metabolomics is een krachtige analytische techniek die wordt gebruikt om kleine moleculen in complexe biologische stalen te identificeren. De huidige methoden om data te meten zijn echter beperkt in het kunnen detecteren van alle relevante moleculen. Om dit probleem aan te pakken, zullen we artificiële intelligentie (AI) gebruiken om de massaspectrometriemetingen in realtime te optimaliseren, waardoor het aantal en de kwaliteit van geïdentificeerde moleculen kan worden geoptimaliseerd. Eerst zullen grote hoeveelheden publiekelijk beschikbare massaspectrometriegegevens gebruikt worden om een diep neuraal netwerk te ontwikkelen dat de kwaliteit van gegenereerde fragmentatiespectra kan voorspellen op basis van de actieve instrumentconfiguraties. Ten tweede zullen we offline reinforcement leren gebruiken om nieuwe instrumentconfiguraties te ontdekken die de massaspectrometriemetingen kunnen verbeteren. Een belangrijk aandachtspunt zal het definiëren van een geschikte beloningsfunctie zijn om de AI-agent zelfstandig te laten leren, waarbij rekening gehouden zal worden met de spectrumkwaliteit, de nieuwheid van de verworven spectra, en de instrumentsefficiëntie. Ten derde zullen we een virtuele massaspectrometrie-omgeving gebruiken om een fragmentatieproces te simuleren en de AI-agent te gebruiken om de metingen te besturen. Op basis hiervan zullen we de performantie van de AI-agent beoordelen en vergelijken met bestaande methoden. Eenmaal volledig getraind en gevalideerd, zal de AI-agent worden ingezet op een echte massaspectrometer om de metingen in realtime autonoom te besturen. Door AI te gebruiken om moleculaire ontdekkingen uit ongerichte metabolomicsexperimenten te optimaliseren, zullen we de identificatie van moleculen die momenteel over het hoofd worden gezien verbeteren en nieuwe waardevolle biologische inzichten verkrijgen. Deze vooruitgang zal transformatieve implicaties hebben voor precisiegeneeskunde, geneesmiddelenontdekking, en talloze andere gebieden van de levenswetenschappen.

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Bekbergenova Madina

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/10/2025 - 31/07/2026

Financiering

Project type(s)

Onderzoeksproject

Onderzoek naar de moleculaire samenstelling van inheemse, traditionele en onconventionele voedingsmiddelen in de Filipijnen. 01/09/2025 - 31/08/2027

Abstract

De Filipijnen herbergen een grote diversiteit aan endemische en erfgoedvoedselsoorten, maar hun nutritionele en bioactieve eigenschappen blijven grotendeels onontgonnen, waardoor hun potentieel voor het verbeteren van voeding, volksgezondheid en duurzame voedselsystemen beperkt is. Dit project beoogt de moleculaire samenstelling van deze unieke voedingsmiddelen te ontrafelen met behulp van geavanceerde metabolomics en bio-informatica. Filipijnse onderzoekers zullen in samenwerking voedselmonsters en massaspectrometrieanalyses leiden, waarbij ze hun expertise op het gebied van lokale biodiversiteit en voedselsystemen benutten, terwijl Vlaamse partners bio-informatica-expertise zullen inbrengen en gezamenlijk workflows voor data-analyse en trainingsprogramma's zullen ontwikkelen. Door middel van workshops en gezamenlijke onderzoeksactiviteiten zal het project de expertise op het gebied van foodomics en computationele biologie in beide regio's versterken. Door lokale gemeenschappen en beleidsmakers actief te betrekken, streven we ernaar wetenschappelijke bevindingen te vertalen naar praktische toepassingen en zo wereldwijde innovatie op lange termijn in duurzame voedselsystemen te bevorderen.

Onderzoeker(s)

Promotor: Bittremieux Wout
Co-promotor: Gauglitz Julia

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/09/2025 - 31/08/2027

Financiering

FED. INST.

Project type(s)

Onderzoeksproject

Accurate en schaalbare AI-gedreven de novo sequencing voor de ontdekking van immunopeptiden. 01/09/2025 - 31/08/2026

Abstract

Casanovo is een AI-gedreven softwareplatform voor de novo peptide sequencing, waarmee peptiden rechtstreeks kunnen worden geïdentificeerd op basis van tandem massaspectra, zonder afhankelijk te zijn van vooraf gedefinieerde eiwitdatabanken. Deze functionaliteit is cruciaal voor toepassingen zoals immunopeptidomics, waar standaard workflows het merendeel van de spectra niet kunnen interpreteren doordat de sequenties van de te beschouwen peptiden ongekend zijn en omwille van de aanwezigheid van post-translationele modificaties. Casanovo gebruikt een transformer neuraal netwerk om zeer sterke resultaten te leveren die bestaande academische en commerciële oplossingen aanzienlijk overtreffen. Dit project zal Casanovo verder ontwikkelen van een onderzoeksprototype tot een breed inzetbaar softwareplatform. We zullen ondersteuning voor post-translationele modificaties implementeren, de analyses versnellen via geoptimaliseerde cloud infrastructuur, en een intuïtieve webinterface aanbieden die AI-gedreven proteomics toegankelijk maakt voor een breed publiek. Tegelijkertijd zullen we eindgebruikers betrekken via gestructureerde pilootstudies en marktonderzoek doen om de positionering van het product te verfijnen, prijsmodellen te valideren, en een bedrijfsstrategie te definiëren. Door een cruciaal knelpunt in de interpretatie van massaspectrometriegegevens aan te pakken, positioneert dit project Casanovo als een innovatieve oplossing voor het ontdekken van peptiden binnen immunotherapie, vaccinontwikkeling, infectieziekteonderzoek, en andere belangrijke domeinen van biomedische innovatie.

Onderzoeker(s)

Promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/09/2025 - 31/08/2026

Financiering

Project type(s)

Onderzoeksproject

Nieuwe 3D multi-electrode technologie voor het meten van elektrische activiteit in complexe weefsels en organoïden. 01/06/2025 - 31/05/2027

Abstract

Deze aanvraag voor financiering is voor de aanschaf van een geavanceerd 3D Multi-Electrode Array (MEA) systeem om elektrofysiologische opnames van elektrisch activiteit mogelijk te maken in complexe weefsels en organoïden. Om de elektrofysiologische eigenschappen van prikkelbare cellen te bestuderen, wordt patch-clamping als de gouden standaard beschouwd, maar dit is een uiterst arbeidsintensieve en invasieve techniek en is beperkt tot korte-termijn metingen van individuele of kleine aantallen cellen op een enkel tijdstip. MEA's maken daarentegen niet-invasieve longitudinale real-time metingen met hoge doorvoer mogelijk van grotere functionele cellulaire netwerken zonder de belangrijke cel-celcontacten te verstoren. Dit maakt het mogelijk om metingen te verrichten van vele honderden tot duizenden cellen mogelijk waardoor een groter inzicht verschaft kan worden in belangrijke fysiologische processen. De huidige MEA-systemen aan de Universiteit Antwerpen omvatten alleen opstellingen die gebruik maken van reeksen vlakke elektroden die niet geschikt zijn voor metingen van complexe weefsels zoals hersen- en hart organoïden of weefselcoupes, omdat de elektroden niet dicht bij de actieve cellen komen. Dit 3D MEA-systeem bestaat daarentegen uit reeksen van ~0,1 mm verhoogde elektroden die herhaalde opnames mogelijk maken van actieve cellen in deze organoïden en weefsels die onder verschillende experimentele omstandigheden kunnen worden gekweekt. Er is een dringende behoefte omdat steeds meer onderzoeksgroepen aan de Universiteit Antwerpen dergelijke weefselmodellen gebruiken, maar niet over de middelen beschikken om hier in metingen te maken. Het 3D MEA-platform is hiervoor het meest geschikte instrument en zal meerdere groepen helpen om de pathomechanismen van neurologische en hartaandoeningen functioneel op te helderen alsook de mogelijkheid bieden om snel grote geneesmiddelenbibliotheken te screenen.

Onderzoeker(s)

Promotor: Ellender Tommas
Co-promotor: Bittremieux Wout
Co-promotor: in 't Groen Stijn
Co-promotor: Weckhuysen Sarah

Onderzoeksgroep(en)

Experimentele Neurobiologie Groep (ENU)01/06/2025 - 31/05/2027

Financiering

Project type(s)

Onderzoeksproject

Bio-informatica-oplossingen voor de diepgaande studie van het menselijke immunopeptidoom. 01/01/2025 - 31/12/2028

Abstract

Het adaptieve immuunsysteem werkt door geïnfecteerde of kwaadaardige cellen te ontdekken en hierop te reageren door peptiden te herkennen die gebonden zijn aan major histocompatibility complex (MHC) moleculen. Dit leidt tot een immuunrespons waarbij antilichamen geproduceerd worden of geïnfecteerde en abnormale cellen direct aangevallen worden om de dreiging te elimineren. Massaspectrometrie-gebaseerde immuunpeptidomics is een belangrijke techniek om het adaptieve immuunsysteem te bestuderen door peptiden die gepresenteerd worden op MHC-moleculen te identificeren. Er bestaan echter geen geoptimaliseerde bioinformatica-tools om immuunpeptidomics data te analyseren, hetgeen leidt tot een zeer laag percentage geannoteerde spectra. Om dit probleem aan te pakken, zullen we een krachtige de novo immuunpeptide sequencing oplossing ontwikkelen met behulp van deep learning om meer biologische kennis uit immuunpeptidomics-gegevens te kunnen halen. We zullen deze tool gebruiken om de aanwezigheid van abnormale peptiden, bijvoorbeeld als gevolg van fouten in de translatie of transcriptionele splitsing, en niet-menselijke peptiden, afkomstig van pathogenen en andere organismen, in het menselijke immuunpeptidoom te bestuderen. Deze innovaties hebben het potentieel om nieuwe biologische en biomedische inzichten in het adaptieve immuunsysteem te verwerven die zullen leiden tot de ontwikkeling van nieuwe immuuntherapieën en vaccins.

Onderzoeker(s)

Promotor: Bittremieux Wout
Co-promotor: Meysman Pieter

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/01/2025 - 31/12/2028

Financiering

Project type(s)

Onderzoeksproject

Artificiële intelligentie om patronen in massaspectrometriegegevens over grote databanken te ontdekken. 01/01/2025 - 31/12/2028

Abstract

De onophoudelijke groei van data in de levenswetenschappen, met name in massaspectrometrie (MS) van kleine moleculen, biedt een unieke kans voor nieuwe ontdekkingen. Dit project zal krachtige artificiële intelligentie (AI) technieken ontwikkelen om traditionele methodes, die datasets in isolatie interpreteren, te overstijgen, door gefragmenteerde gegevens uit grote openbare databanken te integreren en inzichten te onthullen die individuele studies alleen niet kunnen ontdekken. Ons doel is om over te stappen van het analyseren van individuele MS-experimenten naar een gezamenlijke analyse over grote databanken. Deze strategie zal het mogelijk maken om het potentieel van openbare MS-gegevens te ontgrendelen en nieuwe observaties te interpreteren binnen de context van de moleculaire diversiteit beschikbaar in databanken. Om dit doel te bereiken, zullen we AI tools ontwikkelen voor het simuleren van spectrale bibliotheken en het integreren van statistische betrouwbaarheid in moleculaire identificatie. Verder zullen we multimodale representatieleertechnieken gebruiken om tegelijkertijd spectra en moleculen te analyseren. Gebruik makend van AI, machinaal leren, en computationele MS, is ons doel een geïntegreerde analyse van complexe moleculaire data te ontwikkelen. Dit zal voor cruciale vooruitgang zorgen in verschillende domeinen in de levenswetenschappen door een nieuwe manier van moleculaire ontdekking in het tijdperk van "big data" te ontwikkelen.

Onderzoeker(s)

Promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/01/2025 - 31/12/2028

Financiering

Project type(s)

Onderzoeksproject

Deep learning voor ontdekking van kleine moleculen uit ongerichte massaspectrometriegegevens. 01/10/2024 - 30/09/2027

Abstract

Hoewel massaspectrometrie (MS) van kleine moleculen een essentiële techniek is in verschillende domeinen van de levenswetenschappen, wordt het potentieel ervan belemmerd door de lage annotatiemogelijkheden van MS/MS-spectra. Dit onderzoeksproject heeft als doel om de hoeveelheid biologische inzichten die uit MS data verkregen kunnen worden radicaal te verbeteren met behulp van krachtige deep learning technieken. Ik zal verschillende complementaire deep learning-strategieën ontwikkelen voor de identificatie van kleine moleculen. Eerst zal ik een geleerde spectrum-gelijkenisscore ontwikkelen voor de ontdekking van structureel verwante moleculen. Ten tweede zal ik generatieve AI-technieken gebruiken om uitgebreide spectrale bibliotheken te simuleren. Ten derde zal ik een oplossing ontwikkelen voor de novo-identificatie van moleculen rechtstreeks vanuit MS/MS-spectra. Verder zal ik een holistische benadering van MS introduceren door drie diverse gegevensbronnen – MS/MS-spectra, moleculaire structuren, en natuurlijke taal – te integreren in een gedeelde latente ruimte door middel van multimodaal representatieleren. Dit radicaal vernieuwend paradigma zal de semantische interpretatie van MS data mogelijk maken door MS/MS-waarnemingen direct te koppelen aan moleculaire structuren en expertkennis. Ten slotte zal ik verklaarbare AI-technieken gebruiken om de beslissingen van de ontwikkelde modellen te interpreteren en inzicht te verkrijgen in verborgen patronen in MS experimenten.

Onderzoeker(s)

Promotor: Bittremieux Wout
Co-promotor: Laukens Kris
Mandaathouder: Piedrahita Giraldo Juan Sebastian

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/10/2024 - 30/09/2027

Financiering

Project type(s)

Onderzoeksproject

Bio-informatica netwerk voor proteomics en massaspectrometrie. 01/01/2024 - 31/12/2028

Abstract

Proteomics, de studie van eiwitten en hun functies, is een cruciaal onderzoeksdomein in de biologie en geneeskunde. Met massaspectrometrie (MS) kunnen onderzoekers grote hoeveelheden proteomische stalen analyseren, wat leidt tot waardevolle inzichten in complexe biologische processen. MS-datasets vereisen gespecialiseerde data-analysetechnieken, wat heeft geleid tot de ontwikkeling van verschillende krachtige bio-informatica tools en pijplijnen voor massaspectrometrie-gebaseerde proteomics. Desondanks vormen het toenemende volume en de complexe aard van MS-gebaseerde proteomics data aanzienlijke uitdagingen die de vooruitgang in het veld belemmeren. Om deze aan te pakken, is er behoefte aan een open en collaboratieve wetenschappelijke benadering. Wij hebben vier belangrijke uitdagingen geïdentificeerd die we willen aanpakken via deze Wetenschappelijke Onderzoeksgemeenschap (WOG): - Hoogwaardige bio-informatica tools: Naarmate proteomics datasets groeien in grootte, ontstaan computationele knelpunten. Via deze WOG zullen we de ontwikkeling van hoogwaardige en interoperabele bio-informatica tools en workflows bevorderen om deze datasets efficiënt te verwerken, waardoor snellere en transparantere analyses mogelijk worden. - Integratie van machine learning: Hoewel machine learning veel potentieel heeft voor de analyse van proteomics data, blijft de integratie ervan in praktische workflows complex. Onze WOG zal werken aan het overbruggen van deze kloof, door machine learning technieken toegankelijker en naadloos geïntegreerd te maken in routine analyses. - Effectieve benchmarking: De diversiteit aan analysemethoden maakt het uitdagend om methoden effectief te vergelijken. Ons doel is om gestandaardiseerde benchmarking methoden op te stellen waardoor onderzoekers hun analysepijplijnen systematisch kunnen evalueren en verbeteren. - Gemeenschap en educatieve bronnen: Proteomics data-analyse vereist gespecialiseerde kennis die continu evolueert, waardoor het moeilijk is voor jonge wetenschappers en data science-experts om het veld te betreden. Onze WOG streeft ernaar een ondersteunende gemeenschap op te bouwen voor beginnende onderzoekers en hoogwaardige educatieve bronnen te creëren die de leercurve vergemakkelijken en toegankelijke paden bieden voor nieuwkomers. Met drie onderzoeksgroepen in Vlaanderen die wereldleiders zijn in MS-gebaseerde proteomics, zal deze WOG van Vlaanderen het centrum maken van proteomics bio-informatica. Onze samenwerking met internationale partners zal de zichtbaarheid van Vlaams onderzoek vergroten en bijdragen aan een sterke concurrentiepositie in het internationale onderzoekslandschap, waardoor de regio aantrekkelijk wordt voor ambitieuze en getalenteerde jonge onderzoekers om in te werken. De zes samenwerkende onderzoeksgroepen hebben sterke banden met de proteomics bio-informatica gemeenschap binnen Europa en daarbuiten, die we maximaal willen benutten om onze langetermijndoelen te bereiken. In plaats van deze uitdagingen alleen aan te gaan, is het de bedoeling van elk van de zes onderzoeksgroepen om een leidende rol op te nemen in de bredere onderzoeksgemeenschap om onze doelstellingen te bereiken. Via deze WOG zullen we de bestaande verbindingen tussen de zes partners formaliseren en een duidelijke collaboratieve visie en structuur bieden om vooruitgang te stimuleren en de bredere onderzoeksgemeenschap te mobiliseren. De reikwijdte van onze doelen onderstreept de noodzaak van een inspanning op internationaal niveau. Alle zes partners hebben centrale rollen in bestaande initiatieven, zoals de European Bioinformatics Community for Mass Spectromtry (EuBIC-MS), de Proteomics Standards Initiative van de Human Proteome Organization (HUPO-PSI), de ELIXIR Life Science Infrastructuur, en de Computational Mass Spectrometry (CompMS) groep van de International Society for Computational Biology (ISCB), hetgeen de kritische massa levert die nodig is om onze doelen te bereiken.

Onderzoeker(s)

Promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/01/2024 - 31/12/2028

Financiering

Project type(s)

Onderzoeksproject

Referentiegebaseerde metabolomics analyse om de moleculaire samenstelling van Zuid-Afrikaans voedsel te bestuderen. 01/01/2024 - 31/12/2026

Abstract

Het begrijpen van de moleculaire samenstelling van voedsel is essentieel voor het bestuderen van de impact ervan op de menselijke gezondheid. We hebben recent de referentiegebaseerde metabolomics strategie ontwikkeld die gebruikt kan worden om dieet te achterhalen op basis van niet-gerichte metabolomics data. Een probleem hierbij is echter dat er onvoldoende diverse en geografisch representatieve data beschikbaar zijn. Om dit op te lossen zullen we onze moleculaire voedselreferentiedatabase uitbreiden met lokaal geteelde producten uit Zuid-Afrika, een regio met rijke culturele en culinaire tradities, de moleculaire samenstelling hiervan bestuderen met behulp van massaspectrometrie, en deze data integreren in de Global FoodOmics referentiedatabase. Verder zullen we gebruiksvriendelijke bio-informatica toepassingen ontwikkelen om de data-analyse te vereenvoudigen en de moleculaire samenstelling van Zuid-Afrikaans voedsel te bestuderen. Deze samenwerking tussen Zuid-Afrikaanse universiteiten en de Universiteit Antwerpen combineert expertise in analytische chemie, bio-informatica, voeding, en landbouwwetenschappen om geavanceerde metabolomics toepassingen te ontwikkelen, nieuwe wetenschappelijke kennis te vergaren over voedselconsumptie in Zuid-Afrika, en inzichten te bieden voor het verbeteren van voeding en de gezondheid van de Zuid-Afrikaanse bevolking.

Onderzoeker(s)

Promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/01/2024 - 31/12/2026

Financiering

Project type(s)

Onderzoeksproject

Computationele massaspectrometrie en artificiële intelligentie om het immunopeptidoom te ontrafelen. 01/10/2023 - 30/09/2027

Abstract

Het adaptieve immuunsysteem is een cruciaal onderdeel van de immuunrespons en is verantwoordelijk voor het herkennen en elimineren van geïnfecteerde of kwaadaardige cellen, evenals bijdrages aan de ontwikkeling van het immunologisch geheugen. Immunopeptidomics is een snel evoluerend veld dat massaspectrometrie gebruikt om immunopeptiden te identificeren en te kwantificeren, die T-cellen in staat stellen om geïnfecteerde of abnormale cellen te herkennen en te elimineren. Ondanks het aanzienlijke potentieel van immunopeptidomics kunnen momenteel slechts voor een minderheid van de spectra die gegenereerd worden tijdens een immunopeptidomics experiments de immunopeptiden geïdentificeerd worden, waardoor een aanzienlijke hoeveel aan biologische informatie verloren gaat. Om dit probleem aan te pakken zullen wij gespecialiseerde bioinformatica-toepassingen ontwikkelen om immunopeptidomics data te analyseren. We zullen een efficiënte en gevoelige open modificatie-zoekmachine ontwikkelen om immunopeptiden die post-translationele modificaties hebben ondergaan te identificeren. Daarnaast zullen we een de novo peptide sequencingen toepassing ontwikkelen die is geoptimaliseerd om immunopeptidomics data te analyseren. De tools die in dit project worden ontwikkeld hebben het potentieel om de hoeveelheid biologische informatie die kan worden verkregen uit immunopeptidomics experimenten aanzienlijk te vergroten, hetgeen zal leiden tot belangrijke doorbraken in het vakgebied.

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Pominova Marina

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/10/2023 - 30/09/2027

Financiering

Project type(s)

Onderzoeksproject

Artificiële intelligentie-gedreven kennisbank van het geobserveerde moleculaire universum. 01/12/2022 - 30/11/2027

Abstract

Ondanks recente doorbraken in artificiële intelligentie (AI) die hebben geleid tot radicale vooruitgang in verschillende wetenschappelijke domeinen zijn AI-technieken nog niet systematisch ingeburgerd in de levenswetenschappen. In het bijzonder de analyse van massaspectrometrie (MS) data van kleine moleculen is nog steeds gebaseerd op vakkennis en handmatig samengestelde regels. Dit project zal een nieuwe, krachtigere manier van data analyse ontwikkelen waarin MS gegevens worden geïnterpreteerd in de context van bestaande informatie die beschikbaar is in publieke databanken. De onderzoekshypothese waarop het voorgestelde project gebaseerd is, is dat geavanceerde AI-technieken verborgen kennis kunnen ontdekken in grote hoeveelheden MS data om een dieper inzicht te verkrijgen in de moleculaire samenstelling van complexe biologische stalen. We zullen machine learning-gebaseerde oplossingen ontwikkelen om het geobserveerde moleculaire universum te onderzoeken en een uitgebreide kennisbank voor kleine moleculen op te bouwen. Deze ambitieuze doelen bouwen voort op onze unieke expertise in zowel AI als MS om geavanceerde datagestuurde softwareoplossingen te ontwikkelen die zullen leiden tot een verbeterde moleculaire ontdekking uit MS data.

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/12/2022 - 30/11/2027

Financiering

Project type(s)

Onderzoeksproject

Bio-informatica en machinaal leren voor de analyse van grote hoeveelheden metabolomics data 01/12/2022 - 30/11/2026

Abstract

Onderzoeker(s)

Promotor: Bittremieux Wout
Mandaathouder: Heirman Janne

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/12/2022 - 30/11/2026

Financiering

Project type(s)

Onderzoeksproject

Precisiegeneeskunde technologie (PreMeT) 01/01/2021 - 31/12/2026

Abstract

Precisiegeneeskunde staat voor het precies afstemmen van een medische behandeling op basis van het genetisch profiel, levensstijl en omgeving van een patiënt. Het maakt gebruik van technologieën die de artsen de mogelijkheid geven om op een meer accurate manier te voorspellen welke behandeling en preventiestrategie voor een bepaalde aandoening werkzaam zal zijn in welke subgroep van patiënten. De voornaamste drijfveren voor de evolutie naar precisiegeneeskunde zijn de technologische vooruitgang, zoals de nieuwe generatie sequencingtechnologie in genomica, de toenemende beschikbaarheid aan gezondheidsdata en de groei in datawetenschappen en kunstmatige intelligentie. In deze domeinen zullen 6 sterke onderzoeksteams van de UAntwerpen de krachten bundelen om hun onderzoek te vertalen in een technologieplatform voor precisiegeneeskunde (PreMeT) dat aangeboden kan worden aan de industrie, hospitalen, onderzoeksinstituten en onze samenleving. De missie van PreMeT is om precisiegeneeskunde mogelijk te maken via een geïntegreerde aanpak bestaande uit genomica en 'big data analytics'.

Onderzoeker(s)

Promotor: Laukens Kris
Co-promotor: Bittremieux Wout
Co-promotor: Kooy Frank
Co-promotor: Loeys Bart
Co-promotor: Meester Josephina
Co-promotor: Meysman Pieter
Co-promotor: Mortier Geert
Co-promotor: Op de Beeck Ken
Co-promotor: Van Camp Guy
Co-promotor: Van Hul Wim
Co-promotor: Verstraeten Aline
Mandaathouder: Bosschaerts Tom
Mandaathouder: Gauglitz Julia

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/01/2021 - 31/12/2026

Financiering

Project type(s)

Onderzoeksproject

Tracing Ions in Mass Spectra to Identify Small Molecules (TractION). 01/11/2017 - 31/12/2026

Abstract

Momenteel is de analyse en interpretatie van de data de meest tijdrovende stap in de structuuropheldering van kleine moleculen. Dit vergt tot op heden nog steeds veel manuele tussenkomst van hoogopgeleide MS experten. Daarenboven maakt de handmatige aard van het proces het kwetsbaar voor menselijke fouten tijdens de interpretatie. Het doel van dit project is het wegwerken van de flessenhals in de data analyse door middel van aangepaste zoek algoritmes en allernieuwste "pattern mining" technologie.

Onderzoeker(s)

Promotor: Laukens Kris
Co-promotor: Bittremieux Wout
Co-promotor: Valkenborg Dirk

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/11/2017 - 31/12/2026

Financiering

PRIVE - non profit
PRIVE - profit

Project type(s)

Onderzoeksproject

De Live Mouse Tracker (LMT) als een veelzijdig platform voor het screenen van drugs voor zeldzame neurologische ziekten. 01/01/2025 - 31/12/2025

Abstract

Het ontwikkelen van effectieve therapieën voor zeldzame neurologische ontwikkelingsstoornissen blijft één van de grootste uitdagingen binnen de moleculaire geneeskunde. Hoewel vooruitgang in next-generation sequencing-technologieën in het afgelopen decennium hebben geleid tot de ontdekking van honderden nieuwe genetische syndromen, blijft de ontwikkeling van gepersonaliseerde therapieën achter. Elk syndroom is individueel zeldzaam, maar collectief zijn meer dan 300 miljoen mensen op aarde aangedaan. Iedere aandoening wordt veroorzaakt door mutaties in verschillende genen en elk gen verstoort meerdere cellulaire pathways. Dit illustreert de complexiteit van de ontwikkeling van therapieën: immers voor ieder ziektebeeld moet een overweldigende hoeveelheid gegevens geanalyseerd worden om tot een doeltreffende therapie te komen. Het mag dan ook geen verrassing zijn dat de huidige behandelingen en therapieën slechts zeer beperkt succesvol zijn. Honderden miljoenen individuen op de aarde hebben dus geen toegang tot een rationele therapie voor hun ziektebeeld. De snelle opkomst van AI-technologieën heeft echter de potentie om dit landschap te transformeren. Door AI-gestuurde algoritmen kunnen enorme biomedische datasets steeds beter worden doorgenomen, wat leidt tot de versnelde ontdekking van kandidaat medicijnen voor zeldzame ziekten. Veel startups maken al gebruik van dit potentieel, waardoor er een overvloed aan drugs wordt geprioriteerd voor preklinische evaluatie. Deze toename in kandidaat-therapieën heeft echter de bottleneck verschoven van medicijnontdekking naar preklinische testen. Traditionele muistesten zijn arbeidsintensief, duur, en tijdrovend, wat de noodzaak onderstreept voor een gestandaardiseerd, schaalbaar, en efficiënt platform om te voldoen aan de groeiende vraag naar preklinische screening. Wij stellen hier de ontwikkeling en commercialisering van ons Live Mouse Tracker (LMT) platform voor, een baanbrekend systeem dat is ontworpen om aan deze kritieke behoefte te voldoen. Het LMT-systeem automatiseert gedragsanalyse en is in staat om tot 39 verschillende gedragingen te volgen bij groepen muizen over periodes van 24 uur. Deze high-throughput capaciteit biedt een snelle en uitgebreide beoordeling van de effectiviteit van medicijnen in preklinische modellen. Onze initiële validatie zal zich richten op het fragiele X-syndroom, een veel bestudeerde neurologische ontwikkelingsstoornis waarvoor momenteel geen effectieve behandeling bestaat. Door medicijnen te evalueren die meerdere getroffen routes tegelijkertijd aanpakken, streven wij ernaar een nieuwe benadering van preklinische screening voor zeldzame ziekten te pionieren. Tijdens dit project zullen we de robuustheid van het LMT-platform valideren en het uitbreiden naar een volledig geïntegreerde service, en verkennen we samenwerking met andere partners binnen de UA om uitgebreide en multidimensionale preklinische screeningsmethoden aan te bieden. Dit service platform heeft het potentieel om de preklinische screening te versnellen, zodat door AI gegenereerde kandidaat-medicijnen snel en betrouwbaar kunnen worden beoordeeld, wat het traject van laboratorium naar kliniek versnelt. Met dit initiatief willen we de kloof tussen medicijnontdekking en therapeutische toepassing overbruggen, waardoor miljoenen patiënten met zeldzame neurologische aandoeningen hoop wordt geboden.

Onderzoeker(s)

Promotor: Bittremieux Wout
Co-promotor: Annear Dale
Co-promotor: Kooy Frank

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/01/2025 - 31/12/2025

Financiering

Project type(s)

Onderzoeksproject

De novo massaspectrometrie peptide sequencing met een transformer groot taalmodel. 01/05/2024 - 30/04/2025

Abstract

De primaire uitdaging in proteomics is het identificeren van aminozuursequenties uit tandem-massaspectra, hetgeen traditioneel gedaan wordt door te zoeken in sequentiedatabanken. Echter, aangezien dit enkel bekende eiwitsequenties kan identificeren, biedt de novo peptide sequencing een interessant alternatief om onverwachte peptiden te ontdekken. Casanovo is een geavanceerd programma voor de novo peptide sequencing, hetgeen vergelijkbare technologieën gebruikt als in grote taalmodellen om massaspectra te vertalen naar aminozuursequenties. Het doel van dit project is om de capaciteiten van Casanovo voor de novo peptide sequencing verder te verbeteren. Dit zal worden bereikt door het samenstellen van een uitgebreide trainingsdataset uit diverse biologische stalen en massaspectrometrie-instrumenten en door het neurale netwerk van Casanovo op te schalen om zijn leercapaciteit te vergroten. Verder zullen we een aangepast model creëren voor de analyse van immunopeptidomics-gegevens door Casanovo te finetunen. Tot slot zullen we een gebruiksvriendelijke webinterface ontwikkelen, waardoor Casanovo gebruikt zal kunnen worden door vele onderzoekers zonder gespecialiseerde voorkennis en zullen hardwarebeperkingen vermeden worden door middel van cloud computing.

Onderzoeker(s)

Promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/05/2024 - 30/04/2025

Financiering

Project type(s)

Onderzoeksproject

Het mogelijk maken van mobiele en data-gestuurde monitoring van pathogenen door middel van een gekoppelde nanopore squiggle- en genoomsequentie database. 01/05/2023 - 31/12/2024

Abstract

Er is wereldwijd nood aan het monitoren van infectieziekten. De dreiging van bestaande en opkomende pathogenen vormt een grote uitdaging voor de volksgezondheid. Nanopore sequencing is een revolutionaire technologie die draagbare sequencing mogelijk maakt, en heeft zijn waarde bewezen tijdens de COVID-19-pandemie. Deze technologie zou bestaande laboratoria, die geen of beperkte capaciteit hebben voor het monitoren van infectieziekten, in staat kunnen stellen om over te stappen naar monitoring gebaseerd op sequencing. Dit potentieel hangt echter af van het potentieel om te werken in omgevingen met beperkte middelen, hetgeen tot op heden wordt belemmerd door de behoeften aan gegevensopslag en - verwerkingtechnieken. De onbewerkte gegevens, 'squiggles' genoemd, zijn omvangrijk en het decoderen ervan naar DNA-sequenties vereist grafische kaarten (GPU's) die aanzienlijke hoeveelheden energie verbruiken. In dit 'proof-of-concept-project pandemic preparedness' project zullen we voortbouwen op de vorderingen van ons IOF-SBO gefinancierde project LeapSEQ, om belangrijke hindernissen weg te nemen om mobiele en datagestuurde monitoring van pathogenen mogelijk te maken. Deze hindernissen omvatten: (1) een behoefte aan schaalbare data opslag oplossingen voor squiggles, (2) het gebrek aan beschikbare gegevens voor belangrijke pathogenen, en (3) verbeterde computationele oplossingen om met squiggle-gegevens te interageren. We zullen deze problemen aanpakken door een proof-of-concept database te ontwerpen bestaande uit gepaarde nanopore squiggle-genoomsequentiegegevens met behulp van ons draagbare LeapSEQ-lab en door efficiënte datagestuurde algoritmen te ontwikkelen voor snelle pathogeen monitoring. We zullen deze database ontwikkelen met strategische partners van het Instituut voor Tropische Geneeskunde in Antwerpen en de UAntwerpen, en het valorisatiepotentieel van LeapSEQ verder onderzoeken in de context van wereldwijde monitoring van pathogenen.

Onderzoeker(s)

Promotor: Laukens Kris
Co-promotor: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/05/2023 - 31/12/2024

Financiering

VL.WET.BEL

Project type(s)

Onderzoeksproject

Transfereerbare deep learning om moleculaire interacties te voorspellen aan de hand van sequenties. 01/10/2019 - 30/09/2023

Abstract

Machine learning kan worden gebruikt om de aanwezigheid of afwezigheid van interacties te voorspellen. Voor biomedisch onderzoek is de voorspelling van moleculaire interacties die ten grondslag liggen aan de mechanica van cellen, pathogenen en het immuunsysteem, een probleem van grote relevantie. In dit project, zullen we een fundamenteel nieuwe technologie ontwikkelen die onbekende interacties kan voorspellen met modellen die zijn getraind in de enorme hoeveelheid moleculaire interactiegegevens die tegenwoordig beschikbaar is dankzij hoge doorvoer experimentele technieken. Dit zal worden bereikt met behulp van een machine learning model dat de patronen in moleculaire sequenties kan leren die bepalend zijn voor de interacties. We zullen dit probleem op een generaliseerbare manier aanpakken met behulp van de nieuwste generatie neurale netwerken, door een generieke codering voor moleculaire sequenties te bepalen die gemakkelijk kan worden vertaald naar verschillende biomedische problemen. Deze codering zal worden ingevoerd in een geavanceerd diep neuraal netwerk om algemene moleculaire interacties te modelleren, die vervolgens kunnen worden afgestemd op specifieke interactietypes. De attributen die voorspellend zijn zullen vervolgens worden vertaald in nieuwe visualisaties om interpretatie door levenswetenschappers mogelijk te maken. We zullen de performantie van dit model valideren met behulp van zowel computationeel gesimuleerde als echte experimentele sequentie- en interactiegegevens uit een breed scala aan relevante interactietypes.

Onderzoeker(s)

Promotor: Laukens Kris
Co-promotor: Bittremieux Wout
Co-promotor: Meysman Pieter
Mandaathouder: Postovskaya Anna

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/10/2019 - 30/09/2023

Financiering

Project type(s)

Onderzoeksproject

Intelligente kwaliteitscontrole voor massaspectrometriegebaseerde proteoomanalyse 01/10/2017 - 31/07/2021

Abstract

De afgelopen jaren is er een steeds grotere nadruk gelegd geworden op kwaliteitscontrole voor massaspectrometrie-gebaseerde proteoomanalyses, hetgeen een noodzakelijke factor is om de validiteit van de experimentele resultaten te verifiëren. Massaspectrometrie is een zeer complexe analytische techniek. Doordat de resultaten hiervan onderhevig zijn aan een grote variabiliteit zijn aangepaste technieken voor kwaliteitscontrole noodzakelijk om de invloed van de variabiliteit op de experimentele data te modelleren. Dit is momenteel echter nog niet mogelijk omdat informatie met betrekking tot de kwaliteit onvoldoende beschikbaar is: deze informatie wordt zelden gerapporteerd samen met de eigenlijke data en indien het toch aanwezig is, is het zeer moeilijk om dit correct te interpreteren. Om het volle potentieel te benutten van massaspectrometrie-gebaseerde proteoomanalyses is het noodzakelijk om op een systematische manier aan kwaliteitscontrole te doen. Daarom zullen we de technische infrastructuur voorzien om als integraal deel van een massaspectrometrie-experiment kwaliteitsmetrieken te genereren. We zullen het qcML standaard bestandsformaat voor kwaliteitsinformatie verder ontwikkelen. Op basis van dit bestandsformaat zullen we ervoor zorgen dat gedetailleerde kwaliteitsinformatie aanwezig is voor alle datasets die in PRIDE, een voorstaande databank voor publieke proteoomdata, zijn opgeslagen. Verder zullen we geavanceerde machine learning algoritmes gebruiken om op basis van deze waardevolle nieuwe kwaliteitsdata nieuwe kennis over de performantie van een massaspectrometrie-experiment te ontdekken. Dit zal ertoe leiden dat experimentele opstellingen verbeterd kunnen worden om de acquisitie van spectra te maximaliseren, het vertrouwen in de gegenereerde resultaten te verhogen, en de toepassingsmogelijkheden van massaspectrometrie-onderzoek uit te breiden.

Onderzoeker(s)

Promotor: Laukens Kris
Mandaathouder: Bittremieux Wout

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)01/10/2017 - 31/07/2021

Financiering

Project type(s)

Onderzoeksproject