Onderzoeksgroep

Expertise

Dr. Bittremieux onderzoekt hoe geavanceerde machine learning technieken gebruikt kunnen worden om nieuwe kennis te ontrafelen uit proteomics en metabolomics massaspectrometrie data. Naast zijn hoofdfocus op de toepassing van deep learning voor de analyze van massaspectrometrie data is dr. Bittremieux geïnteresseerd in allerlei bioinformatica problemen. Een belangrijk onderdeel van zijn werk betreft het ontwikkelen van computationele technieke voor de kwaliteitscontrole van biologische massaspectrometrie.

De novo massaspectrometrie peptide sequencing met een transformer groot taalmodel. 01/05/2024 - 30/04/2025

Abstract

De primaire uitdaging in proteomics is het identificeren van aminozuursequenties uit tandem-massaspectra, hetgeen traditioneel gedaan wordt door te zoeken in sequentiedatabanken. Echter, aangezien dit enkel bekende eiwitsequenties kan identificeren, biedt de novo peptide sequencing een interessant alternatief om onverwachte peptiden te ontdekken. Casanovo is een geavanceerd programma voor de novo peptide sequencing, hetgeen vergelijkbare technologieën gebruikt als in grote taalmodellen om massaspectra te vertalen naar aminozuursequenties. Het doel van dit project is om de capaciteiten van Casanovo voor de novo peptide sequencing verder te verbeteren. Dit zal worden bereikt door het samenstellen van een uitgebreide trainingsdataset uit diverse biologische stalen en massaspectrometrie-instrumenten en door het neurale netwerk van Casanovo op te schalen om zijn leercapaciteit te vergroten. Verder zullen we een aangepast model creëren voor de analyse van immunopeptidomics-gegevens door Casanovo te finetunen. Tot slot zullen we een gebruiksvriendelijke webinterface ontwikkelen, waardoor Casanovo gebruikt zal kunnen worden door vele onderzoekers zonder gespecialiseerde voorkennis en zullen hardwarebeperkingen vermeden worden door middel van cloud computing.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Bio-informatica netwerk voor proteomics en massaspectrometrie. 01/01/2024 - 31/12/2028

Abstract

Proteomics, de studie van eiwitten en hun functies, is een cruciaal onderzoeksdomein in de biologie en geneeskunde. Met massaspectrometrie (MS) kunnen onderzoekers grote hoeveelheden proteomische stalen analyseren, wat leidt tot waardevolle inzichten in complexe biologische processen. MS-datasets vereisen gespecialiseerde data-analysetechnieken, wat heeft geleid tot de ontwikkeling van verschillende krachtige bio-informatica tools en pijplijnen voor massaspectrometrie-gebaseerde proteomics. Desondanks vormen het toenemende volume en de complexe aard van MS-gebaseerde proteomics data aanzienlijke uitdagingen die de vooruitgang in het veld belemmeren. Om deze aan te pakken, is er behoefte aan een open en collaboratieve wetenschappelijke benadering. Wij hebben vier belangrijke uitdagingen geïdentificeerd die we willen aanpakken via deze Wetenschappelijke Onderzoeksgemeenschap (WOG): - Hoogwaardige bio-informatica tools: Naarmate proteomics datasets groeien in grootte, ontstaan computationele knelpunten. Via deze WOG zullen we de ontwikkeling van hoogwaardige en interoperabele bio-informatica tools en workflows bevorderen om deze datasets efficiënt te verwerken, waardoor snellere en transparantere analyses mogelijk worden. - Integratie van machine learning: Hoewel machine learning veel potentieel heeft voor de analyse van proteomics data, blijft de integratie ervan in praktische workflows complex. Onze WOG zal werken aan het overbruggen van deze kloof, door machine learning technieken toegankelijker en naadloos geïntegreerd te maken in routine analyses. - Effectieve benchmarking: De diversiteit aan analysemethoden maakt het uitdagend om methoden effectief te vergelijken. Ons doel is om gestandaardiseerde benchmarking methoden op te stellen waardoor onderzoekers hun analysepijplijnen systematisch kunnen evalueren en verbeteren. - Gemeenschap en educatieve bronnen: Proteomics data-analyse vereist gespecialiseerde kennis die continu evolueert, waardoor het moeilijk is voor jonge wetenschappers en data science-experts om het veld te betreden. Onze WOG streeft ernaar een ondersteunende gemeenschap op te bouwen voor beginnende onderzoekers en hoogwaardige educatieve bronnen te creëren die de leercurve vergemakkelijken en toegankelijke paden bieden voor nieuwkomers. Met drie onderzoeksgroepen in Vlaanderen die wereldleiders zijn in MS-gebaseerde proteomics, zal deze WOG van Vlaanderen het centrum maken van proteomics bio-informatica. Onze samenwerking met internationale partners zal de zichtbaarheid van Vlaams onderzoek vergroten en bijdragen aan een sterke concurrentiepositie in het internationale onderzoekslandschap, waardoor de regio aantrekkelijk wordt voor ambitieuze en getalenteerde jonge onderzoekers om in te werken. De zes samenwerkende onderzoeksgroepen hebben sterke banden met de proteomics bio-informatica gemeenschap binnen Europa en daarbuiten, die we maximaal willen benutten om onze langetermijndoelen te bereiken. In plaats van deze uitdagingen alleen aan te gaan, is het de bedoeling van elk van de zes onderzoeksgroepen om een leidende rol op te nemen in de bredere onderzoeksgemeenschap om onze doelstellingen te bereiken. Via deze WOG zullen we de bestaande verbindingen tussen de zes partners formaliseren en een duidelijke collaboratieve visie en structuur bieden om vooruitgang te stimuleren en de bredere onderzoeksgemeenschap te mobiliseren. De reikwijdte van onze doelen onderstreept de noodzaak van een inspanning op internationaal niveau. Alle zes partners hebben centrale rollen in bestaande initiatieven, zoals de European Bioinformatics Community for Mass Spectromtry (EuBIC-MS), de Proteomics Standards Initiative van de Human Proteome Organization (HUPO-PSI), de ELIXIR Life Science Infrastructuur, en de Computational Mass Spectrometry (CompMS) groep van de International Society for Computational Biology (ISCB), hetgeen de kritische massa levert die nodig is om onze doelen te bereiken.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Referentiegebaseerde metabolomics analyse om de moleculaire samenstelling van Zuid-Afrikaans voedsel te bestuderen. 01/01/2024 - 31/12/2026

Abstract

Het begrijpen van de moleculaire samenstelling van voedsel is essentieel voor het bestuderen van de impact ervan op de menselijke gezondheid. We hebben recent de referentiegebaseerde metabolomics strategie ontwikkeld die gebruikt kan worden om dieet te achterhalen op basis van niet-gerichte metabolomics data. Een probleem hierbij is echter dat er onvoldoende diverse en geografisch representatieve data beschikbaar zijn. Om dit op te lossen zullen we onze moleculaire voedselreferentiedatabase uitbreiden met lokaal geteelde producten uit Zuid-Afrika, een regio met rijke culturele en culinaire tradities, de moleculaire samenstelling hiervan bestuderen met behulp van massaspectrometrie, en deze data integreren in de Global FoodOmics referentiedatabase. Verder zullen we gebruiksvriendelijke bio-informatica toepassingen ontwikkelen om de data-analyse te vereenvoudigen en de moleculaire samenstelling van Zuid-Afrikaans voedsel te bestuderen. Deze samenwerking tussen Zuid-Afrikaanse universiteiten en de Universiteit Antwerpen combineert expertise in analytische chemie, bio-informatica, voeding, en landbouwwetenschappen om geavanceerde metabolomics toepassingen te ontwikkelen, nieuwe wetenschappelijke kennis te vergaren over voedselconsumptie in Zuid-Afrika, en inzichten te bieden voor het verbeteren van voeding en de gezondheid van de Zuid-Afrikaanse bevolking.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Computationele massaspectrometrie en artificiële intelligentie om het immunopeptidoom te ontrafelen. 01/10/2023 - 30/09/2027

Abstract

Het adaptieve immuunsysteem is een cruciaal onderdeel van de immuunrespons en is verantwoordelijk voor het herkennen en elimineren van geïnfecteerde of kwaadaardige cellen, evenals bijdrages aan de ontwikkeling van het immunologisch geheugen. Immunopeptidomics is een snel evoluerend veld dat massaspectrometrie gebruikt om immunopeptiden te identificeren en te kwantificeren, die T-cellen in staat stellen om geïnfecteerde of abnormale cellen te herkennen en te elimineren. Ondanks het aanzienlijke potentieel van immunopeptidomics kunnen momenteel slechts voor een minderheid van de spectra die gegenereerd worden tijdens een immunopeptidomics experiments de immunopeptiden geïdentificeerd worden, waardoor een aanzienlijke hoeveel aan biologische informatie verloren gaat. Om dit probleem aan te pakken zullen wij gespecialiseerde bioinformatica-toepassingen ontwikkelen om immunopeptidomics data te analyseren. We zullen een efficiënte en gevoelige open modificatie-zoekmachine ontwikkelen om immunopeptiden die post-translationele modificaties hebben ondergaan te identificeren. Daarnaast zullen we een de novo peptide sequencingen toepassing ontwikkelen die is geoptimaliseerd om immunopeptidomics data te analyseren. De tools die in dit project worden ontwikkeld hebben het potentieel om de hoeveelheid biologische informatie die kan worden verkregen uit immunopeptidomics experimenten aanzienlijk te vergroten, hetgeen zal leiden tot belangrijke doorbraken in het vakgebied.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Het mogelijk maken van mobiele en data-gestuurde monitoring van pathogenen door middel van een gekoppelde nanopore squiggle- en genoomsequentie database. 01/05/2023 - 31/12/2024

Abstract

Er is wereldwijd nood aan het monitoren van infectieziekten. De dreiging van bestaande en opkomende pathogenen vormt een grote uitdaging voor de volksgezondheid. Nanopore sequencing is een revolutionaire technologie die draagbare sequencing mogelijk maakt, en heeft zijn waarde bewezen tijdens de COVID-19-pandemie. Deze technologie zou bestaande laboratoria, die geen of beperkte capaciteit hebben voor het monitoren van infectieziekten, in staat kunnen stellen om over te stappen naar monitoring gebaseerd op sequencing. Dit potentieel hangt echter af van het potentieel om te werken in omgevingen met beperkte middelen, hetgeen tot op heden wordt belemmerd door de behoeften aan gegevensopslag en - verwerkingtechnieken. De onbewerkte gegevens, 'squiggles' genoemd, zijn omvangrijk en het decoderen ervan naar DNA-sequenties vereist grafische kaarten (GPU's) die aanzienlijke hoeveelheden energie verbruiken. In dit 'proof-of-concept-project pandemic preparedness' project zullen we voortbouwen op de vorderingen van ons IOF-SBO gefinancierde project LeapSEQ, om belangrijke hindernissen weg te nemen om mobiele en datagestuurde monitoring van pathogenen mogelijk te maken. Deze hindernissen omvatten: (1) een behoefte aan schaalbare data opslag oplossingen voor squiggles, (2) het gebrek aan beschikbare gegevens voor belangrijke pathogenen, en (3) verbeterde computationele oplossingen om met squiggle-gegevens te interageren. We zullen deze problemen aanpakken door een proof-of-concept database te ontwerpen bestaande uit gepaarde nanopore squiggle-genoomsequentiegegevens met behulp van ons draagbare LeapSEQ-lab en door efficiënte datagestuurde algoritmen te ontwikkelen voor snelle pathogeen monitoring. We zullen deze database ontwikkelen met strategische partners van het Instituut voor Tropische Geneeskunde in Antwerpen en de UAntwerpen, en het valorisatiepotentieel van LeapSEQ verder onderzoeken in de context van wereldwijde monitoring van pathogenen.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Artificiële intelligentie-gedreven kennisbank van het geobserveerde moleculaire universum. 01/12/2022 - 30/11/2027

Abstract

Ondanks recente doorbraken in artificiële intelligentie (AI) die hebben geleid tot radicale vooruitgang in verschillende wetenschappelijke domeinen zijn AI-technieken nog niet systematisch ingeburgerd in de levenswetenschappen. In het bijzonder de analyse van massaspectrometrie (MS) data van kleine moleculen is nog steeds gebaseerd op vakkennis en handmatig samengestelde regels. Dit project zal een nieuwe, krachtigere manier van data analyse ontwikkelen waarin MS gegevens worden geïnterpreteerd in de context van bestaande informatie die beschikbaar is in publieke databanken. De onderzoekshypothese waarop het voorgestelde project gebaseerd is, is dat geavanceerde AI-technieken verborgen kennis kunnen ontdekken in grote hoeveelheden MS data om een dieper inzicht te verkrijgen in de moleculaire samenstelling van complexe biologische stalen. We zullen machine learning-gebaseerde oplossingen ontwikkelen om het geobserveerde moleculaire universum te onderzoeken en een uitgebreide kennisbank voor kleine moleculen op te bouwen. Deze ambitieuze doelen bouwen voort op onze unieke expertise in zowel AI als MS om geavanceerde datagestuurde softwareoplossingen te ontwikkelen die zullen leiden tot een verbeterde moleculaire ontdekking uit MS data.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Bio-informatica en machinaal leren voor de analyse van grote hoeveelheden metabolomics data 01/12/2022 - 30/11/2026

Abstract

Ondanks recente doorbraken in artificiële intelligentie (AI) die hebben geleid tot radicale vooruitgang in verschillende wetenschappelijke domeinen zijn AI-technieken nog niet systematisch ingeburgerd in de levenswetenschappen. In het bijzonder de analyse van massaspectrometrie (MS) data van kleine moleculen is nog steeds gebaseerd op vakkennis en handmatig samengestelde regels. Dit project zal een nieuwe, krachtigere manier van data analyse ontwikkelen waarin MS gegevens worden geïnterpreteerd in de context van bestaande informatie die beschikbaar is in publieke databanken. De onderzoekshypothese waarop het voorgestelde project gebaseerd is, is dat geavanceerde AI-technieken verborgen kennis kunnen ontdekken in grote hoeveelheden MS data om een dieper inzicht te verkrijgen in de moleculaire samenstelling van complexe biologische stalen. We zullen machine learning-gebaseerde oplossingen ontwikkelen om het geobserveerde moleculaire universum te onderzoeken en een uitgebreide kennisbank voor kleine moleculen op te bouwen. Deze ambitieuze doelen bouwen voort op onze unieke expertise in zowel AI als MS om geavanceerde datagestuurde softwareoplossingen te ontwikkelen die zullen leiden tot een verbeterde moleculaire ontdekking uit MS data.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Transfereerbare deep learning om moleculaire interacties te voorspellen aan de hand van sequenties. 01/10/2019 - 30/09/2023

Abstract

Machine learning kan worden gebruikt om de aanwezigheid of afwezigheid van interacties te voorspellen. Voor biomedisch onderzoek is de voorspelling van moleculaire interacties die ten grondslag liggen aan de mechanica van cellen, pathogenen en het immuunsysteem, een ​​probleem van grote relevantie. In dit project, zullen we een fundamenteel nieuwe technologie ontwikkelen die onbekende interacties kan voorspellen met modellen die zijn getraind in de enorme hoeveelheid moleculaire interactiegegevens die tegenwoordig beschikbaar is dankzij hoge doorvoer experimentele technieken. Dit zal worden bereikt met behulp van een machine learning model dat de patronen in moleculaire sequenties kan leren die bepalend zijn voor de interacties. We zullen dit probleem op een generaliseerbare manier aanpakken met behulp van de nieuwste generatie neurale netwerken, door een generieke codering voor moleculaire sequenties te bepalen die gemakkelijk kan worden vertaald naar verschillende biomedische problemen. Deze codering zal worden ingevoerd in een geavanceerd diep neuraal netwerk om algemene moleculaire interacties te modelleren, die vervolgens kunnen worden afgestemd op specifieke interactietypes. De attributen die voorspellend zijn zullen vervolgens worden vertaald in nieuwe visualisaties om interpretatie door levenswetenschappers mogelijk te maken. We zullen de performantie van dit model valideren met behulp van zowel computationeel gesimuleerde als echte experimentele sequentie- en interactiegegevens uit een breed scala aan relevante interactietypes.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Intelligente kwaliteitscontrole voor massaspectrometriegebaseerde proteoomanalyse 01/10/2017 - 31/07/2021

Abstract

De afgelopen jaren is er een steeds grotere nadruk gelegd geworden op kwaliteitscontrole voor massaspectrometrie-gebaseerde proteoomanalyses, hetgeen een noodzakelijke factor is om de validiteit van de experimentele resultaten te verifiëren. Massaspectrometrie is een zeer complexe analytische techniek. Doordat de resultaten hiervan onderhevig zijn aan een grote variabiliteit zijn aangepaste technieken voor kwaliteitscontrole noodzakelijk om de invloed van de variabiliteit op de experimentele data te modelleren. Dit is momenteel echter nog niet mogelijk omdat informatie met betrekking tot de kwaliteit onvoldoende beschikbaar is: deze informatie wordt zelden gerapporteerd samen met de eigenlijke data en indien het toch aanwezig is, is het zeer moeilijk om dit correct te interpreteren. Om het volle potentieel te benutten van massaspectrometrie-gebaseerde proteoomanalyses is het noodzakelijk om op een systematische manier aan kwaliteitscontrole te doen. Daarom zullen we de technische infrastructuur voorzien om als integraal deel van een massaspectrometrie-experiment kwaliteitsmetrieken te genereren. We zullen het qcML standaard bestandsformaat voor kwaliteitsinformatie verder ontwikkelen. Op basis van dit bestandsformaat zullen we ervoor zorgen dat gedetailleerde kwaliteitsinformatie aanwezig is voor alle datasets die in PRIDE, een voorstaande databank voor publieke proteoomdata, zijn opgeslagen. Verder zullen we geavanceerde machine learning algoritmes gebruiken om op basis van deze waardevolle nieuwe kwaliteitsdata nieuwe kennis over de performantie van een massaspectrometrie-experiment te ontdekken. Dit zal ertoe leiden dat experimentele opstellingen verbeterd kunnen worden om de acquisitie van spectra te maximaliseren, het vertrouwen in de gegenereerde resultaten te verhogen, en de toepassingsmogelijkheden van massaspectrometrie-onderzoek uit te breiden.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject