Door de corona-crisis zijn afwijkingen in de cursusinformatie mogelijk. Controleer hiervoor de cursusmededelingen in Blackboard!

Data mining

Studiegidsnr:2026FBDBIC
Vakgebied:Biochemie
Academiejaar:2019-2020
Semester:1e semester
Contacturen:30
Studiepunten:4
Studiebelasting:112
Contractrestrictie(s):Geen contractrestrictie
Instructietaal:Nederlands
Examen:1e semester
Lesgever(s)Kris Laukens
Pieter Meysman

Deze cursusinformatie is bedoeld om de student te ondersteunen bij het verwerken van de leerstof

3. Inhoud *

I. introductie verschillende data types en data mining problemen

- Een formeel overzicht van verschillende data types in biologie en geneeskunde: quantitative data (proteoom, metaboloom, mRNA abundanties), string data (vooral DNA and protein sequenties), text, graph data (biologische networken), image data

- Introductie tot data mining uitdagingen. Wat zijn patronen? 

- Introductie machine learning, inclusief overzicht van verschillende technieken die later in de cursus aan bod komen. 

- Introductie algorithmische complexiteit.

II. Overzicht van data mining technieken

1. Introductie: basis exploratorische analyse (univariate statistiek) van kwantitatieve data:revisie van statistische concepten (slechts een revisie in functie van de cursus, omdat dit wordt verondersteld gekend te zijn)

2. Unsupervised learning: clustering, PCA, Self organizing maps

3. Inleiding classificatie methoden: overzicht van classificatie systemen, validatie van modellen (oa verschillende cross-validation technieken) 

4. Biomedische feature selectie en dimensionaliteitsreductie

5. Supervised learning techniques (een inleiding tot de meest gebruikte technieken en algoritmes): regression techniques, discriminant analysis, support vector machines, random forests, ensemble classifiers, decision trees, neural networks, naive Bayes, association rule mining

6. Intelligente optimilizatie technieken: Hill climbing, simulated annealing & evolutionary computation, swarm intelligence, DNA & protein computation

7. Biomedical text mining

8. Visual data mining

III. Biomedical data mining application case studies [in English]

In a series of lectures, bioinformatics and biomedical informatics researchers show through real research results how these techniques can be employed to extract novel insights from biomedical data. These lectures will cover diverse data types (e.g. quantitative molecular data, molecular sequences, molecular interactions, ontologies, text, physiological measurements, patient meta-data, …) and several of the techniques addressed above. Several possible speakers are available at the University. For some lectures, external speakers may be invited (may fit within biomina seminar series).

Some possible topics:

  • reverse engineering of regulatory molecular networks
  • biomarker discovery from genome, transcriptome, proteome and metabolome data
  • finding genetic defects through next generation DNA sequence analysis
  • pattern finding in NMR spectrometry and mass spectrometry data