DNA

In deze module gaan we werken met strings. Bij het programmeren is een string een reeks tekens uit een alfabet. Dit heeft een mooie analogie in het werken met DNA, dat door biologen vaak beschreven wordt als reeksen tekens uit een alfabet van vier letters.

Kijk om te beginnen eens naar het filmpje hiernaast. Iko Koevoets is promovendus bij de UvA en bestudeert de ontwikkeling van wortels bij planten. Daar komt meer dataverwerking bij kijken dan verwacht!

Let op: checkpy is nog niet beschikbaar voor deze module!

Dag 1: voorbereiding

  1. Leer over functies

  2. Verdiep je in het manipuleren van strings

  3. Opdracht Bepaal de initialen van elke willekeurige naam.

Dag 2: een precieze match

  1. Opdracht Tel hoe vaak een stukje DNA precies matcht.

  2. Opdracht Vind alle plekken waar een stukje DNA precies matcht in matches vinden.

Dag 3: kleine afwijkingen

  1. Lees over fuzzy matching, waarmee ook bij kleine verschillen matches tussen strings gevonden kunnen worden.

  2. Opdracht Splits een stuk DNA op alle mogelijke manieren.

Dag 4: fuzzy matches

  1. Opdracht Zoek wat minder precies met fuzzy matching.

Extra: Levenshtein

  1. Open een nieuwe dimensie, en leer meer over 2 dimensionale lijsten.

  2. Duik diep in de wereld van algoritmes, en vind uit hoe veel DNA op elkaar lijkt met Levenshtein.

  3. Opdracht Implementeer je eigen algoritme voor Levenshtein.

Evaluatie

Ben je klaar met deze module? Help ons dan om deze te verbeteren: vul de evaluatie in.