MOOC «Bioinformatique : génomes et algorithmes»

Ce document liste les ajouts notebooks sur la structure du cours, comparé à la V1.

w1

OK w1/w1-s04-c1-notebooks.ipynb

Introduction aux notebooks

OK w1/w1-s04-c2-rudiments.ipynb

Quelques rudiments de python

Super rapide car je compte introduire les choses au fur et à mesure, mais il me faut quand même un tout petit peu de matière avant de commencer. Restera peut-être à ajouter: * mutable / pas mutable - passage d'une liste à une fonction * les tuples et l'affectation a,b = (1, 2) * enumerate vs range

OK w1/w1-s05-c1-frequences.ipynb

Calcul des fréquences des 4 bases

nombre de A, de C, de G, de T, nombre total et calcul des fréquences

OK w1/w1-s07-c1-promenade.ipynb

Promenade le long de l'ADN

tracé type « tortue » dans les 4 directions nord, sud, est, ouest en fonction du nucléotide rencontré. Objectifs secondaires:
exemple: borrelia burdorferi aka CP000013
contrexemple: synechosystis aka BA000022
OK w1/w1-s09-c1-promenade-resume.ipynb

Promenade revisitée

un segment tous les n segments élémentaires
si possible reproduire le résultat de la vidéo - en attente de l'échantillon d'entrée
OK w1/w1-s10-c1-comptage-fenetre.ipynb

Comptage des nucléotides sur une fenêtre

Parcourant la séquence, calcul des valeurs du ratio G/C au sein de chaque fenêtre et affichage de la courbe d’évolution de ce ratio le long de la séquence

w2

OK w2/w2-s02-c1-traduction-adn-arn.ipynb

Traduction d'ADN en ARN

OK w2/w2-s08-c1-arn-acides-amines.ipynb

Traduction d'un ARN en acides aminés

w3

OK w3/w3-s02-c1-regions-codantes-v1.ipynb

Identification de régions codantes sur un brin et une phase

deux stops consécutifs en phase, taille > 300, Start le « plus à gauche », enregistrement dans un tableau (position de début, position de fin)
on utilise ici telles quelles les fonctions next_start_codon et next_stop_codon qui seront vues dans 332.
exemple bacillus subtilis aka CP010053 (je trouve 3124 genes sur la phase 0)
à revoir : statistiques comme histogramme, la présentation est pas terrible
OK w3/w3-s03-c1-recherche-chaine.ipynb

Recherches dans une chaine - techniques de base en python

recherche 'naive'
et avec regexps
OK w3/w3-s03-c2-next-codon.ipynb

Recherche de codons START et STOP

OK w3/w3-s04-c1-sequence-complementaire.ipynb

Calcul de la séquence complémentaire inverse

OK w3/w3-s04-c2-regions-codantes-v2.ipynb

Recherche de régions codantes sur trois phases et brin complémentaire

Identification de toutes les régions codantes, sur les 3 phases et sur le brin complémentaire

TOCHECK w3/w3-s05-c1-recalage-rbs.ipynb

Recalage par recherche des RBS

Confirmation et rectification (position du Start) des prédictions de régions codantes par la recherche des motifs RBS (site de fixation du ribosome)
Version dérivée de coding_regions_one_phase écrite
mais j'ai besoin de données de la part de François (un ARN et le RBS qui va avec)
susceptible d'être tout simplement supprimé si on ne trouve pas de données pertinentes.

w4

OK w4/w4-s03-c1-distance-hamming.ipynb

Calcul de la distance de Hamming entre 2 séquences (nombre de nucléotides différents)

OK w4/w4-s08-c1-needleman-wunsh-rec.ipynb

Algorithme de Needleman et Wunsch : version récursive

TOCHECK w4/w4-s09-c1-needleman-wunsh-iter.ipynb

Algorithme de Needleman et Wunsch : version itérative

phase1 - calcul des coûts : OK
phase2 - OK même si rendu un peu rustique
il faut ajouter une digression sur les performances (200 x moins rapide que du C tou de même...)

w5

OK w5/w5-s03-c1-tableau-distances.ipynb

Remplissage du tableau des distances entre n séquences prises 2 à 2

TOCHECK w5/w5-s04-c1-upgma.ipynb

Algorithme UPGMA de reconstruction d’arbre phylogénétique

Ce serait bien d'ajouter des données réalistes

Ajouts possibles

exercices auto corrigés - à voir où - commencer par une (regexp?)
3.8 : une petite démonstration des fréquences de lettres en français / anglais
sur le complément de recherche et de regexps: dire qu'on obtient quelque chose de très efficace et super optimisé

====

NOTES diverses

Il s'agit donc principalement des algorithmes dont la liste avait été établie par François. Mais j'ajoute également 2 compléments transverses, attachés à la séquence 1.4, pour introduire les choses; pour le reste, j'introduirai les concepts python au fur et à mesure.

ADDITION il serait souhaitable de caser quelque part
- ~~un mot sur comment se procurer des échantillons d'ADN; google 'NCBI' -> http://www.ncbi.nlm.nih.gov/, et comment lire un fichier de ce genre pour appliquer les algos du cours~~
- parler de scikit-bio ?
abandonné 2.5
- Traduction triplet -> AA v1 - voir 2.8
abandonné - groupé avec 3.3 (was 3.1)
- Recherche d’un triplet quelconque dans une séquence d’ADN
abandonnés 3.6
- Algorithme naïf de recherche d’un motif dans une séquence
- Recherche de motifs, algorithme de Boyer-Moore Ces deux-là sont complètements masqués/gratuits dans l'utilisation d'expressions régulières

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

MOOC «Bioinformatique : génomes et algorithmes»

w1

w2

w3

w4

w5

Ajouts possibles

NOTES diverses

FilesExpand file tree

AA-liste-algos.md

Latest commit

History

AA-liste-algos.md

File metadata and controls

MOOC «Bioinformatique : génomes et algorithmes»

w1

w2

w3

w4

w5

Ajouts possibles

NOTES diverses