Skip to content

Python implementation of classical pattern-matching algorithms for DNA sequences, including exact motif search and basic genomic string processing.

Notifications You must be signed in to change notification settings

yasmina-bioinfo/PatternMatching

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Status Language Field Type

Pattern Matching — Mini-Project 1

Bioinformatics Algorithms in Practice
(English / Français)

Période / Period : 2025-11-04 → 2025-11-10
Durée approximative / Approx. duration : 7 jours / 7 days
Statut / Status : Terminé ✅ / Completed ✅


ENG Overview

This mini-project implements a simple pattern-matching algorithm to locate all occurrences of a DNA motif within a genome sequence.
It is part of a personal learning roadmap toward bioinformatics and genomic data science.

Objective

To understand how biological motif searches (such as promoter or restriction site detection) can be implemented from scratch in Python.

Key Concepts

  • String traversal and substring comparison
  • Introduction to searching motifs (motif discovery)

Example

motifs = "ATG","CGA", "TTC", "TTT", "ATA"
DNA  = "AATGCTATGCAATGC"
positions = pattern_matching(motif, DNA)
print(positions)

Files

  • pattern_matching.py → core algorithm
  • results.csv (optional) → exported results
  • README.md → documentation

Initially learned with AI guidance and Coursera courses — understanding functions, logic, required parameters, and coding methodology. Then, created the pattern_matching_Perso file as a personal practice exercise to apply these concepts.


🇫🇷 Résumé

Ce mini-projet met en œuvre un algorithme de recherche de motif ADN permettant d’identifier toutes les occurrences d’un motif donné dans une séquence génomique.
Il s’inscrit dans ma feuille de route d’apprentissage vers la bio-informatique et la science des données génomiques.

Objectif

Comprendre comment les outils bio-informatiques recherchent des motifs biologiques (promoteurs, sites de restriction, etc.) à l’aide de comparaisons de chaînes de caractères en Python.

Notions essentielles

  • Parcours d’une séquence par indices
  • Comparaison de sous-chaînes
  • Introduction à la recherche de motifs (motif discovery)

Exemple

motifs = "ATG","CGA", "TTC", "TTT", "ATA"
DNA  = "AATGCTATGCAATGC"
positions = pattern_matching(motif, DNA)
print(positions)

Fichiers

  • pattern_matching.py : code principal
  • results.csv : export éventuel des résultats
  • README.md : ce fichier explicatif

J'ai d'abord appris avec l'IA et Coursera, les fonctions, leur logique, les paramètres à respecter, la méthodologie pour lancer le code. Ensuite, de là, j'ai retravaillé le code en créant un fichier pattern_matching_Perso en guise d'exercice d'application.

This work was initially completed in skew_array.py with support from AI tools and Coursera. I then reworked, analyzed, and tested the code in skew_array_PERSO.py as a hands-on practice exercise.


— Yasmina Soumahoro

About

Python implementation of classical pattern-matching algorithms for DNA sequences, including exact motif search and basic genomic string processing.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages