[meme] logos der interaction sites

Hi @MatthiasHerrmann 

hier mal die Punkte zum meme-logo bau

- wir extrahieren aus allen sequenzen, in denen wir einen CM Hit haben
  - im 5' UTR : -30 bis +10 bzgl. CDS anfang
  - im 5' CDS : +20 bis +60 
  - im 3' UTR : -25 bis +5 bzgl. CM hit anfang (allerdings vom langen CM... für die kurzen CMs müsste man das entsprechend verschieben)
  - im 3' UTR : +5 bis +35 bzgl. CM hist start

ggf. kannst du für die sequenzen erstmal einen phylogenetischen baum rechnen, um zu sehen, ob du wilde outlier dabei hast. dazu gibts zB ein tool vom [clustalw package](https://www.ebi.ac.uk/Tools/phylogeny/simple_phylogeny/), aber weiss nicht, wie robust/nett das ist. ist nur erstmal eine idee. ggf. einfach alle reinstopfen und dann im meme output nochmal überlegen, ob man das brauchen kann.

- du könntest die virus class in den FASTA header jeder sequenz inkludieren, ala `>MBFV-NC_...`, dann kann man die ggf. einfacher "sortieren" bzw. einordnen, wenn man den phylogenetischen baum oder die meme daten anschaut.

- in meme ggf ausschalten, dass er auf dem komplementären strang sucht. das wär quatsch
- grundlegend erwarten/suchen wir EIN motiv pro subsequenz, aber ggf. schiessen uns da (gerade im 3' UTR) konservierte strukturmotive dazwischen, sodass du da ggf. noch mehr zulassen/suchen musst, um auch ein motiv inder zielregion zu finden
- motivlänge 10-15 nt
- .. ?

Die Grenzen der subsequenzen sind jetzt erstmal ziemlich ad hoc. Kann man auch gern noch anpassen, wenn man bedarf sieht.

Grüße,
Martin


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[meme] logos der interaction sites #11

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

[meme] logos der interaction sites #11

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions