Skip to content

[meme] logos der interaction sites #11

@martin-raden

Description

@martin-raden

Hi @MatthiasHerrmann

hier mal die Punkte zum meme-logo bau

  • wir extrahieren aus allen sequenzen, in denen wir einen CM Hit haben
    • im 5' UTR : -30 bis +10 bzgl. CDS anfang
    • im 5' CDS : +20 bis +60
    • im 3' UTR : -25 bis +5 bzgl. CM hit anfang (allerdings vom langen CM... für die kurzen CMs müsste man das entsprechend verschieben)
    • im 3' UTR : +5 bis +35 bzgl. CM hist start

ggf. kannst du für die sequenzen erstmal einen phylogenetischen baum rechnen, um zu sehen, ob du wilde outlier dabei hast. dazu gibts zB ein tool vom clustalw package, aber weiss nicht, wie robust/nett das ist. ist nur erstmal eine idee. ggf. einfach alle reinstopfen und dann im meme output nochmal überlegen, ob man das brauchen kann.

  • du könntest die virus class in den FASTA header jeder sequenz inkludieren, ala >MBFV-NC_..., dann kann man die ggf. einfacher "sortieren" bzw. einordnen, wenn man den phylogenetischen baum oder die meme daten anschaut.

  • in meme ggf ausschalten, dass er auf dem komplementären strang sucht. das wär quatsch

  • grundlegend erwarten/suchen wir EIN motiv pro subsequenz, aber ggf. schiessen uns da (gerade im 3' UTR) konservierte strukturmotive dazwischen, sodass du da ggf. noch mehr zulassen/suchen musst, um auch ein motiv inder zielregion zu finden

  • motivlänge 10-15 nt

  • .. ?

Die Grenzen der subsequenzen sind jetzt erstmal ziemlich ad hoc. Kann man auch gern noch anpassen, wenn man bedarf sieht.

Grüße,
Martin

Metadata

Metadata

Labels

No labels
No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions