cosmo - Constrained search for motifs in DNA sequences


The following example, which should take a little over a minute to run, uses 20 sequences of length 200 base pairs that each contain the motif

on the forward strand. The true start site of the motif is given after the colon in the name of the sequence.

  1. If desired, enter an email address to receive a confirmation that your job has been completed.

  2. Paste the following sequences into the window "actual sequences":
    >TestSeq0:138
    TATATATATTGTGATCACAGCTTATATACCCACTGATTATTTTCTATCAAAGATAATTTAGTAGATTACACAGACGAAGCATTACTAGAACTACATAAGG
    TTTGTATTGAGCTTTTAACACCGGCGTACCGATTCCGCGCCAGCGTATCGATACTCTATAGACCAAGTTCTATAATTTTTCGATAATCTCGTCGATCTTG
    >TestSeq1:144
    TCAGTGTACGCGATAAAGACATATCAATTACATATAAGTATTATACCCATACATACGCTTATAAAAATTAAACAAATGCAATCTTTTGGTACTATAACTA
    CTCAATAATGATAGCAAAAGATATGTTGGAAAGATCAATTATTCCCCCGGCCCTTTTTTCTGATATAGCGTAGTAAGCACCTATTTTATGTGGTTCCTGG
    >TestSeq2:95
    ACTTAAATGGCGGGACTGTATTAACTTCACAATAACTGAATTCGAATAGAGATAAATTTAATGTGCTTATTCTTACAGTTCACTTAACGCGGTACCCCGG
    CGATCACAAATTTCATCGGCGGTATCTCATAGTTTTAGCGTAACGATGCTCGAATACTCCCTGCGTCCTTATCTGAAAGTTTAAAGATGTTCATGCTCTT
    >TestSeq3:168
    CACATCCCGCAGAAGTCTAATATCCAAAAATCTGTAGTCCGTTGTGCGCTTAAAGTGGATATTAAATACAGCAACCCATACATCCCTTTAGTCATCTATG
    AGACCACTATAATCTACTAACCTAGCGTTACTTCCTTATAAACCGGTAGCAGATGGTAGCCGCTAGACGGCCGCGATATGATCCCTATAACTTAATATAG
    >TestSeq4:8
    TTCCAATCGCACCCGTTTTTAACAATAGGTTTCGCAATAATAGACAGCCGAAACAATACCACAACTGAGTGAACTATTGCACTTTTATAAGCTGTCCACC
    CCAAAACTTGAAGGGTAATACTAGCTATATTAGTTCAGACATAAGGAGCAAGTATGGGTCAGTACCAGGATTATAAAGCTATTTAAATTTCACAAACACC
    >TestSeq5:51
    CCAGAGGTCTGATGGTTAGTAGCCTTAAAGGAATATCGTTGATGCTTGCACGCCCCCGTGCATATCTGTTGCTTTATATCTACTAGCTCTGTGAAAGGCT
    TCCAATATAGTTATGAAATAATCGATTTTGGTTGCTAATTTATGAAAACGCTGTGCAATGAATAAATTGTAGTTTCTGCTCATATGATGTCCTAGGTTCG
    >TestSeq6:44
    AGTTTTCCGTTTTATATTACGGTGAAACAAATGAGTTCCGCTGCGGGCGCGTATTAGTGTCAGCTAAACTGACTTCCACTGCCAAATACTTTCGTATATA
    AATACTTGTACTGCTATGGTATACGACCTTAATATAACGCGCCTAACATCAAGGTGAGCAGTAGCACGTAATCTGTATCTCTCTTACTAGGATTTATAGT
    >TestSeq7:128
    TTTTAGGGCCCGGCCAATACATTCCGTCCGTCTTTTACGTTATTGTGATAATGAGATGCGTGGTGCACGTTGTATTATTTTTTTTAGGAAGCTAATATGA
    TTTAGCTATATGTCGAAATATAATATCCGCAGGCGTTTAACCGGCGCACTCATGCCATACAGTACTTAGGAACTTACGGTTGCAAACCTATACGAGTAAA
    >TestSeq8:73
    TAAGAAGTACGCCAGTTTGAGAATAAAAGGAGAGACAAAGTAAGTGCGCAAAATGTATATGAATCTAGACTACGCGTGCGGTGGTATTGAATTAGACATA
    ATGCAGATAGTAGACCCACCTCGTATGTTGGTCACCTTGTAAACTAGATTGTTAACAAGCTTTTTACTCGTAATCTACAAAATGTGGGTTCTTACGCATG
    >TestSeq9:116
    AGTTGTATGGTTTATTCTAACAGGCAGCTATTGCTATTATTGCAAACAAACAAGAAACTCGTAAGGTTTACCTCAGGGGCGTGCTGCCGGCCCTACTTGG
    ACACACCTTGCATTCGCCGTGCGACCCGCGCCAAGGTAGATGCTGAATCCTTGATATATATTGCTTCTAAAAAAAACATTAAATCCGACAATTACAACAA
    >TestSeq10:3
    CTCGGCAGCGGTTCAGAGTAATAGAAACAGTCTTCTTTATCTCCTTGCCACCTTCGAGTTGTCGCCGATAGTCGATATGTGAATAATGGGGTTTAAAGTG
    CCGTCTGTTACTAGTCACCACGGTTCTTTGTAGCTTCTTAATAGTGCACAGGTCAGTTTCTACTTTGACGTATGATGTTGGCGGGTAACCATCAACGATA
    >TestSeq11:175
    GTATCTTCTCAAAGGGCGATATTCAATAACTAATGCAACGAACCCGGTCCATTGATGAAATTTTTATCAACTACTTTTTGTACTCAAGTAGTATAAGACG
    GTCCTAATATTAAGTTCTATAACTTACATCAAAAAATAAAGTTGTACCTTGAGCTTTACCCGATACGACAGCATGCCCTGCGATGTTTGCGAATAGTAGA
    >TestSeq12:161
    TGTACCACTTATTTGGATAAACCCTTGTGACAAATCAGTATTGTTGATTGTAAAATCGTAAATGATGATTACAGTGACATTATCCACAATATTTTGGATA
    AACTTTCATGACCGGAAAATATTAATCGTAGTATTCCGAATCAACCTATTTTGCCTAACTCGGACGGGGACTCATAAAATAAGCGATATAAGTTGGTTTT
    >TestSeq13:147
    GGCCAGTTGAGCTAAATTATCTTAATATTGTAAGTTCAATACCAAGTAACGTCCAGCGTCAAATCGAACCTTTAAGCTCAGCTTTCAACTACATATGTAG
    GCTTTACTAGCGTTTAATACTCGATACTACGATTTGAGTCAGCCAACGCCAGCGCTTGGTATTTGTAACATATGACATATATAATACTACAATAGGCCGT
    >TestSeq14:88
    GGGATGCAGCACAACTCGTACTTCATTAATTTTGTCTGCTAACTATACATTAACGTGTTACATAATTACGTATTAGATTGAGAAGGTCGCAAGCCTCGTG
    TAGTATCACATACCTAGTAAGTAGCGTCAGCACACGGTCTAGCTAAGCATGGCCTTACAGGTCATATATGTAGATTAGCTAAGATTAGTAGGTAATTACT
    >TestSeq15:12
    TCACTGTTTTTCGCACGGGAAAGGGCCTCGGGATATCGAAAGTATAGGTAGTAACCTAACCTACCCCAGTCATTTAGTTTTTATTTAATTAGTAGTGATG
    TTATTGCGCCACGGATATGAGATTATCGATGAACTCCGTACATACGGATAATAATAAATCCCAATTGGATCACTAGAACCTTATAGGTAAAAAAATTCCC
    >TestSeq16:6
    TTATTCCCGCCGGATCAGGAATCCTTGCATAATCAGTTTCACAGATGTAGTTTAAATTCTTGTCCTTTTGTATCTTTCGTGGCAGTTCCGATCGGTTCAT
    TTGATCATAGATGGCATACTATAAACTCATTTTATGTTATGATAAGAGATGTCCTGTCCACCTCGGTTACCATTATGAATAATTGATGTGGATAGGATAG
    >TestSeq17:130
    AAGTGTGGATGGTAATACTGCAACTTCGTCTTTTTTCTAGTGGATGTTTGGGTCTCGATGCGGTTGTAAACACTCTATCTATATAATTAAACAAGATTAA
    ATGCCACAAACACTTTATCTTTTCTTCGACGCCCGGCAATGAATCATCGTTAAGTGTCACATTATGATAACGTAGTATGAACCAAAGCCTCCATTGCAAT
    >TestSeq18:28
    AAAATAAAATAAACGGGGTATATACTACGGACGGGATACTGTACCTTCTAAACAGCATTTCACCTTTAATCATGAACTGTTTTTTCGAACATCTGCATAA
    AAATTATTTTTCCTTCTTCTCAGATGTGTTAACCCATGTGTACAAGAGTGACGTCTACCGGCTACTTTAAGTGTGTAAATGCATGCTATAGCTAAAATTA
    >TestSeq19:121
    CCGGGCTATGATATGACAAGCGGATAGGTAGTCAGTTAGCTCTTACTAGTTACGCCGACTTTGAATGAACAAATCTAAGAGTAAGATTCGTTAGATATAT
    GCCATACGCTAGGATGCTATGGGGCCCCTTTTTCAAGGTGTAAAATTATATGGTGGAATTAATACGTGGCTTATATCAATCTTAACATATAAGTGTAGGA
    
    

  3. Check the Search given strand only option.

  4. Paste the following constraint definitions into the window "actual constraint definitions":
    @ ConstraintSet 1
    
    >IntervalSetup
    Length: 3 bp
    Length: variable
    Length: 3 bp
    
    >IcBounds
    Interval: 1
    Bounds: 1.0 to 2.0
    
    >IcBounds
    Interval: 2
    Bounds: 0 to 0.8
    
    >Pal
    Intervals: 1 and 3
    ErrorTol: 0.05
    

  5. Check the option Add unconstrained case to given constraints.

  6. Enter 7 for the minimum motif width and 9 for the maximum motif width.

  7. Press the Start search button.