SEARCH

Sequence

GENOMES

Enrichment analyses (GO, KEGG, KOG, NR, SwissProt) were conducted,
including CDS regions and upstream 2k sequences.

BU - BnaA02T106200BU

CDS Sequence (4171 bp)
ATGGAGACGAAGACGGAGATCGAATTCACCAAGGAGCCCTACATCGAAGACGTTGGTCCTCTCAAAATAC
AAAGCATAAACTTCTCAATGCTCTCTGATATTGAAGTCATGAAAGCTGCTGAGGTTCAGGTCTGGAAGAA
TATGTACTACGAGTCCAATTTTAAGCCTATTGAAGGCGGCTTGTTGGATCCTCGAATGGGTCCTCCTAAC
AAAAGGTCTACATGCGCAACCTGTCATGGCAACTTCCAAAACTGTCCTGGACACTATGGCTATCTGAAGC
TTGACCTTCCGGTTTATAACGTTGGATTCTTCAATTTTATCCTTGACATTTTGAAGTGCATCTGTAAGAG
CTGTTCCAGCATGCTTATTGAAGAGAAGATGTATGAAGATCACTTGAAGAAGATGCGGAATCCAAGAACG
GAGCCATTGAGGAAGACTGAATTGGCCAAAGCGGTTGTCAAGAAGTGCAGTCTGATGGCTGGCCAGAGAG
TTATTACTTGCAAAAAATGTGGATACCTCAATGGCATGGTAAAGAAGGTCGCAGCGCAGTTGGGTATAGG
CATCAGTCATGACCGATCTAAAATCCATGGTGGGGAGATTGATGAATTTAAATCTGCAATATCCCACACA
AAAGAGTCTGCTGGTGGAATAAATCCTCTTACCTATGTTCTTGATCCTAACGTGGTGCTTAGACTTTTTA
AAGGAATGAGTGACAAGGACTGCGAACTTCTGTATATTGCTCATAGACCTGAGAATCTCATCATAACGTG
CATGCTCGTGCCACCGTTATCAATCCGACCGTCTGTTATGATTGGTGGTACACAAAGCAATGAAAACGAC
ATAACAGAGAGATTAAAGAAAATCATTCAAGACAATGCTTCTCTTCATAAGATTTTAAGCCAACCTACCA
CATCGCCCAAAAACATGCAAGTATGGGATACAGTTCAAAGCGAGGTTGCACAATACATTAATAGTGAAGT
CCGAGGTGTCCAGATCATGCCAAACACCAAGCCACTGGCTGGACTCCTTCAGCGTCTCAAGGGAAAAGGG
GGACGTTTCCGTGCAAACTTGTCAGGGAAGCGTGTCGAGTTCACTGGTAGAACTGTTATTTCACCTGATC
CCAATTTGAAAATTACAGAGGTAGGGATTCCTATCCTTATGGCCCGGATCTTAACTTTTCCTGAATGTGT
GTCCCGTCATAATATTGATAAGTTGAGGCAACGCGTCCGCAATGGCCCTAATAAATACCCTGGTGCCAGA
AATGTCAGATATCCAGATGGTTCTTCAAGGACTTTGGTGGGTGATTATCGGAAGCGTATTGCTGATGAAT
TGACTTATGGATGCATAGTTGACCGTCATTTGGAAGACGGGGATGCTATTCTTTTCAACAGACAACCGAG
TCTGCATCGGATGTCTATCATGTGTCACAGGGCAAGAATAATGCCTTGGAGAACATTGAGGTTCAACGAA
TCGGTTTGTAACCCATATAATGCTGATTTTGATGGTGATGAGATGAACATGCACGTACCACAAACAGAGG
AGGCTCGGACAGAGGCTATTACATTGATGGGGGTACAAAACAATTTATGCACCCCAAAAAATGGAGAAAT
GTTAGTAGCATCAACACAGGATTTTTTAACATCTGCCTATTTGATAACGAGAAAGGACACGTTCTATGAC
CGTGCAGCCTTTTCACTTATATGTTCTTATATGGGAGACGCCATGGATTCCATAGATCTGCCCACGCCCA
CAATCTTTAAGCCAATAGAGCTTTGGACTGGTAAACAGGTTTTTAATGTTTTGCTGCGTCCAAACGCAAG
TGTCAGAGTCTACGTAACTCTCAATGTGAAAGAGAAGAACTTCAGGAAGGGAGAACATTATGATGAAACA
ATGTGCATAAATGATGGATGGGTTTATTTTCGGAACAGTGAGCTAATATCAGGACAACTGGGGAAGGCTA
CGTTAGGAAATGGAAGCAAGGATGGATTATATTCAATTCTTCTTCGAGATTACAACTCCCATGCTGCTGC
AGTCTGCATGAATCGTCTAGCAAAGTTGAGTGCTCGATGGATTGGAATCCATGGCTTCTCCATTGGGATC
GATGACGTTCAACCTGGAAAAAAGTTGAAAGAGGACAGAGAGGTTATAGTGAAACGCCGATATAAGGATT
GTGATGAATTACTTAAGAACTATGAAAAAGGAGATCTAGATGCTGCAAAAACACTGGAAGCTAACTTAAC
AGGGTTTCTTAATAAAATTCGAGAAGAGACTGGGAAGCTCTGTATGGACGGATTACATTGGAGAAACAGT
CCCTTGATCATGTCGCAATGCGGTTCCAAGGGATCCCCTATCAATATCAGTCAGATGGTTACATGTGTTG
GTCAGCAGACAGTTAATGGTAGCCGTGCTCCTGATGGATTTATAGATCGAAGTCTTCCTCATTTCCCTAG
AATGTCCAGAACCCCTGAAGCTAAAGGTTTTGTTGCTAATTCGTTCTACGACGGCCTTAGTGCCACAGAG
TTTTTCTTTCACACTATGGGTGGACGAGAAGGTCTAGTTGATACAGCGGTGAAAACTGCCAGTACAGGTT
ACATGTCTCGAAGACTGATGAAAGCCTTGGAGGATCTCTTAGTCCATTATGATAACACAGTGCGAAACGC
CAGCGGAAGCATACTTCAGTTTACTTATGGGGATGATGGGATGGACCCAGCACTGATGGAAGGAAAGAAT
GGAACGCCTTTAAATTTTGATAGATTATTTCTTAAAATTCAGGCCACTTGTCCTCCTAGATCACATCACA
ATTATCTTTCTTCAGACGAACTGTTGCAAAAGTTCGAAGAGGAGTTAGTCAGGCAAGATACAAGTCGGGT
GTGCACTGACGCCTTCGTGAAATCTCTAAGAGAATTTGTTTGTTTGCTCGGAGTAAAGTCTGCAAGCCCG
AGCCAGATTTTCTCTAAAGGATCTGGTGTGACTGATAAGCAACTCGAGGTATTTGTGAAAATTTGTGTAT
CTCGATACCGGGGGAAAACAATTGAACCTGGGACTGCAATTGGACCAATAGGAGCTCAGAGTATCGGAGA
ACCAGGGACACAAATGACTCTGAAAACTTTTCACTTTGCTGGAGTTGCTAGCATGAATATCACCCAAGGA
GTTCCTCGAATCAACGAAATCATAAATGCTACCAAAACTATAAGCACACCCGTCATCTCTGCAGAACTTG
AGAACCCCCTGGTAGAGGCTAGTGCCCGAATGGCCAAAGGACGCATCGAGAAAACTACTTTAGGACAGGT
TGCTGAGAGTATCGAGGTGCTAATGACTTCAACATCAGCGTCAGTGAGGATAACCCTTGACAAGAAAATA
ATAGAGGAGGCGTTTTTGTCTATAACCCCCTGGTCGGTTAAAAATTCCATACTAAAGACCAGAATCAAAC
TGCAGGATGAGAATATCAGGGTCTTAGATACGGGATTGGATATTATTCCAAAGGGAGATCAAAATGGGAC
TCATTTCACTCTCCACAATCTGAAGAATGTGCTGCCAAATGTTATAGTGAATGGGATCAAAACAGTTGAG
CGAGTCGTTATAGCAGAGGATACAGATAAAAAGAAAGAGATTGGTGGGAAGAAAAGATTGAAACTGTTCG
TGGAGGGAACAAACCTCCTGGATGTAATGGGCACTCCGGGAATCGATGGGAGAACTACTACAAGCAACAA
TATTGTCGAAGTGAGCAAAACACTGGGAATTGAGGCTGCAAGGACGACAATTATTGATGAAATAGGGTCA
GTTATGGGAAACCATGGAATGAGTATAGACATTCGTCACATGATGCTTTTGGCTGATGTCATGACTTACC
GGGGGGAGGTACTTGGGATCCAAAGAACCGGGATACAGAAGATGGACAAAAGTGTGCTGATGCAGGCATC
TTTTGAGAGGACTGGAGATCATTTATTTAGTGCAGCAATTAGCGGAAAAGTTGATAACATAGAGGGAGTC
ACAGAGTGTGTGATTATGGGCATACCAATGAAACTCGGAACCGGAATCCTCAAAGTCCTCCAAAAGACTA
AGACTGAGGATCTGCCAAAGCTGAACTATGGTGCTGATCCAATCATCTCTTGA
Upstream Sequence
GAGTTCGAAGCTCGATTAGGTTTTTTTCCTCTCCATCGCAGCTCTCTTTTTTTTTTTTCTTTCTCAGCCG
TTCTGTATCTCCCGCCTGTTACTCGATCTGCTGCTTAAACCCTAAAACCCAACCTCCATCGCCATCCTTC
GATTGGAGAGAGATGGAGACGAAGACGGAGATCGAATTCACCAAGGAGCCCTACATCGAAGACGTTGGTC
CTCTCAAAATACAAAGCATAAACTTCTCAATGCTCTCTGATATTGAAGTCATGAAAGCTGCTGAGGTTCA
GGTCTGGAAGAATATGTACTACGAGTCCAATTTTAAGCCTATTGAAGGCGGCTTGTTGGATCCTCGAATG
GGTCCTCCTAACAAAAGGTCTACATGCGCAACCTGTCATGGCAACTTCCAAAACTGTCCTGGACACTATG
GCTATCTGAAGCTTGACCTTCCGGTTTATAACGTTGGATTCTTCAATTTTATCCTTGACATTTTGAAGTG
CATCTGTAAGAGCTGTTCCAGCATGCTTATTGAAGAGAAGATGTATGAAGATCACTTGAAGAAGATGCGG
AATCCAAGAACGGAGCCATTGAGGAAGACTGAATTGGCCAAAGCGGTTGTCAAGAAGTGCAGTCTGATGG
CTGGCCAGAGAGTTATTACTTGCAAAAAATGTGGATACCTCAATGGCATGGTAAAGAAGGTCGCAGCGCA
GTTGGGTATAGGCATCAGTCATGACCGATCTAAAATCCATGGTGGGGAGATTGATGAATTTAAATCTGCA
ATATCCCACACAAAAGAGTCTGCTGGTGGAATAAATCCTCTTACCTATGTTCTTGATCCTAACGTGGTGC
TTAGACTTTTTAAAGGAATGAGTGACAAGGACTGCGAACTTCTGTATATTGCTCATAGACCTGAGAATCT
CATCATAACGTGCATGCTCGTGCCACCGTTATCAATCCGACCGTCTGTTATGATTGGTGGTACACAAAGC
AATGAAAACGACATAACAGAGAGATTAAAGAAAATCATTCAAGACAATGCTTCTCTTCATAAGATTTTAA
GCCAACCTACCACATCGCCCAAAAACATGCAAGTATGGGATACAGTTCAAAGCGAGGTTGCACAATACAT
TAATAGTGAAGTCCGAGGTGTCCAGATCATGCCAAACACCAAGCCACTGGCTGGACTCCTTCAGCGTCTC
AAGGGAAAAGGGGGACGTTTCCGTGCAAACTTGTCAGGGAAGCGTGTCGAGTTCACTGGTAGAACTGTTA
TTTCACCTGATCCCAATTTGAAAATTACAGAGGTAGGGATTCCTATCCTTATGGCCCGGATCTTAACTTT
TCCTGAATGTGTGTCCCGTCATAATATTGATAAGTTGAGGCAACGCGTCCGCAATGGCCCTAATAAATAC
CCTGGTGCCAGAAATGTCAGATATCCAGATGGTTCTTCAAGGACTTTGGTGGGTGATTATCGGAAGCGTA
TTGCTGATGAATTGACTTATGGATGCATAGTTGACCGTCATTTGGAAGACGGGGATGCTATTCTTTTCAA
CAGACAACCGAGTCTGCATCGGATGTCTATCATGTGTCACAGGGCAAGAATAATGCCTTGGAGAACATTG
AGGTTCAACGAATCGGTTTGTAACCCATATAATGCTGATTTTGATGGTGATGAGATGAACATGCACGTAC
CACAAACAGAGGAGGCTCGGACAGAGGCTATTACATTGATGGGGGTACAAAACAATTTATGCACCCCAAA
AAATGGAGAAATGTTAGTAGCATCAACACAGGATTTTTTAACATCTGCCTATTTGATAACGAGAAAGGAC
ACGTTCTATGACCGTGCAGCCTTTTCACTTATATGTTCTTATATGGGAGACGCCATGGATTCCATAGATC
TGCCCACGCCCACAATCTTTAAGCCAATAGAGCTTTGGACTGGTAAACAGGTTTTTAATGTTTTGCTGCG
TCCAAACGCAAGTGTCAGAGTCTACGTAACTCTCAATGTGAAAGAGAAGAACTTCAGGAAGGGAGAACAT
TATGATGAAACAATGTGCATAAATGATGGATGGGTTTATTTTCGGAACAGTGAGCTAATATCAGGACAAC
TGGGGAAGGCTACGTTAGGAAATGGAAGCAAGGATGGATTATATTCAATTCTTCTTCGAGATTACAACTC
CCATGCTGCTGCAGTCTGCATGAATCGTCTAGCAAAGTTGAGTGCTCGATGGATTGGAATCCATGGCTTC
TCCATTGGGATCGATGACGTTCAACCTGGAAAAAAGTTGAAAGAGGACAGAGAGGTTATAGTGAAACGCC
GATATAAGGATTGTGATGAATTACTTAAGAACTATGAAAAAGGAGATCTAGATGCTGCAAAAACACTGGA
AGCTAACTTAACAGGGTTTCTTAATAAAATTCGAGAAGAGACTGGGAAGCTCTGTATGGACGGATTACAT
TGGAGAAACAGTCCCTTGATCATGTCGCAATGCGGTTCCAAGGGATCCCCTATCAATATCAGTCAGATGG
TTACATGTGTTGGTCAGCAGACAGTTAATGGTAGCCGTGCTCCTGATGGATTTATAGATCGAAGTCTTCC
TCATTTCCCTAGAATGTCCAGAACCCCTGAAGCTAAAGGTTTTGTTGCTAATTCGTTCTACGACGGCCTT
AGTGCCACAGAGTTTTTCTTTCACACTATGGGTGGACGAGAAGGTCTAGTTGATACAGCGGTGAAAACTG
CCAGTACAGGTTACATGTCTCGAAGACTGATGAAAGCCTTGGAGGATCTCTTAGTCCATTATGATAACAC
AGTGCGAAACGCCAGCGGAAGCATACTTCAGTTTACTTATGGGGATGATGGGATGGACCCAGCACTGATG
GAAGGAAAGAATGGAACGCCTTTAAATTTTGATAGATTATTTCTTAAAATTCAGGCCACTTGTCCTCCTA
GATCACATCACAATTATCTTTCTTCAGACGAACTGTTGCAAAAGTTCGAAGAGGAGTTAGTCAGGCAAGA
TACAAGTCGGGTGTGCACTGACGCCTTCGTGAAATCTCTAAGAGAATTTGTTTGTTTGCTCGGAGTAAAG
TCTGCAAGCCCGAGCCAGATTTTCTCTAAAGGATCTGGTGTGACTGATAAGCAACTCGAGGTATTTGTGA
AAATTTGTGTATCTCGATACCGGGGGAAAACAATTGAACCTGGGACTGCAATTGGACCAATAGGAGCTCA
GAGTATCGGAGAACCAGGGACACAAATGACTCTGAAAACTTTTCACTTTGCTGGAGTTGCTAGCATGAAT
ATCACCCAAGGAGTTCCTCGAATCAACGAAATCATAAATGCTACCAAAACTATAAGCACACCCGTCATCT
CTGCAGAACTTGAGAACCCCCTGGTAGAGGCTAGTGCCCGAATGGCCAAAGGACGCATCGAGAAAACTAC
TTTAGGACAGGTTGCTGAGAGTATCGAGGTGCTAATGACTTCAACATCAGCGTCAGTGAGGATAACCCTT
GACAAGAAAATAATAGAGGAGGCGTTTTTGTCTATAACCCCCTGGTCGGTTAAAAATTCCATACTAAAGA
CCAGAATCAAACTGCAGGATGAGAATATCAGGGTCTTAGATACGGGATTGGATATTATTCCAAAGGGAGA
TCAAAATGGGACTCATTTCACTCTCCACAATCTGAAGAATGTGCTGCCAAATGTTATAGTGAATGGGATC
AAAACAGTTGAGCGAGTCGTTATAGCAGAGGATACAGATAAAAAGAAAGAGATTGGTGGGAAGAAAAGAT
TGAAACTGTTCGTGGAGGGAACAAACCTCCTGGATGTAATGGGCACTCCGGGAATCGATGGGAGAACTAC
TACAAGCAACAATATTGTCGAAGTGAGCAAAACACTGGGAATTGAGGCTGCAAGGACGACAATTATTGAT
GAAATAGGGTCAGTTATGGGAAACCATGGAATGAGTATAGACATTCGTCACATGATGCTTTTGGCTGATG
TCATGACTTACCGGGGGGAGGTACTTGGGATCCAAAGAACCGGGATACAGAAGATGGACAAAAGTGTGCT
GATGCAGGCATCTTTTGAGAGGACTGGAGATCATTTATTTAGTGCAGCAATTAGCGGAAAAGTTGATAAC
ATAGAGGGAGTCACAGAGTGTGTGATTATGGGCATACCAATGAAACTCGGAACCGGAATCCTCAAAGTCC
TCCAAAAGACTAAGACTGAGGATCTGCCAAAGCTGAACTATGGTGCTGATCCAATCATCTCTTGAAAAGA
CAGTTCAACGCTTCAGAATATATAGATATATTTTCTTCTGTTATGTTCTGATCATTGCTTAGACACTAAA
ATATCTTTTGAGGCATTTTCTTTTGAATCTTTGTGTCACATTGAAAGTCACAAATAGTAACAGTTTAC
Downstream Sequence
TGTAATCTTTCACTCCTTTTTTGCTCAATTACTCGTGATGTGATATCTGATTTGAAGGAG
AAACTGAGATTAACTGTTAATATGCAGACAAAGCATAAACTTCTCAATGCTCTCTGATAT
TGAAGTCATGAAAGCTGCTGAGGTTCAGGTCTGGAAGAATATGTACTACGAGTCCAATTT
TAAGCCTATTGAAGGCGGCTTGTTGGATCCTCGAATGGTATATCTGATTTTTCTTTTGGA
TATGTGTCTTTTGGTTTAAGCTTCTTATTAATGGGCTATAACCATGTCTATACAACAGGG
TCCTCCTAACAAAAGGTCTACATGCGCAACCTGTCATGGCAACTTCCAAAACTGTCCTGG
ACACTATGGCTATCTGAAGCTTGACCTTCCGGTTTATAACGTTGGATTCTTCAATTTTAT
CCTTGACATTTTGAAGTGCATCTGTAAGGTAGCGCAGGGTTACCAGATTCTCTCTCTCTC
TCTCCACCTTTTTTAGTTTTGTTGAATGGGGAAAAAGTTGAGGAACGATAAAGCATGAGA
ACTTATTGACAATGACTGATTTGTCTTTTTTTGTTTTCCCTTCTCACACAGAGCTGTTCC
AGCATGCTTATTGAAGAGAAGATGTATGAAGATCACTTGAAGAAGATGCGGAATCCAAGA
ACGGAGCCATTGAGGAAGACTGAATTGGCCAAAGCGGTTGTCAAGAAGTGCAGTCTGATG
GCTGGCCAGAGAGTTATTACTTGCAAAAAATGTGGATACCTCAATGGTATTACTTTTTTT
CATTCCGCTAAAACATGTAGTTCCATTTAGATGACTCCACAATCTTGATTTCTTTTCTGG
TGTGTTTCATCTTAGATGCAAAAAATTAGTTCATATTCATATAAGTTAGTTTAAGTAGCA
GTAGCAGAAAATTAGGATTCTTCTGCTTATATCCAATGCTTATATCACTGATCCTTTTCA
GGCATGGTAAAGAAGGTCGCAGCGCAGTTGGGTATAGGCATCAGTCATGACCGATCTAAA
ATCCATGGTGGGGAGATTGATGAATTTAAATCTGCAATATCCCACACAAAAGAGTCTGCT
GGTGGAATAAATCCTCTTACCTATGTTCTTGATCCTAACGTGGTGCTTAGACTTTTTAAA
GGAATGAGTGACAAGGTATTTTTTTGAGTTTGAATCTGCAATTCATTTTTAACTTGTGCT
TGGAATATTTCTACCTATTTGTGCTGCAGTTAGAGGATGTTCGTCTCTCTCAAAACATAT
TATAGGGATTATCTTATTTTCAAATATTTCAGCCATACTGATTTTTTTGTTTCTGAAATT
GAAATAGGACTGCGAACTTCTGTATATTGCTCATAGACCTGAGAATCTCATCATAACGTG
CATGCTCGTGCCACCGTTATCAATCCGACCGTCTGTTATGATTGGTGGTACACAAAGGTT
AGCTATCATTTTGTTTATCTTTCTCATGTCAATTATATTTTTCTACTGCTGGTTTTTCTT
GAAAGAATGTGTGTTTTTTTTGCTGCAGCAATGAAAACGACATAACAGAGAGATTAAAGA
AAATCATTCAAGACAATGCTTCTCTTCATAAGATTTTAAGCCAACCTACCACATCGCCCA
AAAACATGGTACAAGGAGTGTTAGTTTACGTTTTGATTCATATTTTCCTTTGTTACTATT
TCTAGTTCTGTTATTTTATTCAGATTTGTTGAGTATTTTTATTTTTCAGCAAGTATGGGA
TACAGTTCAAAGCGAGGTTGCACAATACATTAATAGTGAAGTCCGAGGTGTCCAGATCAT
GCCAAACACCAAGCCACTGGCTGGACTCCTTCAGCGTCTCAAGGGAAAAGGGGGACGTTT
CCGTGCAAACTTGTCAGGGAAGCGTGTCGAGTTCACTGGTAGAACTGTTATTTCACCTGA
TCCCAATTTGAAAATTACAGAGGTAACTCATCATGGAAGGTTGTTTGATTGTTACTTTTG
TGTATTTATATTATTAATGT
mRNA Sequence
GAGTTCGAAGCTCGATTAGGTTTTTTTCCTCTCCATCGCAGCTCTCTTTTTTTTTTTTCTTTCTCAGCCG
TTCTGTATCTCCCGCCTGTTACTCGATCTGCTGCTTAAACCCTAAAACCCAACCTCCATCGCCATCCTTC
GATTGGAGAGAGATGGAGACGAAGACGGAGATCGAATTCACCAAGGAGCCCTACATCGAAGACGTTGGTC
CTCTCAAAATACAAAGCATAAACTTCTCAATGCTCTCTGATATTGAAGTCATGAAAGCTGCTGAGGTTCA
GGTCTGGAAGAATATGTACTACGAGTCCAATTTTAAGCCTATTGAAGGCGGCTTGTTGGATCCTCGAATG
GGTCCTCCTAACAAAAGGTCTACATGCGCAACCTGTCATGGCAACTTCCAAAACTGTCCTGGACACTATG
GCTATCTGAAGCTTGACCTTCCGGTTTATAACGTTGGATTCTTCAATTTTATCCTTGACATTTTGAAGTG
CATCTGTAAGAGCTGTTCCAGCATGCTTATTGAAGAGAAGATGTATGAAGATCACTTGAAGAAGATGCGG
AATCCAAGAACGGAGCCATTGAGGAAGACTGAATTGGCCAAAGCGGTTGTCAAGAAGTGCAGTCTGATGG
CTGGCCAGAGAGTTATTACTTGCAAAAAATGTGGATACCTCAATGGCATGGTAAAGAAGGTCGCAGCGCA
GTTGGGTATAGGCATCAGTCATGACCGATCTAAAATCCATGGTGGGGAGATTGATGAATTTAAATCTGCA
ATATCCCACACAAAAGAGTCTGCTGGTGGAATAAATCCTCTTACCTATGTTCTTGATCCTAACGTGGTGC
TTAGACTTTTTAAAGGAATGAGTGACAAGGACTGCGAACTTCTGTATATTGCTCATAGACCTGAGAATCT
CATCATAACGTGCATGCTCGTGCCACCGTTATCAATCCGACCGTCTGTTATGATTGGTGGTACACAAAGC
AATGAAAACGACATAACAGAGAGATTAAAGAAAATCATTCAAGACAATGCTTCTCTTCATAAGATTTTAA
GCCAACCTACCACATCGCCCAAAAACATGCAAGTATGGGATACAGTTCAAAGCGAGGTTGCACAATACAT
TAATAGTGAAGTCCGAGGTGTCCAGATCATGCCAAACACCAAGCCACTGGCTGGACTCCTTCAGCGTCTC
AAGGGAAAAGGGGGACGTTTCCGTGCAAACTTGTCAGGGAAGCGTGTCGAGTTCACTGGTAGAACTGTTA
TTTCACCTGATCCCAATTTGAAAATTACAGAGGTAGGGATTCCTATCCTTATGGCCCGGATCTTAACTTT
TCCTGAATGTGTGTCCCGTCATAATATTGATAAGTTGAGGCAACGCGTCCGCAATGGCCCTAATAAATAC
CCTGGTGCCAGAAATGTCAGATATCCAGATGGTTCTTCAAGGACTTTGGTGGGTGATTATCGGAAGCGTA
TTGCTGATGAATTGACTTATGGATGCATAGTTGACCGTCATTTGGAAGACGGGGATGCTATTCTTTTCAA
CAGACAACCGAGTCTGCATCGGATGTCTATCATGTGTCACAGGGCAAGAATAATGCCTTGGAGAACATTG
AGGTTCAACGAATCGGTTTGTAACCCATATAATGCTGATTTTGATGGTGATGAGATGAACATGCACGTAC
CACAAACAGAGGAGGCTCGGACAGAGGCTATTACATTGATGGGGGTACAAAACAATTTATGCACCCCAAA
AAATGGAGAAATGTTAGTAGCATCAACACAGGATTTTTTAACATCTGCCTATTTGATAACGAGAAAGGAC
ACGTTCTATGACCGTGCAGCCTTTTCACTTATATGTTCTTATATGGGAGACGCCATGGATTCCATAGATC
TGCCCACGCCCACAATCTTTAAGCCAATAGAGCTTTGGACTGGTAAACAGGTTTTTAATGTTTTGCTGCG
TCCAAACGCAAGTGTCAGAGTCTACGTAACTCTCAATGTGAAAGAGAAGAACTTCAGGAAGGGAGAACAT
TATGATGAAACAATGTGCATAAATGATGGATGGGTTTATTTTCGGAACAGTGAGCTAATATCAGGACAAC
TGGGGAAGGCTACGTTAGGAAATGGAAGCAAGGATGGATTATATTCAATTCTTCTTCGAGATTACAACTC
CCATGCTGCTGCAGTCTGCATGAATCGTCTAGCAAAGTTGAGTGCTCGATGGATTGGAATCCATGGCTTC
TCCATTGGGATCGATGACGTTCAACCTGGAAAAAAGTTGAAAGAGGACAGAGAGGTTATAGTGAAACGCC
GATATAAGGATTGTGATGAATTACTTAAGAACTATGAAAAAGGAGATCTAGATGCTGCAAAAACACTGGA
AGCTAACTTAACAGGGTTTCTTAATAAAATTCGAGAAGAGACTGGGAAGCTCTGTATGGACGGATTACAT
TGGAGAAACAGTCCCTTGATCATGTCGCAATGCGGTTCCAAGGGATCCCCTATCAATATCAGTCAGATGG
TTACATGTGTTGGTCAGCAGACAGTTAATGGTAGCCGTGCTCCTGATGGATTTATAGATCGAAGTCTTCC
TCATTTCCCTAGAATGTCCAGAACCCCTGAAGCTAAAGGTTTTGTTGCTAATTCGTTCTACGACGGCCTT
AGTGCCACAGAGTTTTTCTTTCACACTATGGGTGGACGAGAAGGTCTAGTTGATACAGCGGTGAAAACTG
CCAGTACAGGTTACATGTCTCGAAGACTGATGAAAGCCTTGGAGGATCTCTTAGTCCATTATGATAACAC
AGTGCGAAACGCCAGCGGAAGCATACTTCAGTTTACTTATGGGGATGATGGGATGGACCCAGCACTGATG
GAAGGAAAGAATGGAACGCCTTTAAATTTTGATAGATTATTTCTTAAAATTCAGGCCACTTGTCCTCCTA
GATCACATCACAATTATCTTTCTTCAGACGAACTGTTGCAAAAGTTCGAAGAGGAGTTAGTCAGGCAAGA
TACAAGTCGGGTGTGCACTGACGCCTTCGTGAAATCTCTAAGAGAATTTGTTTGTTTGCTCGGAGTAAAG
TCTGCAAGCCCGAGCCAGATTTTCTCTAAAGGATCTGGTGTGACTGATAAGCAACTCGAGGTATTTGTGA
AAATTTGTGTATCTCGATACCGGGGGAAAACAATTGAACCTGGGACTGCAATTGGACCAATAGGAGCTCA
GAGTATCGGAGAACCAGGGACACAAATGACTCTGAAAACTTTTCACTTTGCTGGAGTTGCTAGCATGAAT
ATCACCCAAGGAGTTCCTCGAATCAACGAAATCATAAATGCTACCAAAACTATAAGCACACCCGTCATCT
CTGCAGAACTTGAGAACCCCCTGGTAGAGGCTAGTGCCCGAATGGCCAAAGGACGCATCGAGAAAACTAC
TTTAGGACAGGTTGCTGAGAGTATCGAGGTGCTAATGACTTCAACATCAGCGTCAGTGAGGATAACCCTT
GACAAGAAAATAATAGAGGAGGCGTTTTTGTCTATAACCCCCTGGTCGGTTAAAAATTCCATACTAAAGA
CCAGAATCAAACTGCAGGATGAGAATATCAGGGTCTTAGATACGGGATTGGATATTATTCCAAAGGGAGA
TCAAAATGGGACTCATTTCACTCTCCACAATCTGAAGAATGTGCTGCCAAATGTTATAGTGAATGGGATC
AAAACAGTTGAGCGAGTCGTTATAGCAGAGGATACAGATAAAAAGAAAGAGATTGGTGGGAAGAAAAGAT
TGAAACTGTTCGTGGAGGGAACAAACCTCCTGGATGTAATGGGCACTCCGGGAATCGATGGGAGAACTAC
TACAAGCAACAATATTGTCGAAGTGAGCAAAACACTGGGAATTGAGGCTGCAAGGACGACAATTATTGAT
GAAATAGGGTCAGTTATGGGAAACCATGGAATGAGTATAGACATTCGTCACATGATGCTTTTGGCTGATG
TCATGACTTACCGGGGGGAGGTACTTGGGATCCAAAGAACCGGGATACAGAAGATGGACAAAAGTGTGCT
GATGCAGGCATCTTTTGAGAGGACTGGAGATCATTTATTTAGTGCAGCAATTAGCGGAAAAGTTGATAAC
ATAGAGGGAGTCACAGAGTGTGTGATTATGGGCATACCAATGAAACTCGGAACCGGAATCCTCAAAGTCC
TCCAAAAGACTAAGACTGAGGATCTGCCAAAGCTGAACTATGGTGCTGATCCAATCATCTCTTGAAAAGA
CAGTTCAACGCTTCAGAATATATAGATATATTTTCTTCTGTTATGTTCTGATCATTGCTTAGACACTAAA
ATATCTTTTGAGGCATTTTCTTTTGAATCTTTGTGTCACATTGAAAGTCACAAATAGTAACAGTTTAC
Pro Sequence
METKTEIEFTKEPYIEDVGPLKIQSINFSMLSDIEVMKAAEVQVWKNMYYESNFKPIEGGLLDPRMGPPN
KRSTCATCHGNFQNCPGHYGYLKLDLPVYNVGFFNFILDILKCICKSCSSMLIEEKMYEDHLKKMRNPRT
EPLRKTELAKAVVKKCSLMAGQRVITCKKCGYLNGMVKKVAAQLGIGISHDRSKIHGGEIDEFKSAISHT
KESAGGINPLTYVLDPNVVLRLFKGMSDKDCELLYIAHRPENLIITCMLVPPLSIRPSVMIGGTQSNEND
ITERLKKIIQDNASLHKILSQPTTSPKNMQVWDTVQSEVAQYINSEVRGVQIMPNTKPLAGLLQRLKGKG
GRFRANLSGKRVEFTGRTVISPDPNLKITEVGIPILMARILTFPECVSRHNIDKLRQRVRNGPNKYPGAR
NVRYPDGSSRTLVGDYRKRIADELTYGCIVDRHLEDGDAILFNRQPSLHRMSIMCHRARIMPWRTLRFNE
SVCNPYNADFDGDEMNMHVPQTEEARTEAITLMGVQNNLCTPKNGEMLVASTQDFLTSAYLITRKDTFYD
RAAFSLICSYMGDAMDSIDLPTPTIFKPIELWTGKQVFNVLLRPNASVRVYVTLNVKEKNFRKGEHYDET
MCINDGWVYFRNSELISGQLGKATLGNGSKDGLYSILLRDYNSHAAAVCMNRLAKLSARWIGIHGFSIGI
DDVQPGKKLKEDREVIVKRRYKDCDELLKNYEKGDLDAAKTLEANLTGFLNKIREETGKLCMDGLHWRNS
PLIMSQCGSKGSPINISQMVTCVGQQTVNGSRAPDGFIDRSLPHFPRMSRTPEAKGFVANSFYDGLSATE
FFFHTMGGREGLVDTAVKTASTGYMSRRLMKALEDLLVHYDNTVRNASGSILQFTYGDDGMDPALMEGKN
GTPLNFDRLFLKIQATCPPRSHHNYLSSDELLQKFEEELVRQDTSRVCTDAFVKSLREFVCLLGVKSASP
SQIFSKGSGVTDKQLEVFVKICVSRYRGKTIEPGTAIGPIGAQSIGEPGTQMTLKTFHFAGVASMNITQG
VPRINEIINATKTISTPVISAELENPLVEASARMAKGRIEKTTLGQVAESIEVLMTSTSASVRITLDKKI
IEEAFLSITPWSVKNSILKTRIKLQDENIRVLDTGLDIIPKGDQNGTHFTLHNLKNVLPNVIVNGIKTVE
RVVIAEDTDKKKEIGGKKRLKLFVEGTNLLDVMGTPGIDGRTTTSNNIVEVSKTLGIEAARTTIIDEIGS
VMGNHGMSIDIRHMMLLADVMTYRGEVLGIQRTGIQKMDKSVLMQASFERTGDHLFSAAISGKVDNIEGV
TECVIMGIPMKLGTGILKVLQKTKTEDLPKLNYGADPIIS