Here are the ouputs:
dput(head(all_neighbours,n=5))
list(list(ACAAAAAT = c("CCAAAAAT", "GCAAAAAT", "TCAAAAAT", "AAAAAAAT",
"AGAAAAAT", "ATAAAAAT", "ACCAAAAT", "ACGAAAAT", "ACTAAAAT", "ACACAAAT",
"ACAGAAAT", "ACATAAAT", "ACAACAAT", "ACAAGAAT", "ACAATAAT", "ACAAACAT",
"ACAAAGAT", "ACAAATAT", "ACAAAACT", "ACAAAAGT", "ACAAAATT", "ACAAAAAA",
"ACAAAAAC", "ACAAAAAG"), ACAAAATT = c("CCAAAATT", "GCAAAATT",
"TCAAAATT", "AAAAAATT", "AGAAAATT", "ATAAAATT", "ACCAAATT", "ACGAAATT",
"ACTAAATT", "ACACAATT", "ACAGAATT", "ACATAATT", "ACAACATT", "ACAAGATT",
"ACAATATT", "ACAAACTT", "ACAAAGTT", "ACAAATTT", "ACAAAAAT", "ACAAAACT",
"ACAAAAGT", "ACAAAATA", "ACAAAATC", "ACAAAATG"), ACAAAAGT = c("CCAAAAGT",
"GCAAAAGT", "TCAAAAGT", "AAAAAAGT", "AGAAAAGT", "ATAAAAGT", "ACCAAAGT",
"ACGAAAGT", "ACTAAAGT", "ACACAAGT", "ACAGAAGT", "ACATAAGT", "ACAACAGT",
"ACAAGAGT", "ACAATAGT", "ACAAACGT", "ACAAAGGT", "ACAAATGT", "ACAAAAAT",
"ACAAAACT", "ACAAAATT", "ACAAAAGA", "ACAAAAGC", "ACAAAAGG")),
list(AAAATCAC = c("CAAATCAC", "GAAATCAC", "TAAATCAC", "ACAATCAC",
"AGAATCAC", "ATAATCAC", "AACATCAC", "AAGATCAC", "AATATCAC",
"AAACTCAC", "AAAGTCAC", "AAATTCAC", "AAAAACAC", "AAAACCAC",
"AAAAGCAC", "AAAATAAC", "AAAATGAC", "AAAATTAC", "AAAATCCC",
"AAAATCGC", "AAAATCTC", "AAAATCAA", "AAAATCAG", "AAAATCAT"
), AAAATTAC = c("CAAATTAC", "GAAATTAC", "TAAATTAC", "ACAATTAC",
"AGAATTAC", "ATAATTAC", "AACATTAC", "AAGATTAC", "AATATTAC",
"AAACTTAC", "AAAGTTAC", "AAATTTAC", "AAAAATAC", "AAAACTAC",
"AAAAGTAC", "AAAATAAC", "AAAATCAC", "AAAATGAC", "AAAATTCC",
"AAAATTGC", "AAAATTTC", "AAAATTAA", "AAAATTAG", "AAAATTAT"
), AAAATCAT = c("CAAATCAT", "GAAATCAT", "TAAATCAT", "ACAATCAT",
"AGAATCAT", "ATAATCAT", "AACATCAT", "AAGATCAT", "AATATCAT",
"AAACTCAT", "AAAGTCAT", "AAATTCAT", "AAAAACAT", "AAAACCAT",
"AAAAGCAT", "AAAATAAT", "AAAATGAT", "AAAATTAT", "AAAATCCT",
"AAAATCGT", "AAAATCTT", "AAAATCAA", "AAAATCAC", "AAAATCAG"
)), list(ATTTTCTA = c("CTTTTCTA", "GTTTTCTA", "TTTTTCTA",
"AATTTCTA", "ACTTTCTA", "AGTTTCTA", "ATATTCTA", "ATCTTCTA",
"ATGTTCTA", "ATTATCTA", "ATTCTCTA", "ATTGTCTA", "ATTTACTA",
"ATTTCCTA", "ATTTGCTA", "ATTTTATA", "ATTTTGTA", "ATTTTTTA",
"ATTTTCAA", "ATTTTCCA", "ATTTTCGA", "ATTTTCTC", "ATTTTCTG",
"ATTTTCTT"), TTTTTCTA = c("ATTTTCTA", "CTTTTCTA", "GTTTTCTA",
"TATTTCTA", "TCTTTCTA", "TGTTTCTA", "TTATTCTA", "TTCTTCTA",
"TTGTTCTA", "TTTATCTA", "TTTCTCTA", "TTTGTCTA", "TTTTACTA",
"TTTTCCTA", "TTTTGCTA", "TTTTTATA", "TTTTTGTA", "TTTTTTTA",
"TTTTTCAA", "TTTTTCCA", "TTTTTCGA", "TTTTTCTC", "TTTTTCTG",
"TTTTTCTT"), ATTTTCAA = c("CTTTTCAA", "GTTTTCAA", "TTTTTCAA",
"AATTTCAA", "ACTTTCAA", "AGTTTCAA", "ATATTCAA", "ATCTTCAA",
"ATGTTCAA", "ATTATCAA", "ATTCTCAA", "ATTGTCAA", "ATTTACAA",
"ATTTCCAA", "ATTTGCAA", "ATTTTAAA", "ATTTTGAA", "ATTTTTAA",
"ATTTTCCA", "ATTTTCGA", "ATTTTCTA", "ATTTTCAC", "ATTTTCAG",
"ATTTTCAT"), ATCTTCTA = c("CTCTTCTA", "GTCTTCTA", "TTCTTCTA",
"AACTTCTA", "ACCTTCTA", "AGCTTCTA", "ATATTCTA", "ATGTTCTA",
"ATTTTCTA", "ATCATCTA", "ATCCTCTA", "ATCGTCTA", "ATCTACTA",
"ATCTCCTA", "ATCTGCTA", "ATCTTATA", "ATCTTGTA", "ATCTTTTA",
"ATCTTCAA", "ATCTTCCA", "ATCTTCGA", "ATCTTCTC", "ATCTTCTG",
"ATCTTCTT"), TTATTCTA = c("ATATTCTA", "CTATTCTA", "GTATTCTA",
"TAATTCTA", "TCATTCTA", "TGATTCTA", "TTCTTCTA", "TTGTTCTA",
"TTTTTCTA", "TTAATCTA", "TTACTCTA", "TTAGTCTA", "TTATACTA",
"TTATCCTA", "TTATGCTA", "TTATTATA", "TTATTGTA", "TTATTTTA",
"TTATTCAA", "TTATTCCA", "TTATTCGA", "TTATTCTC", "TTATTCTG",
"TTATTCTT")), list(AAGAAGAT = c("CAGAAGAT", "GAGAAGAT", "TAGAAGAT",
"ACGAAGAT", "AGGAAGAT", "ATGAAGAT", "AAAAAGAT", "AACAAGAT",
"AATAAGAT", "AAGCAGAT", "AAGGAGAT", "AAGTAGAT", "AAGACGAT",
"AAGAGGAT", "AAGATGAT", "AAGAAAAT", "AAGAACAT", "AAGAATAT",
"AAGAAGCT", "AAGAAGGT", "AAGAAGTT", "AAGAAGAA", "AAGAAGAC",
"AAGAAGAG"), AAGAAGGT = c("CAGAAGGT", "GAGAAGGT", "TAGAAGGT",
"ACGAAGGT", "AGGAAGGT", "ATGAAGGT", "AAAAAGGT", "AACAAGGT",
"AATAAGGT", "AAGCAGGT", "AAGGAGGT", "AAGTAGGT", "AAGACGGT",
"AAGAGGGT", "AAGATGGT", "AAGAAAGT", "AAGAACGT", "AAGAATGT",
"AAGAAGAT", "AAGAAGCT", "AAGAAGTT", "AAGAAGGA", "AAGAAGGC",
"AAGAAGGG"), AAGGAGAT = c("CAGGAGAT", "GAGGAGAT", "TAGGAGAT",
"ACGGAGAT", "AGGGAGAT", "ATGGAGAT", "AAAGAGAT", "AACGAGAT",
"AATGAGAT", "AAGAAGAT", "AAGCAGAT", "AAGTAGAT", "AAGGCGAT",
"AAGGGGAT", "AAGGTGAT", "AAGGAAAT", "AAGGACAT", "AAGGATAT",
"AAGGAGCT", "AAGGAGGT", "AAGGAGTT", "AAGGAGAA", "AAGGAGAC",
"AAGGAGAG")), list(ACAAAAAT = c("CCAAAAAT", "GCAAAAAT", "TCAAAAAT",
"AAAAAAAT", "AGAAAAAT", "ATAAAAAT", "ACCAAAAT", "ACGAAAAT",
"ACTAAAAT", "ACACAAAT", "ACAGAAAT", "ACATAAAT", "ACAACAAT",
"ACAAGAAT", "ACAATAAT", "ACAAACAT", "ACAAAGAT", "ACAAATAT",
"ACAAAACT", "ACAAAAGT", "ACAAAATT", "ACAAAAAA", "ACAAAAAC",
"ACAAAAAG"), ACAAAATT = c("CCAAAATT", "GCAAAATT", "TCAAAATT",
"AAAAAATT", "AGAAAATT", "ATAAAATT", "ACCAAATT", "ACGAAATT",
"ACTAAATT", "ACACAATT", "ACAGAATT", "ACATAATT", "ACAACATT",
"ACAAGATT", "ACAATATT", "ACAAACTT", "ACAAAGTT", "ACAAATTT",
"ACAAAAAT", "ACAAAACT", "ACAAAAGT", "ACAAAATA", "ACAAAATC",
"ACAAAATG"), AGAAAATT = c("CGAAAATT", "GGAAAATT", "TGAAAATT",
"AAAAAATT", "ACAAAATT", "ATAAAATT", "AGCAAATT", "AGGAAATT",
"AGTAAATT", "AGACAATT", "AGAGAATT", "AGATAATT", "AGAACATT",
"AGAAGATT", "AGAATATT", "AGAAACTT", "AGAAAGTT", "AGAAATTT",
"AGAAAAAT", "AGAAAACT", "AGAAAAGT", "AGAAAATA", "AGAAAATC",
"AGAAAATG")))
dput(head(TF,n=5))
c("AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330"
)
Note however that I have distinct values:
dput(head(unique(TF),n=5))
c("AT1G18330", "AT1G19000", "AT1G25550", "AT1G27730", "AT1G30650"
)
In the end I would like to have this (n is 17 because of the first 5 entries in the list containt 3+3+5+3+3 entries):
dput(head(df, n=17))
structure(list(TF = c("AT1G18330", "AT1G18330", "AT1G18330",
"AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330",
"AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330",
"AT1G18330", "AT1G18330", "AT1G18330", "AT1G18330"), Pos = c(1L,
1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 4L, 5L, 5L, 5L
), `_8mer` = c("TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA",
"TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA",
"TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA", "TAGATAAA",
"TAGATAAA"), Neighbour = list(list(c("CCAAAAAT", "GCAAAAAT",
"TCAAAAAT", "AAAAAAAT", "AGAAAAAT", "ATAAAAAT", "ACCAAAAT", "ACGAAAAT",
"ACTAAAAT", "ACACAAAT", "ACAGAAAT", "ACATAAAT", "ACAACAAT", "ACAAGAAT",
"ACAATAAT", "ACAAACAT", "ACAAAGAT", "ACAAATAT", "ACAAAACT", "ACAAAAGT",
"ACAAAATT", "ACAAAAAA", "ACAAAAAC", "ACAAAAAG")), list(c("CCAAAATT",
"GCAAAATT", "TCAAAATT", "AAAAAATT", "AGAAAATT", "ATAAAATT", "ACCAAATT",
"ACGAAATT", "ACTAAATT", "ACACAATT", "ACAGAATT", "ACATAATT", "ACAACATT",
"ACAAGATT", "ACAATATT", "ACAAACTT", "ACAAAGTT", "ACAAATTT", "ACAAAAAT",
"ACAAAACT", "ACAAAAGT", "ACAAAATA", "ACAAAATC", "ACAAAATG")),
list(c("CCAAAAGT", "GCAAAAGT", "TCAAAAGT", "AAAAAAGT", "AGAAAAGT",
"ATAAAAGT", "ACCAAAGT", "ACGAAAGT", "ACTAAAGT", "ACACAAGT",
"ACAGAAGT", "ACATAAGT", "ACAACAGT", "ACAAGAGT", "ACAATAGT",
"ACAAACGT", "ACAAAGGT", "ACAAATGT", "ACAAAAAT", "ACAAAACT",
"ACAAAATT", "ACAAAAGA", "ACAAAAGC", "ACAAAAGG")), list(c("CAAATCAC",
"GAAATCAC", "TAAATCAC", "ACAATCAC", "AGAATCAC", "ATAATCAC",
"AACATCAC", "AAGATCAC", "AATATCAC", "AAACTCAC", "AAAGTCAC",
"AAATTCAC", "AAAAACAC", "AAAACCAC", "AAAAGCAC", "AAAATAAC",
"AAAATGAC", "AAAATTAC", "AAAATCCC", "AAAATCGC", "AAAATCTC",
"AAAATCAA", "AAAATCAG", "AAAATCAT")), list(c("CAAATTAC",
"GAAATTAC", "TAAATTAC", "ACAATTAC", "AGAATTAC", "ATAATTAC",
"AACATTAC", "AAGATTAC", "AATATTAC", "AAACTTAC", "AAAGTTAC",
"AAATTTAC", "AAAAATAC", "AAAACTAC", "AAAAGTAC", "AAAATAAC",
"AAAATCAC", "AAAATGAC", "AAAATTCC", "AAAATTGC", "AAAATTTC",
"AAAATTAA", "AAAATTAG", "AAAATTAT")), list(c("CAAATCAT",
"GAAATCAT", "TAAATCAT", "ACAATCAT", "AGAATCAT", "ATAATCAT",
"AACATCAT", "AAGATCAT", "AATATCAT", "AAACTCAT", "AAAGTCAT",
"AAATTCAT", "AAAAACAT", "AAAACCAT", "AAAAGCAT", "AAAATAAT",
"AAAATGAT", "AAAATTAT", "AAAATCCT", "AAAATCGT", "AAAATCTT",
"AAAATCAA", "AAAATCAC", "AAAATCAG")), list(c("CTTTTCTA",
"GTTTTCTA", "TTTTTCTA", "AATTTCTA", "ACTTTCTA", "AGTTTCTA",
"ATATTCTA", "ATCTTCTA", "ATGTTCTA", "ATTATCTA", "ATTCTCTA",
"ATTGTCTA", "ATTTACTA", "ATTTCCTA", "ATTTGCTA", "ATTTTATA",
"ATTTTGTA", "ATTTTTTA", "ATTTTCAA", "ATTTTCCA", "ATTTTCGA",
"ATTTTCTC", "ATTTTCTG", "ATTTTCTT")), list(c("ATTTTCTA",
"CTTTTCTA", "GTTTTCTA", "TATTTCTA", "TCTTTCTA", "TGTTTCTA",
"TTATTCTA", "TTCTTCTA", "TTGTTCTA", "TTTATCTA", "TTTCTCTA",
"TTTGTCTA", "TTTTACTA", "TTTTCCTA", "TTTTGCTA", "TTTTTATA",
"TTTTTGTA", "TTTTTTTA", "TTTTTCAA", "TTTTTCCA", "TTTTTCGA",
"TTTTTCTC", "TTTTTCTG", "TTTTTCTT")), list(c("CTTTTCAA",
"GTTTTCAA", "TTTTTCAA", "AATTTCAA", "ACTTTCAA", "AGTTTCAA",
"ATATTCAA", "ATCTTCAA", "ATGTTCAA", "ATTATCAA", "ATTCTCAA",
"ATTGTCAA", "ATTTACAA", "ATTTCCAA", "ATTTGCAA", "ATTTTAAA",
"ATTTTGAA", "ATTTTTAA", "ATTTTCCA", "ATTTTCGA", "ATTTTCTA",
"ATTTTCAC", "ATTTTCAG", "ATTTTCAT")), list(c("CTCTTCTA",
"GTCTTCTA", "TTCTTCTA", "AACTTCTA", "ACCTTCTA", "AGCTTCTA",
"ATATTCTA", "ATGTTCTA", "ATTTTCTA", "ATCATCTA", "ATCCTCTA",
"ATCGTCTA", "ATCTACTA", "ATCTCCTA", "ATCTGCTA", "ATCTTATA",
"ATCTTGTA", "ATCTTTTA", "ATCTTCAA", "ATCTTCCA", "ATCTTCGA",
"ATCTTCTC", "ATCTTCTG", "ATCTTCTT")), list(c("ATATTCTA",
"CTATTCTA", "GTATTCTA", "TAATTCTA", "TCATTCTA", "TGATTCTA",
"TTCTTCTA", "TTGTTCTA", "TTTTTCTA", "TTAATCTA", "TTACTCTA",
"TTAGTCTA", "TTATACTA", "TTATCCTA", "TTATGCTA", "TTATTATA",
"TTATTGTA", "TTATTTTA", "TTATTCAA", "TTATTCCA", "TTATTCGA",
"TTATTCTC", "TTATTCTG", "TTATTCTT")), list(c("CAGAAGAT",
"GAGAAGAT", "TAGAAGAT", "ACGAAGAT", "AGGAAGAT", "ATGAAGAT",
"AAAAAGAT", "AACAAGAT", "AATAAGAT", "AAGCAGAT", "AAGGAGAT",
"AAGTAGAT", "AAGACGAT", "AAGAGGAT", "AAGATGAT", "AAGAAAAT",
"AAGAACAT", "AAGAATAT", "AAGAAGCT", "AAGAAGGT", "AAGAAGTT",
"AAGAAGAA", "AAGAAGAC", "AAGAAGAG")), list(c("CAGAAGGT",
"GAGAAGGT", "TAGAAGGT", "ACGAAGGT", "AGGAAGGT", "ATGAAGGT",
"AAAAAGGT", "AACAAGGT", "AATAAGGT", "AAGCAGGT", "AAGGAGGT",
"AAGTAGGT", "AAGACGGT", "AAGAGGGT", "AAGATGGT", "AAGAAAGT",
"AAGAACGT", "AAGAATGT", "AAGAAGAT", "AAGAAGCT", "AAGAAGTT",
"AAGAAGGA", "AAGAAGGC", "AAGAAGGG")), list(c("CAGGAGAT",
"GAGGAGAT", "TAGGAGAT", "ACGGAGAT", "AGGGAGAT", "ATGGAGAT",
"AAAGAGAT", "AACGAGAT", "AATGAGAT", "AAGAAGAT", "AAGCAGAT",
"AAGTAGAT", "AAGGCGAT", "AAGGGGAT", "AAGGTGAT", "AAGGAAAT",
"AAGGACAT", "AAGGATAT", "AAGGAGCT", "AAGGAGGT", "AAGGAGTT",
"AAGGAGAA", "AAGGAGAC", "AAGGAGAG")), list(c("CCAAAAAT",
"GCAAAAAT", "TCAAAAAT", "AAAAAAAT", "AGAAAAAT", "ATAAAAAT",
"ACCAAAAT", "ACGAAAAT", "ACTAAAAT", "ACACAAAT", "ACAGAAAT",
"ACATAAAT", "ACAACAAT", "ACAAGAAT", "ACAATAAT", "ACAAACAT",
"ACAAAGAT", "ACAAATAT", "ACAAAACT", "ACAAAAGT", "ACAAAATT",
"ACAAAAAA", "ACAAAAAC", "ACAAAAAG")), list(c("CCAAAATT",
"GCAAAATT", "TCAAAATT", "AAAAAATT", "AGAAAATT", "ATAAAATT",
"ACCAAATT", "ACGAAATT", "ACTAAATT", "ACACAATT", "ACAGAATT",
"ACATAATT", "ACAACATT", "ACAAGATT", "ACAATATT", "ACAAACTT",
"ACAAAGTT", "ACAAATTT", "ACAAAAAT", "ACAAAACT", "ACAAAAGT",
"ACAAAATA", "ACAAAATC", "ACAAAATG")), list(c("CGAAAATT",
"GGAAAATT", "TGAAAATT", "AAAAAATT", "ACAAAATT", "ATAAAATT",
"AGCAAATT", "AGGAAATT", "AGTAAATT", "AGACAATT", "AGAGAATT",
"AGATAATT", "AGAACATT", "AGAAGATT", "AGAATATT", "AGAAACTT",
"AGAAAGTT", "AGAAATTT", "AGAAAAAT", "AGAAAACT", "AGAAAAGT",
"AGAAAATA", "AGAAAATC", "AGAAAATG")))), row.names = c(NA,
17L), class = "data.frame")