alignmentfreie
Alignmentfreie bezeichnet in der Bioinformatik Ansätze zur Sequenzanalyse, die auf einem direkten Vergleich von Sequenzen ohne die Durchführung von Ausrichtungsalgorithmen beruhen. Statt exakter Paarweise-Ausrichtungen zu erzeugen, werden Merkmale wie Häufigkeiten von k-grams (K-mers), oligonukleotidische Zusammensetzungen oder andere statistische Eigenschaften der Sequenz verwendet, um Ähnlichkeit oder Verwandtschaft abzuschätzen. Ziel ist es, rapide Vergleiche großer Datensätze, wie Genom- oder Metagenomdaten, zu ermöglichen.
Zu gängigen Methoden gehören k-mer-basierte Vektoren, Abstände wie Jensen-Shannon-Divergenz, Kosinus- oder Manhattan-Abstand, sowie Modelle wie CV
Anwendungsgebiete umfassen phylogenetische Analysen, Clustering von Genomen oder Metagenomdaten, Schätzung der genomweiten Ähnlichkeit, Taxonomie-Einteilung, sowie Erkennung