FASTAformaat - Infinite Lexicon - Infinite Lexicon

FASTAformaat

FASTAformaat, of FASTA, is een eenvoudig tekstgebaseerd formaat voor het opslaan van biologische sequenties, zoals nukleotidenreeksen of aminozuurreeksen. Het is sinds de jaren tachtig wijdverspreid in de bioinformatica vanwege de eenvoudige structuur, de leesbaarheid en de brede ondersteuning door databanken en analysetools zoals BLAST en diverse aligners. Een FASTA-bestand kan uit meerdere records bestaan, elk met één sequentie.

De structuur van FASTA is eenvoudig maar strikt. Elk record begint met een headerregel die begint met

FASTA-bestanden kunnen meerdere records bevatten en zijn puur platte tekst. Er is geen officiële strengheid over

Een kort voorbeeld van een FASTA-entry:

>seq1 voorbeeld

>.

accession-nummer

G

T

U

N

FASTA-sequenties

representaties.

programmeertalen

sequentiegegevens.