substringzoek
Substringzoek is het proces waarbij een patroonstring P gezocht wordt in een grotere tekststring T. Het omvat het vinden van alle (of een enkel) voorkomen van P in T en speelt een centrale rol in tekstverwerking, data-analyse en bioinformatica. Het wordt toegepast in zoekfuncties, patroonherkenning en string matching in applicaties zoals editors, databases en compilers.
Eenvoudige aanpak: de brute-force of naive methode vergelijkt P op elke positie in T. Dit kan tot
Belangrijke algoritmen: Knuth–Morris–Pratt (KMP) elimineert onnodige herhalingsvergelijkingen en draait in O(|T|+|P|) tijd; Rabin–Karp gebruikt hashing op
Voor meerdere patronen en grote tekstbestanden worden suffix-constructies zoals suffix trees en suffix arrays gebruikt. Deze
Varianten en praktische overwegingen: het verschil tussen exact substringzoek en approximate matching (bijv. op basis van
Zie ook: string matching, pattern matching, suffix array, suffix tree, Aho-Corasick.