kulcsszókivonás
Kulcsszókivonás a természetes nyelvfeldolgozás (NLP) egyik feladata, amelynek célja, hogy automatikusan azonosítsa és kivonja a dokumentumok tartalmi szempontból legjelentősebb kifejezéseit vagy kulcsszavait. Gyakran egy vagy több szóból álló kifejezéseket (kulcsszó-kifejezéseket vagy keyphrases) állít elő. Ezek a kifejezések segítik a keresést, az indexelést, a témák feltárását és leíró metaadatok készítését.
Kivonási megközelítések lehetnek felügyelt vagy felügyelet nélküli megközelítések. Gyakori módszerek: statisztikai alapú, például TF és TF-IDF,
Az előfeldolgozás során a szöveget tokenizálják, lemmatizálást vagy stemminget végeznek, és gyakran stopword-mentesítést alkalmaznak. A kandidált
Az alkalmazások közé tartozik a dokumentumkeresés és indexelés, automatikus metaadat-ellátás, címfelvetés, témák azonosítása és SEO-optimalizálás.
Az értékelés gyakran emberi annotációkhoz viszonyítva történik, és a pontosság, F1-szám vagy egyéb lefedettségi mutatók adják