inomklustringsvarians
Inomklustringsvarians, ofta kallad intraclustervarians, är ett mått på hur mycket datapunkter inom varje kluster varierar kring klustrets centroid. Det används som ett mått på klustrets koherens eller compactness – lägre värden innebär tätare, mer sammanhängande kluster. Begreppet används främst inom delningbaserad klustring som k-means och relaterade metoder.
Beräkning och tolkning: Anta att datasetet är uppdelat i k kluster. För varje kluster i har n_i
Relation till andra varianter: Den totala variansen i datasetet, TSS, uppdelas ofta i inomklustringsvarians och mellanklustervarians
Användning och begränsningar: Inomklustringsvarians används i elbow-analys för att bedöma antal kluster och som ett mått