multicolinearidade
Multicolinearidade é a presença de correlação alta ou de dependência linear entre variáveis independentes em um modelo de regressão, o que prejudica a estimativa estável dos coeficientes. Em termos simples, quando uma variável pode ser prevista a partir de outras, surgem dificuldades na identificação do efeito de cada variável sobre o resultado.
As causas comuns incluem variáveis redundantes, variáveis que capturam a mesma informação de diferentes formas, inclusão
Os efeitos aparecem principalmente na estimação: os coeficientes podem ter erros padrões inflacionados, tornando-os pouco estáveis
A detecção costuma utilizar o Fator de Inflação da Variância (VIF), com valores acima de 5 ou
Para mitigar a multicolinearidade, pode-se remover variáveis redundantes, combinar informações em índices, aplicar análise de componentes