Boa Tarde Pessoal
Tenho um banco de dados com 9 variáveis categóricas binárias e 12 variáveis categóricas ordinais.
Preciso saber se há correlação entre elas, preciso de um valor que diga se há uma correlação ou associação baixa, média ou alta.
O objetivo é pré-processar um banco de dados antes de criar um grafo de rede (path analysis e rede bayesiana) e eliminar os relacionamentos de variáveis com baixa corrrelação para evitar conexões causais espurias.
Lendo alguns materiais foi recomendado o seguinte:
- Para variáveis categoricas x categoricas usar o qui-quadrado para determinar se elas são independentes ou não.Sendo o valor P considerado a medida de correlação
- Calcular também o v de Crammer (quanto menor maior é a força da correlação)
Alguuém pode me confirmar se esse é o melhor método ? Ou sugere outra coisa ?
--
In Jesu et Maria
Obrigado
Prof. Elias Carvalho
"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)
"Blessed is he who has been able to understand the cause of things"