
Elias, Umas observações: - Ao você « ... e eliminar os relacionamentos de variáveis com baixa corrrelação para evitar conexões causais espurias. » vai deixar as com alta correlação *apenas* e aí ter "colinearidade" para as variáveis? - A recomendação: « Para variáveis categoricas x categoricas. . . Sendo o valor P considerado a medida de correlação » não é muito correta do ponto de vista teórico🤔 Qual material "recomenda isso"? Para ser assertivo seria necessário que você nos contasse mais sobre quem seria (uma binária ou categórica ordinal) a variável resposta. . . HTH -- Cesar Rabak 2017-11-10 15:17 GMT-02:00 Elias Carvalho via R-br <r-br@listas.c3sl.ufpr.br
:
Boa Tarde Pessoal
Tenho um banco de dados com 9 variáveis categóricas binárias e 12 variáveis categóricas ordinais.
Preciso saber se há correlação entre elas, preciso de um valor que diga se há uma correlação ou associação baixa, média ou alta.
O objetivo é pré-processar um banco de dados antes de criar um grafo de rede (path analysis e rede bayesiana) e eliminar os relacionamentos de variáveis com baixa corrrelação para evitar conexões causais espurias.
Lendo alguns materiais foi recomendado o seguinte:
- Para variáveis categoricas x categoricas usar o qui-quadrado para determinar se elas são independentes ou não.Sendo o valor P considerado a medida de correlação - Calcular também o v de Crammer (quanto menor maior é a força da correlação)
Alguuém pode me confirmar se esse é o melhor método ? Ou sugere outra coisa ?
--
*In Jesu et Maria* *Obrigado* *Prof. Elias Carvalho*
*"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he who has been able to understand the cause of things"*
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.