
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida. O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não. O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito. Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial. So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso? Segue um exemplo para ilustrar mais ou menos o que eu to vendo: #Gerando dados de exemplo set.seed(666) n<-90 #eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) #E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } dados<-data.frame(sexo,idade,diagnostico) #so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) #amostras table(dados$sexo,dados$idade) head(dados) #Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) #O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes #mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal #se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2]) modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2]) Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar. -- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056