Duvida de estatistica - GLM binomial

Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida. O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não. O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito. Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial. So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso? Segue um exemplo para ilustrar mais ou menos o que eu to vendo: #Gerando dados de exemplo set.seed(666) n<-90 #eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) #E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } dados<-data.frame(sexo,idade,diagnostico) #so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) #amostras table(dados$sexo,dados$idade) head(dados) #Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) #O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes #mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal #se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2]) modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2]) Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar. -- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Augusto, Tente colocar NA (missing value) onde você não tem a informação. Att, Heloise Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com> escreveu:
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida.
O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não.
O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito.
Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial.
So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso?
Segue um exemplo para ilustrar mais ou menos o que eu to vendo:
#Gerando dados de exemplo set.seed(666) n<-90
#eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25))
#E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } }
dados<-data.frame(sexo,idade,diagnostico)
#so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0))
#amostras table(dados$sexo,dados$idade) head(dados)
#Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes
#mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal
#se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2])
modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2])
Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Então, mas ai: na.action a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options<http://127.0.0.1:30387/library/stats/help/options>, and is na.fail <http://127.0.0.1:30387/library/stats/help/na.fail> if that is unset. The ‘factory-fresh’ default is na.omit<http://127.0.0.1:30387/library/stats/help/na.omit>. Another possible value is NULL, no action. Value na.exclude<http://127.0.0.1:30387/library/stats/help/na.exclude>can be useful. Se eu colocar NA direto, não vai excluir as linhas que tem Indeterminado do Sexo, que vai exluir também as linhas de jovem da idade, e no final eu não vou avaliar a idade para os dois... O na action tinha que ser não o na.exclude não? Em 31 de agosto de 2012 15:29, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Augusto,
Tente colocar NA (missing value) onde você não tem a informação.
Att, Heloise
Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida.
O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não.
O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito.
Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial.
So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso?
Segue um exemplo para ilustrar mais ou menos o que eu to vendo:
#Gerando dados de exemplo set.seed(666) n<-90
#eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25))
#E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } }
dados<-data.frame(sexo,idade,diagnostico)
#so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0))
#amostras table(dados$sexo,dados$idade) head(dados)
#Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes
#mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal
#se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2])
modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2])
Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Arrumando o exemplo: (eu não tinha colocado pra usar o dataframe que criei nas analises) #dados, exemplo set.seed(666) n<-90 idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } sexo idade diagnostico dados<-data.frame(sexo,idade,diagnostico) dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) table(dados$sexo,dados$idade) #grafico par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) #modelos #as 2 variaveis juntas modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family="binomial",data=dados) summary(modelo01) #cada uma separada modelo02<-glm(as.factor(diagnostico)~idade,family="binomial",data=dados) summary(modelo02) modelo03<-glm(as.factor(diagnostico)~factor(sexo),family="binomial",data=dados) summary(modelo03) Em 31 de agosto de 2012 16:17, Augusto Ribas <ribas.aca@gmail.com> escreveu:
Então, mas ai: na.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options<http://127.0.0.1:30387/library/stats/help/options>, and is na.fail <http://127.0.0.1:30387/library/stats/help/na.fail> if that is unset. The ‘factory-fresh’ default is na.omit<http://127.0.0.1:30387/library/stats/help/na.omit>. Another possible value is NULL, no action. Value na.exclude<http://127.0.0.1:30387/library/stats/help/na.exclude>can be useful.
Se eu colocar NA direto, não vai excluir as linhas que tem Indeterminado do Sexo, que vai exluir também as linhas de jovem da idade, e no final eu não vou avaliar a idade para os dois... O na action tinha que ser não o na.exclude não?
Em 31 de agosto de 2012 15:29, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Augusto,
Tente colocar NA (missing value) onde você não tem a informação.
Att, Heloise
Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida.
O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não.
O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito.
Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial.
So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso?
Segue um exemplo para ilustrar mais ou menos o que eu to vendo:
#Gerando dados de exemplo set.seed(666) n<-90
#eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25))
#E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } }
dados<-data.frame(sexo,idade,diagnostico)
#so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0))
#amostras table(dados$sexo,dados$idade) head(dados)
#Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes
#mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal
#se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2])
modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2])
Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Tente: modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family=" binomial",data=dados,na.action=na.exclude) Em 31 de agosto de 2012 17:32, Augusto Ribas <ribas.aca@gmail.com> escreveu:
Arrumando o exemplo: (eu não tinha colocado pra usar o dataframe que criei nas analises)
#dados, exemplo set.seed(666) n<-90
idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } sexo idade diagnostico dados<-data.frame(sexo,idade,diagnostico)
dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) table(dados$sexo,dados$idade)
#grafico
par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#modelos #as 2 variaveis juntas
modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family="binomial",data=dados) summary(modelo01)
#cada uma separada modelo02<-glm(as.factor(diagnostico)~idade,family="binomial",data=dados) summary(modelo02)
modelo03<-glm(as.factor(diagnostico)~factor(sexo),family="binomial",data=dados) summary(modelo03)
Em 31 de agosto de 2012 16:17, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Então, mas ai:
na.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options<http://127.0.0.1:30387/library/stats/help/options>, and is na.fail <http://127.0.0.1:30387/library/stats/help/na.fail> if that is unset. The ‘factory-fresh’ default is na.omit<http://127.0.0.1:30387/library/stats/help/na.omit>. Another possible value is NULL, no action. Value na.exclude<http://127.0.0.1:30387/library/stats/help/na.exclude>can be useful.
Se eu colocar NA direto, não vai excluir as linhas que tem Indeterminado do Sexo, que vai exluir também as linhas de jovem da idade, e no final eu não vou avaliar a idade para os dois... O na action tinha que ser não o na.exclude não?
Em 31 de agosto de 2012 15:29, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Augusto,
Tente colocar NA (missing value) onde você não tem a informação.
Att, Heloise
Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida.
O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não.
O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito.
Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial.
So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso?
Segue um exemplo para ilustrar mais ou menos o que eu to vendo:
#Gerando dados de exemplo set.seed(666) n<-90
#eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25))
#E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } }
dados<-data.frame(sexo,idade,diagnostico)
#so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0))
#amostras table(dados$sexo,dados$idade) head(dados)
#Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes
#mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal
#se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2])
modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2])
Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Então: Ai eu obtenho: Call: glm(formula = as.factor(diagnostico) ~ factor(sexo) + factor(idade), family = "binomial", data = dados, na.action = na.exclude) Deviance Residuals: Min 1Q Median 3Q Max -1.8176 0.4892 0.6524 0.7731 0.7833 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.05484 0.55778 1.891 0.0586 . factor(sexo)Macho 0.38421 0.65814 0.584 0.5594 factor(idade)Jovem -17.82256 1689.28892 -0.011 0.9916 factor(idade)Sub-Adulto -0.03066 0.66748 -0.046 0.9634 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 62.982 on 55 degrees of freedom Residual deviance: 56.863 on 52 degrees of freedom (38 observations deleted due to missingness) AIC: 64.863 Number of Fisher Scoring iterations: 15 Mas ai eu retiro perco muitas observações, e perco justamente as observaçoes com resultados para individuos jovens, e no final não consigo ver nada relacionado a eles. Eu gostaria de declarar "não sei" para o sexo somente, mas não queria que as muitas observaçoes que dizem se os passarinhos jovens estão doentes ou não. Se eu tiro eu não vejo mais nada sem amostras de passarinhos jovens, tanto no exemplo como nos dados reais. A maioria dos indeterminados é jovem. Esse é o problema. Em 31 de agosto de 2012 16:49, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Tente: modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family=" binomial",data=dados,na.action=na.exclude)
Em 31 de agosto de 2012 17:32, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Arrumando o exemplo: (eu não tinha colocado pra usar o dataframe que
criei nas analises)
#dados, exemplo set.seed(666) n<-90
idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } sexo idade diagnostico dados<-data.frame(sexo,idade,diagnostico)
dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) table(dados$sexo,dados$idade)
#grafico
par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#modelos #as 2 variaveis juntas
modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family="binomial",data=dados) summary(modelo01)
#cada uma separada modelo02<-glm(as.factor(diagnostico)~idade,family="binomial",data=dados) summary(modelo02)
modelo03<-glm(as.factor(diagnostico)~factor(sexo),family="binomial",data=dados) summary(modelo03)
Em 31 de agosto de 2012 16:17, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Então, mas ai:
na.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options<http://127.0.0.1:30387/library/stats/help/options>, and is na.fail <http://127.0.0.1:30387/library/stats/help/na.fail> if that is unset. The ‘factory-fresh’ default is na.omit<http://127.0.0.1:30387/library/stats/help/na.omit>. Another possible value is NULL, no action. Value na.exclude<http://127.0.0.1:30387/library/stats/help/na.exclude>can be useful.
Se eu colocar NA direto, não vai excluir as linhas que tem Indeterminado do Sexo, que vai exluir também as linhas de jovem da idade, e no final eu não vou avaliar a idade para os dois... O na action tinha que ser não o na.exclude não?
Em 31 de agosto de 2012 15:29, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Augusto,
Tente colocar NA (missing value) onde você não tem a informação.
Att, Heloise
Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida.
O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não.
O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito.
Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial.
So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso?
Segue um exemplo para ilustrar mais ou menos o que eu to vendo:
#Gerando dados de exemplo set.seed(666) n<-90
#eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25))
#E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } }
dados<-data.frame(sexo,idade,diagnostico)
#so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0))
#amostras table(dados$sexo,dados$idade) head(dados)
#Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes
#mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal
#se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2])
modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2])
Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Augusto, se o que te interessa é idade, como você disse no primeiro e-mail, minha sugestão é que uses apenas idade no modelo. O sexo sozinho tem efeito significativo? Em 31 de agosto de 2012 18:01, Augusto Ribas <ribas.aca@gmail.com> escreveu:
Então: Ai eu obtenho:
Call: glm(formula = as.factor(diagnostico) ~ factor(sexo) + factor(idade), family = "binomial", data = dados, na.action = na.exclude)
Deviance Residuals: Min 1Q Median 3Q Max -1.8176 0.4892 0.6524 0.7731 0.7833
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.05484 0.55778 1.891 0.0586 . factor(sexo)Macho 0.38421 0.65814 0.584 0.5594 factor(idade)Jovem -17.82256 1689.28892 -0.011 0.9916 factor(idade)Sub-Adulto -0.03066 0.66748 -0.046 0.9634 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 62.982 on 55 degrees of freedom Residual deviance: 56.863 on 52 degrees of freedom (38 observations deleted due to missingness) AIC: 64.863
Number of Fisher Scoring iterations: 15
Mas ai eu retiro perco muitas observações, e perco justamente as observaçoes com resultados para individuos jovens, e no final não consigo ver nada relacionado a eles. Eu gostaria de declarar "não sei" para o sexo somente, mas não queria que as muitas observaçoes que dizem se os passarinhos jovens estão doentes ou não. Se eu tiro eu não vejo mais nada sem amostras de passarinhos jovens, tanto no exemplo como nos dados reais. A maioria dos indeterminados é jovem. Esse é o problema.
Em 31 de agosto de 2012 16:49, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Tente:
modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family=" binomial",data=dados,na.action=na.exclude)
Em 31 de agosto de 2012 17:32, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Arrumando o exemplo: (eu não tinha colocado pra usar o dataframe que
criei nas analises)
#dados, exemplo set.seed(666) n<-90
idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } sexo idade diagnostico dados<-data.frame(sexo,idade,diagnostico)
dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) table(dados$sexo,dados$idade)
#grafico
par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#modelos #as 2 variaveis juntas
modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family="binomial",data=dados) summary(modelo01)
#cada uma separada modelo02<-glm(as.factor(diagnostico)~idade,family="binomial",data=dados) summary(modelo02)
modelo03<-glm(as.factor(diagnostico)~factor(sexo),family="binomial",data=dados) summary(modelo03)
Em 31 de agosto de 2012 16:17, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Então, mas ai:
na.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options<http://127.0.0.1:30387/library/stats/help/options>, and is na.fail <http://127.0.0.1:30387/library/stats/help/na.fail> if that is unset. The ‘factory-fresh’ default is na.omit<http://127.0.0.1:30387/library/stats/help/na.omit>. Another possible value is NULL, no action. Value na.exclude<http://127.0.0.1:30387/library/stats/help/na.exclude>can be useful.
Se eu colocar NA direto, não vai excluir as linhas que tem Indeterminado do Sexo, que vai exluir também as linhas de jovem da idade, e no final eu não vou avaliar a idade para os dois... O na action tinha que ser não o na.exclude não?
Em 31 de agosto de 2012 15:29, Heloíse Pavanato <helopavanato@gmail.com
escreveu:
Augusto,
Tente colocar NA (missing value) onde você não tem a informação.
Att, Heloise
Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Ola pessoal. Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida.
O problema é o seguinte: Os dados são referentes a ocorrência de uma doença em passarinhos. Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta doente ou não. Durante a captura, registramos varias caracteristicas dos passarinhos, entre elas o sexo e a idade. Ai gostaríamos de perguntar se essas variáveis influenciam na chance do passarinho estar doente ou não.
O problema começa no seguinte, a idade é fácil de determinar, são 3 classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é muito novo, é impossível saber o sexo dele, então a gente tava colocando indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não tem outro jeito.
Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm binomial.
So que qd eu faço a analise o sexo da significativo (a classe indeterminado), sendo que os indeterminados tem menor chance de estar doente. Mas na verdade eu acho que o que interessa é a idade (Que faz sentido biológico ser significativo). Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. E a inabilidade de identificar o sexo nos passarinhos vem exatamente dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a outra. Será que alguem tem aluma sugestão de o que fazer? Tem como representar o sexo como "Não sei", é um dos 2 níveis mas pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível fazer isso pro sexo no glm no meu caso?
Segue um exemplo para ilustrar mais ou menos o que eu to vendo:
#Gerando dados de exemplo set.seed(666) n<-90
#eu acredito que a idade tem um efeito significativo #ja que por exemplo, o cara muito jovem vai ter tempo de exposição menor #a indivíduos doentes idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25))
#E o sexo do passarinho não tem efeito, mas os jovens sempre são inderterminados sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } }
dados<-data.frame(sexo,idade,diagnostico)
#so completando os casos dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0))
#amostras table(dados$sexo,dados$idade) head(dados)
#Grafico #no final o que eu vejo é mais ou menos isso: par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#O indeterminado e Jovem é mais meio a meio no numero de parasitados que as outras classes
#mas eu vejo um resultado significativo pro sexo, ou jovem se mudar a ordem #isso esta errado
modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") summary(modelo01) plogis(coef(modelo01)[1:2]) #eu acredito que cai naquele problema do aov, de experimento não balanceado e tal
#se olhar individualmente tudo ok, mas não consigo olhar as 2 variaveis juntas. modelo02<-glm(diagnostico~factor(idade),family="binomial") summary(modelo02) plogis(coef(modelo02)[1:2])
modelo03<-glm(diagnostico~factor(sexo),family="binomial") summary(modelo03) plogis(coef(modelo03)[1:2])
Se alguem puder dar uma olhada e dar alguma sugestão, fiz um exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem quiser olhar os dados originais eu posso mandar.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Então nos dados não. Mas por exemplo, machos podem investir em plumagem, entre outras coisas, deixando o sistema imuno mais fraco(menos investimento). O que propiciaria uma maior chance de infecção. Então eu queria testar as duas coisas (sexo e idade), mas me parece que dado esse problema de identificar o sexo, fica uma colineariadade muitro grande nos dados. (Jovens vs Sexo indeterminado) Mas seria legal se eu consegui-se testar as duas coisas, sexo e idade, pq afirmar que sexo não influencia na chance de estar infectado seria uma informação legal também. Por isso se tivesse um jeito de não discartar um variavel em detrimento da outroa seria muito bom. Em 31 de agosto de 2012 17:20, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Augusto, se o que te interessa é idade, como você disse no primeiro e-mail, minha sugestão é que uses apenas idade no modelo. O sexo sozinho tem efeito significativo?
Em 31 de agosto de 2012 18:01, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Então:
Ai eu obtenho:
Call: glm(formula = as.factor(diagnostico) ~ factor(sexo) + factor(idade), family = "binomial", data = dados, na.action = na.exclude)
Deviance Residuals: Min 1Q Median 3Q Max -1.8176 0.4892 0.6524 0.7731 0.7833
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.05484 0.55778 1.891 0.0586 . factor(sexo)Macho 0.38421 0.65814 0.584 0.5594 factor(idade)Jovem -17.82256 1689.28892 -0.011 0.9916 factor(idade)Sub-Adulto -0.03066 0.66748 -0.046 0.9634 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 62.982 on 55 degrees of freedom Residual deviance: 56.863 on 52 degrees of freedom (38 observations deleted due to missingness) AIC: 64.863
Number of Fisher Scoring iterations: 15
Mas ai eu retiro perco muitas observações, e perco justamente as observaçoes com resultados para individuos jovens, e no final não consigo ver nada relacionado a eles. Eu gostaria de declarar "não sei" para o sexo somente, mas não queria que as muitas observaçoes que dizem se os passarinhos jovens estão doentes ou não. Se eu tiro eu não vejo mais nada sem amostras de passarinhos jovens, tanto no exemplo como nos dados reais. A maioria dos indeterminados é jovem. Esse é o problema.
Em 31 de agosto de 2012 16:49, Heloíse Pavanato <helopavanato@gmail.com>escreveu:
Tente:
modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family=" binomial",data=dados,na.action=na.exclude)
Em 31 de agosto de 2012 17:32, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Arrumando o exemplo: (eu não tinha colocado pra usar o dataframe que
criei nas analises)
#dados, exemplo set.seed(666) n<-90
idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) idade efeito<-ifelse(idade=="Jovem",1,0) efeito diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) sexo<-NA for(i in 1:length(idade)) { if(idade[i]=="Jovem") { sexo[i]<-c("Indeterminado") } else{ sexo[i]<-sample(c("Macho","Femea"),1) } } sexo idade diagnostico dados<-data.frame(sexo,idade,diagnostico)
dados<-rbind(dados,c("Femea","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Adulto",0)) dados<-rbind(dados,c("Macho","Jovem",0)) dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) table(dados$sexo,dados$idade)
#grafico
par(mfrow=c(1,2),cex=0.6) barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado")) barplot(table(diagnostico,idade),ylim=c(0,40),legend.text =c("Parasitado","Não Parasitado"))
#modelos #as 2 variaveis juntas
modelo01<-glm(as.factor(diagnostico)~factor(sexo)+factor(idade),family="binomial",data=dados) summary(modelo01)
#cada uma separada modelo02<-glm(as.factor(diagnostico)~idade,family="binomial",data=dados) summary(modelo02)
modelo03<-glm(as.factor(diagnostico)~factor(sexo),family="binomial",data=dados) summary(modelo03)
Em 31 de agosto de 2012 16:17, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Então, mas ai:
na.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options<http://127.0.0.1:30387/library/stats/help/options>, and is na.fail <http://127.0.0.1:30387/library/stats/help/na.fail> if that is unset. The ‘factory-fresh’ default is na.omit<http://127.0.0.1:30387/library/stats/help/na.omit>. Another possible value is NULL, no action. Value na.exclude<http://127.0.0.1:30387/library/stats/help/na.exclude>can be useful.
Se eu colocar NA direto, não vai excluir as linhas que tem Indeterminado do Sexo, que vai exluir também as linhas de jovem da idade, e no final eu não vou avaliar a idade para os dois... O na action tinha que ser não o na.exclude não?
Em 31 de agosto de 2012 15:29, Heloíse Pavanato < helopavanato@gmail.com> escreveu:
Augusto,
Tente colocar NA (missing value) onde você não tem a informação.
Att, Heloise
Em 31 de agosto de 2012 16:18, Augusto Ribas <ribas.aca@gmail.com>escreveu:
> Ola pessoal. > Eu estava olhando aqui uns dados com um amigo e me surgiu uma duvida. > > O problema é o seguinte: > Os dados são referentes a ocorrência de uma doença em passarinhos. > Pegamos muitos passarinhos em redes em um lugar e testamos se ele esta > doente ou não. > Durante a captura, registramos varias caracteristicas dos > passarinhos, entre elas o sexo e a idade. > Ai gostaríamos de perguntar se essas variáveis influenciam na chance > do passarinho estar doente ou não. > > O problema começa no seguinte, a idade é fácil de determinar, são 3 > classes, jovem, sub-adulto e adulto e isso é feito sem muito erro, > Agora o sexo, era pra ser macho ou femea, mas quando o passarinho é > muito novo, é impossível saber o sexo dele, então a gente tava colocando > indeterminado, pq visualmente não da pra saber o sexo do passarinho, e não > tem outro jeito. > > Então eu tenho 2 variáveis, de 3 níveis cada uma e fiz um glm > binomial. > > So que qd eu faço a analise o sexo da significativo (a classe > indeterminado), sendo que os indeterminados tem menor chance de estar > doente. > Mas na verdade eu acho que o que interessa é a idade (Que faz > sentido biológico ser significativo). > Se vc olha o gráfico, vc ve o padrão é o mesmo no sexo e na idade. > E a inabilidade de identificar o sexo nos passarinhos vem exatamente > dele ser jovem demais, não desenvolveu ainda. Ai uma coisa confunde com a > outra. > Será que alguem tem aluma sugestão de o que fazer? > Tem como representar o sexo como "Não sei", é um dos 2 níveis mas > pra esse passarinho eu não sei? Eu não sei como fazer isso. É possível > fazer isso pro sexo no glm no meu caso? > > Segue um exemplo para ilustrar mais ou menos o que eu to vendo: > > #Gerando dados de exemplo > set.seed(666) > n<-90 > > #eu acredito que a idade tem um efeito significativo > #ja que por exemplo, o cara muito jovem vai ter tempo de exposição > menor > #a indivíduos doentes > idade<-sample(c("Adulto","Sub-Adulto","Jovem"),n,replace=T) > idade > efeito<-ifelse(idade=="Jovem",1,0) > efeito > diagnostico<-rbinom(n,1,0.75+efeito*(-0.25)) > > #E o sexo do passarinho não tem efeito, mas os jovens sempre são > inderterminados > sexo<-NA > for(i in 1:length(idade)) { > if(idade[i]=="Jovem") { > sexo[i]<-c("Indeterminado") > } else{ > sexo[i]<-sample(c("Macho","Femea"),1) > } > } > > dados<-data.frame(sexo,idade,diagnostico) > > #so completando os casos > dados<-rbind(dados,c("Femea","Jovem",0)) > dados<-rbind(dados,c("Indeterminado","Adulto",0)) > dados<-rbind(dados,c("Macho","Jovem",0)) > dados<-rbind(dados,c("Indeterminado","Sub-Adulto",0)) > > #amostras > table(dados$sexo,dados$idade) > head(dados) > > > > #Grafico > #no final o que eu vejo é mais ou menos isso: > par(mfrow=c(1,2),cex=0.6) > barplot(table(diagnostico,sexo),ylim=c(0,40),legend.text > =c("Parasitado","Não Parasitado")) > barplot(table(diagnostico,idade),ylim=c(0,40),legend.text > =c("Parasitado","Não Parasitado")) > > #O indeterminado e Jovem é mais meio a meio no numero de parasitados > que as outras classes > > #mas eu vejo um resultado significativo pro sexo, ou jovem se mudar > a ordem > #isso esta errado > > modelo01<-glm(diagnostico~factor(idade)+factor(sexo),family="binomial") > summary(modelo01) > plogis(coef(modelo01)[1:2]) > #eu acredito que cai naquele problema do aov, de experimento não > balanceado e tal > > #se olhar individualmente tudo ok, mas não consigo olhar as 2 > variaveis juntas. > modelo02<-glm(diagnostico~factor(idade),family="binomial") > summary(modelo02) > plogis(coef(modelo02)[1:2]) > > modelo03<-glm(diagnostico~factor(sexo),family="binomial") > summary(modelo03) > plogis(coef(modelo03)[1:2]) > > > Se alguem puder dar uma olhada e dar alguma sugestão, fiz um > exemplo, mas os dados deixam um grafico exatamente como aquele, se alguem > quiser olhar os dados originais eu posso mandar. > > -- > Grato > Augusto C. A. Ribas > > Site Pessoal: http://augustoribas.heliohost.org > Lattes: http://lattes.cnpq.br/7355685961127056 > > > _______________________________________________ > R-br mailing list > R-br@listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e > forneça código mínimo reproduzível. >
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Ainda é possível você assumir que o efeito da classe "não sei" seja uma média das outras duas. Isso é razoável se os dois sexos ocorrem na mesma proporção e se sua inabilidade de identificar o sexo não se altere com a idade de forma diferencial. Ou seja, na idade 1 mês existe relação 1:1 dos sexos minha de dizer que M é F é igual a dizer que F é M, as duas coisas valendo para todas as idades. Assim, você vai estimar apenas 2 efeitos (para M e para F), e os indivíduos "não sei" serão dados pela média. Um jeito simples é recodificar para o vetor para -1 (F), 0 (não sei), 1 (M) e usar na análise. O que me dizem? À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Nossa, parece que funciona muito bem. Eu fiz um exemplo pra ver se estou entendendo bem: #gerando dados de exemplo #variaveis resposta set.seed(3) n<-300 sexo<-sample(c("macho","femea"),n,replace=T) idade<-sample(c("jovem","subadulto","adulto"),n,replace=T) #como é o efeito delas efeito<-model.matrix(~sexo+idade) head(efeito) #jovens tem menor chance de estar infectado, sexo não influencia no diagnostico probabilidades<-c(0.75,0.00,-0.20,0.00) chance<-efeito%*%probabilidades chance diagnostico<-rbinom(n,1,chance) diagnostico #fazendo o modelo se tudo fosse perfeito modelo01<-glm(diagnostico~sexo+idade,family="binomial") summary(modelo01) #No entanto nos jovens eu não consigo ver o sexo sexo.confundido<-NA for(i in 1:n) { if(idade[i]=="jovem"){ sexo.confundido[i]<-"indeterminado" } else { sexo.confundido[i]<-sexo[i] } } sexo.confundido #Dai fica esse problema, resultado confundido: modelo02<-glm(diagnostico~sexo.confundido+idade,family="binomial") summary(modelo02) #Sugestão do Walmes na lista r-br sexo.continuo<-NA for(i in 1:n) { if(sexo.confundido[i]=="indeterminado"){ sexo.continuo[i]<-c(0) } if(sexo.confundido[i]=="femea") { sexo.continuo[i]<-c(1) } if(sexo.confundido[i]=="macho") { sexo.continuo[i]<-c(-1)} } sexo.continuo #O resultado da analise recupera o que era previsto modelo03<-glm(diagnostico~sexo.continuo+idade,family="binomial") summary(modelo03) plogis(coef(modelo01)[c(1,3)]) plogis(coef(modelo03)[c(1,3)]) #no entanto eu fique com uma duvida, se sexo tivesse um efeito, como que eu interpretaria essa variavel sexo desse jeito (-1,0,1), tipo adicionaria a estimativa de chance pra macho e subtrairia das femeas? -- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Aqui vai uma dica para eliminar os for() que você usou, pode-se usar o match() para fazer essas recodificações. Deve ter uma forma ainda melhor, mas atualmente eu uso essa. sexo <- as.factor(sample(c("M","F","I"), 10, repl=TRUE)) recod <- c(-1,0,1) sexo.rec <- recod[match(sexo, c("F","I","M"))] data.frame(sexo, sexo.rec) recod <- c(0,0.5,1) sexo.rec <- recod[match(sexo, c("F","I","M"))] data.frame(sexo, sexo.rec) A interpretação dos coeficientes, bem, teu preditor linear seria b0+b1*sexo, sexo só assume valores (-1,0,1), então você teria as configurações b0-b1 # femea b0 # indeterminado b0+b1 # macho Mas você pode usar (0, 0.5, 1), b0 é a fêmea, b1 é a diferença para macho. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Ficou muito bom assim :) Exatamente o que eu precisava. Obrigado Walmes e Heloise pela atenção. Em 31 de agosto de 2012 22:12, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Aqui vai uma dica para eliminar os for() que você usou, pode-se usar o match() para fazer essas recodificações. Deve ter uma forma ainda melhor, mas atualmente eu uso essa.
sexo <- as.factor(sample(c("M","F","I"), 10, repl=TRUE)) recod <- c(-1,0,1) sexo.rec <- recod[match(sexo, c("F","I","M"))] data.frame(sexo, sexo.rec)
recod <- c(0,0.5,1) sexo.rec <- recod[match(sexo, c("F","I","M"))] data.frame(sexo, sexo.rec)
A interpretação dos coeficientes, bem, teu preditor linear seria
b0+b1*sexo,
sexo só assume valores (-1,0,1), então você teria as configurações
b0-b1 # femea b0 # indeterminado b0+b1 # macho
Mas você pode usar (0, 0.5, 1), b0 é a fêmea, b1 é a diferença para macho.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Walmes, não conhecia este uso pro match, vc acabou de me poupar algumas dezenas de if em uma recodificação que eu estou fazendo aqui valeu, hehehe []s Leonard de Assis assis <dot> leonard <at> gmail <dot> com Em 31/08/2012 23:12, Walmes Zeviani escreveu:
Aqui vai uma dica para eliminar os for() que você usou, pode-se usar o match() para fazer essas recodificações. Deve ter uma forma ainda melhor, mas atualmente eu uso essa.
sexo <- as.factor(sample(c("M","F","I"), 10, repl=TRUE)) recod <- c(-1,0,1) sexo.rec <- recod[match(sexo, c("F","I","M"))] data.frame(sexo, sexo.rec)
recod <- c(0,0.5,1) sexo.rec <- recod[match(sexo, c("F","I","M"))] data.frame(sexo, sexo.rec)
A interpretação dos coeficientes, bem, teu preditor linear seria
b0+b1*sexo,
sexo só assume valores (-1,0,1), então você teria as configurações
b0-b1 # femea b0 # indeterminado b0+b1 # macho
Mas você pode usar (0, 0.5, 1), b0 é a fêmea, b1 é a diferença para macho.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br <mailto:walmes@ufpr.br> twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes <http://www.leg.ufpr.br/%7Ewalmes> linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Leonardo, eu fazia vários if() para recodificar e fazer outras operações. Quando descobri o match() fique de cara. Augusto, esse seu conjunto de dados e problema exposto é muito interessante. Qual a possibilidade de você disponibilizar total ou parcialmente os dados para a gente documentar as sugestões e disponibilizar na página do LEG, por exemplo? À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

A proposwisitodo match() alem do que voces indicaram há outras opcoes super uteis como match.arg() para argumentos de funcao, é o que permite o R ler e qreconhecer argumentos em uma lista valida mesmo que esta nao pareca na chamada da funcao On Sat, 1 Sep 2012, Walmes Zeviani wrote:
Leonardo, eu fazia vários if() para recodificar e fazer outras operações. Quando descobri o match() fique de cara. Augusto, esse seu conjunto de dados e problema exposto é muito interessante. Qual a possibilidade de você disponibilizar total ou parcialmente os dados para a gente documentar as sugestões e disponibilizar na página do LEG, por exemplo?
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

*Este é o motivo pelo qual leio todos os tópicos desta lista!!* * * *Paulo e Walmes, a partir de hoje minha programação evolui uns dois níveis!!! (em uma escala infinita de níveis) :) :) :) :) :)* * * * * * * Em 1 de setembro de 2012 14:51, Paulo Justiniano <paulojus@leg.ufpr.br>escreveu:
A proposwisitodo match() alem do que voces indicaram há outras opcoes super uteis como match.arg() para argumentos de funcao, é o que permite o R ler e qreconhecer argumentos em uma lista valida mesmo que esta nao pareca na chamada da funcao
On Sat, 1 Sep 2012, Walmes Zeviani wrote:
Leonardo, eu fazia vários if() para recodificar e fazer outras operações.
Quando descobri o match() fique de cara. Augusto, esse seu conjunto de dados e problema exposto é muito interessante. Qual a possibilidade de você disponibilizar total ou parcialmente os dados para a gente documentar as sugestões e disponibilizar na página do LEG, por exemplo?
À disposição. Walmes.
==============================**==============================** ============== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==============================**==============================** ==============
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Pode usar os dados como exemplo sim, vou mandar um e-mail com os dados organizados de forma organizada pra vc. É um prazer poder contribuir. Em 1 de setembro de 2012 14:19, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
*Este é o motivo pelo qual leio todos os tópicos desta lista!!* * * *Paulo e Walmes, a partir de hoje minha programação evolui uns dois níveis!!! (em uma escala infinita de níveis) :) :) :) :) :)* * * * * * * Em 1 de setembro de 2012 14:51, Paulo Justiniano <paulojus@leg.ufpr.br>escreveu:
A proposwisitodo match() alem do que voces indicaram há outras opcoes super uteis como match.arg() para argumentos de funcao, é o que permite o R ler e qreconhecer argumentos em uma lista valida mesmo que esta nao pareca na chamada da funcao
On Sat, 1 Sep 2012, Walmes Zeviani wrote:
Leonardo, eu fazia vários if() para recodificar e fazer outras
operações. Quando descobri o match() fique de cara. Augusto, esse seu conjunto de dados e problema exposto é muito interessante. Qual a possibilidade de você disponibilizar total ou parcialmente os dados para a gente documentar as sugestões e disponibilizar na página do LEG, por exemplo?
À disposição. Walmes.
==============================**==============================** ============== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==============================**==============================** ==============
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
participantes (6)
-
Augusto Ribas
-
Heloíse Pavanato
-
Leandro Marino
-
Leonard de Assis
-
Paulo Justiniano
-
Walmes Zeviani