Dúvida equação GLM e Anova

Olá pessoal, Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não sei a resposta. A questão é a seguinte: Tenho dados binários como variável resposta ( 1 – vivo; 0 - morto), e variáveis contínuas como explicativas, e vi no The R book do Crawley que poderia usar GLM para construir um modelo, tendo binomial como família. Usei o seguinte código (os valores são fictícios, pois li meus dados direto da tabela, pois são muitas linhas). status<-c(0,1,0,1,1,1,1,1,0,1) altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2) newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4) m1<-glm(status~altura+newy+altura*newy, binomial) E o summary deu isso: Call: glm(formula = status ~ altura + newy + altura * newy, family = binomial) Deviance Residuals: Min 1Q Median 3Q Max -3.3122 0.1586 0.1969 0.2486 0.6394 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.24827 0.52797 0.470 0.63818 altura 0.80654 0.20006 4.032 5.54e-05 *** newy 0.23918 0.05101 4.689 2.74e-06 *** altura:newy -0.04578 0.01753 -2.611 0.00903 ** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 1705.0 on 7191 degrees of freedom Residual deviance: 1610.4 on 7188 degrees of freedom AIC: 1618.4 Number of Fisher Scoring iterations: 7 Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex., se fosse uma regressão linear o modelo seria y~x, e a equação y=a + bx, mas e para esse modelo? A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o modelo nulo, e qual teste poderia usar, pois no exemplo do livro ele usa o test= chi, porém está comparando dois modelos diferentes, e queria saber se posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero que possam me ajudar. Obrigada, Carol Figueiredo

Caroline, Para obter a anova desse seu modelo você procede:
anova(m1)
De modo análogo ao usual com lm() ou aov(). Quanto a equação ajustada lembre-se que os glm envolvem uma função de ligação, que no caso canônico da binomial (default do erro é a "logit"). Assim os parâmetros para você construir sua equação ajustada vem desses coeficientes que aparecem do summary (intercept, altura, ...). Mas como eu disse você tem observar que como saem, essas estimativas devem passar pela função inversa da logit para você obter seus dados preditos! att, FH 2012/1/17 Caroline Figueiredo <cfigueiredo1002@gmail.com>
Olá pessoal,
Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não sei a resposta. A questão é a seguinte:
Tenho dados binários como variável resposta ( 1 – vivo; 0 - morto), e variáveis contínuas como explicativas, e vi no The R book do Crawley que poderia usar GLM para construir um modelo, tendo binomial como família. Usei o seguinte código (os valores são fictícios, pois li meus dados direto da tabela, pois são muitas linhas).
status<-c(0,1,0,1,1,1,1,1,0,1)
altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2)
newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4)
m1<-glm(status~altura+newy+altura*newy, binomial)
E o summary deu isso:
Call:
glm(formula = status ~ altura + newy + altura * newy, family = binomial)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.3122 0.1586 0.1969 0.2486 0.6394
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.24827 0.52797 0.470 0.63818
altura 0.80654 0.20006 4.032 5.54e-05 ***
newy 0.23918 0.05101 4.689 2.74e-06 ***
altura:newy -0.04578 0.01753 -2.611 0.00903 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1705.0 on 7191 degrees of freedom
Residual deviance: 1610.4 on 7188 degrees of freedom
AIC: 1618.4
Number of Fisher Scoring iterations: 7
Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex., se fosse uma regressão linear o modelo seria y~x, e a equação y=a + bx, mas e para esse modelo?
A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o modelo nulo, e qual teste poderia usar, pois no exemplo do livro ele usa o test= chi, porém está comparando dois modelos diferentes, e queria saber se posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero que possam me ajudar.
Obrigada,
Carol Figueiredo
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

O seu summary() indica uma potencial subdispersão. Procure um consultor local para averiguar as causas e soluções para isso. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Carol sugiro uma revisao de modelos lineares geeneralizados em algum texto introdutorio que vai esclarecer muitas coisas (por exemlo o livro Extending Linear Models in R) Mas rapidamente: O modelo linear que voce menciona y = a+bx Pode ser reescrito como explicitando a distribuicao da resposta Y e definindo uma funcao de sua média (no caso identidade) como uma funcao linear de sua variavel explicativa Y ~ N(mu, sigma^2) E(Y) = mu = nu = a + bx O GLM geeneraliza isto entao de 2 maneiras: - a distribuição nao precisa ser normal - a relacao de mu e nu nao precisa ser identidade No seu caso: Y ~ N(n, p) E(Y) = p log(p/(1-p)) = nu = a + bx Quanto a comparar com modelo nulo é só ajustado e usar a funcao anova para comparar, semelahnte aos lm no R ex: mod0 <- glm(y ~ 1, family = binomial) mod1 <- glm(y ~ x, family = binomial) anova(mod0, mod1) On Tue, 17 Jan 2012, Caroline Figueiredo wrote:
Olá pessoal,
Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não sei a resposta. A questão é a seguinte:
Tenho dados binários como variável resposta ( 1 – vivo; 0 - morto), e variáveis contínuas como explicativas, e vi no The R book do Crawley que poderia usar GLM para construir um modelo, tendo binomial como família. Usei o seguinte código (os valores são fictícios, pois li meus dados direto da tabela, pois são muitas linhas).
status<-c(0,1,0,1,1,1,1,1,0,1)
altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2)
newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4)
m1<-glm(status~altura+newy+altura*newy, binomial)
E o summary deu isso:
Call:
glm(formula = status ~ altura + newy + altura * newy, family = binomial)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.3122 0.1586 0.1969 0.2486 0.6394
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.24827 0.52797 0.470 0.63818
altura 0.80654 0.20006 4.032 5.54e-05 ***
newy 0.23918 0.05101 4.689 2.74e-06 ***
altura:newy -0.04578 0.01753 -2.611 0.00903 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1705.0 on 7191 degrees of freedom
Residual deviance: 1610.4 on 7188 degrees of freedom
AIC: 1618.4
Number of Fisher Scoring iterations: 7
Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex., se fosse uma regressão linear o modelo seria y~x, e a equação y=a + bx, mas e para esse modelo?
A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o modelo nulo, e qual teste poderia usar, pois no exemplo do livro ele usa o test= chi, porém está comparando dois modelos diferentes, e queria saber se posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero que possam me ajudar.
Obrigada,
Carol Figueiredo
participantes (4)
-
Caroline Figueiredo
-
FHRB Toledo
-
Paulo Justiniano
-
Walmes Zeviani