
Olá pessoal; Estou começando a estudar regressão e estou com um pouco de dificuldade em interpretar a tabela ANOVA de meu modelo. Tenho o seguinte modelo ajustado: Call: lm(formula = dados$y_boxcox ~ dados$ndvi) Residuals: Min 1Q Median 3Q Max -0.238352 -0.051448 0.005705 0.063027 0.225765 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.92694 0.02619 -35.39 <2e-16 *** dados$ndvi 2.06763 0.05047 40.97 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.08817 on 98 degrees of freedom Multiple R-squared: 0.9448, Adjusted R-squared: 0.9443 F-statistic: 1678 on 1 and 98 DF, p-value: < 2.2e-16 Consigo interpretar e descrever bem o significado da estatística F e dos outros elementos do summary() a fim de avaliar o modelo. Mas o que dizer dessa anova? O que ela me diz além do que já está dito no summary()? Que conclusões extras posso tirar dela?
anova(ml_bc) Analysis of Variance Table
Response: dados$y_boxcox Df Sum Sq Mean Sq F value Pr(>F) dados$ndvi 1 13.0491 13.0491 1678.4 < 2.2e-16 *** Residuals 98 0.7619 0.0078 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Obrigado! -- *Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá* Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 *Google Maps* - Mapas deste e-mail: Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18> *Contatos particulares:* *(55) 9615-0100*

Em sábado, 21 de junho de 2014 22:59:28, Jefferson Ferreira Ferreira escreveu:
Olá pessoal;
Estou começando a estudar regressão e estou com um pouco de dificuldade em interpretar a tabela ANOVA de meu modelo.
Tenho o seguinte modelo ajustado: Call: lm(formula = dados$y_boxcox ~ dados$ndvi)
Residuals: Min 1Q Median 3Q Max -0.238352 -0.051448 0.005705 0.063027 0.225765
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.92694 0.02619 -35.39 <2e-16 *** dados$ndvi 2.06763 0.05047 40.97 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.08817 on 98 degrees of freedom Multiple R-squared: 0.9448,Adjusted R-squared: 0.9443 F-statistic: 1678 on 1 and 98 DF, p-value: < 2.2e-16
Consigo interpretar e descrever bem o significado da estatística F e dos outros elementos do summary() a fim de avaliar o modelo.
Mas o que dizer dessa anova? O que ela me diz além do que já está dito no summary()? Que conclusões extras posso tirar dela?
anova(ml_bc) Analysis of Variance Table
Response: dados$y_boxcox Df Sum Sq Mean Sq F value Pr(>F) dados$ndvi 1 13.0491 13.0491 1678.4 < 2.2e-16 *** Residuals 98 0.7619 0.0078 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Obrigado! --
*/Jefferson Ferreira-Ferreira/*
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br <mailto:Jefferson.ferreira@mamiraua.org.br>
*Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
/ Contatos particulares:/ /(55) 9615-0100/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Não entendi sua dúvida? Seja mais específico --- Este email está limpo de vírus e malwares porque a proteção do avast! Antivírus está ativa. http://www.avast.com

OI Fernando, obrigado pela resposta. Na verdade eu não tenho uma dúvida específica com relação à função e por isso não tenho como ser mais específico na pergunta. Eu andei pesquisando bastante, mas não encontrei ainda uma resposta satisfatória. A dúvida é sobre como interpretar a tabela anova. Dado o summary(modelo) abaixo, o que é que a anova(modelo) me diz? O que ela me diz além do que já está dito no summary()? Que conclusões extras posso tirar dela? Em 22 de junho de 2014 01:31, Fernando Souza <nandodesouza@gmail.com> escreveu:
Em sábado, 21 de junho de 2014 22:59:28, Jefferson Ferreira Ferreira escreveu:
Olá pessoal;
Estou começando a estudar regressão e estou com um pouco de dificuldade em interpretar a tabela ANOVA de meu modelo.
Tenho o seguinte modelo ajustado: Call: lm(formula = dados$y_boxcox ~ dados$ndvi)
Residuals: Min 1Q Median 3Q Max -0.238352 -0.051448 0.005705 0.063027 0.225765
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.92694 0.02619 -35.39 <2e-16 *** dados$ndvi 2.06763 0.05047 40.97 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.08817 on 98 degrees of freedom Multiple R-squared: 0.9448,Adjusted R-squared: 0.9443
F-statistic: 1678 on 1 and 98 DF, p-value: < 2.2e-16
Consigo interpretar e descrever bem o significado da estatística F e dos outros elementos do summary() a fim de avaliar o modelo.
Mas o que dizer dessa anova? O que ela me diz além do que já está dito no summary()? Que conclusões extras posso tirar dela?
anova(ml_bc) Analysis of Variance Table
Response: dados$y_boxcox Df Sum Sq Mean Sq F value Pr(>F) dados$ndvi 1 13.0491 13.0491 1678.4 < 2.2e-16 *** Residuals 98 0.7619 0.0078 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Obrigado! --
*/Jefferson Ferreira-Ferreira/*
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br <mailto:Jefferson.ferreira@mamiraua.org.br>
*Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151& ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
/ Contatos particulares:/ /(55) 9615-0100/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Não entendi sua dúvida? Seja mais específico
--- Este email está limpo de vírus e malwares porque a proteção do avast! Antivírus está ativa. http://www.avast.com
-- *Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá* Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 *Google Maps* - Mapas deste e-mail: Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18> *Contatos particulares:* *(55) 9615-0100*

Existe diferença de interpretação da anova() e summary(). Pro caso de regressão linear simples, não existe, já vai ficar claro. O é método summary() para modelos (classes lm, aov, nls, glm, lme, lmer, survreg, e muitos outros), mostra informações que podem ser divididas em: informações da chamada (call), testes de hipótese (t valor, p valor) e medidas de ajuste (aic, bic, log-verossimilhança, F, graus de liberdade resíduais, etc). O quadro de testes de hipótese são testes individuais para cada parâmetro e marginais aos demais, ou seja, assumindo que o seu modelo tenha a fórmula y~x1+x2+x3, no summary() são testadas quadro hipóteses: H0: b0==0? H0: b1==0? H0: b2==0? H0: b3==0? O que não de ser esquecido é que essas hipóteses são indivíduais e marginais, então H0: b1==0 significa que você testa hipótese sob b1 sem fazer restrições para b2, b3 e b0. Sendo assim, caso você aceite b1==0 e b2==0 porque eles apresentam p-valor menor que 5%, digamos, não pode-se concluir que b1==b2==0. Essa última é uma hipótese conjunta e marginal à b0 e b3. O quadro de anova é diferente, nele são testadas hipóteses sequenciais ou parcialmente marginais, ou parcialmente condicionais. Assumindo ainda o mesmo modelo, a primeira linha testa b1 marginal à b0 (sem restringir b0) e condicional à b2 e b3 (assume que são 0, pois não entraram no modelo ainda, no caso). A segunda linha testa b2 marginal à b1 e b0 e condicional à b3 (assume que é zero). A última linha é b3 marginal à b0, b1 e b2, que no caso é a mesma hipótese do summary(), mas só para o último termo do modelo. Na situação de modelos de regressão múltipla, não é útil olhar para a anova() e sim para o summary(). Por que? Porque em geral as variáveis são contínuas e para avaliar o seu efeito basta testas o único parâmetro que a multiplica pois o modelo é do tipo y = b0+b1*x1+b2*x2+... . Em casos como esse, comuns em estudos observacionais, não existe garantia de ortogonalidade entre as variáveis regressoras e obviamente testes marginais são mais adequados. No caso de experimentos planejados (geralmente balanceados, com efeitos ortogonais e fatores categóricos) a anova é mais interessante que o summary(). Por que? Porque sendo os efeitos ortogonais, mesmo a anova tendo testes marginais por definição, as somas de quadrados são ortogonais pelo delineamento planejado, o que faz com que os testes sejam então ortogonais. Se uma variável é categórica com 5 níveis, o teste F da anova avalia a hipótese conjunta de 5-1 parâmetros correspondente a não haver efeito deste fator, ou seja, das 5 categorias serem representadas por 5 vs 1 parâmetro (de 5 para 1, 4 graus de liberdade). Nas situações que não estão nem em um extremo (só contínuas) nem em outro (só categóricas, efeitos ortogonais), não se pode apontar qual dos dois é mais relevante. Depende muito da situação. Na minha opinião, para o usuário não treinado, é meio complicado avaliar o summary() para um modelo com fatores categóricos, isso porque existe uma parametrização (por padrão, zerar efeito do primeiro nível) que apesar de simples, para um usuário não treinado, é incomodo, ele procura pelas médias mas o summary() não dá médias. Isso fica ainda mais incomodo quando se trata de dois ou mais fatores com interação. No caso da regressão linear simples, anova() e summary(), por haver apenas o parâmetro b1 sob hipótese, dão exatamente a mesma coisa, inclusive o mesmo p-valor para b1, uma vez que o quadrado de uma v.a. t com 1 grau de liberdade tem distribuição F. À disposição. Walmes.

Perfeito Walmes, era o esclarecimento que procurava. Muito obrigado à ti e aos demais! -- *Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá* Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 *Google Maps* - Mapas deste e-mail: Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18> *Contatos particulares:* *(55) 9615-0100* Em 22 de junho de 2014 17:55, walmes . <walmeszeviani@gmail.com> escreveu:
Existe diferença de interpretação da anova() e summary(). Pro caso de regressão linear simples, não existe, já vai ficar claro.
O é método summary() para modelos (classes lm, aov, nls, glm, lme, lmer, survreg, e muitos outros), mostra informações que podem ser divididas em: informações da chamada (call), testes de hipótese (t valor, p valor) e medidas de ajuste (aic, bic, log-verossimilhança, F, graus de liberdade resíduais, etc).
O quadro de testes de hipótese são testes individuais para cada parâmetro e marginais aos demais, ou seja, assumindo que o seu modelo tenha a fórmula y~x1+x2+x3, no summary() são testadas quadro hipóteses: H0: b0==0? H0: b1==0? H0: b2==0? H0: b3==0? O que não de ser esquecido é que essas hipóteses são indivíduais e marginais, então H0: b1==0 significa que você testa hipótese sob b1 sem fazer restrições para b2, b3 e b0. Sendo assim, caso você aceite b1==0 e b2==0 porque eles apresentam p-valor menor que 5%, digamos, não pode-se concluir que b1==b2==0. Essa última é uma hipótese conjunta e marginal à b0 e b3.
O quadro de anova é diferente, nele são testadas hipóteses sequenciais ou parcialmente marginais, ou parcialmente condicionais. Assumindo ainda o mesmo modelo, a primeira linha testa b1 marginal à b0 (sem restringir b0) e condicional à b2 e b3 (assume que são 0, pois não entraram no modelo ainda, no caso). A segunda linha testa b2 marginal à b1 e b0 e condicional à b3 (assume que é zero). A última linha é b3 marginal à b0, b1 e b2, que no caso é a mesma hipótese do summary(), mas só para o último termo do modelo.
Na situação de modelos de regressão múltipla, não é útil olhar para a anova() e sim para o summary(). Por que? Porque em geral as variáveis são contínuas e para avaliar o seu efeito basta testas o único parâmetro que a multiplica pois o modelo é do tipo y = b0+b1*x1+b2*x2+... . Em casos como esse, comuns em estudos observacionais, não existe garantia de ortogonalidade entre as variáveis regressoras e obviamente testes marginais são mais adequados.
No caso de experimentos planejados (geralmente balanceados, com efeitos ortogonais e fatores categóricos) a anova é mais interessante que o summary(). Por que? Porque sendo os efeitos ortogonais, mesmo a anova tendo testes marginais por definição, as somas de quadrados são ortogonais pelo delineamento planejado, o que faz com que os testes sejam então ortogonais. Se uma variável é categórica com 5 níveis, o teste F da anova avalia a hipótese conjunta de 5-1 parâmetros correspondente a não haver efeito deste fator, ou seja, das 5 categorias serem representadas por 5 vs 1 parâmetro (de 5 para 1, 4 graus de liberdade).
Nas situações que não estão nem em um extremo (só contínuas) nem em outro (só categóricas, efeitos ortogonais), não se pode apontar qual dos dois é mais relevante. Depende muito da situação. Na minha opinião, para o usuário não treinado, é meio complicado avaliar o summary() para um modelo com fatores categóricos, isso porque existe uma parametrização (por padrão, zerar efeito do primeiro nível) que apesar de simples, para um usuário não treinado, é incomodo, ele procura pelas médias mas o summary() não dá médias. Isso fica ainda mais incomodo quando se trata de dois ou mais fatores com interação.
No caso da regressão linear simples, anova() e summary(), por haver apenas o parâmetro b1 sob hipótese, dão exatamente a mesma coisa, inclusive o mesmo p-valor para b1, uma vez que o quadrado de uma v.a. t com 1 grau de liberdade tem distribuição F.
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

anova() com apenas um objeto de modelo nada acrescenta ao summary neste caso ,as a funcao permite voce pssar varios modelos e comparar o ajuste deles ?anova On Sun, 22 Jun 2014, Jefferson Ferreira Ferreira wrote:
OI Fernando, obrigado pela resposta.
Na verdade eu não tenho uma dúvida específica com relação à função e por isso não tenho como ser mais específico na pergunta. Eu andei pesquisando bastante, mas não encontrei ainda uma resposta satisfatória. A dúvida é sobre como interpretar a tabela anova. Dado o summary(modelo) abaixo, o que é que a anova(modelo) me diz? O que ela me diz além do que já está dito no summary()? Que conclusões extras posso tirar dela?
Em 22 de junho de 2014 01:31, Fernando Souza <nandodesouza@gmail.com> escreveu: Em sábado, 21 de junho de 2014 22:59:28, Jefferson Ferreira Ferreira escreveu:
Olá pessoal;
Estou começando a estudar regressão e estou com um pouco de dificuldade em interpretar a tabela ANOVA de meu modelo.
Tenho o seguinte modelo ajustado: Call: lm(formula = dados$y_boxcox ~ dados$ndvi)
Residuals: Min 1Q Median 3Q Max -0.238352 -0.051448 0.005705 0.063027 0.225765
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.92694 0.02619 -35.39 <2e-16 *** dados$ndvi 2.06763 0.05047 40.97 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.08817 on 98 degrees of freedom Multiple R-squared: 0.9448,Adjusted R-squared: 0.9443 F-statistic: 1678 on 1 and 98 DF, p-value: < 2.2e-16
Consigo interpretar e descrever bem o significado da estatística F e dos outros elementos do summary() a fim de avaliar o modelo.
Mas o que dizer dessa anova? O que ela me diz além do que já está dito no summary()? Que conclusões extras posso tirar dela?
anova(ml_bc) Analysis of Variance Table
Response: dados$y_boxcox Df Sum Sq Mean Sq F value Pr(>F) dados$ndvi 1 13.0491 13.0491 1678.4 < 2.2e-16 *** Residuals 98 0.7619 0.0078 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Obrigado! --
*/Jefferson Ferreira-Ferreira/*
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br <mailto:Jefferson.ferreira@mamiraua.org.br>
*Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.7311... num=1&t=h&z=18>
/ Contatos particulares:/ /(55) 9615-0100/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Não entendi sua dúvida? Seja mais específico
--- Este email está limpo de vírus e malwares porque a proteção do avast! Antivírus está ativa. http://www.avast.com
--
Jefferson Ferreira-Ferreira
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
[emailass.png]
Jefferson.ferreira@mamiraua.org.br
Instituto de Desenvolvimento Sustentável Mamirauá
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
[emailgoogle.png] Google Maps - Mapas deste e-mail:
[emailtag.png] Exibir mapa ampliado
Contatos particulares: (55) 9615-0100
participantes (4)
-
Fernando Souza
-
Jefferson Ferreira Ferreira
-
Paulo Justiniano
-
walmes .