Muito obrigado Walmes e Benilton!


Walmes, infelizmente terei de criar essas dummies. E só mais uma coisa, você disse que no R o primeiro nível é a categoria de referência. Todavia, para origin (com 27 levels) estão sendo criadas 27 dummies e para destination (com 78 levels) estão sendo criadas 78 dummies. Não era para ser 26 e 77 dummies?


 
Em 23-04-2014 16:45, walmes . escreveu:
Se você vai usar essas variáveis categóricas em um modelo de regressão, como por exemplo nas funções lm() e glm(), você não precisa passar por essa etapa (dolorosa) de criar as dummies. Essas funções já criam uma matriz de incidência (zeros e uns) correspondente à cada fator categórico declarado na fórmula do modelo. No R o primeiro nível de um fator é tomado como categoria de referência. Veja

str(ChickWeight)
m0 <- lm(weight~Diet, data=subset(ChickWeight, Time==20))
summary(m0)

Caso você esteja usando outras funções e enfim, realmente precise dessa matriz de dummies, pode ser obtida com

X <- model.matrix(~0+Diet, data=subset(ChickWeight, Time==20))
head(X)
unique(X)
X


À disposição.
Walmes.


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

--
Alexandre Rodrigues Loures
Doutorando em Economia Aplicada
Universidade Federal da Paraíba - UFPB
Centro de Ciências Sociais Aplicadas - CCSA
Programa de Pós-Graduação em Economia - PPGE
Tel.: +55 32 9102-0690 (MG) ou +55 83 9804-1000 (PB)
e-Mail: alexandre.loures@ymail.com
Site: www.ccsa.ufpb.br/ppge