
Boa noite! Quero construir dummies da seguinte forma: Tenho uma variável origem (os 27 estados), uma ano (1998 e 1999) e outra destino (os 27 estados mais 51 países), então gostaria de forma as seguintes dummies: 1º) 27 dummies para origem e ano 1998 e 78 dummies para destino e ano 1998; e 2º) 27 dummies para origem e ano 1999 e 78 dummies para destino e ano 1999.
dput(head(mydata)) structure(list(origin = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = c("ac", "al", "am", "ap", "ba", "ce", "df", "es", "go", "ma", "mg", "ms", "mt", "pa", "pb", "pe", "pi", "pr", "rj", "rn", "ro", "rr", "rs", "sc", "se", "sp", "to"), class = "factor"), destination = structure(c(3L, 3L, 5L, 5L, 7L, 7L), .Label = c("ac", "africa", "al", "algeria", "am", "angola", "ap", "arab", "arabia", "argentina", "australia", "austria", "ba", "belgium", "bolivia", "canada", "ce", "chile", "china", "colombia", "df", "ecuador", "egypt", "es", "finland", "france", "germany", "go", "greece", "hong_kong", "india", "indonesia", "iran", "iraq", "ireland", "israel", "italy", "japan", "kingdom", "korea", "ma", "malaysia", "mexico", "mg", "ms", "mt", "netherlands", "nigeria", "norway", "pa", "paraguay", "pb", "pe", "peru", "philippines", "pi", "poland", "portugal", "pr", "rj", "rn", "ro", "rr", "rs", "russian", "sc", "se", "singapore", "sp", "spain", "sweden", "switzerland", "taiwan", "thailand", "to", "turkey", "uruguay", "usa"), class = "factor"), ano = c(1998L, 1999L, 1999L, 1998L, 1999L, 1998L)), .Names = c("origin", "destination", "ano"), row.names = c(NA, 6L), class = "data.frame")
Alguém poderia me ajudar? Desde já muito obrigado! -- *Alexandre Rodrigues Loures*

Quando você diz "dummies", seriam combinações aleatórias desses valores? Já tentaste ver a função *sample *? Atenciosamente, David F. 2015-04-01 23:13 GMT-03:00 Alexandre Loures <alexandre.loures@ymail.com>:
Boa noite!
Quero construir dummies da seguinte forma:
Tenho uma variável origem (os 27 estados), uma ano (1998 e 1999) e outra destino (os 27 estados mais 51 países), então gostaria de forma as seguintes dummies:
1º) 27 dummies para origem e ano 1998 e 78 dummies para destino e ano 1998; e
2º) 27 dummies para origem e ano 1999 e 78 dummies para destino e ano 1999.
dput(head(mydata)) structure(list(origin = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = c("ac", "al", "am", "ap", "ba", "ce", "df", "es", "go", "ma", "mg", "ms", "mt", "pa", "pb", "pe", "pi", "pr", "rj", "rn", "ro", "rr", "rs", "sc", "se", "sp", "to"), class = "factor"), destination = structure(c(3L, 3L, 5L, 5L, 7L, 7L), .Label = c("ac", "africa", "al", "algeria", "am", "angola", "ap", "arab", "arabia", "argentina", "australia", "austria", "ba", "belgium", "bolivia", "canada", "ce", "chile", "china", "colombia", "df", "ecuador", "egypt", "es", "finland", "france", "germany", "go", "greece", "hong_kong", "india", "indonesia", "iran", "iraq", "ireland", "israel", "italy", "japan", "kingdom", "korea", "ma", "malaysia", "mexico", "mg", "ms", "mt", "netherlands", "nigeria", "norway", "pa", "paraguay", "pb", "pe", "peru", "philippines", "pi", "poland", "portugal", "pr", "rj", "rn", "ro", "rr", "rs", "russian", "sc", "se", "singapore", "sp", "spain", "sweden", "switzerland", "taiwan", "thailand", "to", "turkey", "uruguay", "usa"), class = "factor"), ano = c(1998L, 1999L, 1999L, 1998L, 1999L, 1998L)), .Names = c("origin", "destination", "ano"), row.names = c(NA, 6L), class = "data.frame")
Alguém poderia me ajudar?
Desde já muito obrigado!
-- *Alexandre Rodrigues Loures*
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Converta para fator que automaticamente a model.matrix() vai gerar as dummies para você. x <- gl(5, 3, labels=LETTERS[1:5]) is.factor(x) class(x) levels(x) nlevels(x) model.matrix(~x) y <- rnorm(length(x)) lm(y~x) À disposição. Walmes.

Muito obrigado pessoal! Mas agora tenho outra questão. Minha base inicial possui 476.430 observações de 20 variáveis. Quando faço as dummies fico com (Além do inicial): * Dois arquivos de dimensões: 476.430 161 *Dois arquivos de dimensões: 476.430 3.059 Portanto, não estou conseguindo criar a base final. Pois quando tento criar a quarta e última dummy dá a mensagem de que não é possível alocar o vetor de 10,9 GB. Já li que posso resolver o problema de memória definindo que o R não irá carregar a base, mas sim, irá lê-la diretamente do HD. Mas realmente é possível? Alguém saberia me dizer? Configurações da minha máquina: Core i7 com 8 núcleos HD 1T 8 GB de RAM Desde já muito obrigado! On 02/04/2015 11:32, walmes . wrote:
Converta para fator que automaticamente a model.matrix() vai gerar as dummies para você.
x <- gl(5, 3, labels=LETTERS[1:5]) is.factor(x) class(x) levels(x) nlevels(x)
model.matrix(~x)
y <- rnorm(length(x)) lm(y~x)
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Alexandre Rodrigues Loures* Doutorando em Economia Aplicada Universidade Federal da Paraíba - UFPB Centro de Ciências Sociais Aplicadas - CCSA Programa de Pós-Graduação em Economia - PPGE e-Mail: alexandre.loures@ymail.com Site: www.ccsa.ufpb.br/ppge

Boa tarde, Com base na ideia apresentada pelo Walmes, tentou utilizar model.matrix(~levels(x)) ao invés de model.matrix(~x)? Éder Comunello <c <comunello.eder@gmail.com>omunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W] Em 2 de abril de 2015 15:48, Alexandre Loures <alexandre.loures@ymail.com> escreveu:
Muito obrigado pessoal!
Mas agora tenho outra questão. Minha base inicial possui 476.430 observações de 20 variáveis.
Quando faço as dummies fico com (Além do inicial):
* Dois arquivos de dimensões: 476.430 161 *Dois arquivos de dimensões: 476.430 3.059
Portanto, não estou conseguindo criar a base final. Pois quando tento criar a quarta e última dummy dá a mensagem de que não é possível alocar o vetor de 10,9 GB.
Já li que posso resolver o problema de memória definindo que o R não irá carregar a base, mas sim, irá lê-la diretamente do HD. Mas realmente é possível?
Alguém saberia me dizer?
Configurações da minha máquina:
Core i7 com 8 núcleos
HD 1T
8 GB de RAM
Desde já muito obrigado!
On 02/04/2015 11:32, walmes . wrote:
Converta para fator que automaticamente a model.matrix() vai gerar as dummies para você.
x <- gl(5, 3, labels=LETTERS[1:5]) is.factor(x) class(x) levels(x) nlevels(x)
model.matrix(~x)
y <- rnorm(length(x)) lm(y~x)
À disposição. Walmes.
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Alexandre Rodrigues Loures* Doutorando em Economia Aplicada Universidade Federal da Paraíba - UFPB Centro de Ciências Sociais Aplicadas - CCSA Programa de Pós-Graduação em Economia - PPGE e-Mail: alexandre.loures@ymail.com Site: www.ccsa.ufpb.br/ppge
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (4)
-
Alexandre Loures
-
David Feitosa
-
walmes .
-
Éder Comunello