
Izabella, Pela descrição feita no seu texto, parece que vc enfrenta um aspecto de "arquitetura de banco de dados", onde uma chave é usada para conectar logicamente várias "tabelas" no sentido de BD, enquanto o R espera um *dataframe* que é uma tabela mais consolidada ou como diria um analista de BD « na 1ª forma normal ». Seu script deverá usar os subpacotes de *tidyverse* e colocar as variáveis de interesse todas como colunas duma única linha identificável com com 'chave_domicilio'¹. Daí pós processar esse dataframe colocando pesos, agregando, calculando as var dummy, etc. ficará mais fácil. HTH -- Cesar Rabak [1] Em particular veja as funções cast e eventualmente para reverter ou conferir a melt desse pacote. On Wed, Apr 2, 2025 at 10:54 AM Izabella Maria Viana por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Prezados,
Estamos escrevendo um artigo sobre os determinantes do trabalho infantil no Brasil, que utilizará os microdados da PNAD Contínua de 2021, relacionados à quinta visita. Estamos estruturando um script que consolida a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando algumas dificuldades.
O banco de dados em questão deve conter informações relativas à pessoa de referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), assim como informações referentes a criança entre 5 e 17 anos que esteja em situação de trabalho infantil (variável* dummy* que indique essa situação, número de crianças no domicílio que se enquadram neste quesito, sexo da criança, idade e etc.).
Contudo, não estamos conseguindo pensar em uma forma na qual consigamos executar essa ação no R. O grande problema é que, dado um domicílio que é identificado pela variável `chave_domicilio`, existirá diversas observações que abrangem as pessoas que pertencem a ele (pessoa responsável pelo domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações. Estamos utilizando, basicamente, os pacotes *survey, srvyr, PNADcIBGE e tidyverse* para realizar a importação e manipulação das informações.
Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir?
Gratos desde já!
-- Izabella M S Viana Doutoranda em Estatística (UFPE) Economista e Mestre em Economia (UFV) Professora Orientadora USP/ESALq Email secundário: izabella.maria@ufpe.br _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.