
Acho que este e um arquivo de formato fixo. Vc vai precisar do dicionario de dados para importar. Normalmente este dicionario e disponibilizado com os dados pelo inep. Em 01/10/2016 22:31, "Andre Oliveira via R-br" <r-br@listas.c3sl.ufpr.br> escreveu:
Boa noite, não estou conseguindo identificar o motivo de não abrir este arquivo .txt corretamente, ele tem em torno de 6.3 GB <http://portal.inep.gov.br/basica-levantamentos-microdados> Alguém teria uma dica para compartilhar? Acredito que não estou trabalhando corretamente!
library(data.table) readLines("DADOS_ENEM_2011.TXT", n = 1)
*[1] "3000000000012011 2803548708SAO BERNARDO DO CAMPO SP110000000000000000000011 . . ...3548708SAO BERNARDO DO CAMPO SP1111 577.10 576.00 575.50 737.10CEBDCACBEAABBAABAEBDCABDCDEAAADCBBEBADDBEBECDDEECABABEBDDEBAEADCACABCBBECADDAADBADDAABABCAEEAEAEDDDAAEEBDECADCEABDDBAECAAABDAEBCCACBAECBAEBECCAAEBABECECCDDAACDADADBACCBAADCAECCCEDD1241201251290CECDDACBCAEBEBBACEEDCAEBDAEDADBEBBDDADCBCBACDDEECEBABAADDEBAECDCACEDCBBEBCDCAADBADDDBAEACAEEDBDBDDCAEDDDACDEBBECAACDABADBAECCEADDCEBCBACBAEEBAEEECCEEEBCBECEBADCBDBEADCDBDCCCBADCAECCCCDDP 140.00 140.00 140.00 140.00 60.00 620.000 . . . *
require(bit64) enem2011<- fread("DADOS_ENEM_2011.TXT", nrow = 1, header = TRUE, sep=";") head(enem2011)
3000000000012011 2803548708SAO BERNARDO DO CAMPO
SP110000000000000000000011 . .
...3548708SAO BERNARDO DO CAMPO
SP1111 577.10 576.00 575.50 737.10CEBDCACBEAABBAABAEBDCABDCDEA AADCBBEBADDBEBECDDEECABABEBDDEBAEADCACABCBBECADDAADBADDAABAB CAEEAEAEDDDAAEEBDECADCEABDDBAECAAABDAEBCCACBAECBAEBECCAAEBAB ECECCDDAACDADADBACCBAADCAECCCEDD1241201251290CECDDACBCAEBEBB ACEEDCAEBDAEDADBEBBDDADCBCBACDDEECEBABAADDEBAECDCACEDCBBEBCD CAADBADDDBAEACAEEDBDBDDCAEDDDACDEBBECAACDABADBAECCEADDCEBCBA CBAEEBAEEECCEEEBCBECEBADCBDBEADCDBDCCCBADCAECCCCDDP 140.00 140.00 140.00 140.00 60.00 620.000 . . .
... 1: 3000000000022011 2214125506SAO JOSE DOS PINHAIS
PR110000000000000000000011 . .
...4125506SAO JOSE DOS PINHAIS
PR0000 . . . .
1211171251290DCEACDBECBCAEBACB EAECEDEDAABDBEDBBDDDCABCBDCAEDEBCEAEDBDAACACECDBBCACEDCDCBAE ADADBBDDEAABAEEDBDBDDCAEDDDACDEBBECAACDABADBAECCEADDCEBCBACB AEEBAEEECCEEEBCBECEBADCBDBEADCDBDCCCBADCAECCCCDDF 0.00 0.00 0.00 0.00 0.00 0.000 . . .
obrigado.
André Oliveira Souza. Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFES
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.