Re: [R-br] dim(X)

mais recente
Erro ao fazer a leitura de...

Ivan Bezerra Allaman

20 Nov 2013 20 Nov '13

16:04

A mensagem de erro é clara. O arquivo não existe ou o diretório não pode ser encontrado. Use o mesmo caminho que estava usando, apagando sep=";", dec=",",header=TRUE e colocando o que o Benilton sugeriu, ou seja, faça: GBS <- read.csv("C:/GS_tutorial/DatasetS2_29SAWSN_gbs.csv", header=TRUE, stringsAsFactors=FALSE) e prossiga do mesmo jeito que vai dar certo. (s,f,p) Allaman

Anexos:

attachment.htm (text/html — 2,7 KB)

Resposta

Faça login para responder on-line Usar software de e-mail

Mostrar respostas por data

Éder Comunello

21 Nov 21 Nov

14:32

Novo assunto: dim(X)

Senhores, bom dia! Talvez seja melhor ler diretamente a partir do arquivo '.gz'... O código abaixo está testado e aparentemente atende ao que se pede. Está comentado com os principais resultados. Peço avaliar. ### <BEGIN> setwd("C:/LAB/Tmp"); getwd() ### alterar!!! dURL <- " https://www.crops.org/publications/tpg/supplements/5/tpg12-06-0006-dataset-s... " gzFile <- strsplit(dURL, "/")[[1]][8]; gzFile ### fazendo o download download.file(dURL, gzFile, mode='wb') ### downloaded 4.3 Mb ### uma vez baixados, os arquivos comprimidos com bzip2, xvz, ou gzip podem ### ser lidos diretamente com read.table() GBS <- read.table(gzFile, sep=',', header=T, stringsAsFactors=F) dim(GBS) ### [1] 41371 258 parse.GBS <- function(x) { unique.x <- unique(x) alleles <- setdiff(unique.x,union("H","N")) y <- rep(0,length(x)) y[which(x==alleles[1])] <- -1 y[which(x==alleles[2])] <- 1 y[which(x=="N")] <- NA return(y) } X <- apply(GBS[,-c(1:3)],1,parse.GBS) dim(X) ### [1] 255 41371 frac.missing <- apply(X,2,function(z){length(which(is.na(z)))/length(z)}) length(which(frac.missing<0.5)) ### [1] 16317 hist(frac.missing) ### OK!!! ### <END> Atte., Éder Comunello <c <comunello.eder@gmail.com>omunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]

Resposta

Faça login para responder on-line Usar software de e-mail

Giselle Davi

15:09

Novo assunto: dim(X)

Bom dia, eu não sei se reparam, mas a dimensão da matriz X continua diferente da citada no manual que seria de 254 x 41731, o que inflaciona na quantidade de dados perdidos e consequentemente, no gráfico que é gerado. Alguém teria alguma sugestão?? Att, Giselle Em Quinta-feira, 21 de Novembro de 2013 13:01, Éder Comunello <comunello.eder@gmail.com> escreveu: Senhores, bom dia! Talvez seja melhor ler diretamente a partir do arquivo '.gz'... O código abaixo está testado e aparentemente atende ao que se pede. Está comentado com os principais resultados. Peço avaliar. ### <BEGIN> setwd("C:/LAB/Tmp"); getwd() ### alterar!!! dURL <- "https://www.crops.org/publications/tpg/supplements/5/tpg12-06-0006-dataset-s..." gzFile <- strsplit(dURL, "/")[[1]][8]; gzFile ### fazendo o download download.file(dURL, gzFile, mode='wb') ### downloaded 4.3 Mb ### uma vez baixados, os arquivos comprimidos com bzip2, xvz, ou gzip podem ### ser lidos diretamente com read.table() GBS <- read.table(gzFile, sep=',', header=T, stringsAsFactors=F) dim(GBS) ### [1] 41371 258 parse.GBS <- function(x) { unique.x <- unique(x) alleles <- setdiff(unique.x,union("H","N")) y <- rep(0,length(x)) y[which(x==alleles[1])] <- -1 y[which(x==alleles[2])] <- 1 y[which(x=="N")] <- NA return(y) } X <- apply(GBS[,-c(1:3)],1,parse.GBS) dim(X) ### [1] 255 41371 frac.missing <- apply(X,2,function(z){length(which(is.na(z)))/length(z)}) length(which(frac.missing<0.5)) ### [1] 16317 hist(frac.missing) ### OK!!! ### <END> Atte., Éder Comunello <comunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W] _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Resposta

Faça login para responder on-line Usar software de e-mail

Éder Comunello

15:24

Novo assunto: dim(X)

Giselle, Faltou usar a primeira coluna como row.names.... Já atualizei o código que segue abaixo: ### <BEGIN> ### browseURL(' http://cran.r-project.org/web/packages/rrBLUP/vignettes/GS_tutorial.pdf') ### setwd("C:/LAB/Tmp"); getwd() dURL <- " https://www.crops.org/publications/tpg/supplements/5/tpg12-06-0006-dataset-s... " gzFile <- strsplit(dURL, "/")[[1]][8]; gzFile ### fazendo o download download.file(dURL, gzFile, mode='wb') ### downloaded 4.3 Mb ### uma vez baixados, os arquivos comprimidos com bzip2, xvz, ou gzip podem ### ser lidos diretamente com read.table() GBS <- read.table(gzFile, sep=',', header=T, stringsAsFactors=F, row.names=1) dim(GBS) ### [1] 41371 257 parse.GBS <- function(x) { unique.x <- unique(x) alleles <- setdiff(unique.x,union("H","N")) y <- rep(0,length(x)) y[which(x==alleles[1])] <- -1 y[which(x==alleles[2])] <- 1 y[which(x=="N")] <- NA return(y) } X <- apply(GBS[,-c(1:3)],1,parse.GBS) dim(X) ### [1] 254 41371 frac.missing <- apply(X,2,function(z){length(which(is.na(z)))/length(z)}) length(which(frac.missing<0.5)) ### [1] 16030 hist(frac.missing) ### OK!!! ### <END> Éder Comunello <c <comunello.eder@gmail.com>omunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]

Resposta

Faça login para responder on-line Usar software de e-mail

Giselle Davi

15:43

Novo assunto: dim(X)

Muitíssimo obrigada !!! Em Quinta-feira, 21 de Novembro de 2013 13:24, Éder Comunello <comunello.eder@gmail.com> escreveu: Giselle, Faltou usar a primeira coluna como row.names.... Já atualizei o código que segue abaixo: ### <BEGIN> ### browseURL('http://cran.r-project.org/web/packages/rrBLUP/vignettes/GS_tutorial.pdf') ### setwd("C:/LAB/Tmp"); getwd() dURL <- "https://www.crops.org/publications/tpg/supplements/5/tpg12-06-0006-dataset-s..." gzFile <- strsplit(dURL, "/")[[1]][8]; gzFile ### fazendo o download download.file(dURL, gzFile, mode='wb') ### downloaded 4.3 Mb ### uma vez baixados, os arquivos comprimidos com bzip2, xvz, ou gzip podem ### ser lidos diretamente com read.table() GBS <- read.table(gzFile, sep=',', header=T, stringsAsFactors=F, row.names=1) dim(GBS) ### [1] 41371 257 parse.GBS <- function(x) { unique.x <- unique(x) alleles <- setdiff(unique.x,union("H","N")) y <- rep(0,length(x)) y[which(x==alleles[1])] <- -1 y[which(x==alleles[2])] <- 1 y[which(x=="N")] <- NA return(y) } X <- apply(GBS[,-c(1:3)],1,parse.GBS) dim(X) ### [1] 254 41371 frac.missing <- apply(X,2,function(z){length(which(is.na(z)))/length(z)}) length(which(frac.missing<0.5)) ### [1] 16030 hist(frac.missing) ### OK!!! ### <END> Éder Comunello <comunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]

Resposta

Faça login para responder on-line Usar software de e-mail

4286

Idade (dias atrás)

4287

Última atividade (dias atrás)

Visão geral da lista

Baixar

4 comentários

3 participantes

participantes (3)

Giselle Davi
Ivan Bezerra Allaman
Éder Comunello

Re: [R-br] dim(X)

Ivan Bezerra Allaman

Éder Comunello

Giselle Davi

Éder Comunello

Giselle Davi

etiquetas

participantes (3)