Rafael e demais,
Se não me engano, a Microsoft liberou um programa chamado Powershell que tem diversas funcionalidades do bash. Este programa é gratuito e tem versões para Windows (não apenas 10), Mac e Linux.
Eder, tudo bem?Tentando ajudar, caso tenha alguma máquina com linux, tenho a seguinte sugestão.obs.: parece que o update do windows 10 tem ou terá uma layer do shell do linuxtest <- c("SPA100", "MSA200", "MSB300", "MSC400", "MSC500",
"PRA100", "PRC200", "MGV100", "MTJ400", "MTK500")write.csv(test, "eder.csv", row.names = FALSE)## indo para o Shellgrep -v "MS" < eder.csv## para salvar em outro arquivogrep -v "MS" < eder.csv > eder2.csvcat eder2.csvespero ter ajudadoSaudaçõesRafael Tieppo
State University of Mato Grosso - Department of Agricultural Engineering
site: http://docente.unemat.br/rafaeltieppo/ blog: https://fuidebicicleta.wordpress.com "Evite o desperdício: antes de imprimir pense na sua responsabilidade com o ambiente".On Tuesday, October 4, 2016 11:00 AM, "r-br-request@listas.c3sl.ufpr.br " <r-br-request@listas.c3sl.ufpr.br > wrote:
Enviar submissões para a lista de discussão R-br para
r-br@listas.c3sl.ufpr.br
Para se cadastrar ou descadastrar via WWW, visite o endereço
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
corpo da mensagem para
r-br-request@listas.c3sl.ufpr.br
Você poderá entrar em contato com a pessoa que gerencia a lista pelo
endereço
r-br-owner@listas.c3sl.ufpr.br
Quando responder, por favor edite sua linha Assunto assim ela será
mais específica que "Re: Contents of R-br digest..."
Tópicos de Hoje:
1. "alternativa não-paramétrica" para o teste de Dunnett
(Luiz Leal)
2. Re: Processamento paralelo para um modelo de treinamento
(Tito Conte)
3. Re: "alternativa não-paramétrica" para o teste de Dunnett
(Tito Conte)
4. Identificar variáveis dicotomicas (Elias Carvalho)
5. Re: Identificar variáveis dicotomicas (Eduardo Junior)
6. Re: Identificar variáveis dicotomicas (Felipe)
7. Re: "alternativa não-paramétrica" para o teste de Dunnett
(Luiz Henrique Leal)
8. Regexp no grep para linhas que não iniciam com sequência
(Éder Comunello)
9. Re: Regexp no grep para linhas que não iniciam com
sequência (Marcus Nunes)
------------------------------------------------------------ ----------
Message: 1
Date: Mon, 3 Oct 2016 16:24:09 +0000 (UTC)
From: Luiz Leal <richfield1974@yahoo.com>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>
Subject: [R-br] "alternativa não-paramétrica" para o teste de
Dunnett
Message-ID: <318158849.4552633.1475511849793@mail.yahoo.com >
Content-Type: text/plain; charset="utf-8"
Boa tarde a todos.Alguém sabe se existe uma "alternativa não-paramétrica" para o teste de Dunnett?Desde já agradeçoLuiz
...Dunnett's test is a multiple comparison procedure to compare each of a number of treatments with a single control.
...
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161003/2222ae8c/attachment- 0001.html
------------------------------
Message: 2
Date: Mon, 3 Oct 2016 17:37:36 -0300
From: Tito Conte <tito.conte@gmail.com>
To: Fernando Gama <f.fabiogama88@gmail.com>, a lista Brasileira
oficial de discussão do programa R. <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] Processamento paralelo para um modelo de
treinamento
Message-ID:
<CACqq46womHtn9eivqKSQG2K_SdSD9zuSF=9JQG82wWoJuJQAYQ@ mail.gmail.com >
Content-Type: text/plain; charset="utf-8"
Ele está rodando paralelo? Você verificou?
Se unix use o comando top e aperte 1
Se windows abra o gerenciador de tarefas e verifique os núcleos de trabalho.
Aproveite para ver se é a CPU do seu PC o problema. Pode ser a memória ou a
escrita do disco.
Uma solução de baixissimo nível, mas que funciona. é você quebrar o código.
Em partes e rodar vários Rs, cada um com uma etapa, gerar uns arquivos
intermediários e depois concatena tudo.
Tito Conte
Em 2 de outubro de 2016 08:41, Fernando Gama via R-br <
r-br@listas.c3sl.ufpr.br> escreveu:
> Pessoal,
>
> Estou tentando treinar um modelo com 192 atributos e meu objetivo é, no
> pós-treinamento, identificar os atributos mais importantes. (seleção de
> features).
>
> A questão é que estou tendo problemas para treinar o modelo porque o
> processamento é extremamente lento. Pesquisei sobre o parallel e o
> doParallel e coloquei no meu código mas aparentemente não obtive resultados
> segue um trecho do código:
>
> library(caret)
> library(doParallel)
>
> myControl <- trainControl(method = "repeatedcv", number = 10, repeats = 3,
> allowParallel = TRUE)
>
> t<-proc.time()
>
> cl <- makeCluster(detectCores())
>
> registerDoParallel(cl)
>
> model <- train(GENRE~., data=dtset_genres, method="lvq", preProcess =
> "scale", trControl = myControl)
>
> stopCluster(cl)
>
> proc.time()-t
>
>
> Alguma sugestão?
>
> --
> Att,
>
> | Fernando Gama da Mata |
> | Database Specialist | Master's Degree UFPA |
>
> | Contacts: +55 91 99150 0365 | f.fabiogama88@gmail.com | Social
> Networks: [ <https://www.facebook.com/fernando.gama.13 >][
> <https://plus.google.com/+FernandoGama13 >][
> <https://www.linkedin.com/in/fernandogama >] |
>
>
> _______________________________________________
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia ) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161003/6d0dada5/attachment- 0001.html
------------------------------
Message: 3
Date: Mon, 3 Oct 2016 17:38:38 -0300
From: Tito Conte <tito.conte@gmail.com>
To: Luiz Leal <richfield1974@yahoo.com>, a lista Brasileira oficial
de discussão do programa R. <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] "alternativa não-paramétrica" para o teste de
Dunnett
Message-ID:
<CACqq46zura6UmNb=YD0RG84RF4hucLL-MT2aRKQQC8aXVbqnsQ@mail. >gmail.com
Content-Type: text/plain; charset="utf-8"
Achei isso:
"I'm pretty sure Dunnett's Test is for parametric data only. You can use
Mann Whitney follow up tests and just divide alpha by how many follow ups
you need to run to take a conservative approach."
Tito Conte
2016-10-03 13:24 GMT-03:00 Luiz Leal via R-br <r-br@listas.c3sl.ufpr.br>:
> Boa tarde a todos.
> Alguém sabe se existe uma "alternativa não-paramétrica" para o teste de
> Dunnett?
> Desde já agradeço
> Luiz
>
> ...
> *Dunnett's test* is a multiple comparison
> <https://en.wikipedia.org/wiki/Multiple_comparisons > procedure to compare
> each of a number of treatments with a single control.
> ...
>
> _______________________________________________
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia ) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161003/1a2c2fb0/attachment- 0001.html
------------------------------
Message: 4
Date: Mon, 3 Oct 2016 20:18:27 -0300
From: Elias Carvalho <ecacarva@gmail.com>
To: a lista Brasileira oficial de discussão do programa R.
<r-br@listas.c3sl.ufpr.br>
Subject: [R-br] Identificar variáveis dicotomicas
Message-ID:
<CAH8E6UvJE4FJdg3sqPSyEJuUy1QR45KEW0B3kTS4i6QUCyypEw@mail. >gmail.com
Content-Type: text/plain; charset="utf-8"
Boa noite pessoal
Existe alguma função do R que permite identificar variáveis dicotomicas em
um dataframe ?
Como por exemplo: 0 e 1 ou 1 e 2 no mesmo dataframe
Obrigado
--
*In Jesu et Maria*
*Obrigado*
*Prof. Elias Carvalho*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161003/4c256e4c/attachment- 0001.html
------------------------------
Message: 5
Date: Mon, 3 Oct 2016 20:48:23 -0300
From: Eduardo Junior <edujrrib@gmail.com>
To: r-br@listas.c3sl.ufpr.br
Subject: Re: [R-br] Identificar variáveis dicotomicas
Message-ID:
<CAO7eVPz+Nbop7a6e6=yvmMcT4ab2jJOp7KWQoHYvcbT_omCeDA@mail. >gmail.com
Content-Type: text/plain; charset="utf-8"
As funções nativas.
## Mostra quantos valores unicos tem em cada coluna
sapply(dados, function(x) length(unique(x)))
## Os iguais a dois ...
sapply(dados, function(x) length(unique(x))) == 2L
Att,
Eduardo E. R, Junior <http://jreduardo.github.io/>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161003/bf2f4bad/attachment- 0001.html
------------------------------
Message: 6
Date: Mon, 3 Oct 2016 20:57:38 -0300
From: Felipe <felipe.e.barletta@gmail.com>
To: Elias Carvalho <ecacarva@gmail.com>, a lista Brasileira oficial de
discussão do programa R. <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] Identificar variáveis dicotomicas
Message-ID: <efd9e8d7-87a5-26cf-bca9-3bf1576561b0@gmail.com >
Content-Type: text/plain; charset=utf-8; format=flowed
Se as variáveis dicotômicas tiverem valores 0 ou 1, pode tentar da
seguinte maneira:
dados <- data.frame(x1=rbinom(100,1,.5),x2=rnorm(100))
sapply(dados, function(x) all(x%in%c(0,1)))
x1 x2
TRUE FALSE
------------------------------
Message: 7
Date: Mon, 03 Oct 2016 22:50:14 -0300
From: Luiz Henrique Leal <richfield1974@yahoo.com>
To: Tito Conte <tito.conte@gmail.com>
Cc: a lista Brasileira oficial de discussão do programa R.
<r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] "alternativa não-paramétrica" para o teste de
Dunnett
Message-ID: <owgspse5irq36a1succbe6m8.1475545814367@email.android. >com
Content-Type: text/plain; charset="utf-8"
Muito obrigado
Conectado pela Motorola
Tito Conte <tito.conte@gmail.com> escreveu:
>Achei isso:
>
>"I'm pretty sure Dunnett's Test is for parametric data only. You can use Mann Whitney follow up tests and just divide alpha by how many follow ups you need to run to take a conservative approach."
>
>
>Tito Conte
>
>
>2016-10-03 13:24 GMT-03:00 Luiz Leal via R-br <r-br@listas.c3sl.ufpr.br>:
>
>Boa tarde a todos.
>
>Alguém sabe se existe uma "alternativa não-paramétrica" para o teste de Dunnett?
>
>Desde já agradeço
>
>Luiz
>
>
>...
>
>Dunnett's test is a multiple comparison procedure to compare each of a number of treatments with a single control.
>
>...
>
>
>_______________________________________________
>R-br mailing list
>R-br@listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia ) e forneça código mínimo reproduzível.
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161003/8ca1874d/attachment- 0001.html
------------------------------
Message: 8
Date: Tue, 4 Oct 2016 08:49:15 -0400
From: Éder Comunello <comunello.eder@gmail.com>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>
Subject: [R-br] Regexp no grep para linhas que não iniciam com
sequência
Message-ID:
<CABmC8gmXyf0Cv1movTQqUktHucnSUSd-rxLWv0CLDZLcG6aEcw@mail. >gmail.com
Content-Type: text/plain; charset="utf-8"
Senhores, bom dia!
Considerando o vetor:
test <- c("SPA100", "MSA200", "MSB300", "MSC400", "MSC500",
"PRA100", "PRC200", "MGV100", "MTJ400", "MTK500")
Posso obter facilmente os valores iniciados com a sequência "MS":
grep("^MS", test, val=T)
# [1] "MSA200" "MSB300" "MSC400" "MSC500"
Uma primeira tentativa, sem sucesso, para obter linhas que não iniciam com
a sequência foi:
grep("^!(MS)", test, val=T)
# character(0)
Consegui uma solução estranha com:
grep("^[^M]|^M[^S]", test, val=T)
# [1] "SPA100" "PRA100" "PRC200" "MGV100" "MTJ400" "MTK500"
Mas essa solução é limitada quando usando strings maiores, tal como "MSC".
Embora existam alternativas como:
test[-grep("^MSC", test)]
# [1] "SPA100" "MSA200" "MSB300" "PRA100" "PRC200" "MGV100" "MTJ400" "MTK500"
Gostaria de saber se há uma forma fácil de fazer isso usando diretamente
uma regexp.
Grato,
================================================
Éder Comunello
Researcher at Brazilian Agricultural Research Corporation (Embrapa)
DSc in Agricultural Systems Engineering (USP/Esalq)
MSc in Environ. Sciences (UEM), Agronomist (UEM)
---
Embrapa Agropecuária Oeste, Dourados, MS, Brazil |<O>|
================================================
GEO, -22.2752, -54.8182, 408m
UTC-04:00 / DST: UTC-03:00
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161004/ed7972df/attachment- 0001.html
------------------------------
Message: 9
Date: Tue, 4 Oct 2016 10:14:36 -0300
From: Marcus Nunes <marcus.nunes@gmail.com>
To: comunello.eder@gmail.com, a lista Brasileira oficial de
discussão do programa R. <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] Regexp no grep para linhas que não iniciam com
sequência
Message-ID:
<CA+QGQvvMACE6i_RA46nvpY-T34QS9hxZadhbNsaezwhXTg4SbQ@ >mail.gmail.com
Content-Type: text/plain; charset="utf-8"
Se entendi corretamente o teu problema, não é necessário utilizar uma regex:
test <- c("SPA100", "MSA200", "MSB300", "MSC400", "MSC500", "PRA100",
"PRC200", "MGV100", "MTJ400", "MTK500")
grep("MS", test, val=T, invert=T)
2016-10-04 9:49 GMT-03:00 Éder Comunello via R-br <r-br@listas.c3sl.ufpr.br>
:
> Senhores, bom dia!
>
> Considerando o vetor:
>
> test <- c("SPA100", "MSA200", "MSB300", "MSC400", "MSC500",
> "PRA100", "PRC200", "MGV100", "MTJ400", "MTK500")
>
> Posso obter facilmente os valores iniciados com a sequência "MS":
> grep("^MS", test, val=T)
>
> # [1] "MSA200" "MSB300" "MSC400" "MSC500"
>
>
> Uma primeira tentativa, sem sucesso, para obter linhas que não iniciam com
> a sequência foi:
> grep("^!(MS)", test, val=T)
> # character(0)
>
> Consegui uma solução estranha com:
> grep("^[^M]|^M[^S]", test, val=T)
>
> # [1] "SPA100" "PRA100" "PRC200" "MGV100" "MTJ400" "MTK500"
>
>
> Mas essa solução é limitada quando usando strings maiores, tal como "MSC".
>
> Embora existam alternativas como:
> test[-grep("^MSC", test)]
>
> # [1] "SPA100" "MSA200" "MSB300" "PRA100" "PRC200" "MGV100" "MTJ400" "MTK500"
>
>
> Gostaria de saber se há uma forma fácil de fazer isso usando diretamente
> uma regexp.
>
> Grato,
>
> ================================================
> Éder Comunello
> Researcher at Brazilian Agricultural Research Corporation (Embrapa)
> DSc in Agricultural Systems Engineering (USP/Esalq)
> MSc in Environ. Sciences (UEM), Agronomist (UEM)
> ---
> Embrapa Agropecuária Oeste, Dourados, MS, Brazil |<O>|
> ================================================
> GEO, -22.2752, -54.8182, 408m
> UTC-04:00 / DST: UTC-03:00
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia ) e forneça
> código mínimo reproduzível.
>
--
Marcus Nunes
http://marcusnunes.me/
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/ >20161004/585080f4/attachment- 0001.html
------------------------------
Subject: Legenda do Digest
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
------------------------------
Fim da Digest R-br, volume 70, assunto 6
****************************************
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia ) e forneça código mínimo reproduzível.