Enviar submissões para a lista de discussão R-br para
r-br@listas.c3sl.ufpr.br
Para se cadastrar ou descadastrar via WWW, visite o endereço
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
corpo da mensagem para
r-br-request@listas.c3sl.ufpr.br
Você poderá entrar em contato com a pessoa que gerencia a lista pelo
endereço
r-br-owner@listas.c3sl.ufpr.br
Quando responder, por favor edite sua linha Assunto assim ela será
mais específica que "Re: Contents of R-br digest..."
Tópicos de Hoje:
1. split-plot (Fabiana Schneck)
2. Re: Transformar Variáveis discretas em Numeros Binários ->
Pre-processamento para Redes Neurais (Elias T. Krainski)
3. Rotina order (Edson Lira)
4. Re: Rotina order (Elias T. Krainski)
5. Re: MQM (Elias T. Krainski)
6. Re: Modificar valores de dataframe com base em outro
dataframe (Elias T. Krainski)
7. Categorização de variáveis (Edson Lira)
8. Re: Categorização de variáveis (Luis Iván Ortiz Valencia)
9. Re: Categorização de variáveis (Cesar Rabak)
10. Re: Categorização de variáveis (Elias T. Krainski)
11. Re: Categorização de variáveis (Edson Lira)
----------------------------------------------------------------------
Message: 1
Date: Tue, 13 Dec 2011 12:25:13 -0200
From: Fabiana Schneck <fabiana.schneck@gmail.com>
To: r-br <r-br@listas.c3sl.ufpr.br>
Subject: [R-br] split-plot
Message-ID:
<CALjK-AcaG3AELQAOopMDZ1X7oFYOzNg4957pn3-3BG9J+t07oA@mail.gmail.com>
Content-Type: text/plain; charset="windows-1252"
Prezados colegas,
tenho um experimento com o seguinte design split-plot:
fator 'ambiente': 5 corredeiras e 5 remansos
em cada plot de 'ambiente' (num total de 10) há outro fator: 'peixes' com
dois tratamentos: exclusão e controle
ainda, dentro de cada sub-plot do fator 'peixes' existe o fator 'substrato'
com dois tratamentos: liso e rugoso.
A variável resposta é quantidade de clorofila em cada unidade experimental
(cada substrato).
Um exemplo dos dados:
clorofila
ambiente
peixes
substrato
bloco
0.114
1
1
1
1
0.160
1
1
2
1
0.126
1
2
1
1
0.149
1
2
2
1
0.068
1
1
1
2
0.137
1
1
2
2
0.080
1
2
1
2
0.160
1
2
2
2
....
....
0.080
2
1
1
10
0.068
2
1
2
10
0.114
2
2
1
10
0.124
2
2
2
10
Considerei que os fatores 'peixes' e 'substrato' estão em blocos (10),
enquanto o fator 'ambiente' está acima dos blocos (5 blocos são no ambiente
corredeiras e 5 no ambiente remansos).
Analise os dados utilizando dois modelos distintos:
*aov (log(cloro)~(amb+peixes+substrato)^2+Error(bloco/peixes))*
*
*
Error: bloco
Df Sum Sq Mean Sq F value Pr(>F)
amb 1 0.1162 0.11618 0.128 0.7297
Residuals 8 7.2599 0.90749
Error: bloco:peixes
Df Sum Sq Mean Sq F value Pr(>F)
peixes 1 2.96190 2.96190 14.6147 0.005069 **
amb:peixes 1 0.30121 0.30121 1.4862 0.257528
Residuals 8 1.62133 0.20267
---
Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
substrato 1 1.9924 1.99244 10.2620 0.005209 **
amb:substrato 1 0.0013 0.00134 0.0069 0.934840
peixes:substrato 1 0.5934 0.59335 3.0560 0.098473 .
Residuals 17 3.3007 0.19416
*
*
*lme(log(cloro)~(amb+peixes+**substrato)^2, random=~1|bloco/peixes))*
Linear mixed-effects model fit by REML
Data: NULL
AIC BIC logLik
85.58484 100.5499 -32.79242
Random effects:
Formula: ~1 | bloco
(Intercept)
StdDev: 0.4197679
Formula: ~1 | peixes %in% bloco
(Intercept) Residual
StdDev: 0.06522495 0.4406333
Fixed effects: log(cloro) ~ (amb + peixes + substrato)^2
Value Std.Error DF t-value p-value
(Intercept) -2.4342471 0.2647064 17 -9.196027 0.0000
amb2 -0.2929029 0.3611524 8 -0.811023 0.4408
peixes2 0.6142687 0.2448449 8 2.508808 0.0364
substrato2 0.6783940 0.2413448 17 2.810891 0.0120
amb2:peixes2 0.3471056 0.2847218 8 1.219104 0.2575
amb2:substrato2 0.0231237 0.2786810 17 0.082976 0.9348
peixes2:substrato2 -0.4871762 0.2786810 17 -1.748150 0.0985
Correlation:
(Intr) amb2 peixs2 sbstr2 amb2:p2 amb2:s2
amb2 -0.682
peixes2 -0.462 0.229
substrato2 -0.456 0.223 0.329
amb2:peixes2 0.269 -0.394 -0.581 0.000
amb2:substrato2 0.263 -0.386 0.000 -0.577 0.000
peixes2:substrato2 0.263 0.000 -0.569 -0.577 0.000 0.000
Standardized Within-Group Residuals:
Min Q1 Med Q3 Max
-2.42000225 -0.41789060 -0.02451742 0.44159262 1.87090777
Number of Observations: 40
Number of Groups:
bloco peixes %in% bloco
10 20
Tenho dúvidas se estou definindo de forma correta os modelos e também se
devo usar aov ou lme, uma vez que os resultados dos termos isolados diferem
entre as duas funções (porém os resultados são indênticos para as
interações).
Desde já obrigada pela atenção,
Fabiana
--
-----
Fabiana Schneck
Programa de Pós-Graduação em Ecologia
Universidade Federal do Rio Grande do Sul
CP 15007 - CEP 91501-970
Porto Alegre, RS, Brasil
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/6ca4ee6e/attachment-0001.html>
------------------------------
Message: 2
Date: Tue, 13 Dec 2011 06:30:03 -0800 (PST)
From: "Elias T. Krainski" <eliaskrainski@yahoo.com.br>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] Transformar Variáveis discretas em Numeros
Binários -> Pre-processamento para Redes Neurais
Message-ID:
<1323786603.22667.YahooMailNeo@web114716.mail.gq1.yahoo.com>
Content-Type: text/plain; charset="iso-8859-1"
Fernando, talvez eu não tenha entendido exatamente o que você quer. Veja dois exemplos, considerando as colunas 2 e 3 de 'warpbreaks' (disponivel no 'datasets', como o 'iris').
### Considerando que um 'factor' é um inteiro, apenas retiramos os 'levels', e vc pode manipular
### Se ha 3 ou mais classes, o resultado nao é binário, é inteiro de 1 ao número de classes
sapply(warpbreaks[,2:3], unclass)
sapply(warpbreaks[,2:3], unclass)-1
### converte em colunas binárias, como dummies em qualquer modelo regressão
### se há mais de duas classes, é criado mais de uma coluna
model.matrix(~wool + tension, warpbreaks)[,-1]
Att.
Elias T. Krainski
>________________________________
> De: Fernando Neto <fernandoneto7@gmail.com>
>Para: r-br@listas.c3sl.ufpr.br
>Enviadas: Segunda-feira, 12 de Dezembro de 2011 21:32
>Assunto: [R-br] Transformar Variáveis discretas em Numeros Binários -> Pre-processamento para Redes Neurais
>
>
>Boa noite, R-anos!
>Por favor, estou precisando ajustar os arquivos de uma base de dados para processamento de uma RNA.
>Estou usando a função decodeClassLabels(...) mas a operacao tá ficando muito custosa.
>Por exemplo
>__
>Masculino Programador
>Masculino Médico
>Feminino Programador
>__
>tem que ser
>__
>0 1 0 1
>1 0 1 0
>__
>
>
>Só que eu trato cada variável de cada vez. E acho que a operacao de concatenacao que eu uso:
>cbind(...) tá tornando a operacao custosa (além de que a memória passa de 2GB).
>
>
>PS.: eu faço o seguinte:
>
>
>for (i in (VETOR COM AS COLUNAS A SEREM TRANSFORMADAS)){
> colAux = decodeClassLabels(vector[,i])
> vector = vector [,-i]
> vector = cbind(vector, colAux)
>}
>
>
>Alguém sugere algo?
>
>
>Muito grato!!!
>Fernando
>
>
>--
>----------------------------------------------------------------
>
>Fernando Neto
>Twitter: @fernandompneto
>Facebook: facebook.com/fernandompneto
>
>Tecnologia de Ponte
>http://tecnologiadeponte.blogspot.com
>----------------------------------------------------------------
>fmpn2 @ CIn - UFPE
>http://cin.ufpe.br/~fmpn2
>
>- Engenharia da Computação - Turma 2009.2 - CIn, UFPE.
>- Monitor de Estatistica e Probabilidade Para Engenharia da Computacao
>
>
>----------------------------------------------------------------
>Confidencialidade*: *A informação contida nesta mensagem de e-mail,
>incluindo quaisquer anexos, é confidencial e está reservada apenas à pessoa ou entidade para a qual foi endereçada. Se você não é o destinatário ou a pessoa responsável por encaminhar esta mensagem ao destinatário, você está, por meio desta, notificado que não deverá rever, retransmitir, imprimir, copiar, usar ou distribuir esta mensagem de e-mail ou quaisquer anexos. Caso você tenha recebido esta mensagem por engano, por favor, contate o remetente imediatamente e apague esta mensagem de seu computador ou de qualquer outro banco de dados. Muito obrigado.
>Confidentiality Notice: The information contained in this email message, including any attachment, is confidential and is intended only for the person or entity to which it is addressed. If you are neither the intended recipient nor the employee or agent responsible for delivering this message to the intended recipient, you are hereby notified that you may not review, retransmit, convert to hard copy, copy, use or distribute this email message or any attachments to it. If you have received this email in error, please contact the sender immediately and delete this message from any computer or other data bank. Thank you.
>
>--------
>
>_______________________________________________
>R-br mailing list
>R-br@listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/19fb4b33/attachment-0001.html>
------------------------------
Message: 3
Date: Tue, 13 Dec 2011 07:22:54 -0800 (PST)
From: Edson Lira <edinhoestat@yahoo.com.br>
To: R-br Lista <r-br@listas.c3sl.ufpr.br>
Subject: [R-br] Rotina order
Message-ID:
<1323789774.75434.YahooMailNeo@web160704.mail.bf1.yahoo.com>
Content-Type: text/plain; charset="iso-8859-1"
Bom dia a todos!
Com a rotina abaixo eu consigo ordenar a tabela.
inap<-table(tip_doa$INAPTIDAO,tip_doa$mês)
inap2 = inap[order(rowSums(inap), decreasing=TRUE),]
ftable(addmargins(inap2, c(1,2),
FUN=list(Total = sum)))
Que me dá a saida abaixo(as primeiras linhas)
jan fev mar abr mai jun jul ago set out nov Total
ESTEVE EM ZONA DE MALARIA 465 443 387 362 343 347 343 385 550 397 409 4431
HEMATOCRITO IRREGULAR 299 387 478 473 576 393 266 307 362 381 333 4255
VARIAÇÃO DE PARCEIRO SEM PRESERVATIVO (MAIS DE 4 EM 12 MESES) 249 329 240 152 100 183 150 86 110 124 106 1829
VARIAÇÃO DE PARCEIROS SEM PRESERVATIVO (MAIS DE 1 EM 6 MESES) 190 206 147 83 73 104 87 58 103 56 102 1209
VARIAÇÃO DE PARCEIROS SEXUAIS SEM PRESERVATIVO 0 0 20 106 238 135 109 138 134 142 160 1182
GRIPE 119 112 125 98 105 112 75 96 90 84 102 1118
Gostaria de acrescentar o ano e ordenar. Quando acrescento o ano me dá o seguinte problema.
> inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
número incorreto de dimensões
> inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
número incorreto de dimensões
> ftable(addmargins(inap2, c(1,2,3),
+ FUN=list(Total = sum)))
Erro em newdimnames[[margin]] : índice fora de limites
Qual o problema? Alguém pode me ajudar?
[]'s.
Edson Lira
Estatístico
Manaus-Amazonas
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/d6d0f94c/attachment-0001.html>
------------------------------
Message: 4
Date: Tue, 13 Dec 2011 07:43:37 -0800 (PST)
From: "Elias T. Krainski" <eliaskrainski@yahoo.com.br>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>, Edson Lira
<edinhoestat@yahoo.com.br>
Subject: Re: [R-br] Rotina order
Message-ID:
<1323791017.65689.YahooMailNeo@web114705.mail.gq1.yahoo.com>
Content-Type: text/plain; charset="iso-8859-1"
Com
inap <- table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
'inap' deixa de ter duas dimensões. Portanto, rowSums() é inadequado.
Elias T. Krainski
>________________________________
> De: Edson Lira <edinhoestat@yahoo.com.br>
>Para: R-br Lista <r-br@listas.c3sl.ufpr.br>
>Enviadas: Terça-feira, 13 de Dezembro de 2011 13:22
>Assunto: [R-br] Rotina order
>
>
>Bom dia a todos!
>
>Com a rotina abaixo eu consigo ordenar a tabela.
>
>inap<-table(tip_doa$INAPTIDAO,tip_doa$mês)
>inap2 = inap[order(rowSums(inap), decreasing=TRUE),]
>ftable(addmargins(inap2, c(1,2),
> FUN=list(Total = sum)))
>
>Que me dá a saida abaixo(as primeiras linhas)
>
> jan fev mar abr mai jun jul ago set out nov Total
>
>ESTEVE EM ZONA DE MALARIA 465 443 387 362 343 347 343 385 550 397 409 4431
>HEMATOCRITO IRREGULAR 299 387 478 473 576 393 266 307 362 381 333 4255
>VARIAÇÃO DE PARCEIRO SEM PRESERVATIVO (MAIS DE 4 EM 12 MESES) 249 329 240 152 100 183 150 86 110 124 106 1829
>VARIAÇÃO DE PARCEIROS SEM PRESERVATIVO (MAIS DE 1 EM 6 MESES) 190 206 147 83 73 104 87 58 103 56 102 1209
>VARIAÇÃO DE PARCEIROS SEXUAIS SEM PRESERVATIVO 0 0 20 106 238 135 109 138 134 142 160 1182
>GRIPE 119 112 125 98 105 112 75 96 90 84 102 1118
>
>Gostaria de acrescentar o ano e ordenar. Quando acrescento o ano me dá o seguinte problema.
>
>>
inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
>> inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
>Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
> número incorreto de dimensões
>> inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
>> inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
>Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
> número incorreto de dimensões
>> ftable(addmargins(inap2, c(1,2,3),
>+ FUN=list(Total = sum)))
>Erro em newdimnames[[margin]] : índice fora de limites
>
>Qual o problema? Alguém pode me ajudar?
>
> []'s.
>
>
>Edson Lira
>Estatístico
>Manaus-Amazonas
>_______________________________________________
>R-br mailing list
>R-br@listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/53dc517b/attachment-0001.html>
------------------------------
Message: 5
Date: Tue, 13 Dec 2011 08:00:29 -0800 (PST)
From: "Elias T. Krainski" <eliaskrainski@yahoo.com.br>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] MQM
Message-ID:
<1323792029.83765.YahooMailNeo@web114716.mail.gq1.yahoo.com>
Content-Type: text/plain; charset="iso-8859-1"
Se em
A b = x
A tem dimensão 3x3, então vc quer encontrar 6 valore. Para isso, vc tem 3 valores em b e 3 valores em x. Isso é possível? No usual, quando vc quer saber os 3 valores de b e conhece A e x, vc tem bem mais valores conhecidos que desconhecidos.
### Exemplo
### considerando o contexto de LM
n <- 5
X <- cbind(1, runif(5))
b <- c(10, 5)
y <- rnorm(n, X%*%b, 0.5)
### estima b
(XX <- crossprod(X))
(Xy <- crossprod(X, y))
(bhat <- solve(XX, Xy))
### com bhat e Xy podemos obter XX?
### considere que
### XX %*% bhat = Xy
### para compatibilidade de operações seja
### XX %*% (bhat %*% bhat') = Xy %*% bhat'
require(Matrix)
bb <- forceSymmetric(tcrossprod(bhat))
solve(bb, tcrossprod(Xy, bhat)) ## nao é igual a XX
pode ser que este 'sistema' possua mais de uma solução...
Att.
Elias T. Krainski
>________________________________
> De: FHRB Toledo <fernandohtoledo@gmail.com>
>Para: R-Br <r-br@listas.c3sl.ufpr.br>
>Enviadas: Domingo, 11 de Dezembro de 2011 12:07
>Assunto: [R-br] MQM
>
>
>Senhores,
>
>Tenho uma dúvida que não necessáriamente se relaciona com o programa, mas que em muito tem a ver com teoria estatística e algebra de matrizes, espero que aqui ache pelo menos uma sugestão para a resposta ou uma recomendação de literatura.
>
>O problema é dado o sistema de equações na forma matricial: Xb = y, pelo MQM, dada a matriz X e o vetor y, obtenho o vetor de soluções por X^-1y, respeitando todas as pressuposições.
>
>Se caso conheço ao invés de X e y, conheço os vetores b e y, existe alguma forma de conhecer a matriz X, podendo apenas assegurar que ela é uma matriz quadrada simétrica e positiva definida?
>
>att,
>FH
>
>_______________________________________________
>R-br mailing list
>R-br@listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/018859e7/attachment-0001.html>
------------------------------
Message: 6
Date: Tue, 13 Dec 2011 08:06:38 -0800 (PST)
From: "Elias T. Krainski" <eliaskrainski@yahoo.com.br>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] Modificar valores de dataframe com base em outro
dataframe
Message-ID:
<1323792398.50539.YahooMailNeo@web114717.mail.gq1.yahoo.com>
Content-Type: text/plain; charset="iso-8859-1"
d1 <- data.frame(snp1=c("A","A","A","A","T"), snp2=c("A","G","G","A","G"),
snp3=c("C","T","C","C","T"), snp4=c("T","G","G","T","T"))
d2 <- data.frame(snp=paste("snp",1:4,sep=""), anc=c("A","G","C","T"))
sapply(1:ncol(d1), function(i) 1-(as.character(d1[,i])==as.character(d2[i,2])))
Elias T. Krainski
>________________________________
> De: João José de Simoni Gouveia <joao.gouveia@univasf.edu.br>
>Para: r-br@listas.c3sl.ufpr.br
>Enviadas: Sábado, 10 de Dezembro de 2011 22:21
>Assunto: [R-br] Modificar valores de dataframe com base em outro dataframe
>
>Prezados,
>
>Possuo dois dataframes (nomeados aqui de 1 e 2). Preciso modificar os valores do dataframe1 com base no dataframe2.
>Mais precisamente:
>Se os valores da coluna snp1 (dataframe1) forem iguais ao valor da linha snp1 (dataframe2), preciso converter estes valores para 0 (zero), caso contrário o valor deve ser convertido para 1 (um).
>Alguém tem alguma dica?
>Att
>JJ
>Abaixo uma ilustração do que eu tenho
>DataFrame 1 -->
> snp1 snp2 snp3 snp4
>1 A A C T
>2 A G T G
>3 A G C G
>4 A A C T
>5 T G T T
>
>DataFrame 2 -->
> snp anc
>1 snp1 A
>2 snp2 G
>3 snp3 C
>4 snp4 T
>
>E o que eu preciso ter:
>Dataframe final -->
> snp1 snp2 snp3 snp4
>1 0 1 0 0
>2 0 0 1 1
>3 0 0 0 1
>4 0 1 0 0
>5 1 0 1 0
>
>--
>============================================
>João José de Simoni Gouveia
>Médico Veterinário, Msc.
>Doutorando em Zootecnia - PDIZ (UFC/UFPB/UFRPE)
>Professor Assistente I - Colegiado Acadêmico de Zootecnia
>Universidade Federal do Vale do São Francisco (UNIVASF)
>----------------------------------------------------------------------------------------
>Endereço: UNIVASF (Campus Ciências Agrárias)
>Rodovia BR 407, Km 12, Lote 543
>Projeto de Irrigação Senador Nilo Coelho, s/nº-C1
>Petrolina, PE - CEP 56.300-000
>Telefone: (87)3986-3800/3804-3801
>Skype: joao_jose_de_simoni_gouveia
>E-mail alternativo: jjsgouveia@gmail.com
>============================================
>_______________________________________________
>R-br mailing list
>R-br@listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/7ca47fe5/attachment-0001.html>
------------------------------
Message: 7
Date: Tue, 13 Dec 2011 09:54:57 -0800 (PST)
From: Edson Lira <edinhoestat@yahoo.com.br>
To: R-br Lista <r-br@listas.c3sl.ufpr.br>
Subject: [R-br] Categorização de variáveis
Message-ID:
<1323798897.47220.YahooMailNeo@web160703.mail.bf1.yahoo.com>
Content-Type: text/plain; charset="iso-8859-1"
Boa tarde, caros r-istas, estou com alguns probleminhas na categorização de variáveis.
Tenho este banco.
pad pas sexo pg
155 134 83 feminino 15
156 72 99 feminino 30
157 82 151 feminino 10
158 23 70 feminino 20
159 75 128 masculino 13
160 73 125 feminino 05
161 125 80 masculino 08
162 65 110 feminino 10
163 132 92 masculino 13
164 114 68 masculino 11
165 83 153 feminino 26
166 166 107 masculino 22
167 114 76 feminino 03
Preciso classificar da seguinte forma:
se pad<85 e pas<130 é normal
se 85<pad<89 e 130<pas<139 Normal limítrofe
e assim por diante.
a outra classificação é a seguinte:
Para homens o percentual de gordura
entre 15 e 20 é normal
entre 20 e 25 levemente obeso
entre 25 e 30 excessivamente obeso
entre 10 e 14 gordura ideal
3 gordura essencial
Para homens o percentual de gordura
entre 25 e 30 é normal
entre 30 e 35 levemente obeso
entre 35 e 40 excessivamente obeso
entre 14 e 18 gordura ideal
12 gordura essencial
Como fazer estaS categorizações?
[]'s.
Edson Lira
Estatístico
Manaus-Amazonas
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/ddf3f837/attachment-0001.html>
------------------------------
Message: 8
Date: Tue, 13 Dec 2011 15:58:43 -0200
From: Luis Iván Ortiz Valencia <liov2067@gmail.com>
To: r-br@listas.c3sl.ufpr.br, Edson Lira <edinhoestat@yahoo.com.br>
Subject: Re: [R-br] Categorização de variáveis
Message-ID:
<CAJ+S-MHuH4RMQ35u092HTUwcCfMP3nqkR+WdzyouauFD9Yhhng@mail.gmail.com>
Content-Type: text/plain; charset="iso-8859-1"
cut()
Em 13 de dezembro de 2011 15:54, Edson Lira <edinhoestat@yahoo.com.br>escreveu:
> Boa tarde, caros r-istas, estou com alguns probleminhas na categorização
> de variáveis.
>
> Tenho este banco.
> pad pas sexo pg
> 155 134 83 feminino 15
> 156 72 99 feminino 30
> 157 82 151 feminino 10
> 158 23 70 feminino 20
> 159 75 128 masculino 13
> 160 73 125 feminino 05
> 161 125 80 masculino 08
> 162 65 110 feminino 10
> 163 132 92 masculino 13
> 164 114 68 masculino 11
> 165 83 153 feminino 26
> 166 166 107 masculino 22
> 167 114 76 feminino 03
>
>
> Preciso classificar da seguinte forma:
> se pad<85 e pas<130 é normal
> se 85<pad<89 e 130<pas<139 Normal limítrofe
> e assim por diante.
>
>
> a outra classificação é a seguinte:
>
> Para homens o percentual de gordura
>
> entre 15 e 20 é normal
> entre 20 e 25 levemente obeso
> entre 25 e 30 excessivamente obeso
> entre 10 e 14 gordura ideal
> 3 gordura essencial
>
>
>
> Para homens o percentual de gordura
>
> entre 25 e 30 é normal
> entre 30 e 35 levemente obeso
> entre 35 e 40 excessivamente obeso
> entre 14 e 18 gordura ideal
> 12 gordura essencial
>
>
> Como fazer estaS categorizações?
>
> []'s.
>
> Edson Lira
> Estatístico
> Manaus-Amazonas
>
> _______________________________________________
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
Luis Iván Ortiz Valencia
Doutorando Saúde Pública - Epidemiologia, IESC, UFRJ
Estatístico Msc.
Spatial Analyst Msc.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/2702a502/attachment-0001.html>
------------------------------
Message: 9
Date: Tue, 13 Dec 2011 15:14:02 -0300
From: Cesar Rabak <cesar.rabak@gmail.com>
To: r-br@listas.c3sl.ufpr.br
Subject: Re: [R-br] Categorização de variáveis
Message-ID: <4EE795EA.6090407@gmail.com>
Content-Type: text/plain; charset=ISO-8859-1; format=flowed
Edson,
Use o pacote car e a função recode.
Em 13/12/2011 14:54, Edson Lira escreveu:
> Boa tarde, caros r-istas, estou com alguns probleminhas na categorização
> de variáveis.
>
> Tenho este banco.
> pad pas sexo pg
> 155 134 83 feminino 15
> 156 72 99 feminino 30
> 157 82 151 feminino 10
> 158 23 70 feminino 20
> 159 75 128 masculino 13
> 160 73 125 feminino 05
> 161 125 80 masculino 08
> 162 65 110 feminino 10
> 163 132 92 masculino 13
> 164 114 68 masculino 11
> 165 83 153 feminino 26
> 166 166 107 masculino 22
> 167 114 76 feminino 03
>
>
> Preciso classificar da seguinte forma:
> se pad<85 e pas<130 é normal
> se 85<pad<89 e 130<pas<139 Normal limítrofe
> e assim por diante.
>
>
> a outra classificação é a seguinte:
>
> Para homens o percentual de gordura
>
> entre 15 e 20 é normal
> entre 20 e 25 levemente obeso
> entre 25 e 30 excessivamente obeso
> entre 10 e 14 gordura ideal
> 3 gordura essencial
>
>
>
> Para homens o percentual de gordura
>
> entre 25 e 30 é normal
> entre 30 e 35 levemente obeso
> entre 35 e 40 excessivamente obeso
> entre 14 e 18 gordura ideal
> 12 gordura essencial
>
>
> Como fazer estaS categorizações?
>
> []'s.
>
> Edson Lira
> Estatístico
> Manaus-Amazonas
>
>
> _______________________________________________
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Cesar Rabak
GNU/Linux User 52247.
Get counted: http://counter.li.org/
------------------------------
Message: 10
Date: Tue, 13 Dec 2011 10:22:32 -0800 (PST)
From: "Elias T. Krainski" <eliaskrainski@yahoo.com.br>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>
Subject: Re: [R-br] Categorização de variáveis
Message-ID:
<1323800552.38193.YahooMailNeo@web114707.mail.gq1.yahoo.com>
Content-Type: text/plain; charset=iso-8859-1
se vc enviasse um CMR seria mais fácil... veja este exemplo
n <- 10
x1 <- rnorm(n)
### classificação considerando apenas uma variavel
f1 <- factor(findInterval(x1, c(-Inf, -0.5, 0.5, Inf), labels=c("Ruim", "Médio", "Bom"))
quando vc tem:
se pad<85 e pas<130 é normal
>se 85<pad<89 e 130<pas<139 Normal limítrofe
o que deve ser se pad<85 mas pas>130 por exemplo?
Att.
Elias T. Krainski
>________________________________
> De: Edson Lira <edinhoestat@yahoo.com.br>
>Para: R-br Lista <r-br@listas.c3sl.ufpr.br>
>Enviadas: Terça-feira, 13 de Dezembro de 2011 15:54
>Assunto: [R-br] Categorização de variáveis
>
>
>Boa tarde, caros r-istas, estou com alguns probleminhas na categorização de variáveis.
>
>
>Tenho este banco.
> pad pas sexo pg
>155 134 83 feminino 15
>156 72 99 feminino 30
>157 82 151 feminino 10
>158 23 70 feminino 20
>159 75 128 masculino 13
>160 73 125 feminino 05
>161 125 80 masculino 08
>162 65 110 feminino 10
>163 132 92 masculino 13
>164 114 68 masculino 11
>165 83 153 feminino 26
>166 166 107 masculino 22
>167 114 76 feminino 03
>
>
>
>
>Preciso classificar da seguinte forma:
>se pad<85 e pas<130 é normal
>se 85<pad<89 e 130<pas<139 Normal limítrofe
>e assim por diante.
>
>
>
>
>a outra classificação é a seguinte:
>
>
>Para homens o percentual de gordura
>
>
>entre 15 e 20 é normal
>
>entre 20 e 25 levemente obeso
>entre 25 e 30 excessivamente obeso
>entre 10 e 14 gordura ideal
> 3 gordura essencial
>
>
>
>
>
>
>
>Para homens o percentual de gordura
>
>
>entre 25 e 30 é normal
>
>entre 30 e 35 levemente obeso
>entre 35 e 40 excessivamente obeso
>entre 14 e 18 gordura ideal
> 12 gordura essencial
>
>
>
>
>
>Como fazer estaS categorizações?
>
>
>[]'s.
>
>
>Edson Lira
>Estatístico
>Manaus-Amazonas
>_______________________________________________
>R-br mailing list
>R-br@listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
------------------------------
Message: 11
Date: Tue, 13 Dec 2011 15:37:02 -0400
From: Edson Lira <edinhoestat@yahoo.com.br>
To: "r-br@listas.c3sl.ufpr.br" <r-br@listas.c3sl.ufpr.br>, "Elias T.
Krainski" <eliaskrainski@yahoo.com.br>
Subject: Re: [R-br] Categorização de variáveis
Message-ID: <63652F35-F09C-4C24-8D38-0F462C8DBBF2@yahoo.com.br>
Content-Type: text/plain; charset=utf-8
O problema é que você tem duas variáveis, pas é pressão sistólica
e pad é pressão diastólica. Se pas é menor que 130 e pad é menor que 180 o paciente é considerado normal e assim por diante.
[].s
Edson Lira
Estatístico
Ma-Am
Em 13/12/2011, às 14:22, "Elias T. Krainski" <eliaskrainski@yahoo.com.br> escreveu:
>
>
> se vc enviasse um CMR seria mais fácil... veja este exemplo
>
> n <- 10
> x1 <- rnorm(n)
>
> ### classificação considerando apenas uma variavel
> f1 <- factor(findInterval(x1, c(-Inf, -0.5, 0.5, Inf), labels=c("Ruim", "Médio", "Bom"))
>
> quando vc tem:
>
> se pad<85 e pas<130 é normal
> >se 85<pad<89 e 130<pas<139 Normal limítrofe
> o que deve ser se pad<85 mas pas>130 por exemplo?
>
> Att.
> Elias T. Krainski
>
>
>
>> ________________________________
>> De: Edson Lira <edinhoestat@yahoo.com.br>
>> Para: R-br Lista <r-br@listas.c3sl.ufpr.br>
>> Enviadas: Terça-feira, 13 de Dezembro de 2011 15:54
>> Assunto: [R-br] Categorização de variáveis
>>
>>
>> Boa tarde, caros r-istas, estou com alguns probleminhas na categorização de variáveis.
>>
>>
>> Tenho este banco.
>> pad pas sexo pg
>> 155 134 83 feminino 15
>> 156 72 99 feminino 30
>> 157 82 151 feminino 10
>> 158 23 70 feminino 20
>> 159 75 128 masculino 13
>> 160 73 125 feminino 05
>> 161 125 80 masculino 08
>> 162 65 110 feminino 10
>> 163 132 92 masculino 13
>> 164 114 68 masculino 11
>> 165 83 153 feminino 26
>> 166 166 107 masculino 22
>> 167 114 76 feminino 03
>>
>>
>>
>>
>> Preciso classificar da seguinte forma:
>> se pad<85 e pas<130 é normal
>> se 85<pad<89 e 130<pas<139 Normal limítrofe
>> e assim por diante.
>>
>>
>>
>>
>> a outra classificação é a seguinte:
>>
>>
>> Para homens o percentual de gordura
>>
>>
>> entre 15 e 20 é normal
>>
>> entre 20 e 25 levemente obeso
>> entre 25 e 30 excessivamente obeso
>> entre 10 e 14 gordura ideal
>> 3 gordura essencial
>>
>>
>>
>>
>>
>>
>>
>> Para homens o percentual de gordura
>>
>>
>> entre 25 e 30 é normal
>>
>> entre 30 e 35 levemente obeso
>> entre 35 e 40 excessivamente obeso
>> entre 14 e 18 gordura ideal
>> 12 gordura essencial
>>
>>
>>
>>
>>
>> Como fazer estaS categorizações?
>>
>>
>> []'s.
>>
>>
>> Edson Lira
>> Estatístico
>> Manaus-Amazonas
>> _______________________________________________
>> R-br mailing list
>> R-br@listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>>
>>
> _______________________________________________
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
------------------------------
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Fim da Digest R-br, volume 10, assunto 19
*****************************************