Função para comparar acessos. Dados binários. RAPD.

Caros companheiros da Lista R, # Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e 101 marcadores RAPD (1=presença da marca; 0=ausência da marca; NA=dado perdido); portanto os dados são binários. # Preciso de uma função que me retorne a probabilidade (p-value) do acesso A1 ser semelhante ao acesso A2. A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","0") A2=c("1","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1") Agradeço a boa-vontade de quem puder ajudar. Abraços, Luiz Roberto. Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831

Luiz Roberto, como estou sem R ao alcance vou fornecer uma solução aproximada. Em primeiro lugar, você vai querer transformar esses vetores de texto em vetores de números inteiros, utilizando a função as.integer()[1]. Quanto à comparação dos vetores propriamente dita, a solução mais simples é com a função prop.test()[2]. Utilize sum(x, na.rm = TRUE)[3] para calcular o número de sucessos em cada vetor, e length[4](na.omit(x)) ou length(x[!is.na(x)]) para calcular o número de tentativas em cada vetor. Então utilize a função prop.test, informando como primeiro argumento c(sucessosA1, sucessosA2) e segundo argumento c(tentativasA1, tentativasA2). Leonardo Ferreira Fontenelle[5] Em Qua 19 ago. 2015, às 14:46, Luiz Roberto Martins Pinto escreveu:
Caros companheiros da Lista R,
# Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e 101 # marcadores RAPD (1=presença da marca; 0=ausência da marca; NA=dado # perdido); portanto os dados são binários.
# Preciso de uma função que me retorne a probabilidade (p-value) do # acesso A1 ser semelhante ao acesso A2.
A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","- 1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1- ","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1"- ,"1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1- ","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0"- ,"0","1","1","1","1","1","1","0","1","1","1","1","1","1","0") A2=c("1- ","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0"- ,"1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1",- "1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA- ,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","- 1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1",- "1","1","1","0","1","1","1","1","1","1","1")
Agradeço a boa-vontade de quem puder ajudar.
Abraços,
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
_________________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Links: 1. https://stat.ethz.ch/R-manual/R-devel/library/base/html/integer.html 2. https://stat.ethz.ch/R-manual/R-devel/library/stats/html/prop.test.html 3. https://stat.ethz.ch/R-manual/R-devel/library/base/html/sum.html 4. https://stat.ethz.ch/R-manual/R-devel/library/base/html/length.html 5. http://lattes.cnpq.br/9234772336296638

Leonardo, Agradeço a sugestão. Mas é possível que as proporções sejam as mesmas entre dois acessos diferentes, se os marcadores estiverem em posições diferentes. Luiz Roberto. Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831 Em 19 de agosto de 2015 15:07, Leonardo Ferreira Fontenelle < leonardof@leonardof.med.br> escreveu:
Luiz Roberto, como estou sem R ao alcance vou fornecer uma solução aproximada.
Em primeiro lugar, você vai querer transformar esses vetores de texto em vetores de números inteiros, utilizando a função as.integer() <https://stat.ethz.ch/R-manual/R-devel/library/base/html/integer.html>. Quanto à comparação dos vetores propriamente dita, a solução mais simples é com a função prop.test() <https://stat.ethz.ch/R-manual/R-devel/library/stats/html/prop.test.html>. Utilize sum(x, na.rm = TRUE) <https://stat.ethz.ch/R-manual/R-devel/library/base/html/sum.html> para calcular o número de sucessos em cada vetor, e length <https://stat.ethz.ch/R-manual/R-devel/library/base/html/length.html>(na.omit(x)) ou length(x[!is.na(x)]) para calcular o número de tentativas em cada vetor. Então utilize a função prop.test, informando como primeiro argumento c(sucessosA1, sucessosA2) e segundo argumento c(tentativasA1, tentativasA2).
Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
Em Qua 19 ago. 2015, às 14:46, Luiz Roberto Martins Pinto escreveu:
Caros companheiros da Lista R,
# Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e 101 marcadores RAPD (1=presença da marca; 0=ausência da marca; NA=dado perdido); portanto os dados são binários.
# Preciso de uma função que me retorne a probabilidade (p-value) do acesso A1 ser semelhante ao acesso A2.
A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","0")
A2=c("1","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1")
Agradeço a boa-vontade de quem puder ajudar.
Abraços,
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
*_______________________________________________* R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Luiz Roberto, Frente a sua resposta para o Leonardo, é imperioso propor-lhe a questão: Qual seria a definição de semelhança entre os dois acessos? Com essa informação podemos tentar encontrar um teste estatístico com mais potência para a comparação... HTH -- Cesar Rabak 2015-08-19 16:10 GMT-03:00 Luiz Roberto Martins Pinto < luizroberto.uesc@gmail.com>:
Leonardo,
Agradeço a sugestão. Mas é possível que as proporções sejam as mesmas entre dois acessos diferentes, se os marcadores estiverem em posições diferentes.
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 15:07, Leonardo Ferreira Fontenelle < leonardof@leonardof.med.br> escreveu:
Luiz Roberto, como estou sem R ao alcance vou fornecer uma solução aproximada.
Em primeiro lugar, você vai querer transformar esses vetores de texto em vetores de números inteiros, utilizando a função as.integer() <https://stat.ethz.ch/R-manual/R-devel/library/base/html/integer.html>. Quanto à comparação dos vetores propriamente dita, a solução mais simples é com a função prop.test() <https://stat.ethz.ch/R-manual/R-devel/library/stats/html/prop.test.html>. Utilize sum(x, na.rm = TRUE) <https://stat.ethz.ch/R-manual/R-devel/library/base/html/sum.html> para calcular o número de sucessos em cada vetor, e length <https://stat.ethz.ch/R-manual/R-devel/library/base/html/length.html>(na.omit(x)) ou length(x[!is.na(x)]) para calcular o número de tentativas em cada vetor. Então utilize a função prop.test, informando como primeiro argumento c(sucessosA1, sucessosA2) e segundo argumento c(tentativasA1, tentativasA2).
Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
Em Qua 19 ago. 2015, às 14:46, Luiz Roberto Martins Pinto escreveu:
Caros companheiros da Lista R,
# Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e 101 marcadores RAPD (1=presença da marca; 0=ausência da marca; NA=dado perdido); portanto os dados são binários.
# Preciso de uma função que me retorne a probabilidade (p-value) do acesso A1 ser semelhante ao acesso A2.
A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","0")
A2=c("1","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1")
Agradeço a boa-vontade de quem puder ajudar.
Abraços,
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
*_______________________________________________* R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Semelhança no perfil. O perfil de cada acesso é descrito por 101 marcadores moleculares. Pensando, agora, na sugestão do Leonardo, e pensando no seu questionamento, talvez avaliar a proporção de marcadores iguais fosse uma boa análise deste perfil. Não tinha pensado nisto... Luiz Roberto. Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831 Em 19 de agosto de 2015 18:36, Cesar Rabak <cesar.rabak@gmail.com> escreveu:
Luiz Roberto,
Frente a sua resposta para o Leonardo, é imperioso propor-lhe a questão:
Qual seria a definição de semelhança entre os dois acessos?
Com essa informação podemos tentar encontrar um teste estatístico com mais potência para a comparação...
HTH -- Cesar Rabak
2015-08-19 16:10 GMT-03:00 Luiz Roberto Martins Pinto < luizroberto.uesc@gmail.com>:
Leonardo,
Agradeço a sugestão. Mas é possível que as proporções sejam as mesmas entre dois acessos diferentes, se os marcadores estiverem em posições diferentes.
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 15:07, Leonardo Ferreira Fontenelle < leonardof@leonardof.med.br> escreveu:
Luiz Roberto, como estou sem R ao alcance vou fornecer uma solução aproximada.
Em primeiro lugar, você vai querer transformar esses vetores de texto em vetores de números inteiros, utilizando a função as.integer() <https://stat.ethz.ch/R-manual/R-devel/library/base/html/integer.html>. Quanto à comparação dos vetores propriamente dita, a solução mais simples é com a função prop.test() <https://stat.ethz.ch/R-manual/R-devel/library/stats/html/prop.test.html>. Utilize sum(x, na.rm = TRUE) <https://stat.ethz.ch/R-manual/R-devel/library/base/html/sum.html> para calcular o número de sucessos em cada vetor, e length <https://stat.ethz.ch/R-manual/R-devel/library/base/html/length.html>(na.omit(x)) ou length(x[!is.na(x)]) para calcular o número de tentativas em cada vetor. Então utilize a função prop.test, informando como primeiro argumento c(sucessosA1, sucessosA2) e segundo argumento c(tentativasA1, tentativasA2).
Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
Em Qua 19 ago. 2015, às 14:46, Luiz Roberto Martins Pinto escreveu:
Caros companheiros da Lista R,
# Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e 101 marcadores RAPD (1=presença da marca; 0=ausência da marca; NA=dado perdido); portanto os dados são binários.
# Preciso de uma função que me retorne a probabilidade (p-value) do acesso A1 ser semelhante ao acesso A2.
A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","0")
A2=c("1","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1")
Agradeço a boa-vontade de quem puder ajudar.
Abraços,
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
*_______________________________________________* R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Eu recorri à função que o Leonardo sugeriu... e rodei.. # Sugestão do Leonardo: A1= as.integer(c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","0")) A2= as.integer(c("1","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1")) sucA1=sum(A1, na.rm = TRUE) sucA2=sum(A2, na.rm = TRUE) tenA1=length(na.omit(A1)) tenA2=length(na.omit(A2)) prop.test(c(sucA1,sucA2),c(tenA1,tenA2)). # De acordo com a função: smokers <- c( 83, 90, 129, 70 ) patients <- c( 86, 93, 136, 82 ) prop.test(smokers, patients) # Então, semelhantemente, rodei: prop.test(A1, A2) # Output: Erro em prop.test(A1, A2) : elements of 'n' must be positive. Comentário: acredito que a função não admite dados perdidos 'NA'. É isto mesmo? Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831 Em 19 de agosto de 2015 18:57, Luiz Roberto Martins Pinto < luizroberto.uesc@gmail.com> escreveu:
Semelhança no perfil.
O perfil de cada acesso é descrito por 101 marcadores moleculares.
Pensando, agora, na sugestão do Leonardo, e pensando no seu questionamento, talvez avaliar a proporção de marcadores iguais fosse uma boa análise deste perfil. Não tinha pensado nisto...
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 18:36, Cesar Rabak <cesar.rabak@gmail.com> escreveu:
Luiz Roberto,
Frente a sua resposta para o Leonardo, é imperioso propor-lhe a questão:
Qual seria a definição de semelhança entre os dois acessos?
Com essa informação podemos tentar encontrar um teste estatístico com mais potência para a comparação...
HTH -- Cesar Rabak
2015-08-19 16:10 GMT-03:00 Luiz Roberto Martins Pinto < luizroberto.uesc@gmail.com>:
Leonardo,
Agradeço a sugestão. Mas é possível que as proporções sejam as mesmas entre dois acessos diferentes, se os marcadores estiverem em posições diferentes.
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 15:07, Leonardo Ferreira Fontenelle < leonardof@leonardof.med.br> escreveu:
Luiz Roberto, como estou sem R ao alcance vou fornecer uma solução aproximada.
Em primeiro lugar, você vai querer transformar esses vetores de texto em vetores de números inteiros, utilizando a função as.integer() <https://stat.ethz.ch/R-manual/R-devel/library/base/html/integer.html>. Quanto à comparação dos vetores propriamente dita, a solução mais simples é com a função prop.test() <https://stat.ethz.ch/R-manual/R-devel/library/stats/html/prop.test.html>. Utilize sum(x, na.rm = TRUE) <https://stat.ethz.ch/R-manual/R-devel/library/base/html/sum.html> para calcular o número de sucessos em cada vetor, e length <https://stat.ethz.ch/R-manual/R-devel/library/base/html/length.html>(na.omit(x)) ou length(x[!is.na(x)]) para calcular o número de tentativas em cada vetor. Então utilize a função prop.test, informando como primeiro argumento c(sucessosA1, sucessosA2) e segundo argumento c(tentativasA1, tentativasA2).
Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
Em Qua 19 ago. 2015, às 14:46, Luiz Roberto Martins Pinto escreveu:
Caros companheiros da Lista R,
# Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e 101 marcadores RAPD (1=presença da marca; 0=ausência da marca; NA=dado perdido); portanto os dados são binários.
# Preciso de uma função que me retorne a probabilidade (p-value) do acesso A1 ser semelhante ao acesso A2.
A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","0")
A2=c("1","1","1","0","1","0","1","1","0","1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1")
Agradeço a boa-vontade de quem puder ajudar.
Abraços,
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
*_______________________________________________* R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Luiz Roberto, O que o exemplo está medindo é se a proporção de fumantes é diferente entre os quatro grupos; "pacientes" é o denominador e "fumantes" é o numerador. O exemplo não está comparando uma terceira característica entre dois grupos diferentes. Por isso a função não aceita valores faltantes: é impossível calcular a proporção de um grupo quando seu numerador ou denominador está faltando. Att, Leonardo Ferreira Fontenelle[1] Em Qua 19 ago. 2015, às 19:17, Luiz Roberto Martins Pinto escreveu:
Eu recorri à função que o Leonardo sugeriu... e rodei..
# Sugestão do Leonardo:
A1= as.integer(c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","- 1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0- ","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1","1"- ,"1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1","1","0- ","0","1","1","1","1","0","1","0","1","0","0","1","1","1","1","1","1"- ,"1","1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1",- "0")) A2= as.integer(c("1","1","1","0","1","0","1","1","0","1","1","0- ","1","1","1","1","1","0","1","1","1","1","1","1","1","1","1","1","1"- ,"1","0","0","1","1","1","1","1","1","1","0","1","1","1","1","1","1",- "1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1","0","1","1","1","1","0",- "0","1","1","1","1","0","1","0","1",NA,NA,"1","1","1","1","1","1","1"- ,"1","0","0","1","1","1","1","1","1","0","1","1","1","1","1","1","1"))
sucA1=sum(A1, na.rm = TRUE) sucA2=sum(A2, na.rm = TRUE) tenA1=length(na.omit(A1)) tenA2=length(na.omit(A2)) prop.test(c(sucA1,sucA2),c(tenA1,tenA2)).
# De acordo com a função:
smokers <- c( 83, 90, 129, 70 ) patients <- c( 86, 93, 136, 82 ) prop.test(smokers, patients)
# Então, semelhantemente, rodei:
prop.test(A1, A2)
# Output:
Erro em prop.test(A1, A2) : elements of 'n' must be positive.
Comentário: acredito que a função não admite dados perdidos 'NA'.
É isto mesmo?
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 18:57, Luiz Roberto Martins Pinto <luizroberto.uesc@gmail.com> escreveu:
Semelhança no perfil.
O perfil de cada acesso é descrito por 101 marcadores moleculares.
Pensando, agora, na sugestão do Leonardo, e pensando no seu questionamento, talvez avaliar a proporção de marcadores iguais fosse uma boa análise deste perfil. Não tinha pensado nisto...
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia-Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 18:36, Cesar Rabak <cesar.rabak@gmail.com> escreveu:
Luiz Roberto,
Frente a sua resposta para o Leonardo, é imperioso propor-lhe a questão:
Qual seria a definição de semelhança entre os dois acessos?
Com essa informação podemos tentar encontrar um teste estatístico com mais potência para a comparação...
HTH -- Cesar Rabak
2015-08-19 16:10 GMT-03:00 Luiz Roberto Martins Pinto <luizroberto.uesc@gmail.com>:
Leonardo,
Agradeço a sugestão. Mas é possível que as proporções sejam as mesmas entre dois acessos diferentes, se os marcadores estiverem em posições diferentes.
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia- Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
Em 19 de agosto de 2015 15:07, Leonardo Ferreira Fontenelle <leonardof@leonardof.med.br> escreveu:
__ Luiz Roberto, como estou sem R ao alcance vou fornecer uma solução aproximada.
Em primeiro lugar, você vai querer transformar esses vetores de texto em vetores de números inteiros, utilizando a função as.integer()[2]. Quanto à comparação dos vetores propriamente dita, a solução mais simples é com a função prop.test()[3]. Utilize sum(x, na.rm = TRUE)[4] para calcular o número de sucessos em cada vetor, e length[5](na.omit(x)) ou length(x[!is.na(x)]) para calcular o número de tentativas em cada vetor. Então utilize a função prop.test, informando como primeiro argumento c(sucessosA1, sucessosA2) e segundo argumento c(tentativasA1, tentativasA2).
Leonardo Ferreira Fontenelle[6]
Em Qua 19 ago. 2015, às 14:46, Luiz Roberto Martins Pinto escreveu:
Caros companheiros da Lista R,
# Os dados abaixo referem-se a 2 acessos de mandioca (A1 e A2), e # 101 marcadores RAPD (1=presença da marca; 0=ausência da marca; # NA=dado perdido); portanto os dados são binários.
# Preciso de uma função que me retorne a probabilidade (p-value) # do acesso A1 ser semelhante ao acesso A2.
A1=c("1",NA,"1","0","1","0","1","1","0","1","1","0","1","1","1",- "1","1","0","1","1","1","1","1","1","1","1","1","1","1","1","0",- "0","1","1","1","1","1","1","1","0","1","1","1","1","1","1","1",- "1","1","1","1","1",NA,"1",NA,"0","1","0","0","1","1","1","1","1- ","1","0","0","1","1","1","1","0","1","0","1","0","0","1","1","1- ","1","1","1","1","1","0","0","1","1","1","1","1","1","0","1","1- ","1","1","1","1","0") A2=c("1","1","1","0","1","0","1","1","0",- "1","1","0","1","1","1","1","1","0","1","1","1","1","1","1","1",- "1","1","1","1","1","0","0","1","1","1","1","1","1","1","0","1",- "1","1","1","1","1","1","1",NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,"1"- ,"0","1","1","1","1","0","0","1","1","1","1","0","1","0","1",NA,- NA,"1","1","1","1","1","1","1","1","0","0","1","1","1","1","1","- 1","0","1","1","1","1","1","1","1")
Agradeço a boa-vontade de quem puder ajudar.
Abraços,
Luiz Roberto.
Luiz Roberto Martins Pinto Prof. Pleno/DCET/UESC Laboratório de Estatística Computacional Universidade Estadual de Santa Cruz Ilhéus-Bahia- Brasil
luizroberto.uesc@gmail.com skype: lrmpinto http://lattes.cnpq.br/2732314327604831
_________________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Links: 1. http://lattes.cnpq.br/9234772336296638 2. https://stat.ethz.ch/R-manual/R-devel/library/base/html/integer.html 3. https://stat.ethz.ch/R-manual/R-devel/library/stats/html/prop.test.html 4. https://stat.ethz.ch/R-manual/R-devel/library/base/html/sum.html 5. https://stat.ethz.ch/R-manual/R-devel/library/base/html/length.html 6. http://lattes.cnpq.br/9234772336296638
participantes (3)
-
Cesar Rabak
-
Leonardo Ferreira Fontenelle
-
Luiz Roberto Martins Pinto