Caros,
alguém sabe como faço para calcular o tamanho de uma amostra para um experimento com 3 tratamentos e um controle, rodados em paralelo, para um nível de significância de 5% e poder do teste de 80%?
A variável é uma proporção (taxa de usuários que se cadastraram num site). Eu sei calcular o tamanho da amostra para um teste de duas proporções, mas aqui eu quero testar quatro proporções e escolher a maior das quatro.
Eu tenho a proporção esperada de cada um dos tratamentos e controle (seja p1 o controle, e p2, p3 e p4 o tratamento, p1 = .2, p2= .22, p3=.24 e p4 = .3).
O caminho mais simples é calcular o tamanho da amostra para duas proporções, considerando p1 e p4 (maior e menor, sendo que o menor é também o controle). Mas parece que assim estou subestimando a variabilidade em p2 e p3 e a possibilidade de que eles sejam maiores que p4 e p1. Além disso, parece haver o problema de múltiplas comparações.
Li um pouco e eu poderia tentar a correção de Bonferroni para múltiplos experimentos, e calcular o tamanho da amostra para duas propoções com p1 e p4, e usar alhpa_novo = alpha/m, em que alpha é o nível de significância original (5%) e m é o número de tratamentos (4... ou seria 3?). Porém esse método não leva em conta os valores esperados de p2 e p3, apenas p1 e p4, e isso nåo parece certo.
Por fim, vale mebrar que o que quero é descobrir o melhor tratamento (conversão), e nåo testar se as propoções são iguais (eu já sei que não são exatamente iguais).
Eu fiz um script simulando para o meu caso particular vários tamanhos de amostra, e qual a probabilidade de eu escolher o melhor tratamento [ ou seja, prob(escolher p4| dados e que p4 é o melhor). Mas não estou seguro nem que meu script está certo e, mais do que isso, qual a relação entre o número de tratamtnos, e as diferenças esperadas no efeito de cada tratamento sobre o tamanho da amostra (no caso de duas propoções, é fåcil estabelecer quanto minha amostra aumenta pela diferença esperada entre p1 e p2, para um dado alpha e beta).
Se alguém tiver também referência na litertatura, já ajuda.
Obrigado.
Manoel
segue o script:
n.sim <-2000 # número de simulações
mat <- matrix( nrow=n.sim, ncol=4)
n.sample <- seq(500, 5500, by=1000) # tamanho de amostras para ver taxa de acerto para cada tamanho
## proporção de cada tratamento
## vou criar 10 combinações de proporção para 4 tratamentos
## a primeira todos os tratamentos têm a mesma proporção, igual a 20%
## me ajuda a ter uma base do resultado da simulação.
set.seed(2) # fixa a semente, para resultados serem reproduíveis
p1 <- c(.2, runif(9, .15, .3))
p2 <- c(.2, runif(9, .15, .3))
p3 <- c(.2, runif(9, .15, .3))
p4 <- c(.2, runif(9, .15, .3))
mat.p <- matrix(c(p1, p2, p3, p4), nrow=10, ncol=4, byrow=F)
# para armazenar qual é o melhor tratamento, entre 10 combinações de efeitos diferentes dos tratamentos
maior <- numeric()
# simulação
for ( i in 1:10) maior[i] <- which.max(mat.p[i,])
mat.true.max <- matrix(nrow=length(n.sample), ncol=10)
num.true.max <- 0
for (h in 1:6) {
for ( k in 1:10) {
for ( i in 1:n.sim) {
for ( j in 1:4) {
mat[i,j] <- sum(rbinom(n.sample[h], 1, mat.p[k,j]))
}
num.true.max <- num.true.max + as.numeric(which.max(mat[i,]) == maior[k])
}
mat.true.max[h,k] <- num.true.max/n.sim
num.true.max <- 0
}
}
# verifito taxa de acerto para cada um dos tamanhos da amostra. Acerto é escolher a maior proporção.
mat.true.max
Pessoal boa noite,seria de grande valia divulgar as próximas transmissões no grupo rbr.André Oliveira Souza. Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFESEm Sábado, 22 de Agosto de 2015 21:26, David Feitosa <contato@davidfeitosa.com> escreveu:
Eu tb achei muito boa.Sabia nem que o ShareLatex estava com integração com o R.Fico usando o knitr local no RStudio mesmo.Aqui em Fortaleza não há muitos usuários de R.Só conheço duas pessoas por aqui e uma delas sou eu. HahahaPython tem recebido mais destaque por aqui do que o R.Java ainda domina desenvolvimento e pesquisa na região.Atenciosamente,David F.Em 22 de agosto de 2015 17:45, Luis Benites Sánchez <lbenitesanchez@gmail.com> escreveu:Prezado Jobenil,Muito obrigado, temos ainda mais palestras no Meetup de usuários de R em São Paulo, ainda temos 13 palestras mais. Em todos os meetup (se os palestrantes concordam) teremos as filmações das reuniões e estarão disponíveis no canal de YouTube do Meetup.Não esqueçam de junstar-se ao Meetup de usuários de R em São Paulo em nosso site www.meetup.com/pt/useR-SP/ para que possa conhecer mais detalhes sobre as futuras reuniões que estão sendo realizadas no IME-USP (Auditório Jacy Monteiro e que são transmitidas ao vivo).A palestra do 4 e 18 de setembro que minha colega e esposa Rocío Maehara comentou em seu e-mail serão de 14 a 16 horas (sextas).Um abraçoLuis Benites SánchezOrganizador del Meetup de usuários de R em São Paulo2015-08-22 17:26 GMT-03:00 Jobenil - Gmail <pjobenil@gmail.com>:Prezados,Acabei de assistir à apresentação dos Professores Paulo, Walmes e Fernando. Parabéns pelo evento e aos organizadores do Meetup pela iniciativa.Este é uma grande oportunidade para quem trabalha isolado em alguns rincões do país a fora.AbraçosJobenil JúniorDe: R-br [mailto:r-br-bounces@listas.c3sl.ufpr.br] Em nome de Luiz Roberto Martins Pinto
Enviada em: sexta-feira, 21 de agosto de 2015 19:27
Para: r-br@listas.c3sl.ufpr.br
Assunto: Re: [R-br] (Transmissão ao vivo) Meetup R São Paulo Users Group (IME-USP) Sexta 21 de agosto do 2015Walmes,Agradeço o link.Tive dificuldades para acessar. E ainda não entendi o que aconteceu.Luiz Roberto.Luiz Roberto Martins Pinto
Prof. Pleno/DCET/UESCLaboratório de Estatística ComputacionalUniversidade Estadual de Santa CruzEm 21 de agosto de 2015 16:54, Walmes Zeviani <walmeszeviani@gmail.com> escreveu:Para os que não estiveram presentes, passaram por dificuldades ou querer rever, o vídeo também está disponível em https://www.youtube.com/watch?v=UgPX49gkby4. Caso interessar, o endereço memorizável do canal é http://www.leg.ufpr.br/youtube, e o perfil na Google+ é http://www.leg.ufpr.br/g+.À disposição.Walmes.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.--Luis B. SánchezPh.D CandidateDept. of Statistics-IME, University at São Paulo (USP)São Paulo, BRAZILSkype: lbenitesanchezTwitter: @lbenitesanchez
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível._______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.