Olá pessoal,
a pergunta é mais
teórica. Estou analisando o comportamento do sarampo
ao longo dos anos. Aqui, em 1999 foi criada a lei que
diz que as criancas devem ser vacinadas contra
sarampo, cachumba e rubéola em 2 doses de vacinas,
para a garantia de aproximadamente 99% de protecao
contra as doencas.
Mas a princípio,
parece que ao decorrer do tempo (analiso de 2001 a
2011) o numero de criancas com sarampo realmente
diminui, após essa campanha. Existem sim ainda
algumas, devido a varios fatores (pais nao querem
vacinar os filhos, as criancas só tomam 1 vacina...)
mas o numero de adultos que apresentam sarampo tem
aumentado, se comparado ao inicio da campanha. Por
exemplo, se olhar os dados de doentes no peridio de
2003-2005 e 2009-2011 os adultos infectados nesses
ultimos anos sao bem mais do que nos primeiros. (Na
verdade nas idades de 15-39 anos)
Entao a pincipio tenho
dados para os doentes ao longo dos anos e por idade,
algo como:
> dados2
Altersgruppe 2001 2002
2003 2004 2005
2006 2007 2008
2009 2010 2011
1 00-00 107 156
39 14
38 156
24 28
50
29 66
2 01-01 524 405
81 22
57 157
35 50
63 41 96
3 02-02 420 313
42 9
30 68
20 31
15 25 49
4 03-03 359 320
71 10
40 73
25 42
20 16 47
5 04-04 397 375
56 5
42
82 21 46
17
19 42
6 05-09 1594
1527 262 17
250 446 123
210 83 127
293
7 10-14 1034
803 112 8
136 515 116
217 72 179
340
8 15-19 786
356 48
11 56
375
68 139
74 133 218
9
20-24 376 147
26 2
37 135
39 44
55 64
126
10
25-29 175
85 12 8
31 110
32 41
49 45
99
11
30-39 168
124 14 6
45 122
49 46
51
67 124
12 40-49 49
29 11 8
13 39
11
13
17
28 70
13 50-59 17
7 3 2
3 19
3
6
3 4
8
14 60-69 9
3 0 1
3 8
0 1
0 3
3
15 70 1 3
0 0
0 3
0 0
2 0
3
A minha idéia entao é rodar umt este estatistico,
para a hipótese nula H0: a proporcao(?) ou o numero de
adultos doentes no periodo 2003-2005 nao se diferencia
significativamente dos doentes no periodo de
2009-2011.
Tudo bem, meu próximo passo entao foi agrupar os
dados, de talforma que tenho agora grupo de pessoas de
0 a 4 anos, 5 a 14 anos, 15 a 39 anos e acima de 40
anos. Para analisar por pediordos, simplesmente somei
os casos para os anos de 2003-2005 e 2009-2011. Ok,
agora tenho um numero por periodo e por grupo. Como
compara-los efetivamente? Pois do jeito que
retrabalhei os dados, nao consigo aplicar o teste T
para 2 populacoes, nao tenho como medir normalidade e
homocedasticidade. Na verdade, nao sei se o jeito que
formatei os dados para a análise está correta para
analisar a hipótese desejada.
Como vcs fariam?
Abracos,
--
Daniela Rodrigues Recchia
Master Student of
Statistics - Technische Universität Dortmund.
"It is better to have an
inexact answer to the right question than a precise one
to the wrong question!"
John Tuckey