Olá
pessoal,
a
pergunta é mais teórica. Estou analisando o
comportamento do sarampo ao longo dos anos.
Aqui, em 1999 foi criada a lei que diz que
as criancas devem ser vacinadas contra
sarampo, cachumba e rubéola em 2 doses de
vacinas, para a garantia de aproximadamente
99% de protecao contra as doencas.
Mas a
princípio, parece que ao decorrer do tempo
(analiso de 2001 a 2011) o numero de
criancas com sarampo realmente diminui, após
essa campanha. Existem sim ainda algumas,
devido a varios fatores (pais nao querem
vacinar os filhos, as criancas só tomam 1
vacina...) mas o numero de adultos que
apresentam sarampo tem aumentado, se
comparado ao inicio da campanha. Por
exemplo, se olhar os dados de doentes no
peridio de 2003-2005 e 2009-2011 os adultos
infectados nesses ultimos anos sao bem mais
do que nos primeiros. (Na verdade nas idades
de 15-39 anos)
Entao a
pincipio tenho dados para os doentes ao longo
dos anos e por idade, algo como:
> dados2
Altersgruppe 2001
2002
2003
2004
2005
2006
2007
2008
2009
2010 2011
1 00-00 107
156
39
14
38
156
24
28
50
29 66
2 01-01 524
405
81
22
57
157
35
50
63
41 96
3 02-02 420
313
42
9
30
68
20
31
15 25
49
4 03-03 359
320
71
10
40
73
25
42
20 16
47
5 04-04 397
375
56
5
42
82 21
46
17
19 42
6 05-09 1594
1527 262
17
250
446
123
210
83
127
293
7 10-14 1034
803 112
8
136
515
116
217
72
179
340
8 15-19
786
356
48
11
56
375
68 139
74 133
218
9
20-24 376
147
26
2
37 135
39
44 55
64
126
10
25-29
175
85
12 8
31
110
32
41
49
45 99
11
30-39
168
124
14 6
45
122
49
46
51
67 124
12 40-49
49
29 11
8
13
39
11
13
17
28 70
13 50-59
17
7 3
2
3
19
3
6
3
4
8
14 60-69
9
3 0
1
3
8
0
1
0
3
3
15 70 1
3
0
0
0
3
0
0
2
0
3
A minha idéia entao é rodar umt este
estatistico, para a hipótese nula H0: a
proporcao(?) ou o numero de adultos doentes
no periodo 2003-2005 nao se diferencia
significativamente dos doentes no periodo de
2009-2011.
Tudo bem, meu próximo passo entao foi
agrupar os dados, de talforma que tenho
agora grupo de pessoas de 0 a 4 anos, 5 a 14
anos, 15 a 39 anos e acima de 40 anos. Para
analisar por pediordos, simplesmente somei
os casos para os anos de 2003-2005 e
2009-2011. Ok, agora tenho um numero por
periodo e por grupo. Como compara-los
efetivamente? Pois do jeito que retrabalhei
os dados, nao consigo aplicar o teste T para
2 populacoes, nao tenho como medir
normalidade e homocedasticidade. Na verdade,
nao sei se o jeito que formatei os dados
para a análise está correta para analisar a
hipótese desejada.
Como vcs fariam?
Abracos,
--
Daniela Rodrigues Recchia
Master
Student of Statistics - Technische Universität
Dortmund.
"It is
better to have an inexact answer to the
right question than a precise one to the wrong
question!"
John Tuckey