Olá pessoal,

a pergunta é mais teórica. Estou analisando o comportamento do sarampo ao longo dos anos. Aqui, em 1999 foi criada a lei que diz que as criancas devem ser vacinadas contra sarampo, cachumba e rubéola em 2 doses de vacinas, para a garantia de aproximadamente 99% de protecao contra as doencas.

Mas a princípio, parece que ao decorrer do tempo (analiso de 2001 a 2011) o numero de criancas com sarampo realmente diminui, após essa campanha. Existem sim ainda algumas, devido a varios fatores (pais nao querem vacinar os filhos, as criancas só tomam 1 vacina...) mas o numero de adultos que apresentam sarampo tem aumentado, se comparado ao inicio da campanha. Por exemplo, se olhar os dados de doentes no peridio de 2003-2005 e 2009-2011 os adultos infectados nesses ultimos anos sao bem mais do que nos primeiros. (Na verdade nas idades de 15-39 anos)

Entao a pincipio tenho dados para os doentes ao longo dos anos e por idade, algo como:

> dados2
   Altersgruppe 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
1         00-00   107   156   39   14   38   156   24   28   50   29   66
2         01-01   524   405   81   22   57   157   35   50   63   41   96
3         02-02   420   313   42     9   30   68   20   31   15   25   49
4         03-03   359   320   71   10   40   73   25   42   20   16   47
5         04-04   397   375   56     5   42   82   21   46   17   19   42
6         05-09 1594 1527 262   17   250   446   123   210   83   127   293
7         10-14 1034  803   112     8   136   515   116   217   72   179   340
8         15-19  786  356   48   11   56   375   68   139   74   133   218
9         20-24  376  147   26     2   37   135   39   44   55   64   126
10        25-29  175   85   12     8   31   110   32   41   49   45   99
11        30-39  168  124   14     6   45   122   49   46   51   67   124
12        40-49   49   29   11     8   13   39   11   13   17   28   70
13        50-59   17    7     3     2    3   19    3     6    3     4     8
14        60-69    9    3     0     1    3     8     0     1    0    3     3
15           70    1     3     0    0     0     3     0    0    2    0     3

A minha idéia entao é rodar umt este estatistico, para a hipótese nula H0: a proporcao(?) ou o numero de adultos doentes no periodo 2003-2005 nao se diferencia significativamente dos doentes no periodo de 2009-2011.

Tudo bem, meu próximo passo entao foi agrupar os dados, de talforma que tenho agora grupo de pessoas de 0 a 4 anos, 5 a 14 anos, 15 a 39 anos e acima de 40 anos. Para analisar por pediordos, simplesmente somei os casos para os anos de 2003-2005 e 2009-2011. Ok, agora tenho um numero por periodo e por grupo. Como compara-los efetivamente? Pois do jeito que retrabalhei os dados, nao consigo aplicar o teste T para 2 populacoes, nao tenho como medir normalidade e homocedasticidade. Na verdade, nao sei se o jeito que formatei os dados para a análise está correta para analisar a hipótese desejada.

Como vcs fariam?

Abracos,
 
--
Daniela Rodrigues Recchia

Master Student of Statistics - Technische Universität Dortmund.

"It is better to have an inexact answer to the right question than a precise one to the wrong question!"
John Tuckey