Bom dia pessoal, estou com uma dúvida no 'subsetting' de um dataframe de 44 variaveis ambientais, onde as primeras dos são 'MONTH' e 'YEAR' (categóricas), e o resto são numericas (algumas contem NAs)
Estou a precisar usar uma função para criar um novo data frame onde as variaveis numericas [ , 4:44] sejam colocadas em promedios por 'MONTH',
bom aqui vai um exemplo do CMR que estou a usar:
#o data frame
str(OCTOPUS_S_2003)
'data.frame': 115 obs. of  44 variables:
 $ ID                   : int  157 158 159 160 161 162 163 164 165 166 ...
 $ Year                 : Factor w/ 10 levels "2003","2004",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ Month                : int  1 2 3 4 5 6 7 8 9 10 ...
 $ RainFall             : num  88.4 123.2 98.2 NA 8.3 ...
 $ PLOBOI               : int  128301 245454 280876 220158 25878 2546 
 $ PLOBOII              : num  47.9 101.46 104.87 84.94 9.66 ...
 $ ALQUEVA              : int  395168 91474 24386 28427 53978 28278 
 
#eu consigo fazer para cada variable, mais uma de cada vez com o seguinte código (p.e. variavel nº 5 = PLOBOI:

PLOBOI <- tapply(OCTOPUS_S_2003[ ,5], OCTOPUS_S_2003$Year, mean, na.rm =TRUE)

#mas são 40 variaveis tirando ID, Year e Month
##Será que posso/devo fazer um loop? o uma função?

obrigado

Carlos

P.D.: estou a usar o R R-215~1.2\\bin\\x64\



--
Carlos A. Pombo Sonderblohm
PhD Student on Marine Science (Fisheries)
Faculdade de Ciências e Tecnología
Universidade do Algarve,
Campus de Gambelas
8005-139 Faro
Portugal
Tef. 289 800 905 ext. 7605