Olá Benilton e Elias

Instalei o Rclusterpp e gastei menos que 20 segundos para fazer o que antes levava 3 horas (!!!) Estou verificando se está tudo OK.

Coloquei minha matriz de dados em http://www.datafilehost.com/download-696672da.html

A rotina que estava seguindo era

library(vegan)
# carrega a matriz
mat<-read.csv("Dados.csv",row.names=1,sep=";",header=T,dec=",")
# verfica dimensões e os dados das primeiras linhas
dim(mat)
head(mat)
# substitui NA por zero
mat[is.na(mat)]<-0
head(mat)
summary(mat)

# logaritmiza os dados
mat.log <- log(mat+1)
head(mat.log)

# obtem uma amostra da matriz original - não consegui rodar com todas as linhas
ns<-20000
row<-c(1:nrow(mat.log))
srow<-sample(row,ns,replace=F)
mat.logs<-mat.log[srow,]

# calcula distância e ligação
dis<-vegdist(mat.logs,"bray")
clu<-hclust(dis,"ward")

# dendrograma
plot(clu,labels=FALSE)
nl<-7 # indica número de grupos
grp<-cutree(clu, nl)
r <- rect.hclust(clu, nl)
text(cumsum(sapply(r,length)),
     rep(mean(tail(unique(clu$hei),2)), length(r)),
     paste(unique(grp[clu$ord])))


Com o Rclusterpp fiquei com

library(Rclusterpp)
clu2 <- Rclusterpp.hclust(mat.log, method="ward", distance="euclidean") # não  há distância de Bray-Curtis, aqui consigo rodar toda a matriz.
plot(clu2,labels=FALSE)

Agora estou procurando ver como determino os grupos (por nível de corte ou número de grupos), e obtenho seus números e objetos componentes. Comandos como rect.hclust e cutree parecem que não funcionam. Agradeço qualquer dica.

Abraços,

Antônio


Em 7 de março de 2012 11:17, Benilton Carvalho <beniltoncarvalho@gmail.com> escreveu:
Informacoes sobre CMR no rodape de toda msg... e tbm aqui:
https://gist.github.com/1088208
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Antônio Olinto Ávila da Silva
Biólogo / Oceanógrafo
Instituto de Pesca
São Paulo, Brasil