Olá Benilton e Elias
Instalei o Rclusterpp e gastei menos que 20 segundos para fazer o que antes levava 3 horas (!!!) Estou verificando se está tudo OK.
Coloquei minha matriz de dados em http://www.datafilehost.com/download-696672da.html
A rotina que estava seguindo era
library(vegan)
# carrega a matriz
mat<-read.csv("Dados.csv",row.names=1,sep=";",header=T,dec=",")
# verfica dimensões e os dados das primeiras linhas
dim(mat)
head(mat)
# substitui NA por zero
mat[is.na(mat)]<-0
head(mat)
summary(mat)
# logaritmiza os dados
mat.log <- log(mat+1)
head(mat.log)
# obtem uma amostra da matriz original - não consegui rodar com todas as linhas
ns<-20000
row<-c(1:nrow(mat.log))
srow<-sample(row,ns,replace=F)
mat.logs<-mat.log[srow,]
# calcula distância e ligação
dis<-vegdist(mat.logs,"bray")
clu<-hclust(dis,"ward")
# dendrograma
plot(clu,labels=FALSE)
nl<-7 # indica número de grupos
grp<-cutree(clu, nl)
r <- rect.hclust(clu, nl)
text(cumsum(sapply(r,length)),
rep(mean(tail(unique(clu$hei),2)), length(r)),
paste(unique(grp[clu$ord])))
Com o Rclusterpp fiquei com
library(Rclusterpp)
clu2 <- Rclusterpp.hclust(mat.log, method="ward", distance="euclidean") # não há distância de Bray-Curtis, aqui consigo rodar toda a matriz.
plot(clu2,labels=FALSE)
Agora estou procurando ver como determino os grupos (por nível de corte ou número de grupos), e obtenho seus números e objetos componentes. Comandos como rect.hclust e cutree parecem que não funcionam. Agradeço qualquer dica.
Abraços,
Antônio
Informacoes sobre CMR no rodape de toda msg... e tbm aqui:
https://gist.github.com/1088208
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.