
2013/2/22 Roney Fraga <roneyfraga@gmail.com>:
Pretendo fazer uma rede de citação e co-citação, a mesma terá mais de 150000 nós ou (vértices, indivíduos, etc.). Estou buscando as informações no Web of Science. Para exemplificar fiz uma busca de 50 artigos, e exportei para o seguinte endereço: https://docs.google.com/document/d/14w8lQgAwZsmwZ-xGbV5vy4Z3lzvIkFa6Bj44GHia... minha dificuldade é deixar esses dados da seguinte forma, https://docs.google.com/spreadsheet/ccc?key=0AnxuqxFeBpZodG9waVNPYmdNV0V5ZWQ... uma matriz quadrada relacionando todos os atores. Atualmente utilizo o software VantagePoint para importar esses dados e criar uma matriz de adjacência. Considerando as várias dificuldades de uso do VantagePoint, preço, velocidade de processamento, acesso, etc, busco uma alternativa para importar os dados do web of science e criar uma matriz de adjacência pelo R, ou outro software acessível. primeira pergunta: existe alguma função do R para importar esses dados (exportados do web of science) e criar uma matriz de adjacência? segunda pergunta: é possível criar uma rede entre 150 e 250 mil nós usando o R? terceira pergunta: qual pacote (igraph, sna, statnet) lida melhor com redes grandes?
O igraph parece ser a melhor opção para redes muito grandes. E não é necessário criar uma matriz. Uma lista de adjacência resolve. Exemplo: library(igraph) lista <- rbind(c("Autor1", "Autor2"), c("Autor1", "Autor3"), c("Autor1", "Autor4"), c("Autor2", "Autor3"), c("Autor2", "Autor4"), c("Autor2", "Autor5"), c("Autor3", "Autor1"), c("Autor3", "Autor2"), c("Autor3", "Autor4"), c("Autor4", "Autor1"), c("Autor4", "Autor2"), c("Autor4", "Autor3")) g <- graph.edgelist(lista) plot(g) -- Jakson Alves de Aquino Universidade Federal do Ceará Departamento de Ciências Sociais www.lepem.ufc.br/aquino.php