
Nesse link <https://github.com/jdtatsch/inmetr/blob/master/README.md> disponibilizo umas funções que fiz para importar os dados do site do inmet-bdmep para o R. O readme inclui exemplo de uso das funções. O script é baseado no post citado no e-mail Paulo e nas instruções dadas no vídeo <https://www.youtube.com/watch?v=o2fFUw8aSHE>do Meetup R São Paulo (*Web scraping usando o R* por Julio Trecenti). Testado no linux ubuntu somente. Em breve devo empacotar isso. Qualquer problema, me avisem por gentileza. Att. 2016-07-08 13:03 GMT-03:00 Paulo Henrique Pimenta via R-br < r-br@listas.c3sl.ufpr.br>:
Olá Listeiros!
Estou com um grande problema e acho que vcs podem me ajudar! Estou usando um script criado por mim a partir das dicas da própria lista: http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html na qual usei o código como template para automatizar o download dos dados do inmet. Infelizmente estou com alguns problemas, um deles é que só consigo usar o código no Windows, ou seja, no R do Windows e não do Linux (possuo o Windows 10 e o Ubuntu 16.04 no meu notebook).
Os erros no meu Linux são referentes a biblioteca RCurl que mesmo reinstalado várias vezes e usado com a biblioteca bitops continuam a não funcionar. Outro problema que tenho é o não conhecimento sobre como salvar os arquivos baixados em um .txt ao invés de alocar em variáveis como estou fazendo. Caso algum de vcs se interesse em mexer e melhorar o código segue ele abaixo:
####################################################################################################################
### <begin>
library(bitops)
library(RCurl)
####################################################################
dados_1 <- read.table(
"E:/inmet/estacoes_2.txt",
header=F,
sep="\t")
dados_1 <- data.frame(dados_1)
#names(dados_1) <- c("cidades", "estacoes")
######################################################################
# Links para login e dados
myURL1 <- "http://www.inmet.gov.br/projetos/rede/pesquisa/inicio.php"
for (NUM in 1:length(dados_1[,2])){
myURL2[NUM] <- " http://www.inmet.gov.br/projetos/rede/pesquisa/gera_serie_txt.php?&mRelEstacao=dados_1[,2][NUM]&btnProcesso=serie&mRelDtInicio=01/01/2002&mRelDtFim=01/01/2013&mAtributos=1,,,,1,1,,1,1,,,1,,,,, "
# Dados para acesso
myParams=list(
mCod="SEU EMAIL",
mSenha="SUA SENHA",
btnProcesso = " Acessar ")
myCurl <- getCurlHandle()
curlSetOpt(cookiejar="cookies.txt", useragent="Mozilla/5.0", followlocation=TRUE, curl=myCurl)
login <- postForm(myURL1, .params=myParams, curl=myCurl)
dados[NUM] <- getURLContent(myURL2[NUM], curl=myCurl)
exemplo[NUM] <- head(strwrap(dados[NUM], 70), 10000)
}
### <end>
###################################################################################################################
O arquivo estacoes_2.txt esta aqui: http://s000.tinyupload.com/?file_id=66921456922777880817 <http://s000.tinyupload.com/index.php?file_id=66921456922777880817>
Se alguém tiver interesse em modificar para melhorar o código fique a vontade!
Um grande abraço a todos vcs!
Paulo.
Sent from Mail <https://go.microsoft.com/fwlink/?LinkId=550986> for Windows 10
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ############################################################### ## Jônatan Dupont Tatsch ## Professor do Departamento de Física ## Centro de Ciências Exatas e Naturais (CCNE) ## Universidade Federal de Santa Maria - UFSM ## Faixa de Camobi, Prédio 13 - Campus UFSM - Santa Maria, RS, Brasil - 97105-900 ## Telefone: +55(55)33012083 ## www.ufsm.br/meteorologia ###############################################################