Pesquisar elementos dentro de uma variável

Pessoal, tem como eu pesquisar dentro de uma variável no R apenas algumas siglas ou números? Tenho um banco de dados com mais de 5000 observações e estou interessado apenas na região nordeste, ou seja, preciso fazer uma busca no meu banco de dados para que pegue somente essa região. A variável está dessa maneira: [1] "EBA2927400001" "EDF5300100001" "EES3205300001" "EMS5002700001" "EMS5002700002" [6] "EPI2211000001" "EPR4106900002" "ERJ3304551111" "ERS" "ERS4314900001" [11] "ESC4205400001" "ESP3550309999" "ETO1721000001" "MAC1200200001" "MAC1200200002" [16] "MAC1200300001" "MAC1200340001" "MAC1200400001" "MAC1200430001" "MAL2700100001" No caso, pegaria BA, AC, AL e os demais estados do nordeste. Como posso fazer uma busca dentro dessa variável para me retornar apenas as siglas que quero? Abraços e ótima semana!

Faça: novo<-subset(anterior, anterior$estado %in% c('BA','AL','AC')) [. ]'s. Edson Lira Estatístico Ma-Am Em 26/02/2013, às 12:34, Victor Eduardo <victorduca08@gmail.com> escreveu:
Pessoal, tem como eu pesquisar dentro de uma variável no R apenas algumas siglas ou números? Tenho um banco de dados com mais de 5000 observações e estou interessado apenas na região nordeste, ou seja, preciso fazer uma busca no meu banco de dados para que pegue somente essa região. A variável está dessa maneira:
[1] "EBA2927400001" "EDF5300100001" "EES3205300001" "EMS5002700001" "EMS5002700002" [6] "EPI2211000001" "EPR4106900002" "ERJ3304551111" "ERS" "ERS4314900001" [11] "ESC4205400001" "ESP3550309999" "ETO1721000001" "MAC1200200001" "MAC1200200002" [16] "MAC1200300001" "MAC1200340001" "MAC1200400001" "MAC1200430001" "MAL2700100001"
No caso, pegaria BA, AC, AL e os demais estados do nordeste. Como posso fazer uma busca dentro dessa variável para me retornar apenas as siglas que quero?
Abraços e ótima semana! _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Não sei de onde saiu o banco "anterior" da resposta do Edson. Fiquei curioso... Em todo caso, com base apenas no que você postou, NEvec <- ("BA", "AL") ## aqui vocÊ cria um vetor com as siglas dos estados do NE. Lembrando que AC é Acre, do Norte. #Assumindo que seu banco de dados se chame mydf e que a variável seja "x', então, é preciso criar uma coluna com as siglas. mydf$uf <- substring(mydf$x, 2,3) # pega as siglas dos estados da variável x, que são o segundo e terceito caracteres #agora você usa o subset como o Edson sugeriu novodf <- subset(mydf, uf %in% NEvec) abç M 2013/2/26 Edson Lira <edinhoestat@yahoo.com.br>
Faça:
novo<-subset(anterior, anterior$estado %in% c('BA','AL','AC'))
[. ]'s. Edson Lira Estatístico Ma-Am
Em 26/02/2013, às 12:34, Victor Eduardo <victorduca08@gmail.com> escreveu:
Pessoal, tem como eu pesquisar dentro de uma variável no R apenas algumas siglas ou números? Tenho um banco de dados com mais de 5000 observações e estou interessado apenas na região nordeste, ou seja, preciso fazer uma busca no meu banco de dados para que pegue somente essa região. A variável está dessa maneira:
[1] "EBA2927400001" "EDF5300100001" "EES3205300001" "EMS5002700001" "EMS5002700002" [6] "EPI2211000001" "EPR4106900002" "ERJ3304551111" "ERS" "ERS4314900001" [11] "ESC4205400001" "ESP3550309999" "ETO1721000001" "MAC1200200001" "MAC1200200002" [16] "MAC1200300001" "MAC1200340001" "MAC1200400001" "MAC1200430001" "MAL2700100001"
No caso, pegaria BA, AC, AL e os demais estados do nordeste. Como posso fazer uma busca dentro dessa variável para me retornar apenas as siglas que quero?
Abraços e ótima semana!
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/

Obrigado, pessoal! Na pressa acabei digitando o estado errado. rs Vou tentar aqui. Abraços! Em 26 de fevereiro de 2013 13:49, Manoel Galdino <mcz.fea@gmail.com>escreveu:
Não sei de onde saiu o banco "anterior" da resposta do Edson. Fiquei curioso... Em todo caso, com base apenas no que você postou,
NEvec <- ("BA", "AL") ## aqui vocÊ cria um vetor com as siglas dos estados do NE. Lembrando que AC é Acre, do Norte.
#Assumindo que seu banco de dados se chame mydf e que a variável seja "x', então, é preciso criar uma coluna com as siglas.
mydf$uf <- substring(mydf$x, 2,3) # pega as siglas dos estados da variável x, que são o segundo e terceito caracteres
#agora você usa o subset como o Edson sugeriu
novodf <- subset(mydf, uf %in% NEvec)
abç M
2013/2/26 Edson Lira <edinhoestat@yahoo.com.br>
Faça:
novo<-subset(anterior, anterior$estado %in% c('BA','AL','AC'))
[. ]'s. Edson Lira Estatístico Ma-Am
Em 26/02/2013, às 12:34, Victor Eduardo <victorduca08@gmail.com> escreveu:
Pessoal, tem como eu pesquisar dentro de uma variável no R apenas algumas siglas ou números? Tenho um banco de dados com mais de 5000 observações e estou interessado apenas na região nordeste, ou seja, preciso fazer uma busca no meu banco de dados para que pegue somente essa região. A variável está dessa maneira:
[1] "EBA2927400001" "EDF5300100001" "EES3205300001" "EMS5002700001" "EMS5002700002" [6] "EPI2211000001" "EPR4106900002" "ERJ3304551111" "ERS" "ERS4314900001" [11] "ESC4205400001" "ESP3550309999" "ETO1721000001" "MAC1200200001" "MAC1200200002" [16] "MAC1200300001" "MAC1200340001" "MAC1200400001" "MAC1200430001" "MAL2700100001"
No caso, pegaria BA, AC, AL e os demais estados do nordeste. Como posso fazer uma busca dentro dessa variável para me retornar apenas as siglas que quero?
Abraços e ótima semana!
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Talvés seja o caso de fazer uso das expressões regulares! http://stat.ethz.ch/R-manual/R-patched/library/base/html/regex.html 2013/2/26 Manoel Galdino <mcz.fea@gmail.com>
Não sei de onde saiu o banco "anterior" da resposta do Edson. Fiquei curioso... Em todo caso, com base apenas no que você postou,
NEvec <- ("BA", "AL") ## aqui vocÊ cria um vetor com as siglas dos estados do NE. Lembrando que AC é Acre, do Norte.
#Assumindo que seu banco de dados se chame mydf e que a variável seja "x', então, é preciso criar uma coluna com as siglas.
mydf$uf <- substring(mydf$x, 2,3) # pega as siglas dos estados da variável x, que são o segundo e terceito caracteres
#agora você usa o subset como o Edson sugeriu
novodf <- subset(mydf, uf %in% NEvec)
abç M
2013/2/26 Edson Lira <edinhoestat@yahoo.com.br>
Faça:
novo<-subset(anterior, anterior$estado %in% c('BA','AL','AC'))
[. ]'s. Edson Lira Estatístico Ma-Am
Em 26/02/2013, às 12:34, Victor Eduardo <victorduca08@gmail.com> escreveu:
Pessoal, tem como eu pesquisar dentro de uma variável no R apenas algumas siglas ou números? Tenho um banco de dados com mais de 5000 observações e estou interessado apenas na região nordeste, ou seja, preciso fazer uma busca no meu banco de dados para que pegue somente essa região. A variável está dessa maneira:
[1] "EBA2927400001" "EDF5300100001" "EES3205300001" "EMS5002700001" "EMS5002700002" [6] "EPI2211000001" "EPR4106900002" "ERJ3304551111" "ERS" "ERS4314900001" [11] "ESC4205400001" "ESP3550309999" "ETO1721000001" "MAC1200200001" "MAC1200200002" [16] "MAC1200300001" "MAC1200340001" "MAC1200400001" "MAC1200430001" "MAL2700100001"
No caso, pegaria BA, AC, AL e os demais estados do nordeste. Como posso fazer uma busca dentro dessa variável para me retornar apenas as siglas que quero?
Abraços e ótima semana!
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (4)
-
Edson Lira
-
FHRB Toledo
-
Manoel Galdino
-
Victor Eduardo