Problemas em cortar linhas iguais

Pessoal: Dado o DF, com o seguinte nomes fictícios: *NOME* *FILIACAO* AENDER XXXXX AMORIM APARECIDA XXXXX AMORIM AGAPE XXXXX SILVA MARISA IRENEIA DE SOUZA SILVA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGNALDO XXXXX SANTOS BORGES MIRTES XXXXX LUCIANO AGUIDA XXXXX LISBOA DIVA XXXXX LISBOA AGUINALDO XXXXX PAIXAO ROSANE XXXXX PAIXAO AILTON XXXXX DOS SANTOS PATRICIA XXXXX ARAUJO AILTON XXXXX ESTEVES MARIA XXXXX ESTEVES AILTON XXXXX JUNIOR FLAVIA XXXXX MARTINS Uso o seguinte para cortar os nomes repetidos: banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME, df$FILIACAO)),] Meu problema: o script resulta o seguinte df: *NOME* *FILIACAO* AENDER XXXXX AMORIM APARECIDA XXXXX AMORIM AGAPE XXXXX SILVA MARISA IRENEIA DE SOUZA SILVA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGNALDO XXXXX SANTOS BORGES MIRTES XXXXX LUCIANO AGUIDA XXXXX LISBOA DIVA XXXXX LISBOA AGUINALDO XXXXX PAIXAO ROSANE XXXXX PAIXAO AILTON XXXXX DOS SANTOS PATRICIA XXXXX ARAUJO AILTON XXXXX ESTEVES MARIA XXXXX ESTEVES AILTON XXXXX JUNIOR FLAVIA XXXXX MARTINS Observe-se que: AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA Não é cortada a linha porque após o OLIVEIRA tem um espaço. O banco é enorme e tem vários casos iguais ao citado. Alguma solução?

Uma solução é em uma variavel nova remover todos os espaços e fazer a mesma análise. para remover espacos variavel_nova <- gsub(" ","", variavel_velha) Em 20 de fevereiro de 2017 16:03, Amiko Bh via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Pessoal:
Dado o DF, com o seguinte nomes fictícios:
*NOME*
*FILIACAO*
AENDER XXXXX AMORIM
APARECIDA XXXXX AMORIM
AGAPE XXXXX SILVA
MARISA IRENEIA DE SOUZA SILVA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGNALDO XXXXX SANTOS BORGES
MIRTES XXXXX LUCIANO
AGUIDA XXXXX LISBOA
DIVA XXXXX LISBOA
AGUINALDO XXXXX PAIXAO
ROSANE XXXXX PAIXAO
AILTON XXXXX DOS SANTOS
PATRICIA XXXXX ARAUJO
AILTON XXXXX ESTEVES
MARIA XXXXX ESTEVES
AILTON XXXXX JUNIOR
FLAVIA XXXXX MARTINS
Uso o seguinte para cortar os nomes repetidos:
banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME, df$FILIACAO)),]
Meu problema: o script resulta o seguinte df:
*NOME*
*FILIACAO*
AENDER XXXXX AMORIM
APARECIDA XXXXX AMORIM
AGAPE XXXXX SILVA
MARISA IRENEIA DE SOUZA SILVA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGNALDO XXXXX SANTOS BORGES
MIRTES XXXXX LUCIANO
AGUIDA XXXXX LISBOA
DIVA XXXXX LISBOA
AGUINALDO XXXXX PAIXAO
ROSANE XXXXX PAIXAO
AILTON XXXXX DOS SANTOS
PATRICIA XXXXX ARAUJO
AILTON XXXXX ESTEVES
MARIA XXXXX ESTEVES
AILTON XXXXX JUNIOR
FLAVIA XXXXX MARTINS
Observe-se que:
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
Não é cortada a linha porque após o OLIVEIRA tem um espaço.
O banco é enorme e tem vários casos iguais ao citado. Alguma solução?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

dados$NOME2 <- gsub(" ","", dados$NOME) dados2 <- dplyr::distinct(dados,NOME2,FILIACAO)
participantes (3)
-
Amiko Bh
-
Felipe
-
Leandro Marino