
25 Ago
2017
25 Ago
'17
17:47
Pelo visto você terá com fazer um misto de soluções para cada situação. Comece com funções para distâncias entre strings. Minha dica é tomar conhecimento do pacote stringdist ( https://cran.r-project.org/web/packages/stringdist/stringdist.pdf). Se você criar a termDocumentMatrix para os nomes, você pode facilmente encontrar situações de inversão de nome como a que ocorre para o ID 100, por exemplo. À disposição. Walmes.