Gostaria de verificar as duplicidade na integra, o comando "duplicated" mostra os duplicados a partir do segundo registro. Mas eu gostaria de identificar desde o primeiro registro as duplicidade. Por exemplo, o que ocorre fazendo o comando "duplicated":
df <- read.table(header=TRUE, text='
label value
A 4
B 3
C 6
B 3
B 1
A 2
A 4
A 4
')
df = data.table(df, key = "value")
df$duplic = duplicated(df, by="label")
df
label value duplic
1: B 1 FALSE
2: A 2 FALSE
3: B 3 TRUE
4: B 3 TRUE
5: A 4 TRUE
6: A 4 TRUE
7: A 4 TRUE
8: C 6 FALSE
Mas na realidade gostaria que aparecesse da seguinte forma:
df
label value duplic
1: B 1 TRUE
2: A 2 TRUE
3: B 3 TRUE
4: B 3 TRUE
5: A 4 TRUE
6: A 4 TRUE
7: A 4 TRUE
8: C 6 FALSE
Obrigado pela ajuda de vocÊs galera.
ABS
--
Wagner S. Tassinari
Departamento de Matemática
Universidade Federal Rural do Rio de Janeiro.
BR-465, Km 7 - Seropedica, RJ - Brasil
CEP: 23890-000
Skype: wagner.tassinari
wtassinari@gmail.comtassinari@ufrrj.br-------------------------------------------------------
"Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write." (H.G.Wellis)