Hi Everyone,
I would like to remove duplicate values from a dataset. I do not want to delete entire rows though, I would like to remove the value and leave it blank.
Below is an example of the data frame I am using.
A01 A02 A03 A032 A01_CD A02_CD A03_CD A032_CD
1 4.9 NA NA NA 4.9 NA NA NA
2 4.9 NA NA NA NA NA NA NA
5 4.8 NA NA NA NA NA NA NA
9 4.8 NA NA NA 4.8 NA NA NA
16 4.7 NA NA NA 4.8 NA NA NA
18 4.7 NA NA NA NA NA NA NA
31 5.0 NA NA NA NA NA NA NA
This is the outcome I would like to achieve.
A01 A02 A03 A032 A01_CD A02_CD A03_CD A032_CD
1 4.9 NA NA NA NA NA NA NA
2 4.9 NA NA NA NA NA NA NA
5 4.8 NA NA NA NA NA NA NA
9 4.8 NA NA NA NA NA NA NA
16 4.7 NA NA NA 4.8 NA NA NA
18 4.7 NA NA NA NA NA NA NA
31 5.0 NA NA NA NA NA NA NA
I have been using: No_Duplicates = dataset11 %>% distinct(A01, A02, A03, A032, A01_CD, A02_CD, A03_CD, A032_CD, .keep_all = TRUE)
But this deletes entire rows and I do not want that.