bun_oc_girl
Thành viên mới

- Tham gia
- 24/3/08
- Bài viết
- 4
- Được thích
- 0
Mọi người vui lòng giúp tôi xử lý database này với ạ. Tôi đã tham khảo nhiều topic về "lọc dữ liệu trùng" tại diễn đàn mình nhưng không thấy cách nào ứng dụng được với trường hợp của tôi. Mong mọi người bỏ chút thời gian xem qua file đính kèm và giúp đỡ ạ. Tôi xin chân thành cám ơn.
Đặc điểm dữ liệu: Trong khoảng 100.000 dòng dữ liệu, có rất nhiều SĐT trùng. Mỗi dòng dữ liệu bao gồm tên, SĐT, email, ngày cập nhật email và khoảng 20 cột khác. Tuy nhiên SĐT và email là quan trọng nhất.
Yêu cầu lọc dữ liệu: Lọc bỏ bớt những dòng trùng SĐT cho gọn database, nhưng phải giữ càng nhiều email càng tốt, ở vị trí tương ứng với SĐT.
Hướng xử lý: Những dòng trùng hoàn toàn thì bị bỏ hết. Những dòng trùng SĐT nhưng không trùng email thì vẫn bị bỏ nhưng những thông tin về email, ngày cập nhật tương ứng phải được ghi nhận lại tại dòng đầu tiên ghi nhận SĐT đó (cột mới).
(Vui lòng xem chi tiết trong file đính kèm ạ)
Đặc điểm dữ liệu: Trong khoảng 100.000 dòng dữ liệu, có rất nhiều SĐT trùng. Mỗi dòng dữ liệu bao gồm tên, SĐT, email, ngày cập nhật email và khoảng 20 cột khác. Tuy nhiên SĐT và email là quan trọng nhất.
Yêu cầu lọc dữ liệu: Lọc bỏ bớt những dòng trùng SĐT cho gọn database, nhưng phải giữ càng nhiều email càng tốt, ở vị trí tương ứng với SĐT.
Hướng xử lý: Những dòng trùng hoàn toàn thì bị bỏ hết. Những dòng trùng SĐT nhưng không trùng email thì vẫn bị bỏ nhưng những thông tin về email, ngày cập nhật tương ứng phải được ghi nhận lại tại dòng đầu tiên ghi nhận SĐT đó (cột mới).
(Vui lòng xem chi tiết trong file đính kèm ạ)