Lọc danh sách bị trùng

Liên hệ QC

vbman

Thành viên mới
Tham gia
12/1/12
Bài viết
7
Được thích
3
Mình có 2 danh sách, muốn lọc trùng cột họ tên và năm sinh của danh sách này trùng cột họ tên và năm sinh trong danh sách kia thì làm cách nào hả mọi ngườiIMG_20210525_160557.jpgIMG_20210525_160554.jpg
 
Kết quả của Bạn mong muốn trả về dữ liệu như thế nào vậy Bạn, Bạn có thể minh họa kết quả trả về ra một bảng khác được không hay là thế nào nhỉ?
 
Nếu có dữ liệu trùng thì trả về họ tên công dân bạn ạ
 
Cái này thì bạn làm thủ công đi, copy 2 dữ liệu vào 1 sheet > chọn vùng dữ liệu > rồi vào Data > Remove Duplicates > chọn cột cần loại bỏ giá trị trùng nhau
 
Cái này thì bạn làm thủ công đi, copy 2 dữ liệu vào 1 sheet > chọn vùng dữ liệu > rồi vào Data > Remove Duplicates > chọn cột cần loại bỏ giá trị trùng nhau
Mình làm liều rồi.

Ngay cả khi ghép hai cột với nhau để loại trùng vẫn chưa có đúng nhé.

Đây là bài toán thực tế, con người thật đó.


@Thớt: Mình phải dùng mã định danh duy nhất của công dân để phân biệt dữ liệu trùng. Họ và tên + Ngày tháng năm sinh vẫn hoàn toàn trùng mặc dù là 02 công dân.


1621936096516.png
 
Mã định danh ở đây là số CMND hoặc số CCCD. Xong !
Mà nếu có cái dữ liệu đó thì mọi việc trở nên dễ dàng rồi, gần như không phải làm cái nhu cầu như ở bài #1 của thớt.
Thớt chỉ cần thấy có trùng cả họ tên lẫn ngày sinh thì loại ra thôi.
 
Lúc thớt hỏi bài này chưa chắc đã nắm được đặc điểm về vấn đề xã hội, con người ngoài đời thực.
Có thể chả cần "thực". Biết đâu nó chỉ là cái danh sách và câu nói muôn đời của GPE "sếp muốn vậy".
 
@Thớt: Mình phải dùng mã định danh duy nhất của công dân để phân biệt dữ liệu trùng. Họ và tên + Ngày tháng năm sinh vẫn hoàn toàn trùng mặc dù là 02 công dân.


View attachment 259398
Trùng họ tên vào năm sinh là ok đến 95%, vì ko có trường mã định danh.

Xuất phát nhu cầu thực tế, mình có 1 danh sách công dân trong 1 thôn, và nhận 1 danh sách công dân trong thôn đó đã đi tham gia nghĩa vụ quân sự, yêu cầu cần xuất ra những người chưa đi NVQS để lập danh sách, dữ liệu gốc có thêm tên bố mẹ nữa ạ
 
Trùng họ tên vào năm sinh là ok đến 95%, vì ko có trường mã định danh.

Xuất phát nhu cầu thực tế, mình có 1 danh sách công dân trong 1 thôn, và nhận 1 danh sách công dân trong thôn đó đã đi tham gia nghĩa vụ quân sự, yêu cầu cần xuất ra những người chưa đi NVQS để lập danh sách, dữ liệu gốc có thêm tên bố mẹ nữa ạ
Loại trùng chỉ dựa trên họ tên và ngày sinh có thể không chính xác, cần kèm theo điều kiện họ tên bố mẹ mức độ chính xác tiệm cận 100%
 
Loại trùng chỉ dựa trên họ tên và ngày sinh có thể không chính xác, cần kèm theo điều kiện họ tên bố mẹ mức độ chính xác tiệm cận 100%
Ở bài #13, người ta đã nói là chấp nhận 95%.
Cái chỗ 5% kia là dùng để làm thủ tục "đầu tiên". Bạn bảo 100% thì chả còn một chút cháo để húp.
 
Loại trùng chỉ dựa trên họ tên và ngày sinh có thể không chính xác, cần kèm theo điều kiện họ tên bố mẹ mức độ chính xác tiệm cận 100%
Đứng trên phương diện toán học và xã hội học:
* Họ tên + ngày sinh + họ tên bố mẹ: 98%
+ thêm: họ tên ông bà nội: 99%
+ thêm: họ tên ông bà ngoại: 99.9%

Tại sao ngoại>nội thì môn "xã hội học" có giải thích đấy. Tìm hiểu xem.
 
Đứng trên phương diện toán học và xã hội học:
* Họ tên + ngày sinh + họ tên bố mẹ: 98%
+ thêm: họ tên ông bà nội: 99%
+ thêm: họ tên ông bà ngoại: 99.9%

Tại sao ngoại>nội thì môn "xã hội học" có giải thích đấy. Tìm hiểu xem.
Mình chưa đọc qua môn "Xã hội học", nhiều năm làm việc với các con số thống kê mình nghỉ xác suất không trùng với 4 yếu tố họ tên ngày sinh, ba mẹ gần như 100%
 
Đứng trên phương diện toán học và xã hội học:
* Họ tên + ngày sinh + họ tên bố mẹ: 98%
+ thêm: họ tên ông bà nội: 99%
+ thêm: họ tên ông bà ngoại: 99.9%

Tại sao ngoại>nội thì môn "xã hội học" có giải thích đấy. Tìm hiểu xem.
Mấy con số này phải dựa trên thống kê dân số (census).
Môn "xã hội học" và "toán" ấy có nói họ tínhn trên thống kê năm nào? hay chính xác hơn, khoảng thời gian nào vậy?
 
Mấy con số này phải dựa trên thống kê dân số (census).
Môn "xã hội học" và "toán" ấy có nói họ tínhn trên thống kê năm nào? hay chính xác hơn, khoảng thời gian nào vậy?
"Xã hội học" rất cần kiến thức và kỹ năng thu thập xử lý dữ liệu, nói chung phải biết thống kê và toán xác suất, nhưng phần lớn các nhà xã hội học lại không mạnh về toán
Khả năng thu thập và xử lý dữ liệu thực sự vấn đề trùng tên, ngày sinh tên ba mẹ ông bà rất thấp, mình đoán số liệu nếu có là lấy từ nguồn khác không có kiểm chứng, hoặc suy đoán chủ quan
 
Web KT
Back
Top Bottom