Bạn gửi file có dữ liệu và ghi 1 số kết quả bằng tay ra để mọi người hình dung và có cái để thao tác chứ hả?!Mình có 2 danh sách, muốn lọc trùng cột họ tên và năm sinh của danh sách này trùng cột họ tên và năm sinh trong danh sách kia thì làm cách nào hả mọi ngườiView attachment 259389View attachment 259390
Đây mình gửi kèm file đây bạnBạn gửi file có dữ liệu và ghi 1 số kết quả bằng tay ra để mọi người hình dung và có cái để thao tác chứ hả?!
Mình làm liều rồi.Cái này thì bạn làm thủ công đi, copy 2 dữ liệu vào 1 sheet > chọn vùng dữ liệu > rồi vào Data > Remove Duplicates > chọn cột cần loại bỏ giá trị trùng nhau
Lúc thớt hỏi bài này chưa chắc đã nắm được đặc điểm về vấn đề xã hội, con người ngoài đời thực.Thớt chỉ cần thấy có trùng cả họ tên lẫn ngày sinh thì loại ra thôi.
Có thể chả cần "thực". Biết đâu nó chỉ là cái danh sách và câu nói muôn đời của GPE "sếp muốn vậy".Lúc thớt hỏi bài này chưa chắc đã nắm được đặc điểm về vấn đề xã hội, con người ngoài đời thực.
Mình có 2 danh sách, muốn lọc trùng cột họ tên và năm sinh của danh sách này trùng cột họ tên và năm sinh trong danh sách kia thì làm cách nào hả mọi ngườiView attachment 259389View attachment 259390
Trùng họ tên vào năm sinh là ok đến 95%, vì ko có trường mã định danh.@Thớt: Mình phải dùng mã định danh duy nhất của công dân để phân biệt dữ liệu trùng. Họ và tên + Ngày tháng năm sinh vẫn hoàn toàn trùng mặc dù là 02 công dân.
View attachment 259398
Loại trùng chỉ dựa trên họ tên và ngày sinh có thể không chính xác, cần kèm theo điều kiện họ tên bố mẹ mức độ chính xác tiệm cận 100%Trùng họ tên vào năm sinh là ok đến 95%, vì ko có trường mã định danh.
Xuất phát nhu cầu thực tế, mình có 1 danh sách công dân trong 1 thôn, và nhận 1 danh sách công dân trong thôn đó đã đi tham gia nghĩa vụ quân sự, yêu cầu cần xuất ra những người chưa đi NVQS để lập danh sách, dữ liệu gốc có thêm tên bố mẹ nữa ạ
Ở bài #13, người ta đã nói là chấp nhận 95%.Loại trùng chỉ dựa trên họ tên và ngày sinh có thể không chính xác, cần kèm theo điều kiện họ tên bố mẹ mức độ chính xác tiệm cận 100%
Đứng trên phương diện toán học và xã hội học:Loại trùng chỉ dựa trên họ tên và ngày sinh có thể không chính xác, cần kèm theo điều kiện họ tên bố mẹ mức độ chính xác tiệm cận 100%
Mình chưa đọc qua môn "Xã hội học", nhiều năm làm việc với các con số thống kê mình nghỉ xác suất không trùng với 4 yếu tố họ tên ngày sinh, ba mẹ gần như 100%Đứng trên phương diện toán học và xã hội học:
* Họ tên + ngày sinh + họ tên bố mẹ: 98%
+ thêm: họ tên ông bà nội: 99%
+ thêm: họ tên ông bà ngoại: 99.9%
Tại sao ngoại>nội thì môn "xã hội học" có giải thích đấy. Tìm hiểu xem.
Mấy con số này phải dựa trên thống kê dân số (census).Đứng trên phương diện toán học và xã hội học:
* Họ tên + ngày sinh + họ tên bố mẹ: 98%
+ thêm: họ tên ông bà nội: 99%
+ thêm: họ tên ông bà ngoại: 99.9%
Tại sao ngoại>nội thì môn "xã hội học" có giải thích đấy. Tìm hiểu xem.
"Xã hội học" rất cần kiến thức và kỹ năng thu thập xử lý dữ liệu, nói chung phải biết thống kê và toán xác suất, nhưng phần lớn các nhà xã hội học lại không mạnh về toánMấy con số này phải dựa trên thống kê dân số (census).
Môn "xã hội học" và "toán" ấy có nói họ tínhn trên thống kê năm nào? hay chính xác hơn, khoảng thời gian nào vậy?