Chào các bác.
Xin các bác giúp em code về kiểm định outlier và xử lí missing data ạ.
1. Kiểm định outlier bằng phương pháp phi tham số:
- Kiểm định theo từng cột
- Tính giá trị tứ phân vị của dãy: Q1, Q3
- Tính t = Q3-Q1
- Tính giá trị thấp của biên L = Q1-1.5t
- Tính giá trị cao của biến U = Q3+1.5t
- Nếu trong dãy số có số nào thấp hơn L hay cao hơn U thì đó là outlier, cần xóa dữ liệu đó đi
- Ô outlier được tô màu đỏ
2. Xử lí missing data sau khi kiểm định outlier
- Những ô nào còn trống thì điền vào bằng giá trị trung bình của 5 giá trị trước đó trong cột (trừ ô đầu tiên thì tính bằng giá trị trung bình của 5 số sau nó)


Em xin cảm ơn các bác.
Xin các bác giúp em code về kiểm định outlier và xử lí missing data ạ.
1. Kiểm định outlier bằng phương pháp phi tham số:
- Kiểm định theo từng cột
- Tính giá trị tứ phân vị của dãy: Q1, Q3
- Tính t = Q3-Q1
- Tính giá trị thấp của biên L = Q1-1.5t
- Tính giá trị cao của biến U = Q3+1.5t
- Nếu trong dãy số có số nào thấp hơn L hay cao hơn U thì đó là outlier, cần xóa dữ liệu đó đi
- Ô outlier được tô màu đỏ
2. Xử lí missing data sau khi kiểm định outlier
- Những ô nào còn trống thì điền vào bằng giá trị trung bình của 5 giá trị trước đó trong cột (trừ ô đầu tiên thì tính bằng giá trị trung bình của 5 số sau nó)


Em xin cảm ơn các bác.





