Sử dụng Histogram để lập biểu đồ phân phối xác suất

Liên hệ QC

PhanTuHuong

VBA & VB.NET for Excel & AutoCad
Thành viên danh dự
Tham gia
13/6/06
Bài viết
7,121
Được thích
24,279
Trong lĩnh vực kỹ thuật, để nghiên cứu các sự vật, hiện tượng, người ta thường tiến hành đo, cân, ước lượng,... Tuy nhiên, kết quả thu được không bao giờ chính xác một cách tuyệt đối mà dao động xung quanh một giá trị nào đó.
Ví dụ như khi xác định khối lượng của 1 đơn vị thể tích đất đá được coi là giống nhau, ta được 1 tập hợp các giá trị riêng lẻ (trong ví dụ này có 40 mẫu).
Chính vì vậy ta cần phải nghiên cứu quy luật biến đổi của các đại lượng đó bằng cách lập ra biểu đồ phân phối xác suất. Từ đó có thể đánh giá được giá trị gần đúng nhất của đại lượng mà ta nghiên cứu.
Trong Excel, bạn có thể xây dựng được biểu đồ phân phối xác suất (histogram) bằng cách sử dụng tính năng Histogram trong Analysis ToolPak. Bình thường, Excel không cài sẵn Analysis ToolPak. Để cài đặt Analysis ToolPak, bạn chọn Add-Ins trong Tools. Tại cửa sổ Add-Ins, bạn đánh dấu chọn Analysis ToolPak.
Add-In.jpg

Trình tự xây dựng biểu đồ phân phối của đại lượng ngẫu nhiên:
1. Vào giá trị riêng lẻ của đại lượng ngẫu nhiên. Ví dụ trong khoảng C3:C43 (40 đại lượng).
2. Chia vùng phân phối thành các khoảng (gọi là lớp) và được giới hạn bởi các điểm. Ví dụ E3:E10. Giới hạn phải bao kín miền giá trị đơn lẻ. Sự phân lớp không phải tùy tiện mà có quy định cụ thể. Số lượng lớp (m) tối thiểu được xác định gần đúng như sau:
m = 1 + 3.32 logn
Trong đó n là số lượng các giá trị riêng lẻ.
3. Chọn Data Analysis trong Tools. Trong cửa sổ Data Analysis chọn Histogram.
data.jpg


XD_histogram.jpg

4. Khi cửa sổ Histogram hiện ra, bạn khai báo như sau:
- Input range: vào vùng giá trị, C3:C43
- Bin range: vào vùng giới hạn lớp, E3:E10
- Output range: chọn điểm đầu của kết quả, E12.
- Cumulative Percentage: Lập biểu đồ phần trăm tích luỹ.
- Chart Output: Lập biểu đồ phân phối xác suất.
 
histogram.jpg

Kết quả thể hiện như hình kèm theo, bạn có thể sửa đổi lại theo yêu cầu (Đã "mông má" lại rồi :. ).
Nếu dữ liệu gốc (giá trị riêng lẻ) thay đổi, thì bạn phải lập lại vì chức năng này không cập nhật thay đổi.
 
Với một đại lượng ngẫu nhiên (như ví dụ trên) tuân theo quy luật phân phối chuẩn (biểu diễn đồ thị ở dạng XY thì dễ nhìn hơn), phân phối có dạng hình chuông (phân phối chuẩn Gaoxơ).
Tâm phân phối chính là giá trị có tần suất lớn nhất và thường là giá trị kỳ vọng (hay gọi là giá trị trung bình của tập hợp). Nó giao với trục hoành ở -vô cùng và +vô cùng.

Từ ví dụ trên, các bạn thấy các giá trị có tần suất lớn thường ở gần tâm phân phối. Các giá trị có tần suất nhỏ thường nằm xa tâm phân phối.

Người ta cũng chứng minh được rằng, trong khoảng lân cận 3*(Độ lệch bình phương trung bình- Mời các bạn xem thêm hàm STDEV) của kỳ vọng (giá trị TB), có tới 99.74% các giá trị của đại lượng ngẫu nhiên rơi vào.

Những giá trị nằm ngoài khoảng đó không đặc trưng cho phân phối và được coi là sai số. Giá trị sai số đó thường được loại bỏ khi chỉnh lý thống kê.

Bạn nào quan tâm thì tải file kèm theo.

Xin lỗi! Tôi sẽ tải sau vì hết nguồn rồi.
 
Lần chỉnh sửa cuối:
Bảng tô màu xanh thì tôi hiểu nó có nguồn gốc từ đâu sau khi hiển thị biểu đồ lên. Nhưng do h/a của bạn chỉ thể hiện 1 chút nên còn vài cái chưa rõ:
1. chuỗi gtrị B3 => B42: là gtrị liên tục? (tôi chỉ có thể nhìn đến B19)
2. Giới hạn lớp nghĩa là gì, công thức tính ra sao (nếu có), tại sao lại chỉ có gtrị từ E3 => E10?
Rất cám ơn bạn & mong bạn chỉ giáo thêm //**/
Còn đây là hình mà tôi đã chạy thử nghiệm +-+-+-+

800.jpg
 
Số lượng lớp m đã có công thức tính, còn giới hạn lớp thì yêu cầu phải phủ kín giá trị phân phối. Bạn phải tự xác định.

Dưới đây là file ví dụ trên.
 

File đính kèm

  • Histogram.zip
    3.8 KB · Đọc: 6,115
Web KT
Back
Top Bottom