histograms (frequency distributions) của dữ liệu để gom nhóm (5 người xem)

  • Thread starter Thread starter Sacam
  • Ngày gửi Ngày gửi
Liên hệ QC

Người dùng đang xem chủ đề này

Sacam

Thành viên mới
Tham gia
13/10/19
Bài viết
9
Được thích
1
Xin chào mọi người

Em là thành viên mới. Em biết được diễn đàn này là do chồng em giới thiệu :) . Hiện tại em đang làm đề tài nghiên cứu, trong phần xử lý số liệu, em bị bí vấn đề này nên em nhờ cả nhà chỉ giáo cho em vài chiêu ạ.

Em đang phải gom nhóm các hộ gia đình, dựa vào mức độ phụ thuộc rừng của họ. Để gom nhóm, em phải chạy the histograms (frequency distributions) của dữ liệu. Nhưng em không rành cách làm như thế nào và sau khi chạy ra distribution của dữ liệu thì làm sao mình có thể gom nhóm (categorize) được dữ liệu ạ?

Cho em hỏi nhà mình có anh chị nào đã làm phần này có thể cho em xin ít kinh nghiệm được không ạ? Em xin chân thành cảm ơn và chúc cả nhà cuối tuần vui vẻ
 
Có ít nhất là 3 cách:

1. Cách dễ nhất, Insert Static Chart, chọn Histogram. Sau đó chọn customize tuỳ ý.

2. Cách cổ điển nhất, dựng cột Bin, và dùng hàm Frequency. Sau đó, tạo histogram qua column chart.
Chú: Hàm frequency là hàm mảng. Có thể thay bằng hàm CountIfs.

3. Cách điệu nghệ nhất, dùng Analysis Toolpak
Tạo một cột bin, tức là phân khoảng
Vào Analysis, chọn Histogram, khi hộp thoại mở ra, cho range data và bin.
 
Dạ em cảm ơn anh rất nhiều. Nice day anh ạ
 
Xin chào mọi người

Em là thành viên mới. Em biết được diễn đàn này là do chồng em giới thiệu :) . Hiện tại em đang làm đề tài nghiên cứu, trong phần xử lý số liệu, em bị bí vấn đề này nên em nhờ cả nhà chỉ giáo cho em vài chiêu ạ.

Em đang phải gom nhóm các hộ gia đình, dựa vào mức độ phụ thuộc rừng của họ. Để gom nhóm, em phải chạy the histograms (frequency distributions) của dữ liệu. Nhưng em không rành cách làm như thế nào và sau khi chạy ra distribution của dữ liệu thì làm sao mình có thể gom nhóm (categorize) được dữ liệu ạ?

Cho em hỏi nhà mình có anh chị nào đã làm phần này có thể cho em xin ít kinh nghiệm được không ạ? Em xin chân thành cảm ơn và chúc cả nhà cuối tuần vui vẻ
Trong phần xử lý số liệu, nếu cần tổng hợp từng nhóm rừng theo nhóm hoặc theo hộ bạn cũng có thể sử dụng PivotTable.
 
Trong phần xử lý số liệu, nếu cần tổng hợp từng nhóm rừng theo nhóm hoặc theo hộ bạn cũng có thể sử dụng PivotTable.
Pivot Chart cũng là một cách vẽ histogram. Ở trên tôi nói "có ít nhất 3 cách". Và 3 cách tôi đưa ra là thông dụng nhất.
 
Pivot Chart cũng là một cách vẽ histogram. Ở trên tôi nói "có ít nhất 3 cách". Và 3 cách tôi đưa ra là thông dụng nhất.
Tôi nghĩ Chủ Topic không biết sử dụng PivotTable nên đưa ra hướng đi để tham khảo, vì PivotTable có thể chọn hoặc rê thả và ứng biến dữ liệu theo ý muốn một cách nhanh nhất.
 
Dạ, em cảm ơn anh và mọi người đã giúp đỡ em nhiều. Trong quá trình làm, nếu không hiểu chỗ nào, em sẽ tiếp tục xin thỉnh giáo.
 
Dạ, em cảm ơn anh và mọi người đã giúp đỡ em nhiều. Trong quá trình làm, nếu không hiểu chỗ nào, em sẽ tiếp tục xin thỉnh giáo.
Bài 1 bạn nêu chưa cụ thể cho lắm nên mỗi thành viên hiểu 1 kiểu.
Theo tôi hiểu thì thế này: Bạn muốn tổng hợp số hộ sử dụng đất để trồng rừng hoặc chăm sóc, quản lý rừng theo hợp đồng với mỗi nhóm rừng có bao nhiêu hộ, bao nhiêu diện tích.
Hoặc tổng hợp nhóm rừng theo từng năm, mỗi năm có bao nhiêu hộ.
 
Bài 1 bạn nêu chưa cụ thể cho lắm nên mỗi thành viên hiểu 1 kiểu.
Theo tôi hiểu thì thế này: Bạn muốn tổng hợp số hộ sử dụng đất để trồng rừng hoặc chăm sóc, quản lý rừng theo hợp đồng với mỗi nhóm rừng có bao nhiêu hộ, bao nhiêu diện tích.
Hoặc tổng hợp nhóm rừng theo từng năm, mỗi năm có bao nhiêu hộ.
Theo tôi hiểu thì có lẽ cô ta đang làm luận án thạc sĩ tiến sĩ gì đó.
Đây chỉ là phần mở đầu, đại khái là dùng histogram để minh hoạ là dữ liệu của cô ta tuân theo luật phân phổi chuẩn (normal distribution) - biểu đồ hình chuông. Sau đó mới có thể áp dụng các lý thuyết và phương pháp thống kê khác.
 
Theo tôi hiểu thì có lẽ cô ta đang làm luận án thạc sĩ tiến sĩ gì đó.
Đây chỉ là phần mở đầu, đại khái là dùng histogram để minh hoạ là dữ liệu của cô ta tuân theo luật phân phổi chuẩn (normal distribution) - biểu đồ hình chuông. Sau đó mới có thể áp dụng các lý thuyết và phương pháp thống kê khác.

Dạ, sau khi đọc lại thì đúng là em không ghi rõ câu hỏi và diễn đạt ý của mình. Em xin trình bày rõ như sau ạ. Em đang nghiên cứu về mức độ phụ thuộc rừng của các hộ gia đình ở 1 thôn. (Mức độ phụ thuộc vào rừng được tính bằng phần trăm của thu nhập từ rừng chia cho tổng thu nhập hộ). Em đang muốn gom nhóm các hộ gia đình này theo các bậc: phụ thuộc nhiều, phụ thuộc trung bình, phụ thuộc ít và không phụ thuộc. Để làm được điều này, em phải căn cứ vào mức độ tập trung của dữ liệu để phân nhóm cho hợp lý. Ví dụ như: 0% là không phụ thuộc, từ 1-29% là phụ thuộc ít, 30 -59% là phụ thuộc trung bình, >=60% là phụ thuộc nhiều. Vì vậy em cần vẽ Histogram. Em vẫn còn đang loay hoay cách làm. E xin đính kèm file như sau
 

File đính kèm

Lần chỉnh sửa cuối:
Loại nghiên cứu dữ liệu này cần phần mềm chuyên hơn. Nếu bạn giỏi toán ứng dụng thì có thể dùng R.
Excel chi có thể giúp cbo bạn đến một mức nào đó thôi.
Trước mắt thì tôi sẽ chia "phân trăm phụ thuộc" ra thành 5 hoặc 7 khoảng (tuỳ theo dạng cái histogram đã vẽ)
0-20 = 1
21-40 = 2
41-60 = 3
61-80 = 4
81-100 = 5
Với điểm 1-5 như thế, tôi có thể làm được một số con toán khác như tính trung bình, ANOVA, ...

Diễn đàn này chuyên về Excel chứ không phải thóng kê. Nếu cân chi tiết hơn bạn nên tìm các diễn đàn chuyên toán ứng dụng hoặc tìm người học về tâm lý học nhờ hcir dẫn. Ngành Tâm Lý học rất chuyên về ngón này.
 
Dạ, sau khi đọc lại thì đúng là em không ghi rõ câu hỏi và diễn đạt ý của mình. Em xin trình bày rõ như sau ạ. Em đang nghiên cứu về mức độ phụ thuộc rừng của các hộ gia đình ở 1 thôn. (Mức độ phụ thuộc vào rừng được tính bằng phần trăm của thu nhập từ rừng chia cho tổng thu nhập hộ). Em đang muốn gom nhóm các hộ gia đình này theo các bậc: phụ thuộc nhiều, phụ thuộc trung bình, phụ thuộc ít và không phụ thuộc. Để làm được điều này, em phải căn cứ vào mức độ tập trung của dữ liệu để phân nhóm cho hợp lý. Ví dụ như: 0% là không phụ thuộc, từ 1-29% là phụ thuộc ít, 30 -59% là phụ thuộc trung bình, >=60% là phụ thuộc nhiều. Vì vậy em cần vẽ Histogram. Em vẫn còn đang loay hoay cách làm. E xin đính kèm file như sau
Với cách phân nhóm nầy có vẽ không ổn, Thay giá trị Bin và chạy lại tới khi vừa ý
Không phụ thuộc chỉ mang ý nghĩa tương đối không phải là 0% mà có thể là <4%
 

File đính kèm

Với cách phân nhóm nầy có vẽ không ổn, Thay giá trị Bin và chạy lại tới khi vừa ý
Không phụ thuộc chỉ mang ý nghĩa tương đối không phải là 0% mà có thể là <4%

Em cảm ơn anh rất nhiều. Cho em hỏi thêm là vì sao <4% thì mình có thể coi nó là không phụ thuộc ạ?
Bài đã được tự động gộp:

Loại nghiên cứu dữ liệu này cần phần mềm chuyên hơn. Nếu bạn giỏi toán ứng dụng thì có thể dùng R.
Excel chi có thể giúp cbo bạn đến một mức nào đó thôi.
Trước mắt thì tôi sẽ chia "phân trăm phụ thuộc" ra thành 5 hoặc 7 khoảng (tuỳ theo dạng cái histogram đã vẽ)
0-20 = 1
21-40 = 2
41-60 = 3
61-80 = 4
81-100 = 5
Với điểm 1-5 như thế, tôi có thể làm được một số con toán khác như tính trung bình, ANOVA, ...

Diễn đàn này chuyên về Excel chứ không phải thóng kê. Nếu cân chi tiết hơn bạn nên tìm các diễn đàn chuyên toán ứng dụng hoặc tìm người học về tâm lý học nhờ hcir dẫn. Ngành Tâm Lý học rất chuyên về ngón này.

Em cảm ơn anh ạ. Em đang dùng SPSS nhưng cũng chỉ ở mức cơ bản. Phần mềm R thì e có nghe qua nhưng chưa học. Em sẽ tìm hiểu thêm ạ
Bài đã được tự động gộp:

Với cách phân nhóm nầy có vẽ không ổn, Thay giá trị Bin và chạy lại tới khi vừa ý
Không phụ thuộc chỉ mang ý nghĩa tương đối không phải là 0% mà có thể là <4%
A Hiếu ơi, nếu em thay giá trị Bin và chạy lại thì tới khi nào thì mình có thể coi là vừa ý ạ. Em xin lỗi vì em cũng chỉ mới tìm hiểu nên hỏi những câu cơ bản này ạ
 
Em cảm ơn anh rất nhiều. Cho em hỏi thêm là vì sao <4% thì mình có thể coi nó là không phụ thuộc ạ?
Bài đã được tự động gộp:



Em cảm ơn anh ạ. Em đang dùng SPSS nhưng cũng chỉ ở mức cơ bản. Phần mềm R thì e có nghe qua nhưng chưa học. Em sẽ tìm hiểu thêm ạ
Bài đã được tự động gộp:


A Hiếu ơi, nếu em thay giá trị Bin và chạy lại thì tới khi nào thì mình có thể coi là vừa ý ạ. Em xin lỗi vì em cũng chỉ mới tìm hiểu nên hỏi những câu cơ bản này ạ
Nghiên cứu thống kê mang tính xác suất, kết quả chỉ mang tính tương đối không thể đúng 100%, các kiểm định thường dùng mức độ ý nghĩa 5% (tạm gọi chấp nhận 5% sai số), thông thường các mức độ nhỏ coi như không phụ thuộc
Bạn thay giá trị Bin sao cho đồ thị có hình chuông là hợp lý
Nếu bạn nghiên cứu mối liên hệ với các tiêu thức số lượng khác, thì xử lý trực tiếp dữ liệu gốc không thông qua phân nhóm sẽ thuận lợi hơn
 
Nghiên cứu thống kê mang tính xác suất, kết quả chỉ mang tính tương đối không thể đúng 100%, các kiểm định thường dùng mức độ ý nghĩa 5% (tạm gọi chấp nhận 5% sai số), thông thường các mức độ nhỏ coi như không phụ thuộc
Bạn thay giá trị Bin sao cho đồ thị có hình chuông là hợp lý
Nếu bạn nghiên cứu mối liên hệ với các tiêu thức số lượng khác, thì xử lý trực tiếp dữ liệu gốc không thông qua phân nhóm sẽ thuận lợi hơn

Em đã hiểu. Em chân thành cảm ơn anh ạ
 
...Em cảm ơn anh ạ. Em đang dùng SPSS nhưng cũng chỉ ở mức cơ bản. Phần mềm R thì e có nghe qua nhưng chưa học. Em sẽ tìm hiểu thêm ạ
SPSS là quá đủ rồi. Cứ chịu khó học chuyên sâu hơn. Không cần phải học R.

Hiện tại thì cứ phân nhóm thành 5 hoặc 7 đi rồi phân tích tiếp.
 
Web KT

Bài viết mới nhất

Back
Top Bottom