Học sinh nắm vững được kiến thức đã học trong chương 3
Khi điều tra về số cây trồng được của mỗi lớp trong dịp Tết trồng cây người ta thu thập được bảng sau:
28 | 28 | 30 | 50 | 30 |
30 | 35 | 35 | 30 | 35 |
35 | 30 | 50 | 35 | 30 |
30 | 35 | 30 | 35 | 50 |
+ Việc làm trên của người điều tra là thu thập số liệu về vấn đề cần quan tâm.
+ Các số liệu được ghi trong bảng trên được gọi là bảng số liệu thống kê ban đầu.
+ Số liệu thông kê là số liệu thu thập được khi điều tra về một dấu hiệu. Mỗi số liệu là một giá trị của dấu hiệu.
+ Số tất cả các giá trị (không nhất thiết khác nhau) của dấu hiệu bằng số các đơn vị điều tra.
Ví dụ: Số cân nặng (tính tròn đến kg) của 10 học sinh ghi lại như sau:
35 38 29 30 31 42 26 36 39 32
Dấu hiệu ở đây là: số cân nặng của mỗi học sinh.
Số lần xuất hiện của một giá trị trong dãy các giá trị của dấu hiệu gọi là tần số của giá trị đó.
Từ bảng thu thập số liệu ban đầu ta có thể lập được bảng tần số.
Bảng “tần số” được lập như sau:
+ Vẽ một khung hình chữ nhật gồm hai dòng.
+ Dòng trên ghi các giá trị khác nhau của dấu hiệu theo thứ tự tăng dần.
+ Dòng dưới ghi các tần số tương ứng của mỗi giá trị đó.
Bảng tần số giúp cho người điều tra dễ có những nhận xét chung về sự phân phối các giá trị của dấu hiệu và tiện lợi cho việc tính toán sau này.
Ta cũng có thể lập bảng tần số theo hàng dọc.
+ Dựng hệ trục tọa độ, trục hoành biểu diễn các giá trị x, trục tung biểu diễn tần số n (độ dài đơn vị trên hai trục có thể khác nhau).
+ Xác định các điểm có tọa độ là cặp số gồm giá trị và tần số của nó (giá trị viết trước, tần số viết sau).
+ Nối mỗi điểm đó với điểm trên trục hoành có cùng hoành độ.
Ví dụ: Bảng “tần số”:
Số cân(x) | 28 | 29 | 30 | 35 | 37 |
Tần số (n) | 1 | 2 | 2 | 3 | 2 |
Từ bảng tần số ta dựng biểu đồ đoạn thẳng:
Dựa vào bảng “tần số”, ta có thể tính số trung bình cộng của dấu hiệu (kí hiệu $\overline{X}$) như sau:
+ Nhân từng giá trị với tần số tương ứng.
+ Cộng tất cả các tích vừa tính được.
+ Chia tổng đó cho số các giá trị (tức là tổng các tần số).
+ Công thức tính: $\overline{X}=\frac{x_{1}.n_1+x_2.n_2+...+x_k.n_k}{N}$
Trong đó:
• x1, x2,...., xn là k giá trị khác nhau của dấu hiệu X.
• n1, n2,...., nk là các tần số tương ứng.
• N là số các giá trị
+ Số trung bình cộng thường được dùng làm “đại diện” cho dấu hiệu, đặc biệt là khi muốn so sánh các dấu hiệu cùng loại.
+ Khi các giá trị của dấu hiệu có khoảng chênh lệch rất lớn đối với nhau thì không nên lấy số trung bình cộng làm “đại diện” cho dấu hiệu đó.
+ Số trung bình cộng có thể không thuộc dãy giá trị của dấu hiệu.
+ Mốt của dấu hiệu là giá trị tần số lớn nhất trong bảng “tần số”, kí hiệu là $M_0$.
+ Có những dấu hiệu có hai mốt hoặc nhiều hơn