1. Khoảng biến thiên
+) Khoảng biến thiên của mẫu số liệu ghép nhóm luôn lớn hơn hoặc bằng khoảng biến thiên của mẫu số liệu gốc
+) Ý nghĩa của khoảng biến thiên của mẫu số liệu ghép nhóm
\(\bullet\quad\) Khoảng biến thiên của mẫu số liệu ghép nhóm là giá trị xấp xỉ khoảng biến thiên của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của mẫu số liệu.
\(\bullet\quad\) Khoảng biến thiên \(R=u_{k+1}-u_1\) chưa phản ánh được đầy đủ mức độ phân tán của phần lớn các số liệu. Hơn nữa, giá trị của R thường tăng vọt khi xuất hiện giá trị ngoại lệ trong mẫu số liệu.
Do đó, để phản ánh mức độ phân tán của số liệu, người ta còn dùng các số đặc trưng khác.
2. Khoảng tứ phân vị
3. Nhắc lại cách xác định tứ phân vị
B1. Gọi \( n \) là cỡ mẫu.
B2. Giả sử nhóm \( \left[ u_m ; u_{m+1}\right) \) chứa trung vị;
B3. \(n_m\) là tần số của nhóm chứa trung vị;
B4. \(C=n_1+n_2+ \cdots +n_{m-1} \).
Khi đó
\[Q_2=M_e = u_m+\displaystyle\frac{\displaystyle\frac{n}{2}-C}{n_m}\cdot \left( u_{m+1}-u_m\right).\]
B1. Giả sử nhóm \( \left[ u_m ; u_{m+1}\right)\) chứa tứ phân vị thứ nhất;
B2. \( n_m \) là tần số của nhóm tứ phân vị thứ nhất;
B3. \( C=n_1+n_2+\cdots +n_{m-1} \).
Khi đó
\[Q_1=u_m+\displaystyle\frac{\displaystyle\frac{n}{4}-C}{n_m}\cdot \left(u_{m+1}-u_m\right).\]
B1. Giả sử nhóm \(\left[u_j;u_{j+1}\right)\) chứa tứ phân vị thứ ba;
B2. \(n_j\) là tần số của nhóm chứa tứ phân vị thứ ba;
B3. \(C=n_1+n_2+\ldots+n_{j-1}\).
Khi đó
\[Q_3=u_j+\displaystyle\frac{\displaystyle\frac{3n}{4}-C}{n_j}\cdot \left(u_{j+1}-u_j\right).\]
Chú ý: Nếu tứ phân vị thứ \(k\) là \(\displaystyle\frac{1}{2}\left(x_m+x_{m+1}\right)\), trong đó \(x_m\) và \(x_{m+1} \) thuộc hai nhóm liên tiếp, ví dụ như \(x_m\in \left[u_{j-1};u_j\right)\) và \(x_{m+1}\in\left[u_j;u_{j+1}\right)\) thì ta lấy \(Q_k=u_j \).
4. Ý nghĩa của khoảng tứ phân vị của mẫu số liệu ghép nhóm
\(\bullet\quad\) Khoảng tứ phân vị: của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của nửa giữa của mẫu số liệu (tập hợp gồm 50\% số liệu nằm chính giữa mẫu số liệu).
\(\bullet\quad\) Khoảng tứ phân vị của mẫu số liệu ghép nhóm càng nhỏ thì dữ liệu càng tập trung xung quanh trung vị.
\(\bullet\quad\) Khoảng tứ phân vị được dùng để xác định giá trị ngoại lệ trong mẫu số liệu. Giá trị \(x\) trong mẫu số liệu là giá trị ngoại lệ nếu \(x > Q_3+1{,}5\Delta_Q\) hoặc \(x < Q_1-1{,}5\Delta_Q\).
\(\bullet\quad\) Khoảng tứ phân vị của mẫu số liệu ghép nhóm không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ trong mẫu số liệu.