\(\S2.\) TRUNG VỊ VÀ TỨ PHÂN VỊ

1. Trung vị

\begin{array}{|l|c|c|c|c|}\hline \textbf{Nhóm} &\left[u_1; u_2\right) &\left[u_2; u_3\right) & \ldots &\left[u_k; u_{k+1}\right) \\\hline\textbf{Giá trị đại diện} & c_1 & c_2 & \ldots & c_k\\ \hline \textbf{Tần số} & n_1 & n_2 & \ldots & n_k \\ \hline\end{array}

Công thức xác định trung vị của mẫu số liệu ghép nhóm:

+) Gọi \( n \) là cỡ mẫu.

+) Giả sử nhóm \( \left[ u_m ; u_{m+1}\right) \) chứa trung vị;

+) \( n_m \) là tần số của nhóm chứa trung vị;

+) \( C=n_1+n_2+ \cdots +n_{m-1} \).

Khi đó

\[M_e = u_m+\displaystyle\frac{\displaystyle\frac{n}{2}-C}{n_m}\cdot \left( u_{m+1}-u_m\right).\]

Ý nghĩa của trung vị của mẫu số liệu ghép nhóm: Từ dữ liệu ghép nhóm nói chung không thể xác định chính xác trung vị của mẫu số liệu gốc. Trung vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho mẫu số liệu gốc và có thể lấy làm giá trị đại diện cho mẫu số liệu.

2. Tứ phân vị

Tứ phân vị thứ hai của mẫu số liệu ghép nhóm, kí hiệu \(Q_2\), cũng hính là trung vị của mẫu số liệu ghép nhóm.

Để tìm tứ phân vị thứ nhất của mẫu số liệu ghép nhóm, kí hiệu \( Q_1 \), ta thực hiện như sau:

+) Giả sử nhóm \( \left[ u_m ; u_{m+1}\right)\) chứa tứ phân vị thứ nhất;

+) \( n_m \) là tần số của nhóm tứ phân vị thứ nhất;

+) \( C=n_1+n_2+\cdots +n_{m-1} \).

Khi đó

\[Q_1=u_m+\displaystyle\frac{\displaystyle\frac{n}{4}-C}{n_m}\cdot \left( u_{m+1}-u_m\right).\]

Tương tự, để tìm tứ phân vị thứ ba của mẫu số liệu ghép nhóm, kí hiệu \( Q_3 \), ta thực hiện như sau:

+) Giả sử nhóm \( \left[u_j ; u_{j+1} \right) \) chứa tứ phân vị thứ ba;

+) \( n_j \) là tần số của nhóm chứa tứ phân vị thứ ba;

+) \( C=n_1+n_2+\ldots+n_{j-1}\).

Khi đó

\[Q_3=u_j+\displaystyle\frac{\displaystyle\frac{3n}{4}-C}{n_j}\cdot \left(u_{j+1}-u_j \right).\]

Chú ý.

Nếu tứ phân vị thứ \( k \) là \( \displaystyle\frac{1}{2}\left(x_m+x_{m+1} \right) \), trong đó \( x_m \) và \( x_{m+1} \) thuộc hai nhóm liên tiếp, ví dụ như \( x_m\in \left[u_{j-1};u_j \right) \) và \( x_{m+1}\in \left[ u_j ; u_{j+1}\right)\) thì ta lấy \( Q_k=u_j \).

Ý nghĩa của tứ phân vị của mẫu số liệu ghép nhóm

+) Ba điểm tứ phân vị chia mẫu số liệu đã sắp xếp theo thứ tự không giảm thành bốn phần đều nhau.

+) Giống như với trung vị, nói chung không thể xác định chính xác các điểm tứ phân vị của mẫu số liệu ghép nhóm.

+) Bộ ba tứ phân vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho tứ phân vị của mẫu số liệu gốc và được sử dụng làm giá trị đo xu thế trung tâm của mẫu số liệu.

+) Tứ phân bị thứ nhất và thứ ba đo xu thế trung tâm của nửa dưới (các dữ liệu nhỏ hơn \( Q_2 \)) và nửa trên (các dữ liệu lớn hơn \( Q_2 \)) của mẫu số liệu.

Bài tập

Bài tập 1

Thời gian (phút) truy cập internet mỗi buổi tối của một số học sinh được cho trong bảng sau:

\begin{array}{|c|c|c|c|c|c|c|}\hline \text{Thời gian (phút)} & \left[9{,}5;12{,}5 \right) & \left[12{,}5;15{,}5 \right) & \left[15{,}5;18{,}5 \right) & \left[18{,}5;21{,}5 \right) & \left[21{,}5;24{,}5 \right) \\ \hline \text{Số học sinh} &3 & 12 & 15 &24 & 2 \\ \hline\end{array}

Tính trung vị của mẫu số liệu ghép nhóm này.

Cỡ mẫu là \(n=3+12+15+24+2=56\).

Gọi \(x_1,\,\ldots,\,x_{56}\) là thời gian vào internet của \(56\) học sinh và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần.

Khi đó, trung vị là \(\displaystyle\frac{x_{28}+x_{29}}{2}\). Do \(2\) giá trị \(x_{28},\,x_{29}\) thuộc nhóm \(\left[15{,}5;18{,}5 \right)\) nên nhóm này chứa trung vị.

Do đó, \(p=3\); \(a_3=15{,}5\); \(m_3=15\); \(m_1+m_2=3+12=15\); \(a_4-a_3=3\) và ta có \(M_e=15{,}5+\displaystyle\frac{\displaystyle\frac{56}{2}-15}{15}\cdot 3=18{,}1.\)

Bài tập 2

Bảng bên cho biết tần số ghép nhóm số liệu thống kê cân nặng của \(40\) học sinh lớp \(11A\) trong một trường trung học phổ thông (đơn vị: kilôgam). Xác định tứ phân vị của mẫu số liệu ghép nhóm.

\begin{array}{|c|c|c|}\hline\textbf{Nhóm} & \textbf{Tần số} & \textbf{Tần số tích luỹ}\\ \hline\left[30;40\right) & 2 & 2\\\left[40;50\right) & 10 & 12\\ \left[50;60\right) & 16 & 28\\ \left[60;70\right) & 8 & 36\\ \left[70;80\right) & 2 & 38\\ \left[80;90\right) & 2 & 40\\ \hline& n = 40 &\\\hline\end{array}

Số phần tử của mẫu là \(n=40\).

+) Ta có \(\displaystyle\frac{n}{4} = 10\), mà \(2<10<12\) nên nhóm \(2\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(10\).

Xét nhóm \(2\) là nhóm \(\left[40;50\right)\) có \(s=40\), \(h=10\), \(n_2=10\) và nhóm \(1\) có \(cf_1 = 2\).

Khi đó, tứ phân vị thứ nhất là

\[Q_1 = 40 + \displaystyle\frac{10-2}{10} \cdot 10 = 48\text{ (kg)}.\]

+) Ta có \(\displaystyle\frac{n}{2} = 20\), mà \(12<20<28\) nên nhóm \(3\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(20\).

Xét nhóm \(3\) là nhóm \(\left[50;60\right)\) có \(r=50\), \(d=10\), \(n_3=16\) và nhóm \(2\) có \(cf_2 = 12\).

Khi đó, tứ phân vị thứ hai là

\[Q_2 = 50 + \displaystyle\frac{20-12}{16} \cdot 10 = 55\text{ (kg)}.\]

+) Ta có \(\displaystyle\frac{3n}{4} = 30\), mà \(28<30<36\) nên nhóm \(4\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(30\).

Xét nhóm \(4\) là nhóm \(\left[60;70\right)\) có \(t=50\), \(l=10\), \(n_4=8\) và nhóm \(3\) có \(cf_3 = 28\).

Khi đó, tứ phân vị thứ ba là

\[Q_3 = 60 + \displaystyle\frac{30-28}{8} \cdot 10 = 62{,}5\text{ (kg)}.\]

Vậy tứ phân vị của mẫu số liệu trên là \(48\), \(55\) và \(62{,}5\).

Bài tập 3

Kết quả kiểm tra môn Toán của lớp \(11D\) như sau

\begin{array}{cccccccccccccccccccc}5 & 6 & 7 & 5 & 6 & 9 & 10 & 8 & 5 & 5 & 4 & 5 & 4 & 5 & 7 & 4 & 5 & 8 & 9 & 10 \\ 5 & 3 & 5 & 6 & 5 & 7 & 5 & 8 & 4 & 9 & 5 & 6 & 5 & 6 & 8 & 8 & 7 & 9 & 7 & 9\end{array}

a) Lập bảng tần số ghép nhóm của mẫu số liệu trên có bốn nhóm ứng với bốn nửa khoảng \(\left[3;5\right)\), \(\left[5;7\right)\), \(\left[7;9\right)\), \(\left[9;11\right)\).

b) Mốt của bảng số liệu ghép nhóm trên là bao nhiêu (làm tròn kết quả đến hàng phần mười)?

a) Bảng bên là bảng tần số ghép nhóm cho kết quả kiểm tra môn Toán của lớp \(11D\).

\begin{array}{|c|c|}\hline \textbf{Nhóm} & \textbf{Tần số}\\ \hline \left[3;5\right) & 5\\ \hline\left[5;7\right) & 18\\ \hline \left[7;9\right) & 10\\ \hline \left[9;11\right) & 7\\ \hline & n = 40 \\ \hline\end{array}

b) Ta thấy: Nhóm \(2\) ứng với nửa khoảng \(\left[5;7\right)\) là nhóm có tần số lớn nhất với \(u=5\), \(g=2\), \(n_2 = 18\). Nhóm \(1\) có tần số \(n_1 = 5\), nhóm \(3\) có tần số \(n_3=10\).

Khi đó, mốt của mẫu số liệu là

\[M_o = 5 + \left( \displaystyle\frac{18- 5}{2\cdot 18 - 5 - 10} \right) \cdot 2 \approx 6{,}2.\]

Bài tập 4

Bảng bên cho ta bảng tần số ghép nhóm số liệu thống kê chiều cao của \(40\) mẫu cây ở một vườn thực vật (đơn vị: centimét).

a) Xác định số trung bình cộng, trung vị, tứ phân vị của mẫu số liệu ghép nhóm trên.

b) Mốt của mẫu số liệu ghép nhóm trên là bao nhiêu?

\begin{array}{|c|c|c|}\hline\textbf{Nhóm} & \textbf{Tần số} & \textbf{Tần số tích luỹ}\\ \hline \left[30;40\right) & 4 & 4\\ \left[40;50\right) & 10 & 14\\ \left[50;60\right) & 14 & 28\\ \left[60;70\right) & 6 & 34\\ \left[70;80\right) & 4 & 38\\ \left[80;90\right) & 2 & 40\\ \hline& n = 40 &\\ \hline\end{array}

a)

+) Trung bình cộng của mẫu số liệu trên là

\[\overline{x} = \displaystyle\frac{35 \cdot 4 + 45 \cdot 10 + 55 \cdot 14 + 65 \cdot 6 + 75 \cdot 4 + 85 \cdot 2}{40} = 55{,}5\text{ (cm)}.\]

+) Ta có \(\displaystyle\frac{n}{2} = 20\), mà \(14<20<28\) nên nhóm \(3\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(20\).

Xét nhóm \(3\) là nhóm \(\left[50;60\right)\) có \(r=50\), \(d=10\), \(n_3=14\) và nhóm \(2\) có \(cf_2 = 14\).

Khi đó, tứ phân vị thứ hai (cũng là trung vị) là

\[Q_2 = M_e = 50 + \displaystyle\frac{20 - 14}{14} \cdot 10 = 54{,}3\text{ (cm)}.\]

+) Ta có \(\displaystyle\frac{n}{4} = 10\), mà \(4 < 10 < 14\) nên nhóm \(2\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(10\).

Xét nhóm \(2\) là nhóm \(\left[40;50\right)\) có \(s=40\), \(h=10\), \(n_2=10\) và nhóm \(1\) có \(cf_1 = 4\).

Khi đó, tứ phân vị thứ nhất là

\[Q_1 = 40 + \displaystyle\frac{10 - 4}{10} \cdot 10 = 46\text{ (cm)}.\]

+) Ta có \(\displaystyle\frac{3n}{4} = 30\), mà \(28 < 30 < 34\) nên nhóm \(4\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(30\).

Xét nhóm \(4\) là nhóm \(\left[60;70\right)\) có \(t = 60\), \(l = 10\), \(n_4 = 6\) và nhóm \(3\) có \(cf_3 = 28\).

Khi đó, tứ phân vị thứ ba là

\[Q_3 = 60 + \displaystyle\frac{30 - 28}{6} \cdot 10 \approx 63{,}3\text{ (cm)}.\]

Vậy \(55{,}5\text{ (cm)}\) là trung bình mẫu, \(54{,}3\text{ (cm)}\) là trung vị của mẫu và \(Q_1 = 46\text{ (cm)}\), \(Q_2 = 54{,}3\text{ (cm)}\), \(Q_3 = 63{,}3\text{ (cm)}\) là tứ phân vị của mẫu.

b) Ta thấy: Nhóm \(3\) ứng với nửa khoảng \(\left[50;60\right)\) là nhóm có tần số lớn nhất với \(u=50\), \(g=10\), \(n_3 = 14\). Nhóm \(2\) có tần số \(n_2 = 10\), nhóm \(4\) có tần số \(n_4 = 6\).

Khi đó, mốt của mẫu số liệu là

\[M_o = 50 + \left( \displaystyle\frac{14 - 10}{2\cdot 14 - 10 - 6} \right) \cdot 10 \approx 53{,}3\text{ (cm)}.\]

Bài tập 5

Một thư viện thống kê số lượng sách được mượn mỗi ngày trong ba tháng ở bảng sau:

\begin{array}{|c|c|c|c|c|c|c|c|}\hline \text{Số sách} &[16; 20] &[21; 25] &[26; 30] &[31; 35] &[36; 40] &[41; 45] &[46; 50] \\ \hline \text{Số ngày} & 3 & 6 & 15 & 27 & 22 & 14 & 5 \\ \hline\end{array}

Hãy ước lượng số trung bình và mốt của mẫu số liệu ghép nhóm trên.

Vì số lượng sách được mượn là số nguyên nên ta hiệu chỉnh bảng tần số ghép nhóm (theo giá trị đại diện) như sau

\begin{array}{|c|c|c|c|c|c|c|c|}\hline \text{Số sách} &[15{,}5; 20{,}5) &[20{,}5; 25{,}5) &[25{,}5; 30{,}5) &[30{,}5; 35{,}5) &[35{,}5; 40{,}5] &[40{,}5; 45{,}5) &[45{,}5; 50{,}5) \\ \hline \text{GT đại diện} &18 &23 &28 &33 &38 &43 &48 \\ \hline \text{Số ngày} & 3 & 6 & 15 & 27 & 22 & 14 & 5 \\ \hline \end{array}

Trung bình số lượng sách được mượn mỗi ngày trong 3 tháng của thư viện là

\[\overline{x}=\displaystyle\frac{18\cdot 3+23\cdot 6+28\cdot 15+33\cdot 27+38\cdot 22+43\cdot 14+48\cdot 5}{92}\approx 34{,}58. \]

Nhóm chứa mốt của mẫu số liệu trên là nhóm \([30{,}5; 35{,}5)\).

Do đó \(u_m=30{,}5\); \(n_{m-1}=15\); \(n_m=27\); \(n_{m+1}=22\); \(u_{m+1}-u_m=35{,}5-30{,}5=5\).

Mốt của mẫu số liệu ghép nhóm là

\[M_0=30{,}5+\displaystyle\frac{27-15}{(27-15)+(27-22)} \cdot 5\approx 34{,}03. \]

Bài tập 6

Trong tuần lễ bảo vệ môi trường, các học sinh khối \( 11 \) tiến hành thu nhặt vỏ chai nhựa để tái chế. Nhà trường thống kê kết quả thu nhặt vỏ chai của học sinh khối \( 11 \) ở bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Số vỏ chai nhựa} & \left[ 11 ; 15\right] & \left[ 16 ; 29\right] & \left[21 ; 25 \right] & \left[ 26 ; 30\right] & \left[31 ; 35 \right] \\ \hline \textbf{Số học sinh} & 53 & 82 & 48 & 39 & 18 \\ \hline \end{array}

Hãy tìm trung vị của mẫu số liệu ghép nhóm trên.

Do số vỏ chai là số nguyên nên ta hiệu chỉnh lại như sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Số vỏ chai nhựa} & \left[ 10{,}5 ; 15{,}5\right) & \left[ 15{,}5 ; 20{,}5\right) & \left[ 20{,}5 ; 25{,}5\right) & \left[ 25{,}5 ; 30{,}5\right) & \left[30{,}5 ; 35{,}5 \right) \\ \hline \textbf{Số học sinh}& 53 & 82 & 48 & 39 & 18 \\ \hline \end{array}

Số học sinh tham gia thu nhặt vỏ chai nhựa là \( n=53+82+48+39+18=240.\)

Gọi \( x_1; x_2; \ldots ; x_{240} \) lần lượt là số vỏ chai \( 240 \) học sinh khối \( 11 \) thu nhặt được xếp theo thứ tự không giảm.

Do \( x_1, \ldots, x_{53}\in \left[10{,}5 ; 15{,}5 \right) \); \( x_{54}, \ldots, x_{135}\in \left[ 15{,}5 ; 20{,}5\right)\) nên trung vị của mẫu số liệu \( x_1; x_2; \ldots;x_{240} \) là \( \displaystyle\frac{1}{2}\left( x_{120}+x_{121}\right)\in \left[ 15{,}5 ; 20{,}5\right).\)

Ta xác định được \( n=240\); \( n_m=82 \); \( C=53 \); \( u_m=15{,}5 \); \( u_{m+1}=20{,}5 \).

Trung vị của mẫu số liệu ghép nhóm là \( M_e=15{,}5+\displaystyle\frac{\displaystyle\frac{240}{2}-53}{82}\cdot \left( 20{,}5-15{,}5\right)=\displaystyle\frac{803}{41}\approx 19{,}59. \)

Bài tập 7

Trong một hội thao, thời gian chạy \( 200 \) m của một nhóm các vận động viên được ghi lại ở bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Thời gian} \textbf{(giây)}& \left[21 ; 21{,}5 \right) & \left[ 21{,}5 ; 22\right) & \left[ 22 ; 22{,}5\right) & \left[ 22{,}5 ; 23\right) & \left[ 23 ; 23{,}5\right) \\ \hline \textbf{Số vận động viên} & 5 & 12 & 32 & 45 & 30 \\ \hline \end{array}

Dựa vào bảng số liệu trên, ban tổ chức muốn chọn ra khoảng \( 50 \% \) số vận động viên chạy nhanh nhất để tiếp tục thi vòng \( 2 \). Ban tổ chức nên chọn các vận động viên có thời gian chạy không quá bao nhiêu giây?

Số vận động viên tham gia là \(n=5+12+32+45+30=124.\)

Gọi \( x_1; x_2; \ldots ; x_{124} \) lần lượt là thời gian chạy \( 200 \) m của \( 124 \) vận động viên được xếp theo thứ tự không giảm.

Do \( x_1, \ldots, x_5 \in \left[ 21 ; 21{,}5 \right)\), \( x_6, \ldots, x_{17} \in \left[ 21{,}5 ; 22\right) \), \( x_{18}, \ldots, x_{49} \in \left[22 ; 22{,}5\right) \), \( x_{50},\ldots, x_{94} \in \left[ 22{,}5 ; 23\right) \) nên trung vị của mẫu số liệu \( x_1; x_2; \ldots ;x_{124} \) là

\(\displaystyle\frac{1}{2}\cdot \left( x_{62}+x_{63}\right) \in \left[ 22{,}5 ; 23\right).\)

Ta xác định được \( n=124 \); \( n_m=45\); \( C=5+12+32=49 \); \( u_m= 22{,}5\); \( u_{m+1}=23\).

Trung vị của mẫu số liệu ghép nhóm là \(M_e=22{,}5 +\displaystyle\frac{\displaystyle\frac{124}{2}-49}{45}\cdot \left( 23-22{,}5\right)= \displaystyle\frac{1019}{45}\approx 22{,}64.\)

Vậy ban tổ chức nên chọn các vận động viên có thời gian chạy không quá \( 22{,}64\) (giây) được tiếp tục thi vòng hai.

Bài tập 8

Thời gian luyện tập trong một ngày (tính theo giờ) của một số vận động viên được ghi lại ở bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Thời gian luyện tập (giờ)} & \left[ 0 ; 2\right) & \left[ 2 ; 4\right) & \left[ 4 ; 6\right) & \left[ 6 ; 8\right) & \left[8 ; 10 \right) \\ \hline \textbf{Số vận động viên} & 3 & 8 & 12 & 12 & 4 \\ \hline \end{array}

Hãy xác định các tứ phân vị của mẫu số liệu đã cho.

Huấn luyện viên muốn xác định nhóm gồm \( 25\% \) các vận động viên có số giờ luyện tập cao nhất. Hỏi huấn luyện viên nên chọn các vận động viên có thời gian luyện tập từ bao nhiêu giờ trở lên vào nhóm này?

Số vận động viên được khảo sát là \( n=3+8+12+12+4=39\).

Gọi \( x_1 \); \( x_2 \); \(\ldots\) ;\( x_{39} \) là thời gian luyện tập của \( 39 \) vận động viên được xếp theo thứ tự không giảm.

Ta có \( x_1, x_2, x_3 \in \left[ 0 ; 2\right) \); \( x_4\), \(\ldots\), \(x_{11}\in \left[2 ; 4 \right) \); \( x_{12}\), \(\ldots\), \(x_{23}\in \left[ 4 ; 6\right) \); \( x_{24}\), \(\ldots\), \(x_{35}\in \left[6;8\right) \); \( x_{36}\), \(\ldots\) , \(x_{39}\in \left[ 8 ; 10\right) \).

Do đó đối với dãy số liệu \( x_1 \); \( x_2 \); \(\ldots\); \( x_{39} \) thì

+) Tứ phân vị thứ nhất là \( x_{10} \) thuộc nhóm \(\left[ 2 ; 4\right)\);

+) Tứ phân vị thứ hai là \( x_{20} \) thuộc nhóm \( \left[ 4 ; 6\right)\);

+) Tứ phân vị thứ ba là \( x_{30} \) thuộc nhóm \( \left[ 6 ; 8\right) \).

Ta nói nhóm \( \left[2 ; 4 \right)\) là nhóm chứa tứ phân vị thứ nhất; nhóm \( \left[ 4 ; 6\right) \) là nhóm tứ phân vị thứ hai; nhóm \( \left[ 6 ; 8\right) \) là nhóm chứa tứ phân vị thứ ba.

Tứ phân vị thứ hai của dãy số liệu \( x_1; x_2\); \(\ldots\) ; \(x_{39}\) là \( x_{20}\in \left[ 4 ; 6\right) \).

Do đó tứ phân vị thứ hai của mẫu số liệu ghép nhóm là \(Q_2=4+\displaystyle\frac{\displaystyle\frac{2\cdot 39}{4}-(3+8)}{12}\cdot(6-4)=\displaystyle\frac{65}{12}\approx 5{,}417.\)

Tứ phân vị thứ nhất của dãy số liệu \( x_1; x_2\); \(\ldots\) ; \(x_{39}\) là \( x_{10}\in \left[ 2 ; 4\right) \).

Do đó tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là \(Q_1=2+\displaystyle\frac{\displaystyle\frac{1\cdot 39}{4}-3}{8}\cdot(4-2)=\displaystyle\frac{59}{16}\approx 3{,}6875.\)

Tứ phân vị thứ ba của dãy số liệu \( x_1; x_2\); \(\ldots\) ; \(x_{39}\) là \( x_{30}\in \left[ 6 ; 8\right) \).

Do đó tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \(Q_3=6+\displaystyle\frac{\displaystyle\frac{3\cdot 39}{4}-(3+8+12)}{12}\cdot(8-6)=\displaystyle\frac{169}{24}\approx 7{,}042.\)

Huấn luyện viên muốn xác định nhóm gồm \( 25\% \) các vận động viên có số giờ luyện tập cao nhất thì huấn luyện viên nên chọn các vận động viên có thời gian tập luyện từ \( Q_3 \approx 7{,}042\) (giờ).

Bài tập 9

Một hãng xe ô tô thống kê lại số lần gặp sự cố về động cơ của \( 100 \) chiếc xe cùng loại sau \( 2 \) năm sử dụng đầu tiên ở bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Số lần gặp sự cố}& \left[ 1 ; 2\right] & \left[3 ; 4\right] & \left[ 5 ; 6\right] & \left[ 7 ; 8\right] & \left[ 9 ; 10\right] \\ \hline \textbf{Số xe} & 17 & 33 & 25 & 20 & 5\\ \hline \end{array}

a) Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên.

b) Một người cho rằng có trên \( 25\% \) xe của hãng gặp không ít hơn \( 4 \) sự cố về đồng cơ trong \( 2 \) năm sử dụng đầu tiên. Nhận định trên có hợp lí không?

a) Do số lần gặp sự cố là số nguyên nên ta hiệu chỉnh lại như sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Số lần gặp sự cố} & \left[ 0{,}5 ; 2{,}5\right) & \left[ 2{,}5 ; 4{,}5\right) & \left[4{,}5 ; 6{,}5 \right) & \left[ 6{,}5 ; 8{,}5\right) & \left[8{,}5 ; 10{,}5 \right) \\ \hline \textbf{Số xe} & 17 & 33 & 25 & 20 & 5 \\ \hline \end{array}

Gọi \( x_1; x_2\); \(\ldots\); \(x_{100} \) là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có \( x_1, \ldots, x_{17}\in \left[ 0{,}5 ; 2{,}5\right) \); \( x_{18}, \ldots, x_{50}\in \left[ 2{,}5 ; 4{,}5\right) \); \( x_{51}, \ldots, x_{75}\in \left[ 4{,}5 ; 6{,}5\right) \); \( x_{76}, \ldots, x_{95}\in \left[ 6{,}5 ; 8{,}5\right) \); \( x_{96}, \ldots, x_{100}\in \left[ 8{,}5 ; 10{,}5\right) \).

Tứ phân vị thứ hai của dãy số liệu \( x_1; x_2; \ldots; x_{100} \) là \( \displaystyle\frac{1}{2}\left( x_{50}+x_{51}\right) \). Do \( x_{50}\in \left[ 2{,}5 ; 4{,}5\right) \) và \( x_{51}\in \left[4{,}5 ; 6{,}5 \right) \) nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là \( Q_2=4{,}5\).

Tứ phân vị thứ nhất của dãy số liệu \( x_1; x_2; \ldots; x_{100} \) là \( \displaystyle\frac{1}{2}\left( x_{25}+x_{26}\right) \).

Do \( x_{25} \) và \( x_{26} \) thuộc nhóm \( \left[2{,}5 ; 4{,}5 \right)\) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=2{,}5+\displaystyle\frac{\displaystyle\frac{1\cdot100}{4}-17}{33}\cdot (4{,}5-2{,}5)=\displaystyle\frac{197}{66}\approx 2{,}98.\)

Tứ phân vị thứ ba của dãy số liệu

\(x_1; x_2; \ldots; x_{100} \) là \( \displaystyle\frac{1}{2}\left(x_{75}+x_{76} \right)\).

Do \( x_{75}\in \left[4{,}5 ; 6{,}5 \right) \) và \( x_{76}\in \left[ 6{,}5 ; 8{,}5\right)\) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \( Q_3=6{,}5\).

b) Do tứ phân vị thứ nhất \( Q_1\approx 2{,}98 \) nên nhận định trên là hợp lý.

Bài tập 10

Một người thống kê lại thời gian thực hiện các cuộc gọi điện thoại của người đó trong một tuần ở bảng sau:

\begin{array}{|c|c|c|c|c|c|c|}\hline\textbf{Thời gian (s)} & \left[ 0;60\right) & \left[ 60 ; 120\right) & \left[ 120 ; 180\right) & \left[ 180; 240\right) & \left[240 ; 300 \right) & \left[300 ; 360 \right) \\ \hline \textbf{Số cuộc gọi} & 8 & 10 & 7 & 5 & 2 & 1 \\ \hline\end{array}

Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên.

Gọi \( x_1; x_2; \ldots; x_{33} \) là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có \( x_1, \ldots, x_{8}\in \left[ 0 ; 60\right) \); \( x_9, \ldots, x_{18} \in \left[ 60 ; 120\right) \), \( x_{19}, \ldots, x_{25} \in \left[ 120 ; 180\right) \); \( x_{26}, \ldots, x_{30} \in \left[ 180 ; 240\right) \); \( x_{31}, x_{32} \in \left[ 240 ; 300\right) \); \( x_{33}\in \left[ 300 ; 360\right) \).

Tứ phân vị thứ nhất của dãy số liệu \( x_1; x_2; \ldots; x_{33} \) là \( x_9\in \left[60 ; 120 \right) \) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\( Q_1=60+\displaystyle\frac{\displaystyle\frac{33}{4}-8}{10}\cdot (120-60)=\displaystyle\frac{123}{2} \approx 61{,}5.\)

Tứ phân vị thứ hai của dãy số liệu \( x_1; x_2; \ldots; x_{33} \) là \( x_{17}\in \left[60 ; 120 \right) \) nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là \( Q_2=60+\displaystyle\frac{\displaystyle\frac{33}{2}-8}{10}\cdot (120-60)=111.\)

Tứ phân vị thứ ba của dãy số liệu \( x_1; x_2; \ldots; x_{33} \) là \( x_{25}\in \left[120 ; 180 \right) \) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \( Q_3=120+\displaystyle\frac{\displaystyle\frac{33\cdot3}{4}-(8+10)}{7}\cdot (180-120)=\displaystyle\frac{1245}{7}\approx 177{,}857.\)

Bài tập 11

Một phòng khám thống kê số bệnh nhân đến khám bệnh mỗi ngày trong tháng \( 4 \) năm \( 2022 \) ở bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Số bệnh nhân} & \left[1 ; 10 \right] & \left[ 11 ; 20\right] & \left[ 21 ; 30\right] & \left[ 31 ; 40\right] & \left[41 ; 50 \right] \\ \hline \textbf{Số ngày} & 7 & 8 & 7 & 6 & 2 \\ \hline\end{array}

a) Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên.

b) Quản lý phòng khám cho rằng có khoảng \( 25\% \) số ngày khám có nhiều hơn \( 35 \) bệnh nhân đến khám. Nhận định trên có hợp lý không?

a) Do số bệnh nhân đến khám là số nguyên nên ta hiệu chỉnh lại như sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Số bệnh nhân} & \left[0{,}5 ; 10{,}5 \right) & \left[ 10{,}5 ; 20{,}5\right) & \left[ 20{,}5 ; 30{,}5\right) & \left[ 30{,}5 ; 40{,}5\right) & \left[40{,}5 ; 50{,}5 \right) \\ \hline \textbf{Số ngày} & 7 & 8 & 7 & 6 & 2 \\ \hline \end{array}

Gọi \( x_1; x_2; \ldots; x_{30} \) là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có \( x_1, \ldots, x_{7}\in \left[ 0{,}5 ; 10{,}5\right) \); \( x_8, \ldots, x_{15} \in \left[ 10{,}5 ; 20{,}5\right) \), \( x_{16}, \ldots, x_{22} \in \left[ 20{,}5 ; 30{,}5\right) \); \( x_{23}, \ldots, x_{28} \in \left[ 30{,}5 ; 40{,}5\right) \); \( x_{29}, x_{30} \in \left[ 40{,}5 ; 50{,}5\right) \).

Tứ phân vị thứ nhất của dãy số liệu \( x_1; x_2; \ldots; x_{30} \) là \( x_8 \in \left[10{,}5 ; 20{,}5 \right) \) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là \( Q_1=10{,}5+\displaystyle\frac{\displaystyle\frac{30}{4}-7}{8}\cdot (20{,}5-10{,}5)=\displaystyle\frac{89}{8}\approx 11{,}125.\)

Tứ phân vị thứ hai của dãy số liệu \( x_1; x_2; \ldots; x_{30} \) là \( \displaystyle\frac{1}{2}\left( x_{15}+x_{16}\right) \). Do \( x_{15} \in \left[ 10{,}5 ; 20{,}5 \right) \) và \( x_{16}\in \left[ 20{,}5 ; 30{,}5\right) \) nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là \( Q_2=20{,}5 \).

Tứ phân vị thứ hai của dãy số liệu \( x_1; x_2; \ldots; x_{30} \) là \( x_{23}\in \left[ 30{,}5 ; 40{,}5\right)\) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \(Q_3= 30{,}5+\displaystyle\frac{\displaystyle\frac{3\cdot 30}{4}-(7+8+7)}{6}\cdot(40{,}5-30{,}5)=\displaystyle\frac{94}{3}\approx 31{,}333.\)

b) Do \( Q_1\approx 11{,}125 \) nên nhận định \( 25\% \) số ngày khám nhiều hơn \( 35 \) bệnh nhân là không hợp lý.

Bài tập 12

Lương tháng của một số nhân viên văn phòng được ghi lại như sau (đơn vị: triệu đồng):

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|}\hline 12{,}5 & 9{,}6 & 11{,}7 & 12{,}7 & 10{,}0 & 10{,}0 & 12{,}2 & 9{,}8 & 10{,}9 & 6{,}7 & 13{,}6 & 9{,}2 \\ \hline 13{,}1 & 6{,}5 & 10{,}7 & 8{,}9 & 11{,}2 & 13{,}2 & 8{,}3 & 11{,}1 & 11{,}9 & 8{,}4 & 6{,}7 & 13{,}8 \\ \hline \end{array}

a) Tìm tứ phân vị của dãy số liệu trên.

b) Tổng hợp lại dãy số liệu trên dựa vào bảng tần số ghép nhóm theo mẫu sau:

\begin{array}{|c|c|c|c|c|}\hline \textbf{Lương tháng (triệu đồng)} & \left[ 6 ; 8\right) & \left[8 ; 10 \right) & \left[10 ; 12 \right) & \left[ 12 ; 14\right) \\ \hline \textbf{Số nhân viên}& ? & ? & ? & ? \\ \hline \end{array}

c) Hãy ước lượng tứ phân vị của số liệu ở bảng tần số ghép nhóm trên.

a) Gọi \( x_1 \), \( x_2 \), \ldots, \( x_{24} \) là mẫu số liệu được xếp theo thứ tự không giảm. Ta có bảng sau

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 & x_9 & x_{10} & x_{11} & x_{12} \\\hline 6{,}5 & 6{,}7 & 6{,}7 & 8{,}3 & 8{,}4 & 8{,}9 & 9{,}2 & 9{,}6 & 9{,}8 & 10{,}0 & 10{,}0 & 10{,}7 \\ \hline x_{13} & x_{14} & x_{15} & x_{16} & x_{17} & x_{18} & x_{19} & x_{20} & x_{21} & x_{22} & x_{23} & x_{24} \\ \hline 10{,}9 & 11{,}1 & 11{,}2 & 11{,}7 & 11{,}9 & 12{,}2 & 12{,}5 & 12{,}7 & 13{,}1 & 13{,}2 & 13{,}6 & 13{,}8 \\ \hline \end{array}

Tứ phân vị thứ nhất của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_6+x_7\right)= \displaystyle\frac{1}{2}\cdot \left( 8{,}9+9{,}2\right)=\displaystyle\frac{181}{10}=18{,}1\).

Tứ phân vị thứ hai của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_{12}+x_{13}\right)= \displaystyle\frac{1}{2}\cdot \left( 10{,}7+10{,}9\right)=\displaystyle\frac{54}{5}=10{,}8\).

Tứ phân vị thứ ba của mẫu số liệu là \(\displaystyle\frac{1}{2}\cdot\left( x_{18}+x_{19}\right) = \displaystyle\frac{1}{2}\cdot \left( 12{,}2+12{,}5\right) =\displaystyle\frac{247}{20}=12{,}35\).

b) Tổng hợp lại dãy số liệu trên vào bảng tần số ghép nhóm sau:

\begin{array}{|c|c|c|c|c|}\hline \textbf{Lương tháng (triệu đồng)} & \left[ 6 ; 8\right) & \left[8 ; 10 \right) & \left[10 ; 12 \right) & \left[ 12 ; 14\right) \\ \hline \textbf{Số nhân viên}& 3 & 6 & 8 & 7 \\ \hline \end{array}

c) Gọi \( x_1 \), \( x_2 \), \ldots, \( x_{24} \) là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có \( x_1, \ldots, x_3 \in \left[ 6 ; 8\right) \); \( x_4, \ldots, x_9 \in \left[8 ; 10 \right)\); \( x_{10}, \ldots, x_{17}\in \left[10 ; 12 \right) \); \( x_{18}, \ldots, x_{24}\in \left[ 12 ; 14\right) \).

Tứ phân vị thứ nhất của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_6+x_7\right) \in \left[8 ; 10 \right)\) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là \(Q_1= 8+\displaystyle\frac{\displaystyle\frac{24}{4}-3}{6} \cdot \left( 10-8\right)=9.\)

Tứ phân vị thứ hai của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_{12}+x_{13}\right) \in \left[10 ; 12 \right)\) nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là \(Q_2= 10+\displaystyle\frac{\displaystyle\frac{24}{2}-(3+6)}{8} \cdot \left( 12-10\right)=\displaystyle\frac{43}{4}=10{,}75.\)

Tứ phân vị thứ ba của mẫu số liệu là \(\displaystyle\frac{1}{2}\cdot\left( x_{18}+x_{19}\right)\in \left[ 12 ; 14\right)\) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \(Q_3= 12+\displaystyle\frac{\displaystyle\frac{24\cdot 3}{4}-(3+6+8)}{7} \cdot \left( 14-12\right)=\displaystyle\frac{86}{7}\approx 12{,}286.\)

Bài tập 13

Số điểm một cầu thủ bóng rổ ghi được trong \( 20 \) trận đấu được cho ở bảng sau:

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline 25 & 23 & 21 & 13 & 8 & 14 & 15 & 18 & 22 & 11 \\ \hline 24 & 12 & 14 & 14 & 18 & 6 & 8 & 25 & 10 & 11 \\ \hline \end{array}

a) Tìm tứ phân vị của dãy số liệu trên.

b) Tổng hợp lại dãy số liệu trên vào bảng tần số ghép nhóm theo mẫu sau:

\begin{array}{|c|c|c|c|c|} \hline \textbf{Điểm số} & \left[ 6 ; 10\right] & \left[ 11 ; 15\right] & \left[16 ; 20 \right] & \left[ 21 ; 25\right] \\ \hline \textbf{Số trận} & ? & ? & ? & ? \\ \hline \end{array}

c) Hãy ước lượng tứ phân vị của số liệu từ bảng tần số ghép nhóm trên.

a) Gọi \( x_1 \), \( x_2 \), \(\ldots\), \( x_{20} \) là mẫu số liệu được xếp theo thứ tự không giảm. Ta có bảng sau

\begin{array}{|c|c|c|c|c|c|c|c|c|c|}\hline x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 & x_9 & x_{10} \\ \hline 6 & 8 & 8 & 10 & 11 & 11 & 12 & 13 & 14 & 14 \\ \hline x_{11} & x_{12} & x_{13} & x_{14} & x_{15} & x_{16} & x_{17} & x_{18} & x_{19} & x_{20} \\ \hline 14 & 15 & 18 & 18 & 21 & 22 & 23 & 24 & 25 & 25 \\\hline \end{array}

Tứ phân vị thứ nhất của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_{5}+x_6\right) =\displaystyle\frac{1}{2}\cdot \left( 11+11\right)=11\).

Tứ phân vị thứ hai của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot \left( x_{10}+x_{11}\right)= \displaystyle\frac{1}{2}\cdot \left( 14+14\right)=14\).

Tứ phân vị thứ ba của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot \left( x_{15}+x_{16}\right)= \displaystyle\frac{1}{2}\cdot \left( 21+22\right)=21{,}5\).

b) Tổng hợp lại dãy số liệu trên vào bảng tần số ghép nhóm sau:

\begin{array}{|c|c|c|c|c|} \hline \textbf{Điểm số} & \left[ 6 ; 10\right] & \left[ 11 ; 15\right] & \left[16 ; 20 \right] & \left[ 21 ; 25\right] \\ \hline \textbf{Số trận} 4 & 8 & 2 & 6 \\ \hline \end{array}

c) Hãy ước lượng tứ phân vị của số liệu từ bảng tần số ghép nhóm trên.

Vì số điểm của cầu thủ bóng rổ là số nguyên nên ta hiệu chỉnh bảng số liệu tần số ghép nhóm như sau:

\begin{array}{|c|c|c|c|c|}\hline \textbf{Điểm số} & \left[ 5{,}5 ; 10{,}5\right) & \left[ 10{,}5 ; 15{,}5\right) & \left[15{,}5 ; 20{,}5 \right) & \left[ 20{,}5 ; 25{,}5\right) \\ \hline \textbf{Số trận} & 4 & 8 & 2 & 6 \\ \hline \end{array}

Gọi \( x_1 \), \( x_2 \), \( \ldots \), \( x_{20} \) là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có \( x_1, \ldots, x_4 \in \left[ 5{,}5 ; 10{,}5\right) \); \( x_5 \ldots, x_{12} \in \left[ 10{,}5 ; 15{,}5\right)\); \( x_{13}, x_{14}\in \left[15{,}5 ; 20{,}5 \right) \); \( x_{15}, \ldots, x_{20} \in \left[ 20{,}5 ; 25{,}5\right) \).

Tứ phân vị thứ nhất của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_{5}+x_6\right) \in \left[ 10{,}5 ; 15{,}5\right)\) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là \(Q_1=10{,}5 +\displaystyle\frac{\displaystyle\frac{20}{4}-4}{8}\cdot \left(15{,}5-10{,}5 \right)=\displaystyle\frac{89}{8}=11{,}125.\)

Tứ phân vị thứ hai của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_{10}+x_{11}\right) \in \left[ 10{,}5 ; 15{,}5\right)\) nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là \(Q_2=10{,}5 +\displaystyle\frac{\displaystyle\frac{20}{2}-4}{8}\cdot \left(15{,}5-10{,}5 \right)=\displaystyle\frac{57}{4}=14{,}25.\)

Tứ phân vị thứ ba của mẫu số liệu là \( \displaystyle\frac{1}{2}\cdot\left( x_{15}+x_{16}\right) \in \left[ 20{,}5 ; 25{,}5\right)\) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \(Q_3=20{,}5 +\displaystyle\frac{\displaystyle\frac{20\cdot 3}{4}-(4+8+2)}{6}\cdot \left(25{,}5-20{,}5 \right)=\displaystyle\frac{64}{3}\approx 21{,}333.\)

Bài tập 14

Kiểm tra điện lượng của một số viên pin tiểu do một hãng sản xuất thu được kết quả như sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Điện lượng (nghìn mAh)} & \left[ 0{,}9 ; 0{,}95\right) & \left[ 0{,}95 ; 1{,}0\right) & \left[ 1{,}0 ; 1{,}05\right) & \left[ 1{,}05 ; 1{,}1\right) & \left[ 1{,}1 ; 1{,}15\right) \\ \hline \textbf{Số viên pin}& 10 & 20 & 35 & 15 & 5 \\ \hline \end{array}

Hãy ước lượng số trung bình, mốt và tứ phân vị của mẫu số liệu ghép nhóm trên.

+) Tìm số trung bình của mẫu số liệu ghép nhóm.

Ta có bảng thống kê điện lượng của pin theo giá trị đại diện là:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Điện lượng (nghìn mAh)} & \left[ 0{,}9 ; 0{,}95\right) & \left[ 0{,}95 ; 1{,}0\right) & \left[ 1{,}0 ; 1{,}05\right) & \left[ 1{,}05 ; 1{,}1\right) & \left[ 1{,}1 ; 1{,}15\right) \\ \hline \textbf{Giá trị đại diện}& 0{,}925 & 0{,}975 & 1{,}025 & 1{,}075 & 1{,}125 \\ \hline \textbf{Số viên pin}& 10 & 20 & 35 & 15 & 5 \\ \hline \end{array}

Số trung bình của mẫu số liệu ghép nhóm theo dõi điện lượng của một số viên pin xấp xỉ bằng: \( \displaystyle\frac{0{,}925\cdot 10 + 0{,}975\cdot 20 +1{,}025 \cdot 35 +1{,}075 \cdot 15+1{,}125 \cdot 5}{10+20+35+15+5}\approx 1{,}016. \)

+) Tìm mốt của mẫu số liệu ghép nhóm.

Nhóm chứa mốt của mẫu số liệu là \( \left[ 1{,}0 ; 1{,}05\right) \).

Do đó \( u_m=1\); \( n_{m-1}=20 \); \( n_m=35 \); \( n_{m+1}=15 \); \( u_{m+1}-u_m=1{,}05-1{,}0=0{,}05 \).

Mốt của mẫu số liệu ghép nhóm là \(M_0=1+\displaystyle\frac{35-20}{(35-20)+(35-15)}\cdot 0{,}05 =\displaystyle\frac{143}{140}\approx 1{,}021.\)

+) Tìm các tứ phân vị của mẫu số liệu ghép nhóm.

Gọi \( x_1 \), \( x_2 \), \( \ldots \), \( x_{85} \) là mẫu số liệu được xếp theo thứ tự không giảm.

Ta có \( x_1, \ldots, x_{10}\in \left[ 0{,}9 ; 0{,}95\right)\); \( x_{11}, \ldots, x_{30}\in \left[ 0{,}95 ; 1{,}0\right) \); \( x_{31}, \ldots, x_{65}\in \left[ 1{,}0 ; 1{,}05\right) \); \( x_{66}, \ldots, x_{80}\in \left[ 1{,}05 ; 1{,}1\right) \); \( x_{81}, \ldots, x_{85}\in \left[ 1{,}1 ; 1{,}15\right)\).

Tứ phân vị thứ nhất của mẫu số liệu là \( x_{22} \in \left[ 0{,}95 ; 1{,}0\right) \) nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=0{,}95+\displaystyle\frac{\displaystyle\frac{85}{4}-10}{20}\cdot \left( 1{,}0-0{,}95\right)= \displaystyle\frac{313}{320}\approx 0{,}978.\)

Tứ phân vị thứ hai của mẫu số liệu là \( x_{43} \in \left[ 1{,}0 ; 1{,}05\right) \) nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là

\(Q_2=1{,}0+\displaystyle\frac{\displaystyle\frac{85}{2}-(10+20)}{35}\cdot \left( 1{,}05-1{,}0\right)=\displaystyle\frac{57}{56} \approx 1{,}018.\)

Tứ phân vị thứ ba của mẫu số liệu là \( x_{64} \in \left[ 1{,}0 ; 1{,}05\right) \) nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=1{,}0+\displaystyle\frac{\displaystyle\frac{85\cdot 3}{4}-(10+20)}{35}\cdot \left( 1{,}05-1{,}0\right)=\displaystyle\frac{587}{560} \approx 1{,}048.\)

Bài tập 15

Cân nặng của một số lợn con mới sinh thuộc hai giống \( A \) và \( B \) được cho ở biểu đồ dưới đây (đơn vị: kg).

a) Hãy so sánh cân nặng của lợn con mới sinh giống \( A \) và giống \( B \) theo số trung bình và trung vị.

b) Hãy ước lượng tứ phân vị thứ nhất và thứ ba của cân nặng lợn con mới sinh giống \( A \) và của cân nặng lợn con mới sinh giống \( B \).

a) Bảng tần số ghép nhóm thống kê cân nặng của lợn con mới sinh giống \( A \) và giống \( B \) như sau:

\begin{array}{|c|c|c|c|c|}\hline \textbf{Cân nặng (kg)} & \left[1{,}0 ; 1{,}1 \right) & \left[1{,}1 ; 1{,}2 \right) & \left[1{,}2 ; 1{,}3 \right) & \left[1{,}3 ; 1{,}4 \right) \\ \hline \textbf{Giá trị đại diện (kg)} & 1{,}05 & 1{,}15 & 1{,}25 & 1{,}35 \\ \hline \textbf{Giống A (con)} & 8 & 28 & 32 & 17 \\ \hline \textbf{Giống B (con)} & 13 & 14 & 24 & 14 \\ \hline \end{array}

Cân nặng trung bình của lợn con mới sinh giống \( A \) là \( \displaystyle\frac{1{,}05\cdot 8 + 1{,}15 \cdot 28 + 1{,}25 \cdot 32 + 1{,}35 \cdot 17}{8+28+32+17}=\displaystyle\frac{2071}{1700}\approx 1{,}218.\)

Cân nặng trung bình của lợn con mới sinh giống \( B \) là \( \displaystyle\frac{1{,}05\cdot 13 + 1{,}15 \cdot 14 + 1{,}25 \cdot 24 + 1{,}35 \cdot 14}{13+14+24+14}=\displaystyle\frac{121}{100} \approx 1{,}21.\)

Suy ra cân nặng trung bình của lợn con mới sinh giống \( A \) lớn hơn cân nặng trung bình của lợn con mới sinh giống \( B \).

Trung vị của mẫu số liệu ghép nhóm cân nặng của lợn con giống \( A \) là \(M_e=1{,}2+\displaystyle\frac{\displaystyle\frac{85}{2}-(8+28)}{32}\cdot (1{,}3-1{,}2)=\displaystyle\frac{781}{640}\approx 1{,}22.\)

Trung vị của mẫu số liệu ghép nhóm cân nặng của lợn con giống \( B \) là \(M_e=1{,}2+\displaystyle\frac{\displaystyle\frac{65}{2}-(13+14)}{24}\cdot (1{,}3-1{,}2)=\displaystyle\frac{587}{480}\approx 1{,}22.\)

Suy ra trung vị của mẫu số liệu ghép nhóm cân nặng của của lợn con giống \( A \) bằng trung vị của mẫu số liệu ghép nhóm cân nặng của của lợn con giống \( B \).

b) Hãy ước lượng tứ phân vị thứ nhất và thứ ba của cân nặng lợn con mới sinh giống \( A \) và của cân nặng lợn con mới sinh giống \( B \).

+) Đối với mẫu dữ liệu ghép nhóm cân nặng lợn con mới sinh giống \( A \) có:

Tứ phân vị thứ nhất của mẫu số liệu ghép nhóm cân nặng lợn con mới sinh giống \( A \) thuộc \( \left[ 1{,}1 ; 1{,}2\right) \) nên \( Q_1= 1{,}1+\displaystyle\frac{\displaystyle\frac{85}{4}-8}{28}\cdot \left( 1{,}2-1{,}1\right)= \displaystyle\frac{257}{224}\approx 1{,}147.\)

Tứ phân vị thứ ba của mẫu số liệu ghép nhóm cân nặng lợn con mới sinh giống \( A \) thuộc \( \left[ 1{,}2 ; 1{,}3\right) \) nên \( Q_3= 1{,}2+\displaystyle\frac{\displaystyle\frac{85\cdot3 }{4}-(8+28)}{32}\cdot \left( 1{,}3-1{,}2\right)= \displaystyle\frac{1647}{1280}\approx 1{,}287.\)

+) Đối với mẫu dữ liệu ghép nhóm cân nặng lợn con mới sinh giống \( B \) có:

Tứ phân vị thứ nhất của mẫu số liệu ghép nhóm cân nặng lợn con mới sinh giống \( B \) thuộc \( \left[ 1{,}1 ; 1{,}2\right) \) nên \( Q_1= 1{,}1+\displaystyle\frac{\displaystyle\frac{65}{4}-13}{14}\cdot \left( 1{,}2-1{,}1\right)= \displaystyle\frac{629}{560}\approx 1{,}123.\)

Tứ phân vị thứ ba của mẫu số liệu ghép nhóm cân nặng lợn con mới sinh giống \( B \) thuộc \( \left[ 1{,}2 ; 1{,}3\right) \) nên \( Q_3= 1{,}2+\displaystyle\frac{\displaystyle\frac{65\cdot 3}{4}-(13+14)}{24}\cdot \left( 1{,}3-1{,}2\right)= \displaystyle\frac{413}{320}\approx 1{,}291.\)

Bài tập 16

Để kiểm tra thời gian sử dụng pin của một chiếc điện thoại mới, chị An thống kê thời gian sử dụng điện thoại của mình từ lúc sạc đầy pin cho đến khi hết pin ở bảng sau:

\begin{array}{|c|c|c|c|c|c|} \hline\text{Thời gian sử dụng (giờ)} & \left[7;9\right) & \left[9;11\right) & \left[11;13\right) & \left[13,15\right) & \left[15;17\right) \\ \hline\text{Số lần} & 2 & 5 & 7 & 6 & 3 \\ \hline\end{array}

a) Hãy ước lượng thời gian sử dụng trung bình từ lúc chị An sạc đầy pin điện thoại cho tới khi hết pin.

a) Chị An cho rằng có khoảng 25\% số lần sạc điện thoại chỉ dùng được 10 giờ. Nhận định của chị An có hợp lí không?

a) Thời gian sử dụng trung bình

\(\overline{x}=\displaystyle\frac{2\cdot8 +5\cdot10 +7\cdot12 +6\cdot14 +3\cdot16}{2+5+7+6+3}=\displaystyle\frac{282}{23}\approx 12{,}26.\)

a) Nhận định

a) Tứ phân vị thứ nhất. Nhóm \(\left[9;11\right)\)

\hspace*{2cm}\(Q_1=9+\displaystyle\frac{\displaystyle\frac{1\cdot 23}{4}-2}{5}\cdot \left(11-9\right)= \displaystyle\frac{21}{2}=10{,}5.\)

a) Tứ phân vị thứ hai. Nhóm \(\left[11;13\right)\)

\hspace*{2cm}\(Q_2=11+\displaystyle\frac{\displaystyle\frac{2\cdot 23}{4}-(2+5)}{7}\cdot \left(13-11\right)= \displaystyle\frac{86}{7}\approx 12{,}29.\)

a) Tứ phân vị thứ ba. Nhóm \(\left[13;15\right)\)

\hspace*{2cm}\(Q_3=13+\displaystyle\frac{\displaystyle\frac{3\cdot 23}{4}-(2+5+7)}{6}\cdot \left(15-13\right)= \displaystyle\frac{197}{12}\approx 16{,}42.\)

Tứ phân vị thứ nhất \(Q_1=10{,}5\). Nhận định hợp lí.

Bài tập 17

Bảng sau thống kê số ca nhiễm mới SARS-CoV-2 mỗi ngày trong tháng 12/2021 tại Việt Nam.

\begin{array}{|c|c|c|c|c|c|c|c|} \hline \text{Ngày} & \text{Số ca} & \text{Ngày} & \text{Số ca} & \text{Ngày} & \text{Số ca} & \text{Ngày} & \text{Số ca} \\ \hline 1 & 15\,139 & 9 & 15\,965 & 17 & 15\,685 & 25 & 16\,046 \\\hline2 & 14\,295 & 10 & 15\,474 & 18 & 16\,363 & 26 & 15\,667 \\\hline 3 & 14\,254 & 11 & 16\,830 & 19 & 16\,586 & 27 & 15\,310 \\\hline 4 & 14\,598 & 12 & 15\,264 & 20 & 15\,420 & 28 & 14\,866 \\\hline 5 & 14\,927 & 13 & 16\,035 & 21 & 16\,806 & 29 & 14\,299 \\\hline 6 & 15\,215 & 14 & 15\,871 & 22 & 17\,044 & 30 & 20\,454 \\\hline 7 & 14\,433 & 15 & 16\,192 & 23 & 16\,860 & 31 & 17\,004 \\\hline 8 & 15\,223 & 16 & 15\,720 & 24 & 16\,633 &&\\ \hline \end{array}

a) Xác định số trung bình và tứ phân vị của mẫu số liệu trên. Mẫu số liệu có bao nhiêu có bao nhiêu giá trị ngoại lệ?

b) Hoàn thiện bảng tần số ghép nhóm theo mẫu sau:

\begin{array}{|c|c|c|c|c|c|c|c|c|} \hline Số ca (nghìn) & \left[14;15{,}5\right) & \left[15{,}5;17\right) & \left[17;18{,}5\right) & \left[18{,}5;20\right) & \left[20;21{,}5\right) \\ \hline Số ngày & ? & ? & ? & ? & ?\\ \hline \end{array}

c) Hãy ước lượng số trung bình và tứ phân vị của mẫu số liệu ở bảng tần số ghép nhóm trên.

a) Số trung bình, tứ phân vị và mốt

+) Số trung bình \(\bar{x}=\displaystyle\frac{15139+14295+\cdots+20454+17004}{31}\approx 15821.\)

+) Tứ phân vị.

Xếp mẫu số liệu không giảm ta được:

\begin{array}{cccccccccc}14254 &14295 &14299 &14433 &14598 &14866 &14927& 15139 &15215 &15223 \\ 15264 &15310 &15420 &15474 &15668 &15685 &15720 &15871 &15965 &16035 \\ 16046 &16192 &16363 &16586 &16633 &16806 &16830 &16860 &17004 &17044 \\ 20454 & & & & & & & & & \\ \end{array}

Tứ phân vị thứ nhất của mẫu số liệu là \( 15139 \).

Tứ phân vị thứ hai của mẫu số liệu là \( 15685 \).

Tứ phân vị thứ ba của mẫu số liệu là \( 16586 \).

b) Bảng tần số ghép nhóm

\begin{array}{|c|c|c|c|c|c|} \hline \text{Số ca (nghìn)} & \left[14;15{,}5\right) & \left[15{,}5;17\right) & \left[17;18{,}5\right) & \left[18{,}5;20\right) & \left[20;21{,}5\right) \\ \hline \text{Số ngày} & 13 & 15 & 2 & 0 & 1\\ \hline \end{array}

c) Ước lượng số trung bình, tứ phân vị và mốt

+) Số trung bình

\(\overline{x}=\displaystyle\frac{14{,}75\times13+16{,}25\times15+17{,}75\times2+19{,}25\times0+20{,}75\times1}{31}= \displaystyle\frac{1967}{124}\approx 15{,}86.\)

+) Tứ phân vị

+) Tứ phân vị thứ nhất. Nhóm \(\left[14;15{,}5\right)\)

\(Q_1=14+\displaystyle\frac{\displaystyle\frac{1\cdot 31}{4}-0}{13}\cdot \left(15{,}5-14\right)= \displaystyle\frac{1549}{104}\approx 14{,}89.\)

+) Tứ phân vị thứ hai. Nhóm \(\left[15{,}5;17\right)\)

\hspace*{2cm}\(Q_2=15{,}5+\displaystyle\frac{\displaystyle\frac{2\cdot 31}{4}-(0+13)}{15}\cdot \left(17-15{,}5\right)= \displaystyle\frac{63}{4} = 15{,}75.\)

+) Tứ phân vị thứ ba. Nhóm \(\left[17;18{,}5\right)\)

\hspace*{2cm}\(Q_3=17+\displaystyle\frac{\displaystyle\frac{3\cdot 31}{4}-(0+13+15)}{2}\cdot \left(18{,}5-17\right)= \displaystyle\frac{215}{16} \approx 13{,}44.\)

+) Mốt

+) Mốt \(M_o\) chứa trong nhóm \(\left[u_{m};u_{m+1}\right)\)

\(M_o=u_{m}+\displaystyle\frac{n_{m}-n_{m-1}}{\left(n_{m}-n_{m-1}\right)+\left(n_{m}-n_{m+1}\right)}\left(u_{m+1}-u_{m}\right)\)

+) Nhóm chứa mốt của mẫu số liệu trên là nhóm \(\left[120;175\right)\)

Do đó \(\begin{aligned}[t] & u_{m}=15{,}5 ; u_{m+1}=17 \Rightarrow u_{m+1}-u_{m}=17-15{,}5=1{,}5.\\ & n_{m-1}=13 ; n_{m}=15 ; n_{m+1}=2. \\ & M_o=15{,}5+\displaystyle\frac{15-13}{(15-13)+(15-2)}\cdot(17-15{,}5) =\displaystyle\frac{157}{10} = 15{,}7.\end{aligned}\)

Bài tập 18

Thời gian (phút) truy cập internet mỗi buổi tối của một số học sinh được cho trong bảng sau:

\begin{array}{|c|c|c|c|c|c|c|}\hline \text{Thời gian (phút)} & \left[9{,}5;12{,}5 \right) & \left[12{,}5;15{,}5 \right) & \left[15{,}5;18{,}5 \right) & \left[18{,}5;21{,}5 \right) & \left[21{,}5;24{,}5 \right) \\ \hline \text{Số học sinh} &3 & 12 & 15 &24 & 2 \\\hline \end{array}

Tìm tứ phân vị thứ nhất \(Q_1\) và tứ phân vị thứ ba \(Q_3\) của mẫu số liệu ghép nhóm.

Cỡ mẫu là \(n=3+12+15+24+2=56\).

Tứ phân vị thứ nhất \(Q_1\) là \(\displaystyle\frac{x_{14}+x_{15}}{2}\).

Do \(2\) giá trị \(x_{28},\,x_{29}\) thuộc nhóm \(\left[12{,}5;15{,}5 \right)\) nên nhóm này chứa \(Q_1\).

Do đó, \(p=2\); \(a_2=12{,}5\); \(m_2=12\); \(m_1=3\); \(a_3-a_2=3\) và ta có

\(Q_1=12{,}5+\displaystyle\frac{\displaystyle\frac{56}{4}-3}{12}\cdot 3=15{,}25.\)

Với tứ phân vị thứ ba \(Q_3\) là \(\displaystyle\frac{x_{42}+x_{43}}{2}\).

Do \(2\) giá trị \(x_{42},\,x_{43}\) thuộc nhóm \(\left[18{,}5;21{,}5 \right)\) nên nhóm này chứa \(Q_3\).

Do đó, \(p=4\); \(a_4=18{,}5\); \(m_4=24\); \(m_1+m_2+m_3=3+12+15=30\); \(a_5-a_4=3\) và ta có

\(Q_3=18{,}5+\displaystyle\frac{\displaystyle\frac{3\cdot 56}{4}-30}{24}\cdot 3=20.\)

Bài tập 19

Phỏng vấn một số học sinh lớp \(11\) về thời gian (giờ) ngủ của một buổi tối, thu được bảng số liệu ở bên.

a) So sánh thời gian ngủ trung bình của các bạn học sinh nam và nữ.

b) Hãy cho biết \(75\%\) học sinh khối \(11\) ngủ ít nhất bao nhiêu giờ?

\begin{array}{|c|c|c|}\hline \text{Thời gian} & \text{Số học sinh nam} & \text{Số học sinh nữ} \\ \hline\left[4;5 \right) & 6 & 4 \\ \hline \left[5;6 \right) & 10 & 8 \\ \hline \left[6;7 \right) & 13 & 10 \\ \hline \left[7;8 \right) & 9 & 11 \\ \hline \left[8;9 \right) & 7 & 8 \\ \hline \end{array}

a) Trong mỗi khoảng thời gian, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:

\begin{array}{|c|c|c|} \hline \text{Thời gian} & \text{Số học sinh nam} & \text{Số học sinh nữ}\\ \hline4{,}5 & 6 & 4 \\ \hline 5{,}5 & 10 & 8 \\ \hline 6{,}5 & 13 & 10 \\ \hline 7{,}5 & 9 & 11 \\ \hline 8{,}5 & 7 & 8 \\ \hline \end{array}

Tổng số học sinh nam là \(n_1=6+10+13+9+7=45\).\\ Thời gian ngủ trung bình của học sinh nam là:

\(\overline{x_1}=\displaystyle\frac{4{,}5\cdot 6+5{,}5\cdot10+6{,}5\cdot13+7{,}5\cdot9+8{,}5\cdot7}{45}=\displaystyle\frac{587}{90}\approx 6{,}52\,\, \text{(giờ)}.\)

Tổng số học sinh nữ là \(n_2=4+8+10+11+8=41\). Thời gian ngủ trung bình của học sinh nữ là:

\(\overline{x_2}=\displaystyle\frac{4,5\cdot4+5,5\cdot8+6,5\cdot10+7,5\cdot11+8,5\cdot8}{41}=\displaystyle\frac{555}{82}\approx 6{,}77 \,\,\text{(giờ)}.\)

Vì \(\overline{x_2}>\overline{x_1}\) nên thời gian ngủ trung bình của các bạn học sinh nữ lớn hơn thời gian ngủ trung bình của các bạn nam.

b) Tổng số học sinh được điều tra là \(n=n_1+n_2=45+41=86\).

Giả sử \(x_1;x_2;x_3;\cdot \cdot;x_{86}\) là dãy giá trị được sắp xếp theo thứ tự không giảm.

Ta có bảng sau:

\begin{array}{|c|c|c|}\hline \text{Thời gian} & \text{Số học sinh} \\ \hline \left[4;5 \right) & 10 \\ \hline \left[5;6 \right) & 18 \\ \hline \left[6;7 \right) & 23 \\ \hline \left[7;8 \right) & 20 \\ \hline \left[8;9 \right) & 15 \\ \hline\end{array}

Tứ phân vị thứ nhất \(Q_1\) là \(x_{22}\). Do \(x_{22}\) thuộc nhóm \(\left[5;6\right)\) nên nhóm này chứa \(Q_1\).\\ Do đó, \(p=2;\,a_2=5;\,m_2=18;\,m_1=10;\,a_3-a_2=1\) và ta có

\(Q_1=5+\displaystyle\frac{\displaystyle\frac{86}{4}-10}{18}\cdot 1=\displaystyle\frac{203}{36}\approx 5{,}64 \text{(giờ)}.\)

Nghĩa là có \(25\%\) học sinh khối \(11\) ngủ ít hơn \(5{,}64\) giờ.

Vậy \(75\%\) học sinh khối \(11\) ngủ ít nhất \(5{,}64\) giờ.