\(\S1.\) SỐ TRUNG BÌNH VÀ MỐT

1. Mẫu số liệu ghép nhóm

Mẫu số liệu ghép nhóm là mẫu số liệu cho dưới dạng bảng tần số của các nhóm số liệu. Mỗi nhóm số liệu là tập hợp gồm các giá trị của số liệu được ghép nhóm theo một tiêu chí xác định. Nhóm số liệu thường được cho dưới dạng \([a;b)\), trong đó \(a\) là đầu mút trái, \(b\) là đầu mút phải.

\begin{array}{|c|c|c|c|c|}\hline\textbf{Nhóm} &\left[u_1; u_2\right) &\left[u_2; u_3\right) & \ldots &\left[u_k; u_{k+1}\right) \\ \hline \textbf{Tần số} & n_1 & n_2 & \ldots & n_k \\ \hline\end{array}

+) Bảng trên gồm \(k\) nhóm \(\left[u_j; u_{j+1}\right)\) với \(1 \leq j \leq k\), mỗi nhóm gồm một số giá trị được ghép theo một tiêu chí xác định.

+) Cỡ mẫu \(n=n_1+n_2+\cdots+n_k\).

+) Giá trị chính giữa mỗi nhóm được dùng làm giá trị đại diện cho nhóm ấy. Ví dụ nhóm \(\left[u_1; u_2\right)\) có giá trị đại diện là \(\displaystyle\frac{1}{2}\left(u_1+u_2\right)\).

+) Hiệu \(u_{j+1}-u_j\) được gọi là độ dài của nhóm \(\left[u_j; u_{j+1}\right)\).

2. Cách ghép nhóm mẫu số liệu

B1. Chia miền giá trị của mẫu số liệu thành một số nhóm theo tiêu chí cho trước.

B2. Đếm số giá trị của mẫu số liệu thuộc nhóm (tần số) và lập bảng thống kê cho mẫu số liệu ghép nhóm.

3. Số trung bình

\begin{array}{|c|c|c|c|c|}\hline \textbf{Nhóm} &\left[u_1; u_2\right) &\left[u_2; u_3\right) & \ldots &\left[u_k; u_{k+1}\right) \\ \hline \textbf{Giá trị đại diện} & c_1 & c_2 & \ldots & c_k\\ \hline \textbf{Tần số} & n_1 & n_2 & \ldots & n_k \\ \hline \end{array}

\[\overline{x}=\displaystyle\frac{n_1 c_1+n_2 c_2+\cdots+n_k c_k}{n}, \]

trong đó \(n=n_1+n_2+\cdots+n_k\) là cỡ mẫu.

Ý nghĩa của số trung bình của mẫu số liệu ghép nhóm: Số trung bình của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho số trung bình của mẫu số liệu gốc. Nó thường dùng để đo xu thế trung tâm của mẫu số liệu.

4. Mốt

Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất.

Giả sử nhóm chứa mốt là \(\left[u_m; u_{m+1}\right)\), khi đó mốt của mẫu số liệu ghép nhóm, kí hiệu là \(M_o\), được xác định bởi công thức

\[M_o=u_m+\displaystyle\frac{n_m-n_{m-1}}{\left(n_m-n_{m-1}\right)+\left(n_m-n_{m+1}\right)} \cdot\left(u_{m+1}-u_m\right).\]

Chú ý. Nếu không có nhóm kề trước của nhóm chứa mốt thì \(u_{m-1}=0\). Nếu không có nhóm kề sau của nhóm chứa mốt thì \(n_{m+1}=0\).

Ý nghĩa của mốt của mẫu số liệu ghép nhóm

+) Mốt của mẫu số liệu không ghép nhóm là giá trị có khả năng xuất hiện cao nhất khi lấy mẫu. Mốt của mẫu số liệu sau khi ghép nhóm \(M_0\) xấp xỉ với mốt của mẫu số liệu không ghép nhóm. Các giá trị nằm xung quanh \(M_0\) thường có khả năng xuất hiện cao hơn các giá trị khác.

+) Một mẫu số liệu ghép nhóm có thể có nhiều nhóm chứa mốt và nhiều mốt.

Bài tập

Bài tập 1

Số sản phẩm một công nhân làm được trong một ngày được cho như sau:

\begin{array}{c c c c c c c c c c c c c}18&25&39&12&54&27&46&25&19&8&36&22&\\ 20&19&17&44&5&18&23&28&25&34&46&27&16\end{array}

Hãy chuyển mẫu số liệu sang dạng ghép nhóm với sáu nhóm có độ dài bằng nhau.

Khoảng biến thiên là \(54-5=49\).

Ta chia thành các nhóm sau \([4{,}5;13); [13;21{,}5);[21{,}5;30);\ldots ;[47;55{,}5)\).

Đếm số giá trị của mỗi nhóm, ta có bảng ghép nhóm sau:

\begin{array}{|c|c|c|c|c|c|c|}\hline \text{Số sản phẩm} &[4{,}5;13)&[13;21{,}5)&[21{,}5;30)&[30;38{,}5)&[38{,}5;47)&[47;55{,}5)\\ \hline \text{Số công nhân} &3&7&8&2&4&1\\ \hline\end{array}

Bài tập 2

Bảng thống kê sau cho biết thời gian chạy (phút) của \(30\) vận động viên (VĐV) trong một giải chạy Marathon.

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline \text{Thời gian} &129&130&133&134&135&136&138&141&142&143&144&145\\ \hline \text{Số VĐV} &1&2&1&1&1&2&3&3&4&5&2&5\\ \hline \end{array}

Hãy chuyển mẫu số liệu trên sang mẫu số liệu ghép nhóm gồm sáu nhóm có độ dài bằng nhau và bằng \(3\).

Giá trị nhỏ nhất là \(129\), giá trị lớn nhất là \(145\) nên khoảng biến thiên là \(145-129=16\). Tổng độ dài của sáu nhóm là \(18\). Để cho đối xứng, ta chọn đầu mút trái của nhóm đầu tiên là \(127{,}5\) và đầu mút phải của nhóm cuối cùng là \(145{,}5\) ta được các nhóm là \([127{,}5;130{,}5),\; [130{,5};133{,5}],\ldots , [142{,}5;145{,}5]\). Đếm số giá trị thuộc mỗi nhóm, ta có mẫu số liệu ghép nhóm như sau

\begin{array}{|c|c|c|c|c|c|c|}\hline \text{Thời gian}&[125{,}5;130{,}5)&[130{,}5;133{,}5)&[133{,}5;136{,}5)&[136{,}5;139{,}5)&[139{,}5;142{,}5)&[142{,}5;145{,}5)\\ \hline\text{Số VĐV}&3&1&4&3&7&12\\\hline \end{array}

Bài tập 3

Mẫu số liệu sau cho biết phân bố theo độ tuổi của dân số Việt Nam năm \(2019\).

\begin{array}{|c|c|c|c|}\hline\text{Độ tuổi} & \text{Dưới 15 tuổi} & \text{Từ 15 đến dưới 65 tuổi } & \text{Từ 65 tuổi trở lên}\\ \hline \text{Số người} & 23\;371\;882&65\;420\;451&7\;416\;651\\ \hline\end{array}

a) Mẫu số liệu đã cho có là mẫu số liệu ghép nhóm hay không?

b) Nêu các nhóm và tần số tương ứng. Dân số Việt Nam năm \(2019\) là bao nhiêu?

a) Mẫu số liệu đã cho là mẫu số liệu ghép nhóm.

b) Có ba nhóm là: Dưới \(15\) tuổi, Từ \(15\) đến dưới \(65\) tuổi, Từ \(65\) tuổi trở lên. Có \(23\;371\;882\) người dưới \(15\) tuổi; \(65\;420\;451\) người từ \(15\) đến dưới \(65\) tuổi và \(7\;416\;651\) người từ \(65\) tuổi trở lên.

Dân số Việt Nam năm \(2019\) là \(23\;371\;882+65\;420\;451+7\;416\;651=96\;208\;984\) người.

Bài tập 4

Thời gian ra sân (giờ) của một số cựu cầu thủ ở giải ngoại hạng Anh qua các thời kì được cho như sau:

\begin{array}{c c c c c c c c}653 & 632 & 609 & 572 & 565 & 535 & 516 & 514 \\ 508 & 505 & 504 & 504 & 503 & 499 & 496 & 492 \end{array}

Hãy chuyển mẫu số liệu trên sang dạng ghép nhóm với bảy nhóm có độ dài bằng nhau.

Khoảng biến thiên là \(653-492=161\).

Ta chia thành các nhóm sau \([492;515); [515;538);[538;561);\ldots; [47;55{,}5)\).

Đếm số giá trị của mỗi nhóm, ta có bảng ghép nhóm sau:

\begin{array}{|c|c|c|c|c|c|c|c|}\hline \text{Thời gian (giờ)} &[492;515)&[515;538)&[538;561)&[561;584)&[584;607)&[607;630)&[630;653]\\ \hline Số cầu thủ &9&2&0&2&0&1&2\\ \hline \end{array}

Bài tập 5

Tính giá trị đại diện và độ dài của mỗi nhóm trong mẫu số liệu sau

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Khoảng tuổi} &[20; 30) &[30; 40) &[40; 50) &[50; 60) &[60; 70)\\ \hline \textbf{Số khách hàng nữ} & 3 &9 &6 &4 &4 \\ \hline\end{array}

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Khoảng tuổi} &[20; 30) &[30; 40) &[40; 50) &[50; 60) &[60; 70)\\ \hline \textbf{Giá trị đại diện} & 25 & 35 & 45 & 55 & 65 \\ \hline \textbf{Độ dài của nhóm} & 10 & 10 & 10 & 10 & 10 \\ \hline\end{array}

Bài tập 6

Cân nặng của \(28\) học sinh nam lớp \(11\) được cho như sau:

\begin{array}{llllllllllllll}55{,}4 & 62{,}6 & 54{,}2 & 56{,}8 & 58{,}8 & 59{,}4 & 60{,}7 & 58 & 59{,}5 & 63{,}6 & 61{,}8 & 52{,}3 & 63{,}4 & 57{,}9\\ 49{,}7 & 45{,}1 & 56{,}2 & 63{,}2 & 46{,}1 & 49{,}6 & 59{,}1 & 55{,}3 & 55{,}8 & 45{,}5 & 46{,}8 & 54 & 49{,}2 & 52{,}6 \end{array}

Hãy chia mẫu dữ liệu trên thành 5 nhóm, lập bảng tần số ghép nhóm và xác định giá trị đại diện cho mỗi nhóm.

Khoảng biến thiên của mẫu số liệu trên là \(R=63{,}6-45{,}1=18{,}5\).

Độ dài mỗi nhóm \(L > \displaystyle\frac{R}{k}=\displaystyle\frac{18{,}5}{5}=3{,}7\).

Ta chọn \(L=4\) và chia dữ liệu thành các nhóm \([45; 49)\), \([49; 53)\), \([53; 57)\), \([57; 61)\), \([61; 65)\).

Khi đó ta có bảng tần số ghép nhóm sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Cân nặng} &{[45; 49)} &{[49; 53)} &{[53; 57)} &{[57; 61)} &{[61; 65)} \\ \hline \textbf{Giá trị đại diện} & 47 & 51 & 55 & 59 & 63 \\ \hline \textbf{Số học sinh} & 4 & 5 & 7 & 7 & 5 \\ \hline\end{array}

Bài tập 7

Một cửa hàng đã thống kê số ba lô bán được mỗi ngày trong tháng 9 với kết quả cho như sau:

\begin{array}{lllllllllllllll} 12 & 29 & 12 & 19 & 15 & 21 & 19 & 29 & 28 & 12 & 15 & 25 & 16 & 20 & 29\\ 21 & 12 & 24 & 14 & 10 & 12 & 10 & 23 & 27 & 28 & 18 & 16 & 10 & 20 & 21\end{array}

Hãy chia mẫu số liệu trên thành 5 nhóm, lập bảng tần số ghép nhóm, hiệu chỉnh bảng tần số ghép nhóm và xác định giá trị đại diện cho mỗi nhóm.

Khoảng biến thiên của mẫu số liệu trên là \(R=29-10=19\).

Độ dài mỗi nhóm \(L > \displaystyle\frac{R}{k}=\displaystyle\frac{19}{5}=3{,}8\).

Ta chọn \(L=4\) và chia dữ liệu thành các nhóm \([10; 14)\), \([14; 18)\), \([18; 22)\), \([22; 26)\), \([26; 30)\).

Khi đó ta có bảng tần số ghép nhóm sau:

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Cân nặng} &{[10; 14)} &{[14; 18)} &{[18; 22)} &{[22; 26)} &{[26; 30)} \\ \hline \textbf{Giá trị đại diện} & 12 & 16 & 20 & 24 & 28 \\ \hline \textbf{Số ba lô bán được} & 8 & 5 & 8 & 3 & 6 \\ \hline\end{array}

Bài tập 8

Sau khi kiểm tra về số học sinh trong \(100\) lớp học, người ta chia mẫu số liệu đó thành năm nhóm căn cứ vào số lượng học sinh của mỗi lớp (đơn vị: học sinh) và lập bảng tần số ghép nhóm bao gồm tần số tích luỹ như bảng bên. Tìm trung vị của mẫu số liệu đó.

\begin{array}{|c|c|c|}\hline\textbf{Nhóm} & \textbf{Tần số} & \textbf{Tần số tích luỹ}\\ \hline \left[36;38\right) & 9 & 9\\ \left[38;40\right) & 15 & 24\\ \left[40;42\right) & 25 & 49\\ \left[42;44\right) & 30 & 79\\ \left[44;46\right) & 21 & 100\\ \hline & n = 100 &\\ \hline \end{array}

Số phần tử của mẫu là \(n=100\). Ta có \(\displaystyle\frac{n}{2} = \displaystyle\frac{100}{2} = 50\).

Do \(cf_3 = 49 < 50 < cf_4 = 79\) nên nhóm \(4\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng \(50\).

Xét nhóm \(4\) là nhóm \(\left[42;44\right)\) có \(r=42\); \(d=2\) và \(n_4=30\) và nhóm \(3\) là nhóm \(\left[40;42\right)\) có \(cf_3 = 49\).

Khi đó trung vị của mẫu số liệu là

\[M_e = 42 + \displaystyle\frac{50 - 49}{30} \cdot 2 \approx 42\text{ (học sinh)}.\]

Bài tập 9

Một trường trung học phổ thông chọn \(36\) học sinh nam của khối \(11\), do chiều cao của các bạn học sinh đó và thu được mẫu số liệu sau (đơn vị: centimét):

\begin{array}{cccccccccccc}160 & 161 & 161 & 162 & 162 & 162 & 163 & 163 & 163 & 164 & 164 & 164 \\ 164 & 165 & 165 & 165 & 165 & 165 & 166 & 166 & 166 & 166 & 167 & 167 \\ 168 & 168 & 168 & 168 & 169 & 169 & 170 & 171 & 171 & 172 & 172 & 174\end{array}

Lập bảng tần số ghép nhóm bao gồm cả tần số tích luỹ cho mẫu số liệu trên có \(5\) nhóm ứng với \(5\) nửa khoảng:

\[\left[160;163 \right),\ \left[163;169 \right),\ \left[166;169 \right),\ \left[169;172 \right),\ \left[172;175 \right).\]

Bảng tần số ghép nhóm bao gồm cả tần số tích luỹ như sau:

\begin{array}{|c|c|c|}\hline\textbf{Nhóm} & \textbf{Tần số} & \textbf{Tần số tích luỹ}\\ \hline\left[169;163\right) & 6 & 6\\ \hline\left[163;166\right) & 12 & 18\\ \hline\left[166;169\right) & 10 & 28\\ \hline\left[169;172\right) & 5 & 33\\ \hline\left[172;175\right) & 3 & 36\\ \hline& n = 36 &\\ \hline\end{array}

Bài tập 10

Một nhà thực vật học đo chiều dài của \(74\) lá cây (đơn vị: milimét) và thu được bảng tần số như bảng bên. Tính chiều dài trung bình của \(74\) lá cây trên theo đơn vị milimét (làm tròn kết quả đến hàng phần trăm).

\begin{array}{|c|c|c|}\hline\textbf{Nhóm} & \textbf{Giá trị đại diện} & \textbf{Tần số}\\ \hline\left[5{,}45;5{,}85\right) & 5{,}65 & 5\\ \left[5{,}85;6{,}25\right) & 6{,}05 & 9\\ \left[6{,}25;6{,}65\right) & 6{,}45 & 15\\ \left[6{,}65;7{,}05\right) & 6{,}85 & 19\\ \left[7{,}05;7{,}45\right) & 7{,}25 & 16\\ \left[7{,}45;7{,}85\right) & 7{,}65 & 8\\ \left[7{,}85;8{,}25\right) & 8{,}05 & 2\\ \hline& & n = 74\\ \hline\end{array}

Chiều dài trung bình của \(74\) lá cây mà nhà thực vật học đo xấp xỉ là

\[\overline{x} = \displaystyle\frac{5\cdot 5{,}65 + 9 \cdot 6{,}05 + 15\cdot 6{,}45 + 19\cdot 6{,}85 + 16 \cdot 7{,}25 + 8\cdot 7{,}65 + 2\cdot 8{,}05}{74} \approx 6{,}80\ (\text{mm}).\]

Bài tập 11

Cơ cấu dân số Việt Nam năm 2020 theo độ tuổi được cho trong bảng sau

\begin{array}{|c|c|c|c|c|c|}\hline \text{Độ tuổi} & \text{Dưới}\ 5\ \text{tuổi} &5-14&15-24&25-64& \text{Trên}\ 65\\ \hline \text{Số người}\ (\text{triệu})&7{,}89&14{,}68&13{,}32&53{,}78&7{,}66\\ \hline \end{array}

Chọn 80 là giá trị đại diện cho nhóm trên 65 tuổi. Tính tuổi trung bình của người Việt Nam năm 2020.

Trong mỗi khoảng độ tuổi, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau

\begin{array}{|c|c|c|c|c|c|}\hline \text{Độ tuổi} & 2{,}5 & 9{,}5&19{,}5 & 44{,}5 & 80\\ \hline \text{Số người (triệu)} & 7{,}89&14{,}68 & 13{,}32&53{,}78&7{,}66\\ \hline \end{array}

Tổng số dân là \(n=97{,}33\) triệu người. Do đó tuổi trung bình của người dân Việt Nam trong năm \(2020\) là

\(\overline{x}=\displaystyle\frac{2{,}5\cdot 7{,}89+9{,}5\cdot 14{,}68+19{,}5\cdot 13{,}32+44{,}5\cdot 53{,}78+80\cdot 7{,}66}{97{,}33}\approx 35{,}19.\)

Bài tập 12

Người ta ghi lại tuổi thọ của một số con ong cho kết quả như sau

\begin{array}{|c|c|c|c|c|c|}\hline \text{Tuổi thọ (ngày)} & [0;20) &[20;40)&[40;60)&[60;80)& [80;100)\\ \hline \text{Số lượng} &5&12&23&31&29\\ \hline \end{array}

Tìm mốt của mẫu số liệu. Giải thích ý nghĩa của giá trị nhận được.

Tần số lớn nhất là \(31\) nên nhóm chứa mốt là nhóm \([60;80)\).

Ta có \(j=4\); \(a_4=60\); \(m_4=31\); \(m_3=23\); \(m_5=29\); \(h=20\).

Khi đó \(M_O=60+\displaystyle\frac{31-23}{(31-23)+(31-29)}\cdot 20=76\).

Như vậy, số con ong có tuổi thọ \(76\) ngày là nhiều nhất.

Bài tập 13

Tuổi thọ (năm) của 50 bình ắc quy ô tô được cho như sau:

\begin{array}{|c|c|c|c|c|c|c|}\hline \text{Tuổi thọ (năm)} & \left[2;2{,}5 \right) & \left[2{,}5;3 \right) & \left[3;3{,}5 \right)&\left[3{,}5;4 \right)&\left[4;4{,}5 \right)&\left[4{,}5;5 \right)\\ \hline \text{Tần số} &4 & 9 & 14 &11 & 7&5 \\\hline\end{array}

a) Xác định mốt và giải thích ý nghĩa.

b) Tính tuổi thọ trung bình của \(50\) bình ắc quy ô tô này.

a) Tần số lớn nhất là \(14\) nên nhóm chứa mốt là nhóm \(\left[3;3, 5\right)\).

Ta có \(j=3\), \(a_3=3\), \(m_3=14\), \(m_2=9\), \(m_4=11\), \(h=0\), \(5\). Do đó

\(M_o=3+\displaystyle\frac{14-9}{(14-9)+(14-11)}\cdot 0{,}5=3{,}3125.\)

Tuổi thọ cao nhất của bình ắc quy khoảng \(3{,}3125\) năm.

b) Ta có bảng sau

\begin{array}{|c|c|c|c|c|c|c|}\hline\text{Tuổi thọ (năm)} & 2{,}25 & 2{,}75 & 3{,}25&3{,}75&4{,}25&4{,}75 \\\hline\text{Tần số} &4 & 9 & 14 &11 & 7&5\\\hline\end{array}

Tuổi thọ trung bình của 50 bình ắc quy ô tô này là

\(\overline{x}=\displaystyle\frac{2{,}25\cdot 4+2{,}75\cdot 9+3{,}25\cdot 14+3{,}75\cdot 11+4{,}25\cdot 7+4{,}75\cdot 5}{50}=3{,}48 \, \text{(năm)}.\)

Bài tập 14

Quãng đường (km) từ nhà đến nơi làm việc của 40 công nhân một nhà máy được ghi lại như sau:

\begin{array}{|cccccccccccccccccccc|}\hline5 & 3 &10 & 20 & 25 & 11 & 13 & 7 & 12 & 31 & 19 &10 &12 & 17 & 18 & 11 & 32 & 17 &16 &2 \\7 & 9 &7 & 8 & 3 & 5 & 12 & 15 & 18 & 3 & 12 &14 &2 & 9 & 6 & 15 & 15 & 7 &6 &12\\\hline\end{array}

a) Ghép nhóm dãy số liệu trên thành các khoảng có độ rộng bằng nhau, khoảng đầu tiên là \left[0;5\right). Tìm giá trị đại diện cho mỗi nhóm.

b) Tính số trung bình của mẫu số liệu không ghép nhóm và mẫu số liệu ghép nhóm. Giá trị nào chính xác hơn?

c) Xác định nhóm chứa mốt của mẫu số liệu ghép nhóm thu được.

a) Giá trị nhỏ nhất của mẫu số liệu là 2, giá trị lớn nhất là 32, khoảng đầu tiên của mẫu số liệu ghép nhóm là \left[0;5\right) nên ta ghép nhóm mẫu số liệu như sau:

\begin{array}{|c|c|c|c|c|c|c|c|}\hline\text{Quãng đường} & \left[0;5\right) & \left[5;10\right) & \left[10;15\right) & \left[15;20\right) & \left[20;25\right)& \left[25;30\right)& \left[30;35\right)\\\hline\text{Số công nhân} & 5 & 11 & 11 & 9 & 1 & 1 & 2 \\\hline\end{array}

Trong mỗi khoảng, giá trị đại điện là trung bình cộng của hai giá trị đầu mút nên ta có bảng sau:

\begin{array}{|c|c|c|c|c|c|c|c|}\hline\text{Quãng đường} & 2{,}5 & 7{,}5 & 12{,}5 & 17{,}5 & 22{,}5& 27{,}5& 32{,}5\\\hline\text{Số công nhân} & 5 & 11 & 11 & 9 & 1 & 1 & 2 \\\hline\end{array}

b) Số trung bình của mẫu số liệu không ghép nhóm là

\(\overline{x}=\displaystyle\frac{5+3+10+\cdots +12}{40}=11{,}9.\)

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}=\displaystyle\frac{5\cdot 2{,}5+11\cdot 7{,}5+11\cdot 12{,}5+9\cdot 17{,}5+1\cdot 22{,}5+1\cdot 27{,}5+2\cdot 32{,}5}{40}=12{,}625.\)

Số trung bình của mẫu số liệu không ghép nhóm sẽ chính xác hơn số trung bình của mẫu số liệu ghép nhóm vì số trung bình của dữ liệu không ghép nhóm sử dụng chính xác các số liệu, còn số trung bình của dữ liệu ghép nhóm sử dụng giá trị đại diện của mỗi khoảng ghép nhóm.

c) Tần số lớn nhất là 11 nên nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm \(\left[5;10\right)\) và nhóm \(\left[10;15\right)\).

Bài tập 15

Bảng số liệu ghép nhóm sau cho biết chiều cao (cm) của \(50\) học sinh lớp \(11A\).

\begin{array}{|c|c|c|c|c|c|c|}\hline\text{Khoảng chiều cao (cm)} & \left[145;150 \right) & \left[150;155 \right) & \left[155;160 \right) & \left[160;165 \right)&\left[165;170 \right) \\ \hline\text{Số học sinh} &7 & 14 & 10 &10 & 9 \\ \hline\end{array}

Tính mốt của mẫu số liệu ghép nhóm này. Có thể kết luận gì từ giá trị tính được?

Tần số lớn nhất là \(14\) nên nhóm chứa mốt là nhóm \(\left[150;155 \right)\). Ta có \(j=2\), \(a_2=150\), \(m_2=14\), \(m_1=7\), \(m_3=10\), \(h=5\). Do đó \(M_o=150+\displaystyle\frac{14-7}{\left(14-7\right)+\left(14-10\right)\cdot 5}\approx 153{,}18.\)

Số học sinh có chiều cao khoảng \(153{,}18\) là nhiều nhất.

Bài tập 16

Tìm cân nặng trung bình của học sinh lớp \(11A\) cho trong bảng dưới đây.

\begin{array}{|c|c|c|c|c|c|c|}\hline\text{Cân nặng} & \left[40{,}5;45{,}5 \right) & \left[45{,}5;50{,}5 \right) & \left[50{,}5;55{,}5 \right) & \left[55{,}5;60{,}5 \right) & \left[60{,}5;65{,}5 \right) & \left[65{,}5;70{,}5 \right) \\\hline\text{Số học sinh} &10 & 7 & 16 &4 & 2 & 3 \\\hline\end{array}

Trong mỗi khoảng cân nặng, giá trị đại diện là trung bình cộng của hai giá trị đầu mút nên ta có bảng sau:

\begin{array}{|c|c|c|c|c|c|c|}\hline\text{Cân nặng (kg)} & 43 & 48 & 53 & 58 & 63 & 68 \\ \hline\text{Số học sinh}&10 & 7 & 16 &4 & 2 & 3 \\\hline\end{array}

Tổng số học sinh là \(n=42\). Cân nặng trung bình của học sinh lớp \(11D\) là \(\overline{x}=\displaystyle\frac{10\cdot 43+7\cdot 48+16\cdot 53+4\cdot 58+2\cdot 63+3\cdot 68}{42}\approx51{,}81\,\mathrm{(kg)}.\(

Bài tập 17

Kết quả đo chiều cao của \(200\) cây keo \(3\) năm tuổi ở một nông trường được biểu diễn ở biểu đồ dưới đây.

Hãy ước lượng số trung bình và mốt của mẫu số liệu ghép nhóm trên.

Bảng tần số ghép nhóm (theo giá trị đại diện)

\begin{array}{|c|c|c|c|c|c|}\hline \text{Chiều cao} &[8{,}5; 8{,}8) &[8{,}8; 9{,}1) &[9{,}1; 9{,}4) &[9{,}4; 9{,}7) &[9{,}7; 10{,}0) \\ \hline \text{Giá trị đại diện} &8{,}65 &8{,}95 &9{,}25 &9{,}55 &9{,}85 \\ \hline \text{Số cây} & 20 & 35 & 60 & 55 & 30\\ \hline\end{array}

Chiều cao trung bình của \(200\) cây keo 3 năm tuổi là

\[\overline{x}=\displaystyle\frac{8{,}65\cdot 20+8{,}95\cdot 35+9{,}25\cdot 60+9{,}55\cdot 55+9{,}85\cdot 30}{200}\approx 9{,}31. \]

Nhóm chứa mốt của mẫu số liệu trên là nhóm \([9{,}1; 9{,}4)\).

Do đó \(u_m=9{,}1\); \(n_{m-1}=35\); \(n_m=60\); \(n_{m+1}=55\); \(u_{m+1}-u_m=9{,}4-9{,}1=0{,}3\).

Mốt của mẫu số liệu ghép nhóm là

\[M_0=9{,}1+\displaystyle\frac{60-35}{(60-35)+(60-55)} \cdot 0{,}3= 9{,}35. \]

Bài tập 18

Người ta đếm số xe ô tô đi qua một trạm thu phí mỗi phút trong khoảng thời gian từ \(9\) giờ đến \(9\) giờ \(30\) phút sáng. Kết quả được ghi lại ở bảng sau:

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline 15 & 16 & 13 & 21 & 17 & 23 & 15 & 21 & 6 & 11 & 12 & 23 & 19 & 25 & 11 \\\hline 25 & 7 & 29 & 10 & 28 & 29 & 24 & 6 & 11 & 23 & 11 & 21 & 9 & 27 & 15 \\\hline\end{array}

a) Tính số xe trung bình đi qua trạm thu phí trong mỗi phút.

b) Tổng hợp lại số liệu trên vào bảng tần số ghép nhóm theo mẫu sau:

\begin{array}{|c|c|c|c|c|c|}\hline \text{Số xe} &[6; 10] &[11; 15] &[16; 20] &[21; 25] &[26; 30] \\ \hline \text{Số lần} & ? & ? & ? & ? & ? \\\hline\end{array}

c) Hãy ước lượng trung bình số xe đi qua trạm thu phí trong mỗi phút từ bảng tần số ghép nhóm trên.

a) Bảng tần số

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline \text{Giá trị} &6 & 7 & 9 & 10 & 11 & 12 & 13 & 15 & 16 & 17 & 19 & 21 & 23 & 24 & 25 & 27 & 28 & 29 &\\ \hline \text{Tần số} &2 & 1 & 1 & 1 & 4 & 1 & 1 & 3 & 1 & 1 & 1 & 3 & 3 & 1 & 2 & 1 & 1 & 2 &N=30\\\hline\end{array}

Số xe trung bình đi qua trạm thu phí trong mỗi phút là

\begin{eqnarray*}\overline{x}&=&\displaystyle\frac{6\cdot 2+7+9+10+11\cdot 4+12+13+15\cdot 3}{30}\\ &&+\displaystyle\frac{16+17+19+21\cdot 3+23\cdot 3+24+25\cdot 2+27+28+29\cdot 2}{30}\\&\approx& 17{,}43\ (\text{xe}).\end{eqnarray*}

b) Bảng tần số ghép nhóm

\begin{array}{|c|c|c|c|c|c|}\hline \text{Số xe} &[6; 10] &[11; 15] &[16; 20] &[21; 25] &[26; 30] \\ \hline \text{Số lần} & 5 & 9 & 3 & 9 & 4 \\ \hline\end{array}

c) Bảng tần số ghép nhóm (theo giá trị đại diện) được hiệu chỉnh lại như sau

\begin{array}{|c|c|c|c|c|c|}\hline \text{Số xe} &[5{,}5; 10{,}5) &[10{,}5; 15{,}5) &[15{,}5; 20{,}5) &[20{,}5; 25{,}5) &[25{,}5; 30{,}5) \\ \hline \text{Giá trị đại diện} &8 &13 &18 &23 &28 \\ \hline \text{Số lần} & 5 & 9 & 3 & 9 & 4 \\\hline\end{array}

Số xe trung bình đi qua trạm qua bảng tần số ghép nhóm là

\[\overline{x}=\displaystyle\frac{8\cdot 5+13\cdot 9+18\cdot 3+23\cdot 9+28\cdot 4}{30}\approx 17{,}67\ (\text{xe}). \]

Bài tập 19

Anh Văn ghi lại cự li 30 lần ném lao của mình ở bảng sau (đơn vị: mét):

\begin{array}{|c|c|c|c|c|c|c|c|c|c|}\hline 72{,}1 & 72{,}9 & 70{,}2 & 70{,}9 & 72{,}2 & 71{,}5 & 72{,}5 & 69{,}3 & 72{,}3 & 69{,}7 \\ \hline 72{,}3 & 71{,}5 & 71{,}2 & 69{,}8 & 72{,}3 & 71{,}1 & 69{,}5 & 72{,}2 & 71{,}9 & 73{,}1 \\ \hline 71{,}6 & 71{,}3 & 72{,}2 & 71{,}8 & 70{,}8 & 72{,}2 & 72{,}2 & 72{,}9 & 72{,}7 & 70{,}7 \\\hline \end{array}

a) Tính cự li trung bình của mỗi lần ném.

b) Tổng hợp lại kết quả ném của anh Văn vào bảng tần số ghép nhóm theo mẫu sau:

\begin{array}{|c|c|c|c|c|c|} \hline \text{Cự li} (\mathrm{m}) &[69{,}2; 70) &[70; 70{,}8) &[70{,}8; 71{,}6) &[71{,}6; 72{,}4) &[72{,}4; 73{,}2) \\ \hline \text{Số lần} & ? & ? & ? & ? & ? \\\hline\end{array}

c) Hãy ước lượng cự li trung bình mỗi lần ném từ bảng tần số ghép nhóm trên.

d) Khả năng anh Văn ném được khoảng bao nhiêu mét là cao nhất?

a) Điểm tổng của mỗi đợt gồm 10 lần ném

\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|}\hline \text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Điểm} &\text{Tổng} \\ \hline 72{,}1 & 72{,}9 & 70{,}2 & 70{,}9 & 72{,}2 & 71{,}5 & 72{,}5 & 69{,}3 & 72{,}3 & 69{,}7 &713{,}6\\ \hline 72{,}3 & 71{,}5 & 71{,}2 & 69{,}8 & 72{,}3 & 71{,}1 & 69{,}5 & 72{,}2 & 71{,}9 & 73{,}1 &714{,}9\\ \hline 71{,}6 & 71{,}3 & 72{,}2 & 71{,}8 & 70{,}8 & 72{,}2 & 72{,}2 & 72{,}9 & 72{,}7 & 70{,}7 &718{,}4\\ \hline\end{array}

Cự li trung bình của mỗi lần ném của anh Văn

\[\overline{x}=\displaystyle\frac{713{,}6+714{,}9+718{,}4}{30}\approx71{,}56\ (\mathrm{m}). \]

b) Bảng tần số ghép nhóm kết quả ném của anh Văn:

\begin{array}{|c|c|c|c|c|c|}\hline \text{Cự li} (\mathrm{m}) &[69{,}2; 70) &[70; 70{,}8) &[70{,}8; 71{,}6) &[71{,}6; 72{,}4) &[72{,}4; 73{,}2) \\ \hline \text{Số lần} & 4 & 2 & 7 & 12 & 5 \\ \hline\end{array}

c) Bảng tần số ghép nhóm kết quả ném của anh Văn (theo giá trị đại diện):

\begin{array}{|c|c|c|c|c|c|}\hline \text{Cự li} (\mathrm{m}) &[69{,}2; 70) &[70; 70{,}8) &[70{,}8; 71{,}6) &[71{,}6; 72{,}4) &[72{,}4; 73{,}2) \\ \hline \text{Giá trị đại diện} &69{,}6 &70{,}4 &71{,}2 &72{,}0 &72{,}8\\ \hline \text{Số lần} & 4 & 2 & 7 & 12 & 5 \\ \hline\end{array}

Cự li trung bình mỗi lần ném của anh Văn qua bảng tần số ghép nhóm

\[(69{,}6\cdot 4+70{,}4\cdot 2+71{,}2\cdot 7+72\cdot 12+72{,}8\cdot 5):30=71{,}52\ (\mathrm{m}). \]

d) Nhóm chứa mốt của mẫu số liệu trên là nhóm \([71{,}6; 72{,}4)\).

Do đó \(u_m=71{,}6\); \(n_{m-1}=7\); \(n_m=12\); \(n_{m+1}=5\); \(u_{m+1}-u_m=72{,}4-71{,}6=0{,}8\).

Mốt của mẫu số liệu ghép nhóm là

\[M_0=71{,}6+\displaystyle\frac{12-7}{(12-7)+(12-5)} \cdot 0{,}8=\displaystyle\frac{101}{14} \approx 71{,}93. \]

Dựa vào kết quả trên thì khả năng anh Văn ném được cao nhất là khoảng \(71{,}93\) mét.

Bài tập 20

Số cuộc gọi điện thoại một nguời thực hiện mỗi ngày trong \(30\) ngày được lựa chọn ngẫu nhiên được thống kê trong bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \text{Số cuộc gọi} &[3; 5] &[6; 8] &[9; 11] &[12; 14] &[15; 17] \\ \hline \text{Số ngày} & 5 & 13 & 7 & 3 & 2 \\\hline\end{array}

a) Tìm mốt của mẫu số liệu ghép nhóm trên.

b) Hãy dự đoán xem khả năng người đó thực hiện bao nhiêu cuộc gọi mỗi ngày là cao nhất.

Do số cuộc gọi là số nguyên nên ta hiệu chỉnh lại như sau:

\begin{array}{|c|c|c|c|c|c|}\hline \text{Số cuộc gọi} &[2{,}5; 5{,}5) &[5{,}5; 8{,}5) &[8{,}5; 11{,}5) &[11{,}5; 14{,}5) &[14{,}5; 17{,}5) \\ \hline \text{Số ngày} & 5 & 13 & 7 & 3 & 2 \\ \hline\end{array}

a) Nhóm chứa mốt của mẫu số liệu trên là nhóm \([5{,}5; 8{,}5)\).

Do đó \(u_m=5{,}5\); \(n_{m-1}=5\); \(n_m=1\); \(n_{m+1}=7\); \(u_{m+1}-u_m=8{,}5-5{,}5=3\).

Mốt của mẫu số liệu ghép nhóm là

\[M_0=5{,}5+\displaystyle\frac{13-5}{(13-5)+(13-7)} \cdot 3=\displaystyle\frac{101}{14} \approx 7{,}2. \]

b) Dựa vào kết quả trên ta có thể dự đoán rằng khả năng người đó thực hiện 7 cuộc gọi mỗi ngày là cao nhất.

Bài tập 21

Một công ty xây dựng khảo sát khách hàng xem họ có nhu cầu mua nhà ở mức giá nào. Kết quả khảo sát được ghi lại ở bảng sau

\begin{array}{|c|c|c|c|c|c|}\hline \textbf{Mức giá (triệu đồng}/\mathrm{m}^2) &[10; 14) &[14; 18) &[18; 22) &[22; 26) &[26; 30) \\ \hline \textbf{Số khách hàng} & 54 & 78 & 120 & 45 & 12 \\ \hline\end{array}

a) Tìm mốt của mẫu số liệu ghép nhóm trên.

b) Công ty nên xây nhà ở mức giá nào để nhiều người có nhu cầu mua nhất?

a) Nhóm chứa mốt của mẫu số liệu trên là nhóm \([18; 22)\).

Do đó \(u_m=18\), \(n_{m-1}=78\), \(n_m=120\), \(n_{m+1}=45\), \(u_{m+1}-u_m=22-18=4\).

Mốt của mẫu số liệu ghép nhóm là

\[M_0=18+\displaystyle\frac{120-78}{(120-78)+(120-45)}\cdot 4=\displaystyle\frac{758}{39} \approx 19{,}4.\]

b) Dựa vào kết quả trên ta có thể dự đoán rằng nếu công ty xây nhà ở mức giá \(19{,}4\) triệu đồng\(/ \mathrm{m}^2\) thì sẽ có nhiều người có nhu cầu mua nhất.

Bài tập 22

Kết quả khảo sát cân nặng của \(25\) quả cam ở mỗi lô hàng \(A\) và \(B\) được cho ở bảng sau:

\begin{array}{|c|c|c|c|c|c|}\hline \text{Cân nặng} (\mathrm{g}) &[150; 155) &[155; 160) &[160; 165) &[165; 170) &[170; 175) \\ \hline \text{Số quả cam ở lô hàng} A & 2 & 6 & 12 & 4 & 1 \\ \hline \text{Số quả cam ở lô hàng} B & 1 & 3 & 7 & 10 & 4 \\ \hline \end{array}

a) Hãy ước lượng cân nặng trung bình của mỗi quả cam ở lô hàng \(A\) và lô hàng \(B\).

b) Nếu so sánh theo số trung bình thì cam ở lô hàng nào nặng hơn?

Ta có bảng thống kê số lượng cam theo giá trị đại diện:

\begin{array}{|c|c|c|c|c|c|}\hline \text{Cân nặng} (\mathrm{g}) &152{,}5 &157{,}5 &162{,}5 &167{,}5 &172{,}5\\ \hline \text{Số quả cam ở lô hàng} A & 2 & 6 & 12 & 4 & 1 \\ \hline \text{Số quả cam ở lô hàng} B & 1 & 3 & 7 & 10 & 4 \\ \hline\end{array}

a) Cân nặng trung bình của mỗi quả cam ở lô hàng \(A\) xấp xỉ bằng

\[(2\cdot 152{,}5+6\cdot 157{,}5+12\cdot 162{,}5+4\cdot 167{,}5+1\cdot 172{,}5): 25=161{,}7\ (\mathrm{g}). \]

Cân nặng trung bình của mỗi quả cam ở lô hàng \(B\) xấp xỉ bằng

\[(1\cdot 152{,}5+3\cdot 157{,}5+7\cdot 162{,}5+10\cdot 167{,}5+4\cdot 172{,}5): 25=165{,}1\ (\mathrm{g}). \]

b) Nếu so sánh theo số trung bình thì cam ở lô hàng \(B\) nặng hơn cam ở lô hàng \(A\).

Bài tập 23

Mẫu số liệu dưới đây ghi lại độ dài quãng đường di chuyển trong một tuần (đơn vị: kilômét) của \(40\) chiếc ô tô:

\begin{array}{|c|c|c|c|c|c|c|c|c|c|}\hline 100 & 105 & 115 & 116 & 130 & 135 & 138 & 132 & 135 & 120 \\\hline125 & 128 & 120 & 124 & 140 & 140 & 146 & 145 & 142 & 142 \\ \hline 145 & 148 & 150 & 150 & 159 & 155 & 151 & 156 & 155 & 151 \\ \hline 154 & 152 & 153 & 160 & 162 & 175 & 176 & 165 & 188 & 198 \\ \hline \end{array}

a) Lập bảng tần số ghép nhóm bao gồm cả tần số tích lũy với năm nhóm ứng với năm nửa khoảng:

\([100;120),[120;140),[140;160),[160;180),[180;200).\)

b) Xác định số trung bình cộng, trung vị, tứ phân vị của mẫu số liệu ghép nhóm trên.

c) Mốt của mẫu số liệu ghép nhóm trên là bao nhiêu?

\begin{array}{|c|c|c|}\hline \text{Nhóm} & \text{Tần số} & \text{Tần số tích lũy} \\ \hline [100;120) & 4 & 4 \\ \hline [120;140) & 10 & 14 \\ \hline [140;160) & 19 & 33 \\ \hline [160;180) & 5 & 38 \\ \hline [180;200) & 2 & 40 \\ \hline & n=40 \\ \hline \end{array}

a) Số phần tử của mẫu là \(n=40\). Ta có:

\(\displaystyle\frac{n}{2}=\displaystyle\frac{40}{2}=20\)

mà \(cf_2=14 < 20 < cf_3=33\). Suy ra nhóm \(3\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(20\).

Xét nhóm \(3\) là nhóm \([140;160)\) có \(r=140;d=20;n_3=19\) và nhóm \(2\) là nhóm \([140;160)\) có \(cf_2=14\).

Áp dụng công thức, ta có trung vị của mẫu số liệu là:

\(M_e=140+\left(\displaystyle\frac{20-14}{19}\right) \cdot 20 \approx 146\)

b) Số phần tử của mẫu là \(n=40\).

+) Ta có: \(\displaystyle\frac{n}{4}=10\) mà \(4 < 10 \le 10\). Suy ra nhóm \(2\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(10\). Xét nhóm \(2\) là nhóm \([120;140)\) có \(s=120;h=20;n_2=10\) và nhóm \(1\) là nhóm \([100;120)\) có \(cf_1=4\).

Áp dụng công thức, ta có tứ phân vị thứ nhất là:

\(Q_1=120+\left(\displaystyle\frac{10-4}{10}\right) \cdot 20 \approx 132.\)

+) Ta có tứ phân vị thứ hai là:

\(Q_2=M_e \approx 146.\(

+) Ta có \(\displaystyle\frac{3n}{4}=30\) mà \(14 < 30 < 33\). Suy ra nhóm \(3\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(30\). Xét nhóm \(3\) là nhóm \([140;160)\) có \(t=140;l=20;n_3=19\) và nhóm \(2\) là nhóm \([120;140)\) có \(cf_2=14\).

Áp dụng công thức, ta có tứ phân vị thứ ba là:

\(Q_3=140+\left(\displaystyle\frac{30-14}{19}\right)\cdot 20 \approx 157.\)

c) Ta thấy nhóm \(3\) ứng với nửa khoảng \([140;160)\) là nhóm có tần số lớn nhất với \(u=140;g=20;n_3=23\). Nhóm \(2\) có tần số \(n_2=5\), nhóm \(4\) có tần số \(n_4=6\).

Áp dụng công thức, ta có mốt của mẫu số liệu là:

\( M_o=140+\left(\displaystyle\frac{23-5}{2.23-5-6}\right) \cdot 20 \approx 170.\)