Dạng 1. Tính khoảng biến thiên
Dạng 2. Tính khoảng tứ phân vị
Câu 1:
Bảng dưới đây biểu diễn mẫu số liệu ghép nhóm về chiều cao (đơn vị: centimet) của 36 học sinh nam lớp \(12\) ở một trường trung học phổ thông. Tìm khoảng biến thiên của mẫu số liệu ghép nhóm đó.
Trong mẫu số liệu ghép nhóm đó, ta có: đầu mút trái của nhóm \(1\) là \(a_{1} = 160\), đầu mút phải của nhóm 5 là \(a_6 = 175\). Vậy khoảng biến thiên của mẫu số liệu ghép nhóm đó là \(R=a_6 - a_1=175-160=15~(\mathrm{cm})\).
Câu 2:
Cô Hà thống kê lại đường kính thân gỗ của một số cây xoan đào 6 năm tuổi được trồng ở một lâm trường ở bảng sau.
Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm trên.
Khoảng biến thiên của mẫu số liệu ghép nhóm trên là \(R=65-40=25\) (cm).
Câu 3:
Bạn Chi rất thích nhảy hiện đại. Thời gian tập nhảy mỗi ngày trong thời gian gần đây của bạn Chi được thống kê lại ở bảng sau
Tính khoảng biến thiên của mẫu số liệu ghép nhóm đã cho.
Khoảng biến thiên của mẫu số liệu ghép nhóm là \(45-20=25\).
Câu 4:
Dũng là học sinh rất giỏi chơi rubik, bạn có thể giải nhiều loại khối rubik khác nhau. Trong một lần tập luyện giải khối rubik \(3\times 3\), bạn Dũng đã tự thống kê lại thời gian giải rubik trong \(25\) lần giải liên tiếp ở bảng sau:
Tính khoảng biến thiên của mẫu số liệu ghép nhóm đã cho.
Khoảng biến thiên của mẫu số liệu ghép nhóm là \(18-8=10\).
Câu 5:
Bảng bên dưới biểu thị kết quả điều tra thời gian sử dụng Internet hằng ngày của một số người.
Tìm khoảng biến thiên của mẫu số liệu đã cho. Kết quả cho biết điều gì?
Đầu mút phải của nhóm ghép cuối cùng là \(180\), đầu mút trái của nhóm ghép đầu tiên là \(30\). Vậy khoảng biến thiên của mẫu số liệu là \(R=180-30=150\).
Kết quả này cho biết thời gian sử dụng Internet hằng ngày của các thành viên thuộc nhóm người được điều tra chênh lệch nhau nhiều nhất là \(150\) phút.
Câu 6:
Để chuẩn bị mở một trung tâm thể dục thể thao, anh Dũng đã tiến hành điều tra tuổi thọ của máy chạy bộ do hai hãng \(X\), \(Y\) sản xuất. Bảng bên dưới biểu thị hai mẫu số liệu mà anh thu thập được qua Internet.
Khoảng biến thiên của mẫu số liệu nào lớn hơn? Từ đó có thể nói là máy chạy bộ do hãng nào sản xuất có tuổi thọ phân tán hơn?
Khoảng biến thiên của tuổi thọ máy chạy bộ do hãng \(X\) và hãng \(Y\) sản xuất tương ứng là \(R_X=12-2=10 \text{ và } R_Y=12-4=8.\)
Vì \(R_X > R_Y\) nên có thể nói là máy do hãng \(X\) sản xuất có tuổi thọ phân tán hơn so với máy của hãng \(Y\).
Câu 7:
Người ta tiến hành phỏng vấn hai nhóm khán giả về một bộ phim mới công chiếu. Nhóm \(A\) gồm những khán giả thuộc lứa tuổi \(20-30\), nhóm \(B\) thuộc lứa tuổi trên \(30\). Người được hỏi ý kiến phải đánh giá bộ phim bằng cách cho điểm theo một số tiêu chí nêu trong phiếu điều tra và sau đó lấy tổng số điểm (thang điểm \(100\)). Bảng dưới đây trình bày kết quả điều tra hai nhóm khán giả:
Ý kiến đánh giá của nhóm khán giả nào phân tán hơn?
Khoảng biến thiên của ý kiến đánh giá của hai nhóm khán giả \(A\) và \(B\) tương ứng là \(R_A=100-50=50 \text{ và } R_B=90-60=30.\)
Vì \(R_A > R_B\) nên có thể nói là ý kiến đánh giá của nhóm khán giả \(A\) phân tán hơn so với ý kiến đánh giá của nhóm khán giả \(B\).
Câu 8:
Thống kê thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ 1, Tổ 2 lớp 12A, được kết quả như sau:
Tìm khoảng biến thiên cho thời gian sử dụng mạng xã hội của học sinh mỗi tổ và giải thích ý nghĩa.
Gọi \(R_1\), \(R_2\) tương ứng là khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ \(1\) và Tổ \(2\).
Ta có: \(R_1= 90-0=90\) và \(R_2= 60-0=60\).
Do \(R_1>R_2\) nên ta có thể kết luận rằng thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ \(1\) phân tán hơn thời gian sử dụng mạng xã hội của các bạn Tổ \(2\).
Câu 9:
Thời gian hoàn thành bài kiểm tra môn Toán của các bạn trong lớp \(12\)C được cho trong bảng sau:
a) Tính khoảng biến thiên \(R\) cho mẫu số liệu ghép nhóm trên.
b) Nếu biết học sinh hoàn thành bài kiểm tra sớm nhất mất \(27\) phút và muộn nhất mất \(43\) phút thì khoảng biến thiên của mẫu số liệu gốc là bao nhiêu?
a) Khoảng biến thiên \(R = 45-25 = 20\).
b) Nếu biết học sinh hoàn thành bài kiểm tra sớm nhất mất \(27\) phút và muộn nhất mất \(43\) phút thì khoảng biến thiên của mẫu số liệu gốc là \(43-27=16\).
Câu 1:
Bảng dưới đây biểu diễn mẫu số liệu ghép nhóm về chiều cao của \(42\) mẫu cây ở một vườn thực vật (đơn vị: centimét).
Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đó (làm tròn kết quả đến hàng phần mười nếu cần).
Số phần tử của mẫu là \(n=42\).
+) Ta có: \(\displaystyle\frac{n}{4}=\displaystyle\frac{42}{4}=10{,}5\) mà \(5< 10{,}5< 15\). Suy ra nhóm 2 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(10{,}5\). Xét nhóm \(2\) là nhóm \([45; 50)\) có \(s=45\); \(h=5\); \(n_2=10\) và nhóm \(1\) là nhóm \([40; 45)\) có \(cf_1=5\).
Áp dụng công thức, ta có tứ phân vị thứ nhất là:
\[Q_1=45+\left(\displaystyle\frac{10{,}5-5}{10}\right) \cdot 5=47,75~(\mathrm{cm})\]
+) Ta có: \(\displaystyle\frac{3n}{4}=\displaystyle\frac{3\cdot 42}{4}=31{,}5\) mà \(31< 31{,}5< 38\). Suy ra nhóm \(5\) là nhóm đầu tiên có tần số tích lũy lơn hơn hoặc bằng \(31{,}5\). Xét nhóm \(5\) là nhóm \([60; 65)\) có \(t=60\); \(l=5\); \(n_5=7\) và nhóm \(4\) là nhóm \([55; 60\) ) có \(cf_4=31\).
Áp dụng công thức, ta có tứ phân vị thứ ba là:
\[Q_{3}=60+\left(\displaystyle\frac{31,5-31}{7}\right) \cdot 5 \approx 60{,}4~(\mathrm{cm}).\]
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là:
\[\Delta_{Q}=Q_3-Q_1 \approx 60{,}4-47{,}75=12{,}65~(\mathrm{cm}).\]
Câu 2:
Bảng dưới đây biểu diễn mẫu số liệu ghép nhóm vể số tiền (đơn vị: nghìn đồng) mà \(60\) khách hàng mua sách ở một cửa hàng trong một ngày.
a) Tính khoảng biến thiên của mẫu số liệu ghép nhóm.
b) Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm.
a) Trong mẫu số liệu ghép nhóm, ta có: đầu mút trái của nhóm \(1\) là \(a_1=40\), đầu mút phải của nhóm \(5\) là \(a_5=90\). Vậy khoảng biến thiên của mẫu số liệu ghép nhóm là
\[R=a_5-a_1=90-40=50 ~\text{(nghìn đồng)}.\]
b) Số phần tử của mẫu là \(60\).
Ta có \(\displaystyle\frac{n}{4}=\displaystyle\frac{60}{4}=15\), mà \(9< 15< 28\). Suy ra nhóm \(3\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(15\). Xét nhóm \(3\) là nhóm \([60; 70)\) có \(s=60\); \(h=10\); \(n_3=19\) và tần số tích lũy của nhóm trước là \(cf_2=9\).
Tứ phân vị thứ nhất: \(Q_1=60+\displaystyle\frac{15-9}{19}\cdot 10 \approx 63{,}16\) (nghìn đồng).
Ta có \(\displaystyle\frac{3n}{4}=\displaystyle\frac{3\cdot 60}{4}=45\), mà \(28< 45< 51\). Suy ra nhóm \(4\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(45\). Xét nhóm \(4\) là nhóm \([70; 80)\) có \(s=70\); \(h=10\); \(n_4=23\) và tần số tích lũy của nhóm trước là \(cf_3=28\).
Tứ phân vị thứ ba: \(Q_3=70+\displaystyle\frac{45-28}{23}\cdot 10 \approx 77{,}39\) (nghìn đồng).
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là
\[\Delta_Q=Q_3-Q_1=77{,}39-63{,}16=14{,}23 ~\text{(nghìn đồng)}.\]
Câu 3:
Bảng dưới đây biểu diễn mẫu số liệu ghép nhóm thống kê mức lương của một công ty (đơn vị: triệu đồng).
a) Tính khoảng biến thiên của mẫu số liệu ghép nhóm đó.
b) Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đó.
a) Trong mẫu số liệu ghép nhóm, ta có: đầu mút trái của nhóm \(1\) là \(a_1=10\), đầu mút phải của nhóm \(6\) là \(a_6=40\). Vậy khoảng biến thiên của mẫu số liệu ghép nhóm là
\[R=a_6-a_1=40-10=30 ~\text{(triệu đồng)}.\]
b) Số phần tử của mẫu là \(60\).
Ta có \(\displaystyle\frac{n}{4}=\displaystyle\frac{60}{4}=15\). Suy ra nhóm \(1\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(15\). Xét nhóm \(1\) là nhóm \([10; 15)\) có \(s=10\); \(h=5\); \(n_1=15\) và tần số tích lũy nhóm trước xem là \(0\).
Tứ phân vị thứ nhất: \(Q_1=10+\displaystyle\frac{15-0}{15}\cdot 5 = 15\) (triệu đồng).
Ta có \(\displaystyle\frac{3n}{4}=\displaystyle\frac{3\cdot 60}{4}=45\), mà \(43< 45< 53\). Suy ra nhóm \(4\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(45\). Xét nhóm \(4\) là nhóm \([25; 30)\) có \(s=25\); \(h=5\); \(n_4=10\) và tần số tích lũy của nhóm trước là \(cf_3=43\).
Tứ phân vị thứ ba: \(Q_3=25+\displaystyle\frac{45-43}{10}\cdot 5 = 26\) (triệu đồng).
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là
\[\Delta_Q=Q_3-Q_1=26-15=11 ~\text{(triệu đồng)}.\]
Câu 4:
Bảng dưới đây biểu diễn mẫu số liệu ghép nhóm về độ tuổi của cư dân trong một khu phố.
a) Tính khoảng biến thiên của mẫu số liệu ghép nhóm đó.
b) Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đó.
a) Trong mẫu số liệu ghép nhóm, ta có: đầu mút trái của nhóm \(1\) là \(a_1=20\), đầu mút phải của nhóm \(5\) là \(a_5=90\). Vậy khoảng biến thiên của mẫu số liệu ghép nhóm là
\[R=a_6-a_1=80-20=60 ~\text{(tuổi)}.\]
b) Số phần tử của mẫu là \(100\).
Ta có \(\displaystyle\frac{n}{4}=\displaystyle\frac{100}{4}=25\). Suy ra nhóm \(1\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(25\). Xét nhóm \(1\) là nhóm \([20; 30)\) có \(s=20\); \(h=10\); \(n_1=25\) và tần số tích lũy nhóm trước xem là \(0\).
Tứ phân vị thứ nhất: \(Q_1=20+\displaystyle\frac{25-0}{25}\cdot 10 = 30\) (tuổi).
Ta có \(\displaystyle\frac{3n}{4}=\displaystyle\frac{3\cdot 100}{4}=75\), mà \(65< 75< 80\). Suy ra nhóm \(4\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(75\). Xét nhóm \(4\) là nhóm \([50; 60)\) có \(s=50\); \(h=10\); \(n_4=15\) và tần số tích lũy của nhóm trước là \(cf_3=65\).
Tứ phân vị thứ ba: \(Q_3=50+\displaystyle\frac{75-65}{15}\cdot 10 \approx 56{,}7\) (tuổi).
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là
\[\Delta_Q=Q_3-Q_1=56{,}7-30=26{,}7 ~\text{(tuổi)}.\]
Câu 5:
Sử dụng dữ liệu ở biểu đồ trong bài toán mở đầu, chọn số thích hợp thay vào các vị trí được đánh dấu ? ở bảng sau
Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng mỗi ngày của bác Bình và bác An.
Ta có bảng sau
Khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác Bình là \(R= 40-15=25\) (phút).
Tuy nhiên, trong mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác An,khoảng đầu tiên chứa dữ liệu là \([20;25)\) và khoảng cuối cùng chứa dữ liệu là \([25;30)\). Do đó khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sángcủa bác An là \(30-20=10\) (phút).
Câu 6:
Bảng sau thống kê cân nặng của \(50\) quả xoài Thanh Ca được lựa chọn ngẫu nhiên sau khi thu hoạch ở một nông trường
Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.
Cỡ mẫu \(n=50\).
Gọi \(x_1\); \(x_2\); \ldots; \(x_{50}\) là mẫu số liệu gốc gồm cân nặng của \(50\) quả xoài được xếp theo thứ tự không giảm.
Ta có \(x_1\), \(x_2\), \(x_3\in[250;290)\); \(x_4\), \ldots, \(x_{16}\in[290;330)\); \(x_{17}\), \ldots, \(x_{34}\in[330;370)\); \break\(x_{35}\), \ldots, \(x_{45}\in[370;410)\); \(x_{46}\), \ldots, \(x_{50}\in[410;450)\).
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_{13}\in[290;330)\).
Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=290+\displaystyle\frac{\displaystyle\frac{50}{4}-3}{13}\cdot(330-290)=\displaystyle\frac{4150}{13}.\)
Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{38}\in[370;410)\).
Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=370+\displaystyle\frac{\displaystyle\frac{3\cdot50}{4}-(3+13+18)}{11}\cdot(410-370)=\displaystyle\frac{4210}{11}.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho. \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{4210}{11}-\displaystyle\frac{4150}{13}=\displaystyle\frac{9080}{143}\).
Câu 7:
Hằng ngày ông Thắng đều đi xe buýt từ nhà đến cơ quan. Dưới đây là bảng thống kê thời gian của \(100\) lần ông Thắng đi xe buýt từ nhà đến cơ quan.
a) Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.
b) Biết rằng trong \(100\) lần đi trên, chỉ có đúng một lần ông Thắng đi hết hơn \(29\) phút. Thời gian của lần đi đó có phải là giá trị ngoại lệ không?
a) Cỡ mẫu \(n=100\).
Gọi \(x_1\); \(x_2\); \ldots; \(x_{100}\) là mẫu số liệu gốc gồm thời gian \(100\) lần đi xe buýt của ông Thắng.
Ta có: \(x_1\), \ldots, \(x_{22}\in[15;18)\); \(x_{23}\), \ldots, \(x_{60}\in[18;21)\); \(x_{61}\), \ldots, \(x_{87}\in[21;24)\); \(x_{88}\), \ldots, \(x_{95}\in[24;27)\); \(x_{96}\), \ldots, \(x_{99}\in[27;30)\); \(x_{100}\in[30;33)\).
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{x_{25}+x_{26}}{2}\in[18;21)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=18+\displaystyle\frac{\displaystyle\frac{100}{4}-22}{38}\cdot(21-18)=\displaystyle\frac{693}{38}.\)
Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{x_{75}+x_{76}}{2}\in[21;24)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=21+\displaystyle\frac{\displaystyle\frac{3\cdot100}{4}-(22+38)}{27}\cdot(24-21)=\displaystyle\frac{68}{3}.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho. \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{505}{114}\).
b) Trong lần duy nhất ông Thắng đi hết hơn \(29\) phút, thời gian đi của ông thuộc nhóm \([30;33)\).
Vì \(Q_3+1{,}5\Delta_Q=\displaystyle\frac{6683}{228}< 30\) nên thời gian của lần ông Thắng đi hết hơn \(29\) phút là giá trị ngoại lệ của mẫu số liệu ghép nhóm.
Câu 8:
Bảng sau thống kê tổng lượng mưa (đơn vị: mm) đo được vào tháng 7 từ năm 2002 đến 2021 tại một trạm quan trắc đặt ở Cà Mau.
a) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu trên.
b) Hãy chia mẫu số liệu trên thành 4 nhóm với nhóm đầu tiên là \([140;240)\) và lập bảng tần số ghép nhóm.
c) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu ghép nhóm và so sánh với kết quả tương ứng thu được ở câu a.
a) Xếp lại mẫu số liệu theo thứ tự không giảm, ta được
Khoảng biến thiên của mẫu số liệu trên là \(R=522{,}9-147=375{,}9\).
Cỡ mẫu \(n=20\).
Gọi \(x_1\); \(x_2\); \ldots; \(x_{20}\) là mẫu số liệu lượng mưa của trạm.
Tứ phân vị thứ nhất của mẫu số liệu là \(Q_1=\displaystyle\frac{x_5+x_6}{2}=\displaystyle\frac{251{,}4+258{,}4}{2}=254{,}9\).
Tứ phân vị thứ ba của mẫu số liệu lớp 12C là \(Q_3=\displaystyle\frac{x_{15}+x_{16}}{2}=\displaystyle\frac{413{,}5+421}{2}=417{,}25\).
Vậy khoảng tứ phân vị của mẫu số liệu là \(\Delta_Q=Q_3-Q_1=162{,}35\).
b) Chia mẫu số liệu trên thành 4 nhóm với nhóm đầu tiên là \([140;240)\) ta được bảng như sau
c) Khoảng biến thiên của mẫu số liệu ghép nhóm là \(R=540-140=400\), lớn hơn khoảng biến thiên của mẫu số liệu thông thường.
Gọi \(x_1\); \(x_2\); \ldots; \(x_{20}\) là mẫu số liệu lượng mưa của trạm. Ta có: \(x_1\), \(x_2\), \(x_3\in[140;240)\); \(x_4\), \ldots, \(x_{10}\in[240;340)\); \(x_{11}\), \ldots, \(x_{17}\in[340;440)\); \(x_{18}\), \(x_{19}\), \(x_{20}\in[440;540)\).
Tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là \(\displaystyle\frac{x_6+x_7}{2}\in[240;340)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=240+\displaystyle\frac{\displaystyle\frac{20}{4}-3}{7}\cdot(340-240)=\displaystyle\frac{1700}{7}.\)
Tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \(\displaystyle\frac{x_{15}+x_{16}}{2}\in[340;440)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=340+\displaystyle\frac{\displaystyle\frac{3\cdot20}{4}-(3+7)}{7}\cdot(440-340)=\displaystyle\frac{2430}{7}.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho. \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{730}{7}\approx104{,}29\), thấp hơn khoảng tứ phân vị của mẫu số liệu thông thường.
Câu 9:
Biểu đồ dưới đây biểu diễn số lượt khách hàng đặt bàn qua hình thức trực tuyến mỗi ngày trong quý III năm 2022 của một nhà hàng. Cột thứ nhất biểu diễn số ngày có từ \(1\) đến dưới \(6\) lượt đặt bàn; cột thứ hai biểu diễn số ngày có từ \(6\) đến dưới \(11\) lượt đặt bàn;\ldots.
Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm cho bởi biểu đồ trên.
Dựa vào biểu đồ, ta lập được bảng ghép nhóm như bên dưới.
Ta có cỡ mẫu \(n=92\).
Gọi \(x_1\); \(x_2\); \ldots; \(x_{92}\) là mẫu số liệu đã cho.
Ta có: \(x_1\), \ldots, \(x_{14}\in[1;6)\); \(x_{15}\), \ldots, \(x_{44}\in[6;11)\); \(x_{45}\), \ldots, \(x_{69}\in[11;16)\); \(x_{70}\), \ldots, \(x_{87}\in[16;21)\); \(x_{88}\), \ldots, \(x_{92}\in[21;26)\).
Tứ phân vị thứ nhất của mẫu số liệu là \(\displaystyle\frac{x_{23}+x_{24}}{2}\in[6;11)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu là
\(Q_1=6+\displaystyle\frac{\displaystyle\frac{92}{4}-14}{30}\cdot(11-6)=7{,}5.\)
Tứ phân vị thứ ba của mẫu số liệu là \(\displaystyle\frac{x_{69}+x_{70}}{2}\) với \(x_{69}\in[11;16)\) và \(x_{70}\in[16;21)\). Do đó, tứ phân vị thứ ba của mẫu số liệu là \(Q_3=16\).
Vậy khoảng tứ phân vị của mẫu số liệu là \(\Delta_Q=Q_3-Q_1=8{,}5\).
Câu 10:
Kết quả đo chiều cao của \(100\) cây keo 3 năm tuổi tại một nông trường được cho ở bảng sau
a) Hãy tìm khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.
b) Trong \(100\) cây keo trên có \(1\) cây cao \(8{,}4\) m. Hỏi chiều cao của cây keo này có phải là giá trị ngoại lệ không?
a) Khoảng biến thiên của mẫu số liệu là \(R=9{,}4-8{,}4=1\).
Ta có cỡ mẫu \(n=100\).
Gọi \(x_1\); \(x_2\); \ldots; \(x_{100}\) là mẫu số liệu gồm chiều cao của \(100\) cây keo.
Ta có: \(x_1\), \ldots, \(x_5\in[8{,}4;8{,}6)\); \(x_6\), \ldots, \(x_{17}\in[8{,}6;8{,}8)\); \(x_{18}\), \ldots, \(x_{42}\in[8{,}8;9{,}0)\); \(x_{43}\), \ldots, \(x_{86}\in[9{,}0;9{,}2)\); \(x_{87}\), \ldots, \(x_{100}\in[9{,}2;9{,}4)\).
Tứ phân vị thứ nhất của mẫu số liệu là \(\displaystyle\frac{x_{25}+x_{26}}{2}\in[8{,}8;9{,}0)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=8{,}8+\displaystyle\frac{\displaystyle\frac{100}{4}-(5+12)}{25}\cdot(9{,}0-8{,}8)=8{,}864.\)
Tứ phân vị thứ ba của mẫu số liệu là \(\displaystyle\frac{x_{75}+x_{76}}{2}\in[9{,}0;9{,}2)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=9{,}0+\displaystyle\frac{\displaystyle\frac{3\cdot100}{4}-(5+12+25)}{44}\cdot(9{,}2-9{,}0)=9{,}15.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho. \(\Delta_Q=Q_3-Q_1=0{,}286\).
b) Vì \(Q_1-1{,}5\Delta_Q=8{,}435\) và \(Q_3+1{,}5\Delta_Q=9{,}579\) nên cây keo có chiều cao \(8{,}4\) m là giá trị ngoại lệ của mẫu số liệu ghép nhóm.
Câu 11:
Bảng tần số ghép nhóm dưới đây thể hiện kết quả điều tra về tuổi thọ trung bình của nam giới và nữ giới ở \(50\) quốc gia.
a) Hãy tính các khoảng tứ phân vị của tuổi thọ trung bình của nam giới và nữ giới trong mẫu số liệu ghép nhóm trên.
b) Hãy cho biết tuổi thọ trung bình của nam giới hay nữ giới trong mẫu số liệu ghép nhóm trên đồng đều hơn
a) Xét ở nam giới, ta có cỡ mẫu \(n=50\).
Gọi \(x_1\); \(x_2\); \(\ldots\); \(x_{50}\) là mẫu số liệu gồm tuổi thọ của \(50\) nam giới.
Ta có: \(x_1\), \(\ldots\), \(x_4\in[50;55)\); \(x_5\), \(\ldots\), \(x_{11}\in[55;60)\); \(x_{12}\), \(\ldots\), \(x_{15}\in[60;65)\); \(x_{16}\), \(\ldots\), \(x_{21}\in[65;70)\); \(x_{22}\), \(\ldots\), \(x_{36}\in[70;75)\); \(x_{37}\), \(\ldots\), \(x_{48}\in[75;80)\); \(x_{49}\), \(x_{50}\in[80;85)\).
Tứ phân vị thứ nhất của mẫu số liệu là \(x_{13}\in[60;65)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu nam giới là
\(Q_1=60+\displaystyle\frac{\displaystyle\frac{50}{4}-(4+7)}{4}\cdot(65-60)=\displaystyle\frac{495}{8}.\)
Tứ phân vị thứ ba của mẫu số liệu là \(x_{38}\in[75;80)\). Do đó, tứ phân vị thứ ba của mẫu số liệu nam giới là
\(Q_3=75+\displaystyle\frac{\displaystyle\frac{3\cdot50}{4}-(4+7+4+6+15)}{12}\cdot(80-75)=\displaystyle\frac{605}{8}.\)
Vậy khoảng tứ phân vị của mẫu số liệu nam giới là \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{55}{4}=13{,}75\).
Xét ở nữ giới, ta có cỡ mẫu \(n=50\).
Gọi \(x_1\); \(x_2\); \(\ldots\); \(x_{50}\) là mẫu số liệu gồm tuổi thọ của \(50\) nữ giới.
Ta có: \(x_1\), \(x_2\), \(x_3\in[50;55)\); \(x_4\), \(\ldots\), \(x_7\in[55;60)\); \(x_8\), \(\ldots\), \(x_{12}\in[60;65)\); \(x_{13}\), \(x_{14}\), \(x_{15}\in[65;70)\); \(x_{16}\), \(\ldots\), \(x_{22}\in[70;75)\); \(x_{23}\), \(\ldots\), \(x_{36}\in[75;80)\); \(x_{37}\), \(\ldots\), \(x_{49}\in[80;85)\); \(x_{50}\in[85;90)\).
Tứ phân vị thứ nhất của mẫu số liệu là \(x_{13}\in[65;70)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu nữ giới là
\(Q_1=65+\displaystyle\frac{\displaystyle\frac{50}{4}-(3+4+5)}{3}\cdot(70-65)=\displaystyle\frac{395}{6}.\)
Tứ phân vị thứ ba của mẫu số liệu là \(x_{38}\in[80;85)\). Do đó, tứ phân vị thứ ba của mẫu số liệu nữ giới là
\(Q_3=80+\displaystyle\frac{\displaystyle\frac{3\cdot50}{4}-(3+4+5+3+7+14)}{13}\cdot(85-80)=\displaystyle\frac{2095}{26}.\)
Vậy khoảng tứ phân vị của mẫu số liệu nữ giới là \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{575}{39}\approx14{,}74\).
b) Do khoảng tứ phân vị của mẫu số liệu của nam giới nhỏ hơn mẫu số liệu của nữ giới nên tuổi thọ của nam giới đều hơn tuổi thọ của nữ giới.
Câu 12:
Mỗi ngày bác Hương đều đi bộ để rèn luyện sức khỏe. Quãng đường đi bộ mỗi ngày (đơn vị km) của bác Hương trong \(20\) ngày được thống kê lại ở bảng sau
Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho.
Cỡ mẫu \(n=20\).
Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{20}\) là mẫu số liệu gốc gồm quãng đường của \(20\) ngày đi bộ của bác Hương được sắp xếp theo thứ tự không giảm.
Ta có \(x_1\), \(x_2\), \(x_3\in [2{,}7;3{,}0)\); \(x_4\); \(x_5\); \(\ldots\); \(x_9\in [3{,}0;3{,}3)\); \(x_{10}\); \(\ldots\); \(x_{14}\in [3{,}3;3{,}6)\); \break\(x_{15}\); \(\ldots\); \(x_{18}\in [3{,}6;3{,}9)\); \(x_{19}\); \(x_{20}\in [3{,}9;4{,}2)\).
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_5+x_6)\in [3{,}0;3{,}3)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=3{,}0+\displaystyle\frac{\displaystyle\frac{20}{4}-3}{6}(3{,}3-3{,}0)=3{,}1.\)
Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{15}+x_{16})\in [3{,}6;3{,}9)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=3{,}6+\displaystyle\frac{\displaystyle\frac{3\cdot 20}{4}-(3+6+5)}{4}(3{,}9-3{,}6)=3{,}675.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho.
\(\Delta_Q=3{,}675-3{,}1=0{,}575.\)
Câu 13:
Bạn Chi rất thích nhảy hiện đại. Thời gian tập nhảy mỗi ngày trong thời gian gần đây của bạn Chi được thống kê lại ở bảng sau
Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho.
Cỡ mẫu \(n=18\).
Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{18}\) là mẫu số liệu gốc gồm thời gian của \(18\) ngày tập nhảy của bạn Chi được sắp xếp theo thứ tự không giảm.
Ta có \(x_1\), \(\ldots\), \(x_6\in [20;25)\); \(x_7\); \(x_8\); \(\ldots\); \(x_{12}\in [25;30)\); \(x_{13}\); \(\ldots\); \(x_{16}\in [30;35)\); \(x_{17}\in [35;40)\); \(x_{18}\in [40;45)\).
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_5\in [20;25)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=20+\displaystyle\frac{\displaystyle\frac{18}{4}-0}{6}(25-20)=23{,}75.\)
Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{14}\in [30;35)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=30+\displaystyle\frac{\displaystyle\frac{3\cdot 18}{4}-(6+6)}{4}(35-30)=31{,}875.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho.
\(\Delta_Q=31{,}875-23{,}75=8{,}125.\)
Câu 14:
Dũng là học sinh rất giỏi chơi rubik, bạn có thể giải nhiều loại khối rubik khác nhau. Trong một lần tập luyện giải khối rubik \(3\times 3\), bạn Dũng đã tự thống kê lại thời gian giải rubik trong \(25\) lần giải liên tiếp ở bảng sau:
Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho.
Cỡ mẫu \(n=25\).
Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{25}\) là mẫu số liệu gốc gồm thời gian của \(25\) lần mà bạn Dũng giải rubik được sắp xếp theo thứ tự không giảm.
Ta có \(x_1\), \(\ldots\), \(x_4\in [8;10)\); \(x_5\); \(\ldots\); \(x_{10}\in [10;12)\); \(x_{11}\); \(\ldots\); \(x_{18}\in [12;14)\); \(x_{19}\); \(\ldots\); \(x_{22}\in [14;16)\); \break\(x_{23}\); \(\ldots\); \(x_{25}\in [16;18)\).
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_6+x_7)\in [10;12)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
\(Q_1=10+\displaystyle\frac{\displaystyle\frac{25}{4}-4}{6}(12-10)=10{,}75.\)
Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{19}+x_{20})\in [14;16)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là
\(Q_3=14+\displaystyle\frac{\displaystyle\frac{3\cdot 25}{4}-(4+6+8)}{4}(16-14)=14{,}375.\)
Tính kậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho.
\(\Delta_Q=14{,}375-10{,}75=3{,}625.\)
Câu 15:
Điểm kiểm tra cuối khoá môn Tiếng Anh của hai lớp ở một trung tâm ngoại ngữ được thống kê trong các bảng lần lượt như sau.
a) Tìm khoảng biến thiên của mỗi mẫu số liệu. Có thể dùng khoảng biến thiên để biết điểm của lớp nào đồng đều hơn không?
b) Tìm các tứ phân vị và khoảng tứ phân vị của mỗi mẫu số liệu.
c) Mẫu số liệu nào có độ phân tán lớn hơn? Minh hoạ câu trả lời bằng cách biểu diễn các tứ phân vị và khoảng tứ phân vị của mỗi mẫu số liệu trên trục số.
a) Hai mẫu số liệu đều có khoảng biến thiên là \(R=100-50=50\) nên không thể căn cứ vào đó để nói điểm của lớp nào đồng đều hơn.
b) Kích thước của hai mẫu số liệu đều là \(N=100\). Ta có \(\displaystyle\frac{N}{4}=25\); \(\displaystyle\frac{N}{2}=50\); \(\displaystyle\frac{3 N}{4}=75\).
a) Đối với mẫu số liệu về điểm của lớp \(A\), ta tìm các tứ phân vị \(Q_1^{A}\), \(Q_2^{A}\), \(Q_3^{A}\) và khoảng tứ phân vị \(\Delta_Q^{A}\) qua bảng tần số tích luỹ dưới đây:
Nhóm chứa \(Q_1^{A}\) là \([60;70)\).
\(Q_1^{A}=60+\displaystyle\frac{25-8}{20} \cdot 10=68{,}5.\)
Nhóm chứa \(Q_2^{A}\) là \([70;80)\).
\(Q_2^{A}=70+\displaystyle\frac{50-28}{50} \cdot 10=74{,}4.\)
Nhóm chứa \(Q_3^{A}\) là \([70;80)\).
\(Q_3^{A}=70+\displaystyle\frac{75-28}{50} \cdot 10=79{,}4.\)
Vậy \(\Delta_Q^{A}=79{,}4-68{,}5=10{,}9\).
a) Gọi \(Q_1^{B}\), \(Q_2^{B}\), \(Q_3^{B}\) là các tứ phân vị và \(\Delta_Q^{B}\) là khoảng tứ phân vị của mẫu số liệu về điểm của lớp \(B\). Ta lập bảng tần số tích luỹ và tính được:
Nhóm chứa \(Q_1^{B}\) là \([60; 70)\).
\(Q_1^{B}=60+\displaystyle\frac{25-15}{20} \cdot 10=65.\)
Nhóm chứa \(Q_2^{B}\) là \([70; 80)\).
\(Q_2^{B}=70+\displaystyle\frac{50-35}{30} \cdot 10=75.\)
Nhóm chứa \(Q_3^{B}\) là \([80; 90)\).
\(Q_3^{B}=80+\displaystyle\frac{75-65}{20} \cdot 10=85.\)
Vậy \(\Delta_Q^{B}=85-65=20\).
c) \(\Delta_Q^{B}>\Delta_Q^{A}\) nên điểm của lớp \(B\) phân tán hơn điểm của lớp \(A\). Minh hoạ trên trục số: Mỗi mẫu đều có \(100\) số liệu thuộc khoảng [\(50;100)\). Có \(50\%\) số liệu ở giữa của bảng điểm lớp \(B\) thuộc khoảng \(\left(Q_1^{B}, Q_3^{B}\right)\). Bảng điểm lớp \(A\) cũng có \(50\%\) số liệu ở giữa thuộc khoảng \(\left(Q_1^{A}, Q_3^{A}\right)\). Vì \(\left(Q_1^{A}, Q_3^{A}\right) \subset\left(Q_1^{B}, Q_3^{B}\right)\) nên ta có thể nói là điểm của lớp \(B\) phân tán hơn so với điểm lớp \(A\).
Câu 16:
Hình bên dưới là biểu đồ biểu diễn lượng mưa trung bình của các tháng trong năm ở thành phố \(A\).
a) Lập bảng số liệu ghép nhóm về lượng mưa của thành phố \(A\), với độ dài các nhóm là \(50\) và đầu mút phải của nhóm cuối cùng là \(350\).
b) Xác định khoảng tứ phân vị của mẫu số liệu (làm tròn kết quả đến hàng đơn vị). Nêu ý nghĩa của kết quả tìm được.
a) Bảng số liệu về lượng mưa của thành phố \(A\):
b) Ta có
\(N=12\) nên \(\displaystyle\frac{N}{4}=3 ; \displaystyle\frac{3 N}{4}=9\).
Nhóm chứa \(Q_1\) là \([50 ; 100)\).
\(Q_1=50+\displaystyle\frac{3-2}{3} \cdot 50 \approx 67.\)
Nhóm chứa \(Q_3\) là \([250 ; 300)\).
\(Q_3=250+\displaystyle\frac{9-8}{2} \cdot 50=275.\)
Vậy \(\Delta_Q=275-67=208\).
Kết quả tìm được cho thấy: Hằng năm, ở thành phố \(A\) có \(3\) tháng có lượng mưa trung bình không vượt quá \(67\) mm và \(3\) tháng có lượng mưa trung bình ít nhất là \(275\) mm. Trong \(6\) tháng còn lại, lượng mưa trung bình đạt từ \(67\) mm đến \(275\) mm và như vậy là lượng mưa của \(6\) tháng này có thể chênh lệch nhau đến \(208\) mm.
Câu 17:
Dưới đây là kết quả điều tra thời gian hoàn thành bài tập ở nhà môn Toán của 30 học sinh lớp 9:
a) Tìm trung bình, các tứ phân vị và khoảng tứ phân vị của mẫu số liệu đã cho.
b) Lập mẫu số liệu ghép nhóm với các nhóm ghép có độ dài bằng 10 và nhóm đầu tiên là \([40 ; 50)\).
c) Tìm trung bình, khoảng biến thiên, các tứ phân vị và khoảng tứ phân vị của mẫu số liệu ghép nhóm lập ở câu b.
d) So sánh các kết quả tìm được ở câu a và c. Giải thích vì sao có sự khác biệt.
a) Ta có \(n=30\), khi đó:
Giá trị trung bình: \(\overline{x}=66\).
Vì \(n\) chẵn nên tứ phân vị thứ 2 là: \(Q_2=M_e=\displaystyle\frac{x_{15}+x_{16}}{2}=\displaystyle\frac{67+68}{2}=67{,}5\).
Tứ phân vị thứ nhất: \(Q_1=x_8=58\).
Tứ phân vị thứ ba: \(Q_3=x_{23}=77\).
Khoảng tứ phân vị: \(\Delta_Q=Q_3-Q_1=77-58=19\).
b) Ta có bảng mẫu số liệu ghép nhóm như sau:
c) Ta có
Giá trị trung bình \(\overline{x}=\displaystyle\frac{45 \cdot 4+55 \cdot 6+65 \cdot 8+75 \cdot 8+85 \cdot 4}{30}\approx 65{,}67\).
Khoảng biến thiên \(R=90-40=50\).
\(N=30; \displaystyle\frac{N}{4}=7{,}5; \displaystyle\frac{N}{2}=15; \displaystyle\frac{3N}{4}=22{,}5\).
Dựa vào bảng ở câu b, nhóm chứa \(Q_1\) là \([50 ; 60)\).
\(Q_1=50+\displaystyle\frac{7{,}5 -4}{6} \cdot 10\approx 55{,}83.\)
Nhóm chứa \(Q_2\) là \([60 ; 70)\).
\(Q_2=60+\displaystyle\frac{15-10}{8} \cdot 10=66{,}875.\)
Nhóm chứa \(Q_3\) là \([70 ; 80)\).
\(Q_3=70+\displaystyle\frac{22{,}5 -18}{8} \cdot 10=75{,}625.\)
Vậy khoảng tứ phân vị là \(\Delta_Q \approx 75{,}625-55{,}83 \approx 19{,}795\).
d) Kết quả ở hai câu khác nhau nhiều vì ở câu c, ta chỉ xét số liệu được một cách tương đối vì xét qua các lớp và giá trị đại diện của nó. Tuy nhiên với số liệu của bảng lớn và phân tán thì việc sử dụng bảng số liệu ghép lớp ưu việt hơn.
Câu 18:
Thời gian trung bình hằng ngày mà một số nhân viên đi từ nhà đến công ty được thống kê trong bảng bên dưới. Tìm khoảng biến thiên và khoảng tứ phân vị của thời gian di chuyển đến công ty của các nhân viên (làm tròn kết quả đến hàng phần mười).
Ta có bảng tần số tích luỹ như sau:
Khoảng biến thiên \(R=70-10=60\).
Ta có \(N=40; \displaystyle\frac{N}{4}=10; \displaystyle\frac{N}{2}=20; \displaystyle\frac{3N}{4}=30\).
Dựa vào bảng ở câu b, nhóm chứa \(Q_1\) là \([20 ; 30)\).
\(Q_1=20+\displaystyle\frac{10 -8}{8} \cdot 10= 22{,}5.\)
Nhóm chứa \(Q_2\) là \([30 ; 40)\).
\(Q_2=30+\displaystyle\frac{20-16}{10} \cdot 10=34.\)
Nhóm chứa \(Q_3\) là \([40 ; 50)\).
\(Q_3=40+\displaystyle\frac{30 -26}{6} \cdot 10\approx 46{,}67.\)
Vậy khoảng tứ phân vị là \(\Delta_Q \approx 46{,}67-22{,}5 \approx 24{,}17\).
Câu 19:
Trình bày dữ liệu về tốc độ của \(100\) xe ô tô lưu thông trên một đoạn đường cao tốc vào giờ cao điểm, được trích xuất từ camera của cơ quan cảnh sát giao thông. Hãy tìm khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu (làm tròn kết quả đến hàng đơn vị). Nêu ý nghĩa của các kết quả tìm được.
Ta có bảng tần số tích luỹ như sau:
Khoảng biến thiên \(R=110-50=50\).
Ta có \(N=100; \displaystyle\frac{N}{4}=25; \displaystyle\frac{N}{2}=50; \displaystyle\frac{3N}{4}=75\).
Dựa vào bảng, nhóm chứa \(Q_1\) là \([70 ; 80)\).
\(Q_1=70+\displaystyle\frac{25 -10}{20} \cdot 10\approx 78.\)
Nhóm chứa \(Q_2\) là \([80 ; 90)\).
\(Q_2=80+\displaystyle\frac{50-30}{20} \cdot 10=90.\)
Nhóm chứa \(Q_3\) là \([90 ; 100).\)
\(Q_3=90+\displaystyle\frac{75 -50}{35} \cdot 10\approx 97.\)
Vậy khoảng tứ phân vị là \(\Delta_Q \approx 97-78 \approx 19\).
Ý nghĩa: \(50\%\) lượng xe lưu thông đi trên đường cao tốc giờ cao điểm chạy tốc độ từ \(78\) km/h đến \(97\) km/h.
Câu 20:
Một ngân hàng thống kê ở bảng dưới số tiền (đơn vị: nghìn đồng) mà khách hàng rút từ một máy ATM trong một buổi sáng.
Tìm khoảng tứ phân vị của số tiền rút (làm tròn kết quả đến hàng đơn vị). Nêu ý nghĩa của các kết quả tìm được.
Ta có bảng tần số tích luỹ như sau:
Ta có \(N=80; \displaystyle\frac{N}{4}=20; \displaystyle\frac{N}{2}=40. \displaystyle\frac{3N}{4}=60;\)
Dựa vào bảng, nhóm chứa \(Q_1\) là \([500 ; 1 \,000)\).
\(Q_1=500+\displaystyle\frac{20 -11}{16} \cdot 500\approx 781.\)
Nhóm chứa \(Q_2\) là \([1 \,500 ; 2 \,000)\).
\(Q_2=1\,500+\displaystyle\frac{40-39}{15} \cdot 500\approx 1 \,533.\)
Nhóm chứa \(Q_3\) là \([2 \,000 ; 2 \,500)\).
\(Q_3=2\, 000+\displaystyle\frac{60 -54}{10} \cdot 500=2 \,300.\)
Vậy khoảng tứ phân vị là \(\Delta_Q \approx 2 \,300-781 \approx 1\, 519\).
Ý nghĩa: Có khoảng \(\displaystyle\frac{1}{4}\) lượng khách rút số tiền không quá \(781\) nghìn đồng, khoảng \(\displaystyle\frac{1}{4}\) lượng khách rút số tiền ít nhất là \(2\) triệu \(300\) nghìn đồng, \(50\%\) số khách hàng rút tiền dao động từ \(781\) đến \(2\) triệu \(300\) nghìn đồng. Như vậy, \(50\%\) lượng khách này rút tiền có thể chênh lệch nhau đến 1 triệu 519 nghìn đồng.
Câu 21:
Trong \(30\) ngày, một nhà đầu tư đã theo dõi giá cổ phiếu của hai công ty G và H vào phiên mở cửa mỗi ngày. Thông tin được ghi lại ở hai bảng dưới đây:
Giá cổ phiếu của công ty nào ít biến động hơn (làm tròn kết quả đến hàng phần trăm)?
Công ty G:
Bổ sung thêm các giá trị đại diện, ta có bảng sau
Giá trị trung bình của mẫu số liệu là
\(\overline{x}=\displaystyle\frac{51\cdot 3 + 53\cdot 7 + 55 \cdot 9 + 57 \cdot 8 + 59 \cdot 3}{30}\approx 55{,}1.\)
Trung bình cộng của các bình phương số liệu thống kê là
\(\overline{x^2}=\displaystyle\frac{51^2\cdot 3 + 53^2\cdot 7 + 55^2 \cdot 9 + 57^2 \cdot 8 + 59^2 \cdot 3}{30}\approx 3037{,}5.\)
Từ đó ta có độ lệch chuẩn của mấu số liệu là
\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}= 5{,}2.\)
Công ty H
Bổ sung thêm các giá trị đại diện, ta có bảng sau
Giá trị trung bình của mẫu số liệu là
\(\overline{x}=\displaystyle\frac{41\cdot6+43\cdot7+45\cdot5+47\cdot7+49\cdot 5}{30}\approx 44{,}9.\)
Trung bình cộng của các bình phương số liệu thống kê là
\(\overline{x^2}=\displaystyle\frac{41^2\cdot 6 + 43^2\cdot 7 + 45^2 \cdot 5 + 47^2 \cdot 7 + 49^2 \cdot 5}{30}\approx 2020{,}7.\)
Từ đó ta có độ lệch chuẩn của mấu số liệu là
\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}= 7{,}7.\)
Từ kết quả trên, ta thấy công ty G có giá cổ phiếu ít biến động hơn.
Câu 22:
Một công ty giống cây trồng đã thử nghiệm hai phương pháp chăm sóc khác nhau cho cây hướng dương. Sau hai tuần, người ta thấy cây được chăm sóc theo cả hai phương pháp đều thấp hơn \(50\) cm.
a) Ước tính số trung bình và độ lệch chuẩn của chiều cao các cây được chăm sóc theo mỗi phương pháp.
b) So sánh hiệu quả của các phương pháp trên hai phương diện
+) Chiều cao trung bình của cây.
+) Sự đồng đều về chiều cao của cây.
a) Ước tính số trung bình và độ lệch chuẩn của chiều cao các cây được chăm sóc theo mỗi phương pháp.
Cỡ mẫu của hai mẫu số liệu thống kê là \(N= 40\).
Ta có bảng tần số ghép nhóm về chiều cao của cây được chăm sóc theo phương pháp A như sau:
Chiều cao trung bình của các cây được chăm sóc theo phương án \(A\) là
\(\overline{x}_A= \displaystyle\frac{5 \cdot 6 + 15 \cdot 8 + 25 \cdot 12 + 35 \cdot 8 + 45 \cdot 6}{40}=25.\)
Độ lệch chuẩn của chiều cao các cây được chăm sóc theo phương án \(A\) là
\(s_A =\sqrt{\displaystyle\frac{5^2 \cdot 6 + 15^2 \cdot 8 + 25^2 \cdot 12 + 35^2 \cdot 8 + 45 ^2 \cdot 6}{40} - 25^2}\approx 12{,} 65.\)
Ta có bảng tần số ghép nhóm về chiều cao của cây được chăm sóc theo phương pháp A như sau:
Chiều cao trung bình của các cây được chăm sóc theo phương án \(B\) là
\(\overline{x}_B= \displaystyle\frac{5 \cdot 13 + 15 \cdot 6 + 25 \cdot 2 + 35 \cdot 6 + 45 \cdot 13}{40}=25 \text{ cm}.\)
Độ lệch chuẩn của chiều cao các cây được chăm sóc theo phương án \(B\) là
\(s_B =\sqrt{\displaystyle\frac{5^2 \cdot 13 + 15^2 \cdot 6 + 25^2 \cdot 2 + 35^2 \cdot 6+ 45 ^2 \cdot 13}{40} - 25^2}\approx 17{,} 03 \text{ cm}.\)
b) So sánh hiệu quả của các phương pháp
Dựa trên chiều cao trung bình, ta thấy dù có dùng phương pháp nào thì các loại cây đều có chiều cao trung bình giống nhau là \(25\) cm.
Dựa trên sự đồng đều về chiều cao: do \(s_A< s_B\) nên chiều cao của các loại cây được chăm sóc theo phương án \(A\) ít bị chênh lệch hơn so với phương án \(B\).
Câu 23:
Hai bảng dưới đây trình bày kết quả thống kê lượng cà phê (tính theo cm\(^3\)) được pha chế trong mỗi cốc do hai máy bán cà phê tự động \(A\), \(B\) thực hiện trong một ngày.
a) Ước tính giá trị trung bình và độ lệch chuẩn của lượng cà phê trong những cốc được pha chế bởi mỗi máy.
b) Giả sử lượng cà phê mong muốn trong mỗi cốc là \(250\) cm\(^3\). Nếu định kinh doanh cà phê bằng hình thức bán hàng tự động thì anh Hùng nên chọn mua loại máy nào
a) Ước tính giá trị trung bình và độ lệch chuẩn của lượng cà phê trong những cốc được pha chế bởi mỗi máy.
Kích thước của hai mẫu số liệu đều là \(N=50\).
Giá trị trung bình của hàm lượng cà phê trong mỗi cốc do nhà máy \(A\) sản xuất là
\(\overline{x}_A= \displaystyle\frac{ 244 \cdot 6 + 248 \cdot 5 + 252 \cdot 28 + 256 \cdot 7 + 260 \cdot 4}{ 50}= 251{,} 84.\)
Độ lệch chuẩn của hàm lượng cà phê trong mỗi cốc do nhà máy \(A\) sản xuất là
\(\overline{s}_A=\sqrt{ \displaystyle\frac{ 244^2 \cdot 6 + 248^2 \cdot 5 + 252^2 \cdot 28 + 256^2 \cdot 7 + 260^2 \cdot 4}{ 50} - 251{,}84^2}\approx 4{,} 08.\)
Giá trị trung bình của hàm lượng cà phê trong mỗi cốc do nhà máy \(B\) sản xuất là
\(\overline{x}_A= \displaystyle\frac{ 244 \cdot 5 + 248 \cdot 8 + 252 \cdot 17 + 256 \cdot 14 + 260 \cdot 6}{ 50}= 252{,} 64.\)
Độ lệch chuẩn của hàm lượng cà phê trong mỗi cốc do nhà máy \(B\) sản xuất là
\(\overline{s}_A=\sqrt{ \displaystyle\frac{ 244^2 \cdot 5 + 248^2 \cdot 8 + 252^2 \cdot 17 + 256^2 \cdot 14 + 260^2 \cdot 6}{ 50} - 252{,}64^2}\approx 4{,} 55.\)
b) Ta có \(\left|\overline{x}_A- 250 \right| =1{,} 84\) và \(\left|\overline{x}_B- 250 \right| =2{,} 64\).
Suy ra hàm lượng cà phê trung bình trong mỗi cốc do nhà máy \(A\) sản xuất gần với lượng cà phê mong muốn (là \(250\) cm\(^3\)) hơn.
Đồng thời, do \(s_A < s_B\) nên hàm lượng cà phê trong mỗi cốc do nhà máy \(A\) sản xuất ít phân tán hơn so với nhà máy B.
Vậy nếu định kinh doanh cà phê bằng hình thức bán hàng tự động thì anh Hùng nên chọn mua loại máy \(A\).
Câu 24:
Hai bảng dưới đây biểu diễn kết quả đo đường kính (tính theo mm) của một số ổ bi được sản xuất bởi các máy \(X\) và \(Y\).
a) Ước tính giá trị trung bình và độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi mỗi máy.
b) Biết rằng đường kính mong muốn cho các ổ bi là \(30{,}4\) mm. Hãy phân tích chất lượng sản phẩm do mỗi máy sản xuất.
a) Ước tính giá trị trung bình và độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi mỗi máy.
Kích thước của hai mẫu số liệu đều là \(N= 60\).
Đường kính trung bình của các ổ bi được sản xuất bởi nhà máy X là
\(\overline{x}_X= \displaystyle\frac{28{,} 5 \cdot 2 + 29{,}5 \cdot 23 + 30{,} 5 \cdot 25 + 31{,} 5 \cdot 7 + 32{,} 5 \cdot 3 }{60} \approx 30{,} 27 \text{ mm}.\)
Độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi nhà máy \(X\) là
\(s_X=\sqrt{\displaystyle\frac{28{,} 5^2 \cdot 2 + 29{,}5^2 \cdot 23 + 30{,} 5^2 \cdot 25 + 31{,} 5^2 \cdot 7 + 32{,} 5^2 \cdot 3 }{60} - \left(\overline{x}_X\right)^2 }\approx 0{,} 88 \text{ mm}.\)
Đường kính trung bình của các ổ bi được sản xuất bởi nhà máy Y là
\(\overline{x}_Y= \displaystyle\frac{28{,} 5 \cdot 9 + 29{,}5 \cdot 8 + 30{,} 5 \cdot 20+ 31{,} 5 \cdot 17 + 32{,} 5 \cdot 6 }{60} \approx 30{,} 55 \text{ mm}.\)
Độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi nhà máy \(Y\) là
\(s_Y=\sqrt{ \displaystyle\frac{28{,} 5 ^2\cdot 9 + 29{,}5^2 \cdot 8 + 30{,} 5^2 \cdot 20+ 31{,} 5^2 \cdot 17 + 32{,} 5^2 \cdot 6 }{60} - \left(\overline{x}_Y\right)^2}\approx 1{,} 19 \text{ mm}.\)
b) Ta có \(\left|\overline{x}_X - 30{,}4 \right| \approx 0{,} 13\) và \(\left|\overline{x}_Y- 30{,} 4 \right| \approx 0{,} 15.\)
Suy ra đường kính trung bình của \(60\) ổ bi do nhà máy \(X\) sản xuất gần với đường kính mong muốn là \(30{,} 4\) mm hơn so với nhà máy B.
Đồng thời do \(s_{X} < s_Y\) nên đường kính của mỗi ổ bi do nhà máy \(X\) sản xuất ít phân tán hơn so với nhà máy \(Y\).
Vì vậy, chất lượng sản phẩm do nhà máy \(X\) tốt hơn so với nhà máy \(Y\).
Câu 25:
Thời gian chờ khám bệnh của các bệnh nhân tại phòng khám X được cho trong bảng sau:
a) Tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm này.
b) Từ một số liệu về thời gian chờ khám bệnh của các bệnh nhân tại phòng khám Y người ta tính được khoảng tứ phần vị bằng \(9{,}23\). Hỏi thời gian chờ của bệnh nhân tại phòng khám nào phân tán hơn?
a) Cỡ mẫu là \(n = 3+12+15+8=38\). Gọi \(x_1,\ldots,x_{38}\) là thời gian chờ khám bệnh của \(38\) bệnh nhân này và giả sử rằng dãy số liệu gốc này đã được sắp xếp theo thứ tự tăng dần.
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_{10}\) nên nhóm chứa tứ phân vị thứ nhất là nhóm \([5;10)\) và ta có:
\[Q_1 = 5+ \displaystyle\frac{\left[ \displaystyle\frac{38}{4}-3\right] }{12}\cdot 5 \approx 7{,}71.\]
Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{29}\) nên nhóm chứa tứ phân vị thứ ba là nhóm \([10;15)\) và ta có:
\[Q_3 = 10+ \displaystyle\frac{\left[ \displaystyle\frac{3\cdot 38}{4}-15\right] }{15}\cdot 5 = 14{,}5.\]
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là: \(\Delta_Q = Q_3 - Q_1 \approx 14{,}5 - 7{,}71= 6{,}79\).
b) Do \(\Delta_Q = 6{,}79 < 9{,}23\) nên thời gian chờ của bệnh nhân tại phòng khám \(Y\) phân tán hơn thời gian chờ của bệnh nhân tại phòng khám \(X\).
Câu 26:
Một người ghi lại thời gian đàm thoại của một số cuộc gọi cho kết quả như bảng sau:
Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.
Cỡ mẫu là \(8+17+25+20+10=80\).
Gọi \(x_1;x_2;\ldots;x_{80}\) là thứ tự các cuộc gọi, và giả sử dữ liệu này tăng dần.
Khi đó tứ phân vị thứ nhất của mẫu số liệu của dữ liệu gốc là \(x_{20}\), nên nhóm chứa tứ phân vị thứ nhất là \([1;2]\), và ta có
\[Q_1 = 17+ \displaystyle\frac{\left[ \displaystyle\frac{80\cdot 1}{4}-(8)\right] }{17}\cdot 1 \approx 17{,}7.\]
Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{70}\) nên nhóm chưa tứ phân vị thứ ba là nhóm \([3;4)\) và ta có:
\[Q_3 = 20+ \displaystyle\frac{\left[ \displaystyle\frac{80\cdot 3}{4}-(8+17+25)\right] }{20}\cdot 1 = 20{,}5.\]
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là: \(\Delta_Q = Q_3 - Q_1 \approx 20{,}5 - 17{,}7= 2{,}8\).
Câu 27:
Thống kê số thẻ vàng của mỗi câu lạc bộ trong giải ngoại hạng Anh mùa giải \(2021-2022\) cho kết quả sau:
a) Hãy ghép nhóm dãy số liệu trên thành các nhóm có độ dài bằng nhau với nhóm đầu tiên là \([40;50)\).
b) Tính khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu gốc và mẫu số liệu ghép nhóm thu được ở câu a. Giá trị nào là giá trị chính xác? Giá trị nào là giá trị xấp xỉ?
a) Ta có bảng dữ liệu sau khi ghép nhóm như sau:
b) Khoảng biến thiên của mẫu số liệu ghép nhóm là
\[110-40=70 \text{ (thẻ vàng).}\]
Với \(n=20\), ta có: \(\displaystyle\frac{n}{4}=5\) mà \(2< 5< 7\). Suy ra nhóm \(2\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(5\).
Xét nhóm \(2\) là \([50;60)\) có \(s=50\), \(h=10\), \(n_2 = 5\).
Nhóm \(1\) là \([40;50)\) có \(cf_1=2\) \(\Rightarrow Q_1 = 50+\displaystyle\frac{5-2}{5}\cdot 10 = 56\).
Ta có: \(\displaystyle\frac{3n}{4}=15\) mà \(14< 15< 19\) suy ra nhóm \(4\) là nhóm có tần số tích lũy lớn hơn hoặc bằng \(15\).
Xét nhóm \(4\) là \([70;80)\) có \(t=70\), \(h=10\), \(n_4 = 5\).
Nhóm 3 là \([60;70)\) có \(cf_3 = 14\) \(\Rightarrow Q_3 = 60+\displaystyle\frac{15-14}{5}\cdot 10 = 62\).
Vậy \(\triangle Q = Q_3-Q_1 = 62-56 = 6\).
Câu 28:
Thu nhập theo tháng (đơn vị: triệu đồng) của người lao động ở hai nhà máy như sau:
Tính mức thu nhập trung bình của người lao động ở hai nhà máy trên. Dựa vào khoảng tứ phân vị, hãy xác định xem mức thu nhập của người lao động ở nhà máy nào biến động nhiều hơn.
Ta có:
Thu nhập trung bình của người lao động của nhà máy A là
\[\overline{x}_A = \displaystyle\frac{6{,}5\cdot 20 + 9{,}5 \cdot 35 + 12{,}5\cdot45+ 15{,}5\cdot35 +18{,}5\cdot20}{155}= 12{,}5.\]
Thu nhập trung bình của người lao động của nhà máy B là
\[\overline{x}_A = \displaystyle\frac{6{,}5\cdot 17 + 9{,}5 \cdot 23 + 12{,}5\cdot 30+ 15{,}5\cdot23 +18{,}5\cdot17}{110}= 12{,}5.\]
Xét nhà máy A, \(Q_1 = 10{,}8125\); \(Q_3 = 15{,}39\) \(\Rightarrow \triangle Q = 4{,}58\).
Xét nhà máy B, \(Q_1 = 9{,}85\); \(Q_3 = 15{,}63\) \(\Rightarrow \triangle Q = 5{,}78\).
Vậy mức thu nhập của người lao động ở nhà máy B có biến động nhiều hơn
Câu 29:
Bảng sau đây cho biết chiều cao của các học sinh lớp 12A và 12B.
a) Tính khoảng biến thiên, khoảng tứ phần vị cho các mẫu số liệu ghép nhóm của học sinh lớp 12A, 12B.
b) Để so sánh độ phân tán về chiều cao của học sinh hai lớp này ta nên dùng khoảng biến thiên hay khoảng tứ phân vị? Vì sao?
a) Ta có
Khoảng biến thiên là \(175-145 = 30\) (cm).
Xét lớp 12A,
\[Q_1 = 155 + \displaystyle\frac{\displaystyle\frac{43}{4}-1}{15}\cdot 5 = 158{,}25.\]
\[Q_3 = 165 + \displaystyle\frac{\displaystyle\frac{43\cdot 3}{4}-28}{10}\cdot 5 = 167{,}125.\]
\[\triangle Q = Q_3 -Q_1 = 8{,}875.\]
Xét lớp 12B,
\[Q_1 = 155 + \displaystyle\frac{\displaystyle\frac{42}{4}-0}{17}\cdot 5 = 158{,}5\]
\[Q_3 = 165 + \displaystyle\frac{\displaystyle\frac{42\cdot 3}{4}-27}{9}\cdot 5 = 167{,}5\]
\[\triangle Q = Q_3 -Q_1 = 9{,}4.\]
b) Để so sánh độ phân tán về chiều cao của học sinh hai lớp này ta nên dùng khoảng tứ phân vị, vì khoảng biến thiên của \(2\) lớp này là bằng nhau.
Câu 30:
Thời gian chạy tập luyện cự li \(100 \mathrm{~m}\) của hai vận động viên được cho trong bảng sau:
Dựa trên độ lệch chuẩn của các mẫu số liệu ghép nhóm, hãy cho biết vận động viên nào có thành tích luyện tập ổn định hơn.
Thời gian chạy trung bình củ vận động viên \(A\) là \(\overline{x}_A=\displaystyle\frac{1}{20}(2\cdot10{,}15+10\cdot10,45+5\cdot10{,}75+3\cdot11{,}05)=10{,}585\)
Độ lệch chuẩn của vận động viên \(A\). \(s_A=\sqrt{\displaystyle\frac{1}{20}\left(2\cdot10{,}15^2+10\cdot10{,}45^2+5\cdot10{,}75^2+3\cdot11{,}05^2\right)-10{,}585^2}=0{,}25937.\)
Thời gian chạy trung bình củ vận động viên \(B\) là \(\overline{x}_A=\displaystyle\frac{1}{25}(3\cdot10{,}15+7\cdot10{,}45+9\cdot10{,}75+6\cdot11{,}05)=10{,}666.\)
Độ lệch chuẩn của vận động viên \(B\). \(s_A=\sqrt{\displaystyle\frac{1}{25}\left(3\cdot10{,}15^2+7\cdot10{,}45^2+9\cdot10{,}75^2+6\cdot11{,}05^2\right)-10{,}666^2}=0{,}288.\)
Vậy độ viên \(B\) có thành tích ổn định hơn.
Câu 31:
Có nên dùng phương sai (hoặc độ lệch chuẩn) để so sánh độ phân tán của hai mẫu số liệu ghép nhóm trong mỗi trường hợp sau không? Tại sao?
a) Các mẫu số liệu ghép nhóm về điểm thi tốt nghiệp môn Toán của học sinh hai trường trung học phổ thông có chất lượng tương đương.
b) Các mẫu số liệu ghép nhóm về doanh thu của \(100\) cửa hàng bán lẻ và doanh thu của \(100\) siêu thị.
a) Có nên dùng phương sai (hoặc độ lệch chuẩn) để so sánh độ phân tán của học sinh hai trường vì \(2\) trường này có chất lượng tương đương nhau
b) Không nên dùng phương sai (hoặc độ lệch chuẩn) để so sánh độ phân tán về doanh thu của \(100\) cửa hàng bán lẻ và \(100\) siêu thị vì doanh thu của \(100\) cửa hàng bán lẻ và \(100\) siêu thị là không gần tương đương nhau.