Bài 1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ

1. Khoảng biến thiên


Image


Khoảng biến thiên, kí hiệu \(R\), ta có: \(\mathbf{R=u_{k+1}-u_1.}\)

+) Khoảng biến thiên của mẫu số liệu ghép nhóm luôn lớn hơn hoặc bằng khoảng biến thiên của mẫu số liệu gốc

+) Ý nghĩa của khoảng biến thiên của mẫu số liệu ghép nhóm

\(\bullet\quad\) Khoảng biến thiên của mẫu số liệu ghép nhóm là giá trị xấp xỉ khoảng biến thiên của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của mẫu số liệu.

\(\bullet\quad\) Khoảng biến thiên \(R=u_{k+1}-u_1\) chưa phản ánh được đầy đủ mức độ phân tán của phần lớn các số liệu. Hơn nữa, giá trị của R thường tăng vọt khi xuất hiện giá trị ngoại lệ trong mẫu số liệu.

Do đó, để phản ánh mức độ phân tán của số liệu, người ta còn dùng các số đặc trưng khác.


2. Khoảng tứ phân vị


Image


Khoảng tứ phân vị, kí hiệu\(\Delta_Q\), ta có: \(\mathbf{\Delta_Q=Q_3-Q_1.}\)


3. Nhắc lại cách xác định tứ phân vị


Cách xác định tứ phân vị thứ hai \(\mathbf{Q_2}\) (Trung vị):

B1. Gọi \( n \) là cỡ mẫu.

B2. Giả sử nhóm \( \left[ u_m ; u_{m+1}\right) \) chứa trung vị;

B3. \(n_m\) là tần số của nhóm chứa trung vị;

B4. \(C=n_1+n_2+ \cdots +n_{m-1} \).

Khi đó

\[Q_2=M_e = u_m+\displaystyle\frac{\displaystyle\frac{n}{2}-C}{n_m}\cdot \left( u_{m+1}-u_m\right).\]

Cách xác định tứ phân vị thứ nhất \(\mathbf{Q_1}\):

B1. Giả sử nhóm \( \left[ u_m ; u_{m+1}\right)\) chứa tứ phân vị thứ nhất;

B2. \( n_m \) là tần số của nhóm tứ phân vị thứ nhất;

B3. \( C=n_1+n_2+\cdots +n_{m-1} \).

Khi đó

\[Q_1=u_m+\displaystyle\frac{\displaystyle\frac{n}{4}-C}{n_m}\cdot \left(u_{m+1}-u_m\right).\]

Cách xác định tứ phân vị thứ ba \(\mathbf{Q_3}\):

B1. Giả sử nhóm \(\left[u_j;u_{j+1}\right)\) chứa tứ phân vị thứ ba;

B2. \(n_j\) là tần số của nhóm chứa tứ phân vị thứ ba;

B3. \(C=n_1+n_2+\ldots+n_{j-1}\).

Khi đó

\[Q_3=u_j+\displaystyle\frac{\displaystyle\frac{3n}{4}-C}{n_j}\cdot \left(u_{j+1}-u_j\right).\]

Chú ý: Nếu tứ phân vị thứ \(k\)\(\displaystyle\frac{1}{2}\left(x_m+x_{m+1}\right)\), trong đó \(x_m\)\(x_{m+1} \) thuộc hai nhóm liên tiếp, ví dụ như \(x_m\in \left[u_{j-1};u_j\right)\)\(x_{m+1}\in\left[u_j;u_{j+1}\right)\) thì ta lấy \(Q_k=u_j \).


4. Ý nghĩa của khoảng tứ phân vị của mẫu số liệu ghép nhóm


\(\bullet\quad\) Khoảng tứ phân vị: của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của nửa giữa của mẫu số liệu (tập hợp gồm 50\% số liệu nằm chính giữa mẫu số liệu).

\(\bullet\quad\) Khoảng tứ phân vị của mẫu số liệu ghép nhóm càng nhỏ thì dữ liệu càng tập trung xung quanh trung vị.

\(\bullet\quad\) Khoảng tứ phân vị được dùng để xác định giá trị ngoại lệ trong mẫu số liệu. Giá trị \(x\) trong mẫu số liệu là giá trị ngoại lệ nếu \(x > Q_3+1{,}5\Delta_Q\) hoặc \(x < Q_1-1{,}5\Delta_Q\).

\(\bullet\quad\) Khoảng tứ phân vị của mẫu số liệu ghép nhóm không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ trong mẫu số liệu.

Câu 1:

Dũng là học sinh rất giỏi chơi rubik, bạn có thể giải nhiều loại khối rubik khác nhau. Trong một lần tập luyện giải khối rubik \(3\times 3\), bạn Dũng đã tự thống kê lại thời gian giải rubik trong \(25\) lần giải liên tiếp ở bảng sau:

Image

Tính khoảng biến thiên của mẫu số liệu.

Khoảng biến thiên của mẫu số liệu ghép nhóm là \(18-8=10\).

Câu 2:

Bạn Chi rất thích nhảy hiện đại. Thời gian tập nhảy mỗi ngày trong thời gian gần đây của bạn Chi được thống kê lại ở bảng sau

Image

Tính khoảng biến thiên của mẫu số liệu.

Khoảng biến thiên của mẫu số liệu ghép nhóm là \(45-20=25\).

Câu 3:

Bảng bên dưới biểu thị kết quả điều tra thời gian sử dụng Internet hằng ngày của một số người.

Image

Tìm khoảng biến thiên của mẫu số liệu đã cho. Kết quả cho biết điều gì?

Đầu mút phải của nhóm ghép cuối cùng là \(180\), đầu mút trái của nhóm ghép đầu tiên là \(30\). Vậy khoảng biến thiên của mẫu số liệu là \(R=180-30=150\).

Kết quả này cho biết thời gian sử dụng Internet hằng ngày của các thành viên thuộc nhóm người được điều tra chênh lệch nhau nhiều nhất là \(150\) phút.

Câu 4:

Cô Hà thống kê lại đường kính thân gỗ của một số cây xoan đào 6 năm tuổi được trồng ở một lâm trường ở bảng sau.

Image

Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm trên.

Khoảng biến thiên của mẫu số liệu ghép nhóm trên là \(R=65-40=25\) (cm).

Câu 5:

Để chuẩn bị mở một trung tâm thể dục thể thao, anh Dũng đã tiến hành điều tra tuổi thọ của máy chạy bộ do hai hãng \(X\), \(Y\) sản xuất. Bảng bên dưới biểu thị hai mẫu số liệu mà anh thu thập được qua Internet.

Image

Khoảng biến thiên của mẫu số liệu nào lớn hơn? Từ đó có thể nói là máy chạy bộ do hãng nào sản xuất có tuổi thọ phân tán hơn?

Khoảng biến thiên của tuổi thọ máy chạy bộ do hãng \(X\) và hãng \(Y\) sản xuất tương ứng là \(R_X=12-2=10\)\(R_Y=12-4=8.\)

\(R_X > R_Y\) nên có thể nói là máy do hãng \(X\) sản xuất có tuổi thọ phân tán hơn so với máy của hãng \(Y\).

}

Câu 6:

Thống kê số thẻ vàng của mỗi câu lạc bộ trong giải ngoại hạng Anh mùa giải \(2021-2022\) cho kết quả sau:

Image

a) Hãy ghép nhóm dãy số liệu trên thành các nhóm có độ dài bằng nhau với nhóm đầu tiên là \([40;50)\).

b) Tính khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu gốc và mẫu số liệu ghép nhóm thu được ở câu a. Giá trị nào là giá trị chính xác? Giá trị nào là giá trị xấp xỉ?

a) Ta có bảng dữ liệu sau khi ghép nhóm như sau:

Image

b) Khoảng biến thiên của mẫu số liệu ghép nhóm là

\[110-40=70 \text{ (thẻ vàng).}\]

Với \(n=20\), ta có: \(\displaystyle\frac{n}{4}=5\)\(2<5<7\). Suy ra nhóm \(2\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(5\).

Xét nhóm \(2\)\([50;60)\)\(s=50\), \(h=10\), \(n_2 = 5\).

Nhóm \(1\)\([40;50)\)\(cf_1=2\) \(\Rightarrow Q_1 = 50+\displaystyle\frac{5-2}{5}\cdot 10 = 56\).

Ta có: \(\displaystyle\frac{3n}{4}=15\)\(14<15<19\) suy ra nhóm \(4\) là nhóm có tần số tích lũy lớn hơn hoặc bằng \(15\).

Xét nhóm \(4\)\([70;80)\)\(t=70\), \(h=10\), \(n_4 = 5\).

Nhóm 3 là \([60;70)\)\(cf_3 = 14\) \(\Rightarrow Q_3 = 60+\displaystyle\frac{15-14}{5}\cdot 10 = 62\).

Vậy \(\triangle Q = Q_3-Q_1 = 62-56 = 6\).

Câu 7:

Thời gian hoàn thành bài kiểm tra môn Toán của các bạn trong lớp \(12\)C được cho trong bảng sau:

Image

a) Tính khoảng biến thiên \(R\) cho mẫu số liệu ghép nhóm trên.

b) Nếu biết học sinh hoàn thành bài kiểm tra sớm nhất mất \(27\) phút và muộn nhất mất \(43\) phút thì khoảng biến thiên của mẫu số liệu gốc là bao nhiêu?

a) Khoảng biến thiên \(R = 45-25 = 20\).

b) Nếu biết học sinh hoàn thành bài kiểm tra sớm nhất mất \(27\) phút và muộn nhất mất \(43\) phút thì khoảng biến thiên của mẫu số liệu gốc là \(43-27=16\).

Câu 8:

Thống kê thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ 1, Tổ 2 lớp 12A, được kết quả như sau:

Image

Tìm khoảng biến thiên cho thời gian sử dụng mạng xã hội của học sinh mỗi tổ và giải thích ý nghĩa.

Gọi \(R_1\), \(R_2\) tương ứng là khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ \(1\) và Tổ \(2\).

Ta có: \(R_1= 90-0=90\)\(R_2= 60-0=60\).

Do \(R_1>R_2\) nên ta có thể kết luận rằng thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ \(1\) phân tán hơn thời gian sử dụng mạng xã hội của các bạn Tổ \(2\).

Câu 9:

Người ta tiến hành phỏng vấn hai nhóm khán giả về một bộ phim mới công chiếu. Nhóm \(A\) gồm những khán giả thuộc lứa tuổi \(20-30\), nhóm \(B\) thuộc lứa tuổi trên \(30\). Người được hỏi ý kiến phải đánh giá bộ phim bằng cách cho điểm theo một số tiêu chí nêu trong phiếu điều tra và sau đó lấy tổng số điểm (thang điểm \(100\)). Bảng dưới đây trình bày kết quả điều tra hai nhóm khán giả:

Image

Ý kiến đánh giá của nhóm khán giả nào phân tán hơn?

Khoảng biến thiên của ý kiến đánh giá của hai nhóm khán giả \(A\)\(B\) tương ứng là \(R_A=100-50=50\)\(R_B=90-60=30.\)

\(R_A > R_B\) nên có thể nói là ý kiến đánh giá của nhóm khán giả \(A\) phân tán hơn so với ý kiến đánh giá của nhóm khán giả \(B\).

Câu 10:

Sử dụng dữ liệu ở biểu đồ trong bài toán mở đầu, chọn số thích hợp thay vào các vị trí được đánh dấu ? ở bảng sau

Image

Hãy tìm khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng mỗi ngày của bác Bình và bác An.

Image

Khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác Bình là \(R= 40-15=25\) (phút).

Tuy nhiên, trong mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sáng của bác An,khoảng đầu tiên chứa dữ liệu là \([20;25)\) và khoảng cuối cùng chứa dữ liệu là \([25;30)\). Do đó khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian tập thể dục buổi sángcủa bác An là \(30-20=10\) (phút).

Câu 11:

Bảng bên biểu diễn mẫu số liệu ghép nhóm thống kê mức lương của một công ty (đơn vị: triệu đồng).

a) Tính khoảng biến thiên của mẫu số liệu ghép nhóm đó.

b) Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đó.

Image

a) Trong mẫu số liệu ghép nhóm, ta có: đầu mút trái của nhóm \(1\)\(a_1=10\), đầu mút phải của nhóm \(6\)\(a_6=40\). Vậy khoảng biến thiên của mẫu số liệu ghép nhóm là

\[R=a_6-a_1=40-10=30 ~\text{(triệu đồng)}.\]

b) Số phần tử của mẫu là \(60\).

Ta có \(\displaystyle\frac{n}{4}=\displaystyle\frac{60}{4}=15\). Suy ra nhóm \(1\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(15\). Xét nhóm \(1\) là nhóm \([10; 15)\)\(s=10\); \(h=5\); \(n_1=15\) và tần số tích lũy nhóm trước xem là \(0\).

Tứ phân vị thứ nhất: \(Q_1=10+\displaystyle\frac{15-0}{15}\cdot 5 = 15\) (triệu đồng).

Ta có \(\displaystyle\frac{3n}{4}=\displaystyle\frac{3\cdot 60}{4}=45\), mà \(43<45<53\). Suy ra nhóm \(4\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(45\). Xét nhóm \(4\) là nhóm \([25; 30)\)\(s=25\); \(h=5\); \(n_4=10\) và tần số tích lũy của nhóm trước là \(cf_3=43\).

Tứ phân vị thứ ba: \(Q_3=25+\displaystyle\frac{45-43}{10}\cdot 5 = 26\) (triệu đồng).

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là

\[\Delta_Q=Q_3-Q_1=26-15=11 ~\text{(triệu đồng)}.\]

Câu 12:

Bảng bên biểu diễn mẫu số liệu ghép nhóm về độ tuổi của cư dân trong một khu phố.

a) Tính khoảng biến thiên của mẫu số liệu ghép nhóm đó.

b) Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm đó.

Image

a) Trong mẫu số liệu ghép nhóm, ta có: đầu mút trái của nhóm \(1\)\(a_1=20\), đầu mút phải của nhóm \(5\)\(a_5=90\). Vậy khoảng biến thiên của mẫu số liệu ghép nhóm là

\[R=a_6-a_1=80-20=60 ~\text{(tuổi)}.\]

b) Số phần tử của mẫu là \(100\).

Ta có \(\displaystyle\frac{n}{4}=\displaystyle\frac{100}{4}=25\). Suy ra nhóm \(1\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(25\). Xét nhóm \(1\) là nhóm \([20; 30)\)\(s=20\); \(h=10\); \(n_1=25\) và tần số tích lũy nhóm trước xem là \(0\).

Tứ phân vị thứ nhất: \(Q_1=20+\displaystyle\frac{25-0}{25}\cdot 10 = 30\) (tuổi).

Ta có \(\displaystyle\frac{3n}{4}=\displaystyle\frac{3\cdot 100}{4}=75\), mà \(65<75<80\). Suy ra nhóm \(4\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(75\). Xét nhóm \(4\) là nhóm \([50; 60)\)\(s=50\); \(h=10\); \(n_4=15\) và tần số tích lũy của nhóm trước là \(cf_3=65\).

Tứ phân vị thứ ba: \(Q_3=50+\displaystyle\frac{75-65}{15}\cdot 10 \approx 56{,}7\) (tuổi).

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là

\[\Delta_Q=Q_3-Q_1=56{,}7-30=26{,}7 ~\text{(tuổi)}.\]

Câu 13:

Bảng sau thống kê cân nặng của \(50\) quả xoài Thanh Ca được lựa chọn ngẫu nhiên sau khi thu hoạch ở một nông trường

Image

Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.

Gọi \(x_1\); \(x_2\); \ldots; \(x_{50}\) là mẫu số liệu gốc gồm cân nặng của \(50\) quả xoài được xếp theo thứ tự không giảm.

Ta có \(x_1\), \(x_2\), \(x_3\in[250;290)\); \(x_4\), \ldots, \(x_{16}\in[290;330)\); \(x_{17}\), \ldots, \(x_{34}\in[330;370)\); \break\(x_{35}\), \ldots, \(x_{45}\in[370;410)\); \(x_{46}\), \ldots, \(x_{50}\in[410;450)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_{13}\in[290;330)\).

Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=290+\displaystyle\frac{\displaystyle\frac{50}{4}-3}{13}\cdot(330-290)=\displaystyle\frac{4150}{13}.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{38}\in[370;410)\).

Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=370+\displaystyle\frac{\displaystyle\frac{3\cdot50}{4}-(3+13+18)}{11}\cdot(410-370)=\displaystyle\frac{4210}{11}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=Q_3-Q_1=\displaystyle\frac{4210}{11}-\displaystyle\frac{4150}{13}=\displaystyle\frac{9080}{143}\).

Câu 14:

Hằng ngày ông Thắng đều đi xe buýt từ nhà đến cơ quan. Dưới đây là bảng thống kê thời gian của \(100\) lần ông Thắng đi xe buýt từ nhà đến cơ quan.

Image

a) Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.

b) Biết rằng trong \(100\) lần đi trên, chỉ có đúng một lần ông Thắng đi hết hơn \(29\) phút. Thời gian của lần đi đó có phải là giá trị ngoại lệ không?

a) Cỡ mẫu \(n=100\).

Gọi \(x_1\); \(x_2\); \ldots; \(x_{100}\) là mẫu số liệu gốc gồm thời gian \(100\) lần đi xe buýt của ông Thắng.

Ta có: \(x_1\), \ldots, \(x_{22}\in[15;18)\); \(x_{23}\), \ldots, \(x_{60}\in[18;21)\); \(x_{61}\), \ldots, \(x_{87}\in[21;24)\); \(x_{88}\), \ldots, \(x_{95}\in[24;27)\); \(x_{96}\), \ldots, \(x_{99}\in[27;30)\); \(x_{100}\in[30;33)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{x_{25}+x_{26}}{2}\in[18;21)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=18+\displaystyle\frac{\displaystyle\frac{100}{4}-22}{38}\cdot(21-18)=\displaystyle\frac{693}{38}.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{x_{75}+x_{76}}{2}\in[21;24)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=21+\displaystyle\frac{\displaystyle\frac{3\cdot100}{4}-(22+38)}{27}\cdot(24-21)=\displaystyle\frac{68}{3}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=Q_3-Q_1=\displaystyle\frac{505}{114}\).

b) Trong lần duy nhất ông Thắng đi hết hơn \(29\) phút, thời gian đi của ông thuộc nhóm \([30;33)\).

\(Q_3+1{,}5\Delta_Q=\displaystyle\frac{6683}{228}<30\) nên thời gian của lần ông Thắng đi hết hơn \(29\) phút là giá trị ngoại lệ của mẫu số liệu ghép nhóm.

Câu 15:

Bảng sau thống kê tổng lượng mưa (đơn vị: mm) đo được vào tháng 7 từ năm 2002 đến 2021 tại một trạm quan trắc đặt ở Cà Mau.

Image

a) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu trên.

b) Hãy chia mẫu số liệu trên thành 4 nhóm với nhóm đầu tiên là \([140;240)\) và lập bảng tần số ghép nhóm.

c) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu ghép nhóm và so sánh với kết quả tương ứng thu được ở câu a.

a) Xếp lại mẫu số liệu theo thứ tự không giảm, ta được

Image

Khoảng biến thiên của mẫu số liệu trên là \(R=522{,}9-147=375{,}9\).

Cỡ mẫu \(n=20\).

Gọi \(x_1\); \(x_2\); \ldots; \(x_{20}\) là mẫu số liệu lượng mưa của trạm.

Tứ phân vị thứ nhất của mẫu số liệu là \(Q_1=\displaystyle\frac{x_5+x_6}{2}=\displaystyle\frac{251{,}4+258{,}4}{2}=254{,}9\).

Tứ phân vị thứ ba của mẫu số liệu lớp 12C là \(Q_3=\displaystyle\frac{x_{15}+x_{16}}{2}=\displaystyle\frac{413{,}5+421}{2}=417{,}25\).

Vậy khoảng tứ phân vị của mẫu số liệu là \(\Delta_Q=Q_3-Q_1=162{,}35\).

b) Chia mẫu số liệu trên thành 4 nhóm với nhóm đầu tiên là \([140;240)\) ta được bảng như sau

Image

c) Khoảng biến thiên của mẫu số liệu ghép nhóm là \(R=540-140=400\), lớn hơn khoảng biến thiên của mẫu số liệu thông thường.

Gọi \(x_1\); \(x_2\); \ldots; \(x_{20}\) là mẫu số liệu lượng mưa của trạm. Ta có: \(x_1\), \(x_2\), \(x_3\in[140;240)\); \(x_4\), \ldots, \(x_{10}\in[240;340)\); \(x_{11}\), \ldots, \(x_{17}\in[340;440)\); \(x_{18}\), \(x_{19}\), \(x_{20}\in[440;540)\).

Tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là \(\displaystyle\frac{x_6+x_7}{2}\in[240;340)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=240+\displaystyle\frac{\displaystyle\frac{20}{4}-3}{7}\cdot(340-240)=\displaystyle\frac{1700}{7}.\)

Tứ phân vị thứ ba của mẫu số liệu ghép nhóm là \(\displaystyle\frac{x_{15}+x_{16}}{2}\in[340;440)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=340+\displaystyle\frac{\displaystyle\frac{3\cdot20}{4}-(3+7)}{7}\cdot(440-340)=\displaystyle\frac{2430}{7}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{730}{7}\approx104{,}29\), thấp hơn khoảng tứ phân vị của mẫu số liệu thông thường.

Câu 16:

Biểu đồ dưới đây biểu diễn số lượt khách hàng đặt bàn qua hình thức trực tuyến mỗi ngày trong quý III năm 2022 của một nhà hàng. Cột thứ nhất biểu diễn số ngày có từ \(1\) đến dưới \(6\) lượt đặt bàn; cột thứ hai biểu diễn số ngày có từ \(6\) đến dưới \(11\) lượt đặt bàn;\ldots.

Image

Hãy tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm cho bởi biểu đồ trên.

Dựa vào biểu đồ, ta lập được bảng ghép nhóm như bên dưới.

Image

Ta có cỡ mẫu \(n=92\).

Gọi \(x_1\); \(x_2\); \ldots; \(x_{92}\) là mẫu số liệu đã cho.

Ta có: \(x_1\), \ldots, \(x_{14}\in[1;6)\); \(x_{15}\), \ldots, \(x_{44}\in[6;11)\); \(x_{45}\), \ldots, \(x_{69}\in[11;16)\); \(x_{70}\), \ldots, \(x_{87}\in[16;21)\); \(x_{88}\), \ldots, \(x_{92}\in[21;26)\).

Tứ phân vị thứ nhất của mẫu số liệu là \(\displaystyle\frac{x_{23}+x_{24}}{2}\in[6;11)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu là

\(Q_1=6+\displaystyle\frac{\displaystyle\frac{92}{4}-14}{30}\cdot(11-6)=7{,}5.\)

Tứ phân vị thứ ba của mẫu số liệu là \(\displaystyle\frac{x_{69}+x_{70}}{2}\) với \(x_{69}\in[11;16)\)\(x_{70}\in[16;21)\). Do đó, tứ phân vị thứ ba của mẫu số liệu là \(Q_3=16\).

Vậy khoảng tứ phân vị của mẫu số liệu là \(\Delta_Q=Q_3-Q_1=8{,}5\).

Câu 17:

Kết quả đo chiều cao của \(100\) cây keo 3 năm tuổi tại một nông trường được cho ở bảng sau

Image

a) Hãy tìm khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.

b) Trong \(100\) cây keo trên có \(1\) cây cao \(8{,}4\) m. Hỏi chiều cao của cây keo này có phải là giá trị ngoại lệ không?

a) Khoảng biến thiên của mẫu số liệu là \(R=9{,}4-8{,}4=1\).

Ta có cỡ mẫu \(n=100\).

Gọi \(x_1\); \(x_2\); \ldots; \(x_{100}\) là mẫu số liệu gồm chiều cao của \(100\) cây keo.

Ta có: \(x_1\), \ldots, \(x_5\in[8{,}4;8{,}6)\); \(x_6\), \ldots, \(x_{17}\in[8{,}6;8{,}8)\); \(x_{18}\), \ldots, \(x_{42}\in[8{,}8;9{,}0)\); \(x_{43}\), \ldots, \(x_{86}\in[9{,}0;9{,}2)\); \(x_{87}\), \ldots, \(x_{100}\in[9{,}2;9{,}4)\).

Tứ phân vị thứ nhất của mẫu số liệu là \(\displaystyle\frac{x_{25}+x_{26}}{2}\in[8{,}8;9{,}0)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(\)Q_1=8{,}8+\displaystyle\frac{\displaystyle\frac{100}{4}-(5+12)}{25}\cdot(9{,}0-8{,}8)=8{,}864.\(\)

Tứ phân vị thứ ba của mẫu số liệu là \(\displaystyle\frac{x_{75}+x_{76}}{2}\in[9{,}0;9{,}2)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(\)Q_3=9{,}0+\displaystyle\frac{\displaystyle\frac{3\cdot100}{4}-(5+12+25)}{44}\cdot(9{,}2-9{,}0)=9{,}15.\(\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là \(\Delta_Q=Q_3-Q_1=0{,}286\).

b) Vì \(Q_1-1{,}5\Delta_Q=8{,}435\)\(Q_3+1{,}5\Delta_Q=9{,}579\) nên cây keo có chiều cao \(8{,}4\) m là giá trị ngoại lệ của mẫu số liệu ghép nhóm.

Câu 18:

Bảng tần số ghép nhóm dưới đây thể hiện kết quả điều tra về tuổi thọ trung bình của nam giới và nữ giới ở \(50\) quốc gia.

Image

a) Hãy tính các khoảng tứ phân vị của tuổi thọ trung bình của nam giới và nữ giới trong mẫu số liệu ghép nhóm trên.

b) Hãy cho biết tuổi thọ trung bình của nam giới hay nữ giới trong mẫu số liệu ghép nhóm trên đồng đều hơn

a) Xét ở nam giới, ta có cỡ mẫu \(n=50\).

Gọi \(x_1\); \(x_2\); \(\ldots\); \(x_{50}\) là mẫu số liệu gồm tuổi thọ của \(50\) nam giới.

Ta có: \(x_1\), \(\ldots\), \(x_4\in[50;55)\); \(x_5\), \(\ldots\), \(x_{11}\in[55;60)\); \(x_{12}\), \(\ldots\), \(x_{15}\in[60;65)\); \(x_{16}\), \(\ldots\), \(x_{21}\in[65;70)\); \(x_{22}\), \(\ldots\), \(x_{36}\in[70;75)\); \(x_{37}\), \(\ldots\), \(x_{48}\in[75;80)\); \(x_{49}\), \(x_{50}\in[80;85)\).

Tứ phân vị thứ nhất của mẫu số liệu là \(x_{13}\in[60;65)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu nam giới là

\(\)Q_1=60+\displaystyle\frac{\displaystyle\frac{50}{4}-(4+7)}{4}\cdot(65-60)=\displaystyle\frac{495}{8}.\(\)

Tứ phân vị thứ ba của mẫu số liệu là \(x_{38}\in[75;80)\). Do đó, tứ phân vị thứ ba của mẫu số liệu nam giới là

\(\)Q_3=75+\displaystyle\frac{\displaystyle\frac{3\cdot50}{4}-(4+7+4+6+15)}{12}\cdot(80-75)=\displaystyle\frac{605}{8}.\(\)

Vậy khoảng tứ phân vị của mẫu số liệu nam giới là \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{55}{4}=13{,}75\).

Xét ở nữ giới, ta có cỡ mẫu \(n=50\).

Gọi \(x_1\); \(x_2\); \(\ldots\); \(x_{50}\) là mẫu số liệu gồm tuổi thọ của \(50\) nữ giới.

Ta có: \(x_1\), \(x_2\), \(x_3\in[50;55)\); \(x_4\), \(\ldots\), \(x_7\in[55;60)\); \(x_8\), \(\ldots\), \(x_{12}\in[60;65)\); \(x_{13}\), \(x_{14}\), \(x_{15}\in[65;70)\); \(x_{16}\), \(\ldots\), \(x_{22}\in[70;75)\); \(x_{23}\), \(\ldots\), \(x_{36}\in[75;80)\); \(x_{37}\), \(\ldots\), \(x_{49}\in[80;85)\); \(x_{50}\in[85;90)\).

Tứ phân vị thứ nhất của mẫu số liệu là \(x_{13}\in[65;70)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu nữ giới là

\(Q_1=65+\displaystyle\frac{\displaystyle\frac{50}{4}-(3+4+5)}{3}\cdot(70-65)=\displaystyle\frac{395}{6}.\)

Tứ phân vị thứ ba của mẫu số liệu là \(x_{38}\in[80;85)\). Do đó, tứ phân vị thứ ba của mẫu số liệu nữ giới là

\(Q_3=80+\displaystyle\frac{\displaystyle\frac{3\cdot50}{4}-(3+4+5+3+7+14)}{13}\cdot(85-80)=\displaystyle\frac{2095}{26}.\)

Vậy khoảng tứ phân vị của mẫu số liệu nữ giới là \(\Delta_Q=Q_3-Q_1=\displaystyle\frac{575}{39}\approx14{,}74\).

b) Do khoảng tứ phân vị của mẫu số liệu của nam giới nhỏ hơn mẫu số liệu của nữ giới nên tuổi thọ của nam giới đều hơn tuổi thọ của nữ giới.

Câu 19:

Mỗi ngày bác Hương đều đi bộ để rèn luyện sức khỏe. Quãng đường đi bộ mỗi ngày (đơn vị km) của bác Hương trong \(20\) ngày được thống kê lại ở bảng sau

Image

Tính khoảng tứ phân vị của mẫu số liệu.

Cỡ mẫu \(n=20\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{20}\) là mẫu số liệu gốc gồm quãng đường của \(20\) ngày đi bộ của bác Hương được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(x_2\), \(x_3\in [2{,}7;3{,}0)\); \(x_4\); \(x_5\); \(\ldots\); \(x_9\in [3{,}0;3{,}3)\); \(x_{10}\); \(\ldots\); \(x_{14}\in [3{,}3;3{,}6)\); \break\(x_{15}\); \(\ldots\); \(x_{18}\in [3{,}6;3{,}9)\); \(x_{19}\); \(x_{20}\in [3{,}9;4{,}2)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_5+x_6)\in [3{,}0;3{,}3)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=3{,}0+\displaystyle\frac{\displaystyle\frac{20}{4}-3}{6}(3{,}3-3{,}0)=3{,}1.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{15}+x_{16})\in [3{,}6;3{,}9)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=3{,}6+\displaystyle\frac{\displaystyle\frac{3\cdot 20}{4}-(3+6+5)}{4}(3{,}9-3{,}6)=3{,}675.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=3{,}675-3{,}1=0{,}575.\)

Câu 20:

Bạn Chi rất thích nhảy hiện đại. Thời gian tập nhảy mỗi ngày trong thời gian gần đây của bạn Chi được thống kê lại ở bảng sau

Image

Tính khoảng tứ phân vị của mẫu số liệu.

Cỡ mẫu \(n=18\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{18}\) là mẫu số liệu gốc gồm thời gian của \(18\) ngày tập nhảy của bạn Chi được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(\ldots\), \(x_6\in [20;25)\); \(x_7\); \(x_8\); \(\ldots\); \(x_{12}\in [25;30)\); \(x_{13}\); \(\ldots\); \(x_{16}\in [30;35)\); \(x_{17}\in [35;40)\); \(x_{18}\in [40;45)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_5\in [20;25)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(\)Q_1=20+\displaystyle\frac{\displaystyle\frac{18}{4}-0}{6}(25-20)=23{,}75.\(\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{14}\in [30;35)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(\)Q_3=30+\displaystyle\frac{\displaystyle\frac{3\cdot 18}{4}-(6+6)}{4}(35-30)=31{,}875.\(\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\)\Delta_Q=31{,}875-23{,}75=8{,}125.\(\)

Câu 21:

Dũng là học sinh rất giỏi chơi rubik, bạn có thể giải nhiều loại khối rubik khác nhau. Trong một lần tập luyện giải khối rubik \(3\times 3\), bạn Dũng đã tự thống kê lại thời gian giải rubik trong \(25\) lần giải liên tiếp ở bảng sau:

Image

Tính khoảng tứ phân vị của mẫu số liệu.

Cỡ mẫu \(n=25\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{25}\) là mẫu số liệu gốc gồm thời gian của \(25\) lần mà bạn Dũng giải rubik được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(\ldots\), \(x_4\in [8;10)\); \(x_5\); \(\ldots\); \(x_{10}\in [10;12)\); \(x_{11}\); \(\ldots\); \(x_{18}\in [12;14)\); \(x_{19}\); \(\ldots\); \(x_{22}\in [14;16)\); \break\(x_{23}\); \(\ldots\); \(x_{25}\in [16;18)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_6+x_7)\in [10;12)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=10+\displaystyle\frac{\displaystyle\frac{25}{4}-4}{6}(12-10)=10{,}75.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{19}+x_{20})\in [14;16)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=14+\displaystyle\frac{\displaystyle\frac{3\cdot 25}{4}-(4+6+8)}{4}(16-14)=14{,}375.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=14{,}375-10{,}75=3{,}625.\)

Câu 22:

Điểm kiểm tra cuối khoá môn Tiếng Anh của hai lớp ở một trung tâm ngoại ngữ được thống kê trong các {\it bảng a} và {\it b}.

Image

a) Tìm khoảng biến thiên của mỗi mẫu số liệu. Có thể dùng khoảng biến thiên để biết điểm của lớp nào đồng đều hơn không?

b) Tìm các tứ phân vị và khoảng tứ phân vị của mỗi mẫu số liệu.

c) Mẫu số liệu nào có độ phân tán lớn hơn? Minh hoạ câu trả lời bằng cách biểu diễn các tứ phân vị và khoảng tứ phân vị của mỗi mẫu số liệu trên trục số.

a) Hai mẫu số liệu đều có khoảng biến thiên là \(R=100-50=50\) nên không thể căn cứ vào đó để nói điểm của lớp nào đồng đều hơn.

b) Kích thước của hai mẫu số liệu đều là \(N=100\). Ta có \(\displaystyle\frac{N}{4}=25\); \(\displaystyle\frac{N}{2}=50\); \(\displaystyle\frac{3 N}{4}=75\).

+) Đối với mẫu số liệu về điểm của lớp \(A\), ta tìm các tứ phân vị \(Q_1^{A}\), \(Q_2^{A}\), \(Q_3^{A}\) và khoảng tứ phân vị \(\Delta_Q^{A}\) qua bảng tần số tích luỹ dưới đây:

Nhóm chứa \(Q_1^{A}\)\([60;70)\).

\(Q_1^{A}=60+\displaystyle\frac{25-8}{20} \cdot 10=68{,}5.\)

Nhóm chứa \(Q_2^{A}\)\([70;80)\).

\(Q_2^{A}=70+\displaystyle\frac{50-28}{50} \cdot 10=74{,}4.\)

Nhóm chứa \(Q_3^{A}\)\([70;80)\).

\(Q_3^{A}=70+\displaystyle\frac{75-28}{50} \cdot 10=79{,}4.\)

Vậy \(\Delta_Q^{A}=79{,}4-68{,}5=10{,}9\).

Image

+) Gọi \(Q_1^{B}\), \(Q_2^{B}\), \(Q_3^{B}\) là các tứ phân vị và \(\Delta_Q^{B}\) là khoảng tứ phân vị của mẫu số liệu về điểm của lớp \(B\). Ta lập bảng tần số tích luỹ và tính được:

Nhóm chứa \(Q_1^{B}\)\([60; 70)\).

\(Q_1^{B}=60+\displaystyle\frac{25-15}{20} \cdot 10=65.\)

Nhóm chứa \(Q_2^{B}\)\([70; 80)\).

\(Q_2^{B}=70+\displaystyle\frac{50-35}{30} \cdot 10=75.\)

Nhóm chứa \(Q_3^{B}\)\([80; 90)\).

\(Q_3^{B}=80+\displaystyle\frac{75-65}{20} \cdot 10=85.\)

Vậy \(\Delta_Q^{B}=85-65=20\).

Image

c) \(\Delta_Q^{B}>\Delta_Q^{A}\) nên điểm của lớp \(B\) phân tán hơn điểm của lớp \(A\). Minh hoạ trên trục số: Mỗi mẫu đều có \(100\) số liệu thuộc khoảng [\(50;100)\). Có \(50\%\) số liệu ở giữa của bảng điểm lớp \(B\) thuộc khoảng \(\left(Q_1^{B}, Q_3^{B}\right)\). Bảng điểm lớp \(A\) cũng có \(50\%\) số liệu ở giữa thuộc khoảng \(\left(Q_1^{A}, Q_3^{A}\right)\). Vì \(\left(Q_1^{A}, Q_3^{A}\right) \subset\left(Q_1^{B}, Q_3^{B}\right)\) nên ta có thể nói là điểm của lớp \(B\) phân tán hơn so với điểm lớp \(A\).

Image

Câu 23:

Hình bên dưới là biểu đồ biểu diễn lượng mưa trung bình của các tháng trong năm ở thành phố \(A\).

Image

a) Lập bảng số liệu ghép nhóm về lượng mưa của thành phố \(A\), với độ dài các nhóm là \(50\) và đầu mút phải của nhóm cuối cùng là \(350\).

b) Xác định khoảng tứ phân vị của mẫu số liệu (làm tròn kết quả đến hàng đơn vị). Nêu ý nghĩa của kết quả tìm được.

a) Bảng số liệu về lượng mưa của thành phố \(A\):

Image

b) Ta có

\(N=12\) nên \(\displaystyle\frac{N}{4}=3 ; \displaystyle\frac{3 N}{4}=9\).

Nhóm chứa \(Q_1\)\([50 ; 100)\).

\(Q_1=50+\displaystyle\frac{3-2}{3} \cdot 50 \approx 67.\)

Nhóm chứa \(Q_3\)\([250 ; 300)\).

\(Q_3=250+\displaystyle\frac{9-8}{2} \cdot 50=275.\)

Vậy \(\Delta_Q=275-67=208\).

Kết quả tìm được cho thấy: Hằng năm, ở thành phố \(A\)\(3\) tháng có lượng mưa trung bình không vượt quá \(67\) mm và \(3\) tháng có lượng mưa trung bình ít nhất là \(275\) mm. Trong \(6\) tháng còn lại, lượng mưa trung bình đạt từ \(67\) mm đến \(275\) mm và như vậy là lượng mưa của \(6\) tháng này có thể chênh lệch nhau đến \(208\) mm.

Câu 24:

Dưới đây là kết quả điều tra thời gian hoàn thành bài tập ở nhà môn Toán của 30 học sinh lớp 9:

Image

a) Tìm trung bình, các tứ phân vị và khoảng tứ phân vị của mẫu số liệu đã cho.

b) Lập mẫu số liệu ghép nhóm với các nhóm ghép có độ dài bằng 10 và nhóm đầu tiên là \([40 ; 50)\).

c) Tìm trung bình, khoảng biến thiên, các tứ phân vị và khoảng tứ phân vị của mẫu số liệu ghép nhóm lập ở câu b.

d) So sánh các kết quả tìm được ở câu a và c. Giải thích vì sao có sự khác biệt.

a) Ta có \(n=30\), khi đó:

+) Giá trị trung bình: \(\bar{x}=66\).

+) Vì \(n\) chẵn nên tứ phân vị thứ 2 là: \(Q_2=M_e=\displaystyle\frac{x_{15}+x_{16}}{2}=\displaystyle\frac{67+68}{2}=67{,}5\).

+) Tứ phân vị thứ nhất: \(Q_1=x_8=58\).

+) Tứ phân vị thứ ba: \(Q_3=x_{23}=77\).

+) Khoảng tứ phân vị: \(\Delta_Q=Q_3-Q_1=77-58=19\).

b) Ta có bảng mẫu số liệu ghép nhóm như sau:

Image

c) Ta có

+) Giá trị trung bình \(\bar{x}=\displaystyle\frac{45 \cdot 4+55 \cdot 6+65 \cdot 8+75 \cdot 8+85 \cdot 4}{30}\approx 65{,}67\).

+) Khoảng biến thiên \(R=90-40=50\).

+) \(N=30; \displaystyle\frac{N}{4}=7{,}5; \displaystyle\frac{N}{2}=15; \displaystyle\frac{3N}{4}=22{,}5\).

+) Dựa vào bảng ở câu b, nhóm chứa \(Q_1\)\([50 ; 60)\).

\(Q_1=50+\displaystyle\frac{7{,}5 -4}{6} \cdot 10\approx 55{,}83.\)

+) Nhóm chứa \(Q_2\)\([60 ; 70)\).

\(Q_2=60+\displaystyle\frac{15-10}{8} \cdot 10=66{,}875.\)

+) Nhóm chứa \(Q_3\)\([70 ; 80)\).

\(Q_3=70+\displaystyle\frac{22{,}5 -18}{8} \cdot 10=75{,}625.\)

+) Vậy khoảng tứ phân vị là \(\Delta_Q \approx 75{,}625-55{,}83 \approx 19{,}795\).

d) Kết quả ở hai câu khác nhau nhiều vì ở câu c, ta chỉ xét số liệu được một cách tương đối vì xét qua các lớp và giá trị đại diện của nó. Tuy nhiên với số liệu của bảng lớn và phân tán thì việc sử dụng bảng số liệu ghép lớp ưu việt hơn.

Câu 25:

Thời gian trung bình hằng ngày mà một số nhân viên đi từ nhà đến công ty được thống kê trong \textit{Bảng 3.9}. Tìm khoảng biến thiên và khoảng tứ phân vị của thời gian di chuyển đến công ty của các nhân viên (làm tròn kết quả đến hàng phần mười).

Image

Ta có bảng tần số tích luỹ như sau:

Image

+) Khoảng biến thiên \(R=70-10=60\).

+) Ta có \(N=40; \displaystyle\frac{N}{4}=10; \displaystyle\frac{N}{2}=20; \displaystyle\frac{3N}{4}=30\).

+) Dựa vào bảng ở câu b, nhóm chứa \(Q_1\)\([20 ; 30)\).

\(Q_1=20+\displaystyle\frac{10 -8}{8} \cdot 10= 22{,}5.\)

+) Nhóm chứa \(Q_2\)\([30 ; 40)\).

\(Q_2=30+\displaystyle\frac{20-16}{10} \cdot 10=34.\)

+) Nhóm chứa \(Q_3\)\([40 ; 50)\).

\(Q_3=40+\displaystyle\frac{30 -26}{6} \cdot 10\approx 46{,}67.\)

+) Vậy khoảng tứ phân vị là \(\Delta_Q \approx 46{,}67-22{,}5 \approx 24{,}17\).