Câu 1:
Trình bày dữ liệu về tốc độ của \(100\) xe ô tô lưu thông trên một đoạn đường cao tốc vào giờ cao điểm, được trích xuất từ camera của cơ quan cảnh sát giao thông. Hãy tìm khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu (làm tròn kết quả đến hàng đơn vị). Nêu ý nghĩa của các kết quả tìm được.
+) Ta có bảng tần số tích luỹ như sau:
+) Khoảng biến thiên \(R=110-50=50\).
+) Ta có \(N=100; \displaystyle\frac{N}{4}=25; \displaystyle\frac{N}{2}=50; \displaystyle\frac{3N}{4}=75\).
+) Dựa vào bảng, nhóm chứa \(Q_1\) là \([70 ; 80)\).
\(Q_1=70+\displaystyle\frac{25 -10}{20} \cdot 10\approx 78.\)
+) Nhóm chứa \(Q_2\) là \([80 ; 90)\).
\(Q_2=80+\displaystyle\frac{50-30}{20} \cdot 10=90.\)
+) Nhóm chứa \(Q_3\) là \([90 ; 100).\)
\(Q_3=90+\displaystyle\frac{75 -50}{35} \cdot 10\approx 97.\)
+) Vậy khoảng tứ phân vị là \(\Delta_Q \approx 97-78 \approx 19\).
+) Ý nghĩa: \(50\%\) lượng xe lưu thông đi trên đường cao tốc giờ cao điểm chạy tốc độ từ \(78\) km/h đến \(97\) km/h.
Câu 2:
Một ngân hàng thống kê ở bảng dưới số tiền mà khách hàng rút từ một máy ATM (máy rút tiền tự động) trong một buổi sáng.
Tìm khoảng tứ phân vị của số tiền rút (làm tròn kết quả đến hàng đơn vị). Nêu ý nghĩa của các kết quả tìm được.
+) Ta có bảng tần số tích luỹ như sau:
+) Ta có \(N=80; \displaystyle\frac{N}{4}=20; \displaystyle\frac{N}{2}=40. \displaystyle\frac{3N}{4}=60;\)
+) Dựa vào bảng, nhóm chứa \(Q_1\) là \([500 ; 1 \,000)\).
\(Q_1=500+\displaystyle\frac{20 -11}{16} \cdot 500\approx 781.\)
+) Nhóm chứa \(Q_2\) là \([1 \,500 ; 2 \,000)\).
\(Q_2=1\,500+\displaystyle\frac{40-39}{15} \cdot 500\approx 1 \,533.\)
+) Nhóm chứa \(Q_3\) là \([2 \,000 ; 2 \,500)\).
\(Q_3=2\, 000+\displaystyle\frac{60 -54}{10} \cdot 500=2 \,300.\)
+) Vậy khoảng tứ phân vị là \(\Delta_Q \approx 2 \,300-781 \approx 1\, 519\).
+) Ý nghĩa: Có khoảng \(\displaystyle\frac{1}{4}\) lượng khách rút số tiền không quá \(781\) nghìn đồng, khoảng \(\displaystyle\frac{1}{4}\) lượng khách rút số tiền ít nhất là \(2\) triệu \(300\) nghìn đồng, \(50\%\) số khách hàng rút tiền dao động từ \(781\) đến \(2\) triệu \(300\) nghìn đồng. Như vậy, \(50\%\) lượng khách này rút tiền có thể chênh lệch nhau đến 1 triệu 519 nghìn đồng.
Câu 3:
Thời gian chờ khám bệnh của các bệnh nhân tại phòng khám X được cho trong bảng sau:
a) Tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm này.
b) Từ một số liệu về thời gian chờ khám bệnh của các bệnh nhân tại phòng khám Y người ta tính được khoảng tứ phần vị bằng \(9{,}23\). Hỏi thời gian chờ của bệnh nhân tại phòng khám nào phân tán hơn?
a) Cỡ mẫu là \(n = 3+12+15+8=38\). Gọi \(x_1,\ldots,x_{38}\) là thời gian chờ khám bệnh của \(38\) bệnh nhân này và giả sử rằng dãy số liệu gốc này đã được sắp xếp theo thứ tự tăng dần.
Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_{10}\) nên nhóm chứa tứ phân vị thứ nhất là nhóm \([5;10)\) và ta có:
\[Q_1 = 5+ \displaystyle\frac{\left[ \displaystyle\frac{38}{4}-3\right] }{12}\cdot 5 \approx 7{,}71.\]
Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{29}\) nên nhóm chứa tứ phân vị thứ ba là nhóm \([10;15)\) và ta có:
\[Q_3 = 10+ \displaystyle\frac{\left[ \displaystyle\frac{3\cdot 38}{4}-15\right] }{15}\cdot 5 = 14{,}5.\]
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là: \(\Delta_Q = Q_3 - Q_1 \approx 14{,}5 - 7{,}71= 6{,}79\).
b) Do \(\Delta_Q = 6{,}79 < 9{,}23\) nên thời gian chờ của bệnh nhân tại phòng khám \(Y\) phân tán hơn thời gian chờ của bệnh nhân tại phòng khám \(X\).
Câu 4:
Một người ghi lại thời gian đàm thoại của một số cuộc gọi cho kết quả như bảng sau:
Tính khoảng tứ phân vị của mẫu số liệu ghép nhóm trên.
Cỡ mẫu là \(8+17+25+20+10=80\).
Gọi \(x_1;x_2;\ldots;x_{80}\) là thứ tự các cuộc gọi, và giả sử dữ liệu này tăng dần.
Khi đó tứ phân vị thứ nhất của mẫu số liệu của dữ liệu gốc là \(x_{20}\), nên nhóm chứa tứ phân vị thứ nhất là \([1;2]\), và ta có
\[Q_1 = 17+ \displaystyle\frac{\left[ \displaystyle\frac{80\cdot 1}{4}-(8)\right] }{17}\cdot 1 \approx 17{,}7.\]
Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{70}\) nên nhóm chưa tứ phân vị thứ ba là nhóm \([3;4)\) và ta có:
\[Q_3 = 20+ \displaystyle\frac{\left[ \displaystyle\frac{80\cdot 3}{4}-(8+17+25)\right] }{20}\cdot 1 = 20{,}5.\]
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là: \(\Delta_Q = Q_3 - Q_1 \approx 20{,}5 - 17{,}7= 2{,}8\).
Câu 5:
Thu nhập theo tháng (đơn vị: triệu đồng) của người lao động ở hai nhà máy như sau:
Tính mức thu nhập trung bình của người lao động ở hai nhà máy trên. Dựa vào khoảng tứ phân vị, hãy xác định xem mức thu nhập của người lao động ở nhà máy nào biến động nhiều hơn.
Ta có:
Thu nhập trung bình của người lao động của nhà máy A là
\[\overline{x}_A = \displaystyle\frac{6{,}5\cdot 20 + 9{,}5 \cdot 35 + 12{,}5\cdot45+ 15{,}5\cdot35 +18{,}5\cdot20}{155}= 12{,}5.\]
Thu nhập trung bình của người lao động của nhà máy B là
\[\overline{x}_A = \displaystyle\frac{6{,}5\cdot 17 + 9{,}5 \cdot 23 + 12{,}5\cdot 30+ 15{,}5\cdot23 +18{,}5\cdot17}{110}= 12{,}5.\]
Xét nhà máy A, \(Q_1 = 10{,}8125\); \(Q_3 = 15{,}39\) \(\Rightarrow \triangle Q = 4{,}58\).
Xét nhà máy B, \(Q_1 = 9{,}85\); \(Q_3 = 15{,}63\) \(\Rightarrow \triangle Q = 5{,}78\).
Vậy mức thu nhập của người lao động ở nhà máy B có biến động nhiều hơn
Câu 6:
Bảng sau đây cho biết chiều cao của các học sinh lớp 12A và 12B.
a) Tính khoảng biến thiên, khoảng tứ phần vị cho các mẫu số liệu ghép nhóm của học sinh lớp 12A, 12B.
b) Để so sánh độ phân tán về chiều cao của học sinh hai lớp này ta nên dùng khoảng biến thiên hay khoảng tứ phân vị? Vì sao?
a) Ta có
Khoảng biến thiên là \(175-145 = 30\) (cm).
Xét lớp 12A,
\[Q_1 = 155 + \displaystyle\frac{\displaystyle\frac{43}{4}-1}{15}\cdot 5 = 158{,}25.\]
\[Q_3 = 165 + \displaystyle\frac{\displaystyle\frac{43\cdot 3}{4}-28}{10}\cdot 5 = 167{,}125.\]
\[\triangle Q = Q_3 -Q_1 = 8{,}875.\]
Xét lớp 12B,
\[Q_1 = 155 + \displaystyle\frac{\displaystyle\frac{42}{4}-0}{17}\cdot 5 = 158{,}5\]
\[Q_3 = 165 + \displaystyle\frac{\displaystyle\frac{42\cdot 3}{4}-27}{9}\cdot 5 = 167{,}5\]
\[\triangle Q = Q_3 -Q_1 = 9{,}4.\]
b) Để so sánh độ phân tán về chiều cao của học sinh hai lớp này ta nên dùng khoảng tứ phân vị, vì khoảng biến thiên của \(2\) lớp này là bằng nhau.
Câu 7:
Mai và Ngọc cùng sử dụng vòng đeo tay thông minh để ghi lại số bước chân hai bạn đi mỗi ngày trong một tháng. Kết quả được ghi lại ở bảng sau
a) Hãy tính số trung bình và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.
b) Nếu so sánh theo độ lệch chuẩn thì bạn nào có số lượng bước chân đi mỗi ngày đều đặn hơn?
a) Ta có bảng sau
+) Xét mẫu số liệu của Mai.
Cỡ mẫu là \( n_1=6+7+6+6+5=30\).
Số trung bình của mẫu số liệu ghép nhóm là
\(\overline{x}_1=\displaystyle\frac{6\cdot 4+7\cdot6+6\cdot8+6\cdot10+5\cdot12}{30}=7{,}8.\)
Phương sai của mẫu số liệu ghép nhóm là
\(S_1^2=\displaystyle\frac{1}{30}\left(6\cdot 4^2+7\cdot6^2+6\cdot8^2+6\cdot10^2+5\cdot12^2 \right) -7{,}8^2=7{,}56.\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S_1=\sqrt{7{,}56}.\)
+) Xét mẫu số liệu của Ngọc.
Cỡ mẫu là \( n_2=2+5+13+8+2=30 \).
Số trung bình của mẫu số liệu ghép nhóm là
\(\overline{x}_2=\displaystyle\frac{2\cdot 4+5\cdot6+13\cdot8+8\cdot10+2\cdot12}{30}=8{,}2. \)
Phương sai của mẫu số liệu ghép nhóm là
\(S_2^2=\displaystyle\frac{1}{30}\left(2\cdot 4^2+5\cdot6^2+13\cdot8^2+8\cdot10^2+2\cdot12^2 \right) -8{,}2^2=\displaystyle\frac{287}{75}. \)
Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S_2=\sqrt{\displaystyle\frac{287}{75}}. \)
b) Do \( S_1>S_2 \) nên nếu so sánh theo độ lệch chuẩn thì Ngọc có số lượng bước chân đi mỗi ngày đều đặn hơn Mai.
Câu 8:
Tốc độ của 20 xe hơi khi đi qua một trạm kiểm tra tốc độ (đơn vị: km/h) được thống kê lại như sau
a) Hãy tính khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu trên.
b) Hãy lập bảng tần số ghép nhóm với nhóm đầu tiên là \([42; 46)\) và độ dài mỗi nhóm bằng \(4\).
c) Hãy tính khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu ghép nhóm.
a)
+) Ta có khoảng biến thiên \( R_1=61{,}1-42=19{,}1 \).
+) Ta có \( Q_1=\displaystyle\frac{46{,}7+46{,}8}{2}=46{,}75 \); \( Q_2=\displaystyle\frac{48{,}4+50{,}8}{2}=49{,}6 \); \(Q_3=\displaystyle\frac{54{,}8+55{,}6}{2}=55{,}2 \).
Từ đó suy ra khoảng tứ phân vị \(\Delta_Q=55{,}2-46{,}75=8{,}45\).
+) Cỡ mẫu \( n=20 \).
Số trung bình của mẫu số liệu trên là
\(\overline{x}_1=\displaystyle\frac{42+43{,}4+\ldots+61{,}1}{20}=50{,}945.\)
Phương sai của mẫu số liệu trên là
\(S_1^2=\displaystyle\frac{1}{20}\left( 42^2+43{,}4^2+\ldots+61{,}1^2 \right)-50{,}945^2\approx 32{,}2. \)
Độ lệch chuẩn của mẫu số liệu trên là \( S_1\approx \sqrt{32{,}2} \).
b) Ta có bảng tần số ghép nhóm là
c) Ta có bảng sau
+) Ta có khoảng biến thiên \( R_2=62-42=20 \).
+) Ta có nhóm chứa trung vị là nhóm \([46;50)\) từ đó ta có
\(Q'_2=46+\displaystyle\frac{\displaystyle\frac{20}{2}-3}{7}(50-46)=50.\)
+) Ta có nhóm chứa tứ phân vị thứ nhất là nhóm \([46;50)\) từ đó ta có
\(Q'_1=46+\displaystyle\frac{\displaystyle\frac{20}{4}-3}{7}(50-46)\approx47{,}14. \)
+) Ta có nhóm chứa tứ phân vị thứ ba là nhóm \([54;58)\) từ đó ta có
\(Q'_3=54+\displaystyle\frac{\displaystyle\frac{3\cdot20}{4}-14}{7}(58-54)\approx54{,}57. \)
Từ đó suy ra khoảng tứ phân vị \( \Delta'_Q\approx 54{,}57-47{,}14\approx7{,}43\).
+) Số trung bình của mẫu số liệu ghép nhóm là
\(\overline{x}_2=\displaystyle\frac{3\cdot 44+7\cdot48+4\cdot52+3\cdot56+3\cdot60}{20}=51{,}2.\)
Phương sai của mẫu số liệu ghép nhóm là
\(S_2^2=\displaystyle\frac{1}{20}\left(3\cdot 44^2+7\cdot48^2+4\cdot52^2+3\cdot56^2+3\cdot60^2 \right) -51{,}2^2=26{,}56.\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S_2=\sqrt{26{,}56}. \)
Câu 9:
Một giống cây xoan đào được trồng tại hai địa điểm \(A\) và \(B\). Người ta thống kê đường kính thân của một số cây xoan đào \(5\) năm tuổi ở bảng sau
a) Hãy so sánh đường kính trung bình của thân cây xoan đào trồng tại địa điểm \(A\) và địa điểm \(B\).
b) Nếu so sánh theo độ lệch chuẩn thì cây trồng tại địa điểm nào có đường kính đồng đều hơn?
a) Ta có bảng sau
Cỡ mẫu \( n=100 \).
Đường kính trung bình của cây xoan đào trồng ở địa điểm \(A\)
\(\overline{x}_A=\displaystyle\frac{25\cdot31+38\cdot33+20\cdot35+10\cdot37+7\cdot39}{100}=33{,}72. \)
Đường kính trung bình của cây xoan đào trồng ở địa điểm \(B\)
\(\overline{x}_B=\displaystyle\frac{22\cdot31+27\cdot33+19\cdot35+18\cdot37+14\cdot39}{100}=34{,}5.\)
Ta có \(\overline{x}_B>\overline{x}_A\) nên đường kính trung bình cây xoan đào ở địa điểm \( B \) lớn hơn ở địa điểm \( A \).
b) Phương sai của mẫu số liệu cây xoan đào trồng ở địa điểm \( A\)
\(S_A^2=\displaystyle\frac{1}{100}\left(25\cdot31^2+38\cdot33^2+20\cdot35^2+10\cdot37^2+7\cdot39^2 \right)- 33{,}72^2=5{,}4016.\)
Suy ra độ lệch chuẩn của mẫu số liệu cây xoan đào trồng ở địa điểm \( A \) là \( S_A=\sqrt{5{,}4016}\).
Phương sai của mẫu số liệu cây xoan đào trồng ở địa điểm \( B\)
\(S_B^2=\displaystyle\frac{1}{100}\left(22\cdot31^2+27\cdot33^2+19\cdot35^2+18\cdot37^2+14\cdot39^2 \right)- 34{,}5^2=7{,}31.\)
Suy ra độ lệch chuẩn của mẫu số liệu cây xoan đào trồng ở địa điểm \( B \) là \( S_B=\sqrt{7{,}31} \).
Ta có \( S_B>S_A \) nên nếu so sánh theo độ lệch chuẩn thì cây trồng tại địa điểm \( A \) đồng đều hơn ở địa điểm \( B \).
Câu 10:
Biểu đồ dưới đây mô tả kết quả điều tra về mức lương khởi điểm (đơn vị: triệu đồng) của một số công nhân ở hai khu vực \(A\) và \( B \).
a) Hãy xác định giá trị đại diện cho mỗi nhóm và lập bảng tần số ghép nhóm cho mẫu số liệu đó.
b) Nếu so sánh theo độ lệch chuẩn của mẫu số liệu ghép nhóm thì công nhân ở khu vực nào có mức lương khởi điểm đồng đều hơn?
a) Ta có bảng sau
b) Xét mẫu số liệu của khu vực A
Cỡ mẫu là \( n_A=4+5+5+4+2=20 \).
Số trung bình của mẫu số liệu ghép nhóm là
\(overline{x}_A=\displaystyle\frac{4\cdot 5{,}5+5\cdot 6{,}5+5\cdot 7{,}5+4\cdot 8{,}5+2\cdot 9{,}5}{20}=7{,}25. \)
Phương sai của mẫu số liệu ghép nhóm là
\(S_A^2=\displaystyle\frac{1}{20}\left( 4\cdot 5{,}5^2+5\cdot 6{,}5^2+5\cdot 7{,}5^2+4\cdot 8{,}5^2+2\cdot 9{,}5^2\right)-7{,}25^2=1{,}5875.\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S_A=\sqrt{1{,}5875}\).
Xét mẫu số liệu của khu vực B
Cỡ mẫu là \( n_B=3+6+5+5+1=20 \).
Số trung bình của mẫu số liệu ghép nhóm là
\(\overline{x}_B=\displaystyle\frac{3\cdot 5{,}5+6\cdot 6{,}5+5\cdot 7{,}5+5\cdot 8{,}5+1\cdot 9{,}5}{20}=7{,}25. \)
Phương sai của mẫu số liệu ghép nhóm là
\(S_B^2=\displaystyle\frac{1}{20}\left( 3\cdot 5{,}5^2+6\cdot 6{,}5^2+5\cdot 7{,}5^2+5\cdot 8{,}5^2+1\cdot 9{,}5^2\right)-7{,}25^2=1{,}2875.\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S_B=\sqrt{1{,}2875} \).
Do \(S_A > S_B\) nên nếu so sánh theo độ lệch chuẩn của mẫu số liệu ghép nhóm thì mức lương khởi điểm của công nhân khu vực \(B\) đồng đều hơn của công nhân khu vực \(A\).
Câu 11:
Thống kê tổng số giờ nắng trong tháng 9 tại một trạm quan trắc đặt ở Cà Mau trong các năm từ 2002 đến 2021 được thống kê như sau
a) Hãy tính phương sai và độ lệch chuẩn của mẫu số liệu trên.
b) Hãy lập bảng tần số ghép nhóm với nhóm đầu tiên là \([80; 98)\) và độ dài mỗi nhóm
bằng \(18\). Tính phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm.
c) Hãy tính sai số tương đối của độ lệch chuẩn của mẫu số liệu ghép nhóm so với độ lệch
chuẩn của mẫu số liệu gốc.
(Kết quả các phép tính làm tròn đến hàng phần nghìn.)
a) Cỡ mẫu \( n=20\).
Số trung bình của mẫu số liệu trên là
\(\overline{x}_1=\displaystyle\frac{111{,}6+134{,}9+\ldots+114}{20}=122{,}775.\)
Phương sai của mẫu số liệu trên là
\(S_1^2=\displaystyle\frac{1}{20}\left( 111{,}6^2+134{,}9^2+\ldots+114^2 \right)-122{,}755^2\approx 515{,}453.\)
Độ lệch chuẩn của mẫu số liệu trên là
\(S_1\approx \sqrt{515{,}453}\approx22{,}704.\)
b) Ta có bảng sau
Số trung bình của mẫu số liệu ghép nhóm là
\(\overline{x}_2=\displaystyle\frac{3\cdot 89+6\cdot107+3\cdot125+5\cdot143+3\cdot161}{20}=124{,}1. \)
Phương sai của mẫu số liệu ghép nhóm là
\(S_2^2=\displaystyle\frac{1}{20}\left(3\cdot89^2+6\cdot107^2+3\cdot125^2+5\cdot143^2+3\cdot161^2 \right)-124{,}1^2=566{,}19.\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm là
\(S_2= \sqrt{566{,}19}\approx23{,}795. \)
c) Sai số tương đối của độ lệch chuẩn của mẫu số liệu ghép nhóm so với độ lệch chuẩn
của mẫu số liệu gốc là
\(\displaystyle\frac{|S_2-S_1|}{S_1}=\displaystyle\frac{|23{,}795-22{,}704|}{22{,}704}\cdot100\%\approx4{,}805\%. \)
Câu 12:
Bảng bên dưới thống kê độ ẩm không khí trung bình các tháng trung bình tại Đà Lạt và Vũng Tàu (đơn vị: \%)
a) Hãy lần lượt ghép các số liệu của Đà Lạt, Vũng Tàu thành năm nhóm sau
\([75 ; 78{,}3)\), \([78{,}3 ; 81{,}6)\), \([81{,}6 ; 84{,}9)\), \([84{,}9 ; 88{,}2)\), \([88{,}2 ; 91{,}5)\).
b) Tính khoảng biến thiên, khoảng tứ phân vị, phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm của Đà Lạt và Vũng Tàu.
c) Trong hai thành phố Đà Lạt và Vũng Tàu, thành phố nào có độ ẩm không khí trung bình tháng đồng đều hơn?
a) Bảng số liệu ghép nhóm độ ẩm trung bình các tháng tại Đà Lạt.
Bảng số liệu ghép nhóm độ ẩm trung bình các tháng tại Vũng Tàu.
b) Xét bảng số liệu ghép nhóm độ ẩm trung bình các tháng tại Đà Lạt
Độ ẩm trung bình các tháng tại Đà Lạt
\(\bar{x}_1=\displaystyle\frac{0 \cdot 76{,}65+2 \cdot 79{,}95+1 \cdot 83{,}25+6 \cdot 86{,}55+3 \cdot 89{,}85}{12}=86(\%).\)
Vậy phương sai của mẫu số liệu
\(\begin{aligned}&s_1^2=\displaystyle\frac{1}{12}\left[0 \cdot(76{,}65-86)^2+2 \cdot(79{,}95-86)^2+1\cdot(83{,}25-24{,}86)^2\right.\\ &\left.+6 \cdot(86{,}55-86)^2+3 \cdot(89{,}85-86)^2\right]=\displaystyle\frac{847}{80} \approx 10{,}5875.\end{aligned}\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm trên là: \(s_1 \approx \sqrt{10{,}5875} \approx 3{,}25(\%)\).
Khoảng biến thiên của mẫu số liệu \(R=a_6-a_1=91{,}5-75=16{,}5\).
Khoảng tứ phân vị của mẫu số liệu
Số phần tử của mẫu là \(n=12\).
Ta có: \(\displaystyle\frac{n}{4}=\displaystyle\frac{12}{4}=3\). Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ bằng 3. Xét nhóm 3 là nhóm \([81{,}6 ; 84{,}9)\) có \(s=81{,}6 ; h=3{,}3 ; n_3=1\) và nhóm 2 là nhóm \([78{,}3 ; 81{,}6)\) có \(c f_1=2\).
Áp dụng công thức, ta có tứ phân vị thứ nhất là
\(Q_1=81{,}6+\left(\displaystyle\frac{3-2}{1}\right) \cdot3{,}3=84{,}9(\%).\)
Ta có: \(\displaystyle\frac{3 n}{4}=\displaystyle\frac{3.12}{4}=9\). Suy ra nhóm 4 là nhóm đầu tiên có tần số tích luỹ lơn hơn hoặc bằng 9. Xét nhóm 4 là nhóm \([84{,}9 ; 88{,}2)\) có \(s=84{,}9 ; l=3{,}3 ; n_4=6\) và nhóm 3 là nhóm \([81{,}6 ; 84{,}9)\) có \(c f_3=3\).
Áp dụng công thức, ta có tứ phân vị thứ ba là
\(Q_3=84{,}9+\left(\displaystyle\frac{9-3}{6}\right) \cdot3{,}3 \approx 88{,}2(\%).\)
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là
\[\Delta_Q=Q_3-Q_1=88{,}2-84{,}9=3{,}3.\]
Xét bảng số liệu ghép nhóm độ ẩm trung bình các tháng tại Vũng Tàu
Độ ẩm trung bình các tháng tại Vũng Tàu
\(\bar{x}_2=\displaystyle\frac{5 \cdot 76{,}65+6 \cdot 79{,}95+1 \cdot 83{,}25+0 \cdot 86{,}55+0 \cdot 89{,}85}{12}=78{,}85(\%).\)
Vậy phương sai của mẫu số liệu
\(\begin{aligned}& s_2^2=\displaystyle\frac{1}{12}\left[5 \cdot(76{,}65-78{,}85)^2+6 \cdot(79{,}95-78{,}85)^2+1\cdot(83{,}25-78{,}85)^2\right.\\ &\left.+0 \cdot(86{,}55-78{,}85)^2+0 \cdot(89{,}85-78{,}85)^2\right]=\displaystyle\frac{847}{200} \approx 4{,}235.\end{aligned}\)
Độ lệch chuẩn của mẫu số liệu ghép nhóm trên là: \(s_1 \approx \sqrt{4{,}235} \approx 2{,}06(\%)\).
Khoảng biến thiên của mẫu số liệu \(R=a_6-a_1=91{,}5-75=16{,}5\).
Khoảng tứ phân vị của mẫu số liệu
Số phần tử của mẫu là \(n=12\).
Ta có: \(\displaystyle\frac{n}{4}=\displaystyle\frac{12}{4}=3\). Suy ra nhóm 1 là nhóm đầu tiên có tần số tích luỹ bằng 3. Xét nhóm 1 là nhóm \([75; 78{,}3)\) có \(s=75; h=3{,}3 ; n_1=5\) có \(c f_0=0\).
Áp dụng công thức, ta có tứ phân vị thứ nhất là
\[Q_1=75+\left(\displaystyle\frac{3-0}{6}\right) .3{,}3=76{,}65(\%).\]
Ta có: \(\displaystyle\frac{3 n}{4}=\displaystyle\frac{3.12}{4}=9\). Suy ra nhóm 2 là nhóm đầu tiên có tần số tích luỹ lơn hơn hoặc bằng 9. Xét nhóm 2 là nhóm \([78{,}3 ;81{,}6)\) có \(s=78{,}3; l=3{,}3 ; n_2=6\) và nhóm 1 là nhóm \([75 ; 78{,}3)\) có \(c f_1=5\).
Áp dụng công thức, ta có tứ phân vị thứ ba là
\(Q_3=78{,}3+\left(\displaystyle\frac{9-5}{6}\right) .3{,}3 \approx 80{,}5(\%).\)
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm đã cho là
\(\Delta_Q=Q_3-Q_1=80{,}5-76{,}65=3{,}85.\)
Trong hai thành phố Đà Lạt và Vũng Tàu, thành phố Vũng Tàu có độ ẩm không khí trung bình tháng đồng đều hơn.
}