Bài 2. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN

1. Phương sai


Image


Phương sai, kí hiệu \( S^2 \), được tính bởi công thức

\[S^2=\displaystyle\frac{1}{n}\left[n_1(c_1-\overline{x})^2+n_2(c_2-\overline{x})^2+\ldots+n_k(c_k-\overline{x})^2 \right].\]

Hoặc

\[S^2=\displaystyle\frac{1}{n}\left( n_1c_1^2+n_2c_2^2+\ldots+n_kc_k^2\right)-\overline{x}^2.\]

Trong đó

\(\bullet\quad\) \( n=n_1+n_2+\ldots+n_k \) là cỡ mẫu.

\(\bullet\quad\) \( \overline{x}=\displaystyle\frac{1}{n}(n_1c_1+n_2c_2+\ldots+n_kc_k) \) là số trung bình.


2. Độ lệch chuẩn


Độ lệch chuẩn, kí hiệu \(S\), được tính bởi công thức \(S=\sqrt{S^2}\).


3. Ý nghĩa của phương sai và độ lệch chuẩn


\(\bullet\quad\) Phương sai của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho phương sai của mẫu số liệu gốc. Độ lệch chuẩn của mẫu số liệu ghép nhóm cũng là giá trị xấp xỉ cho độ lệch chuẩn của mẫu số liệu gốc. Chúng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm. Phương sai và độ lệch chuẩn càng lớn thì dữ liệu càng phân tán.

\(\bullet\quad\) Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.


Chú ý: Trong thống kê, người ta còn dùng đại lượng sau để đo mức độ phân tán của mẫu số liệu ghép nhóm

\[\widehat{s}^2=\displaystyle\frac{1}{n-1}\left[n_1(c_1-\overline{x})^2+n_2(c_2-\overline{x})^2+\ldots+n_k(c_k-\overline{x})^2 \right].\]

Câu 1:

Mỗi ngày bác Hương đều đi bộ để rèn luyện sức khỏe. Quãng đường đi bộ mỗi ngày (đơn vị km) của bác Hương trong \(20\) ngày được thống kê lại ở bảng sau

Image

Tính phương sai của mẫu số liệu.

Xét mẫu số liệu ghép nhóm cho bởi bảng sau

Image

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{1}{20}\cdot (2{,}85\cdot 3+3{,}15\cdot 6+3{,}45\cdot 5+3{,}75\cdot 4+4{,}05\cdot 2)=3{,}39.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{20}\left(3\cdot 2{,}85^2+6\cdot 3{,}15^2+5\cdot 3{,}45^2+4\cdot 3{,}45^2+2\cdot 4{,}05^2\right)-3{,}39^2=0{,}1314.\)

Câu 2:

Bạn Chi rất thích nhảy hiện đại. Thời gian tập nhảy mỗi ngày trong thời gian gần đây của bạn Chi được thống kê lại ở bảng sau

Image

Tính phương sai của mẫu số liệu.

Xét mẫu số liệu ghép nhóm cho bởi bảng sau

Image

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{1}{18}\cdot (22{,}5\cdot 6+27{,}5\cdot 6+32{,}5\cdot 4+37{,}5\cdot 1+42{,}5\cdot 1)=\displaystyle\frac{85}{3}.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{18}\left(6\cdot 22{,}5^2+6\cdot 27{,}5^2+4\cdot 32{,}5^2+1\cdot 37{,}5^2+1\cdot 42{,}5^2\right)-\left(\displaystyle\frac{85}{3}\right)^2=31{,}25.\)

Câu 3:

Dũng là học sinh rất giỏi chơi rubik, bạn có thể giải nhiều loại khối rubik khác nhau. Trong một lần tập luyện giải khối rubik \(3\times 3\), bạn Dũng đã tự thống kê lại thời gian giải rubik trong \(25\) lần giải liên tiếp ở bảng sau

Image

Tính độ lệch chuẩn của mẫu số liệu.

Xét mẫu số liệu ghép nhóm cho bởi bảng sau

Image

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{1}{25}\cdot (9\cdot 4+11\cdot 6+13\cdot 8+15\cdot 4+17\cdot 3)=12{,}68.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{25}\left(4\cdot 9^2+6\cdot 11^2+8\cdot 13^2+4\cdot 15^2+3\cdot 17^2\right)-12{,}68^2=5{,}9776.\)

Độ lệch chuẩn của mẫu số liệu là

\(S=\sqrt{5{,}9776}=\approx 2{,}445.\)

Câu 4:

Bộ phận kiểm tra chất lượng sản phẩm dùng máy để đo (chính xác đến \(0{,}001\) mm) độ dày của một chi tiết máy. Kết quả đo một số sản phẩm được thống kê trong bảng sau:

ImageImage

a) Tính phương sai, độ lệch chuẩn của độ dày chi tiết máy.

b) Giải thích tầm quan trọng của việc có độ lệch chuẩn nhỏ trong trường hợp này.

a) Ta có bảng sau

Image

Ta có cỡ mẫu \(n=60\).

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{3 \cdot 18{,}5+7\cdot 19{,}5+23\cdot 20{,}5+25\cdot 21{,}5+2\cdot 22{,}5}{60}=\displaystyle\frac{623}{30}\approx 20{,}77.\)

Phương sai của mẫu số liệu là

\(S^2=\displaystyle\frac{1}{60}\left(3 \cdot 18{,}5^2+7\cdot 19{,}5^2+23\cdot 20{,}5^2+25\cdot 21{,}5^2+2\cdot 22{,}5^2\right)-\left(\displaystyle\frac{623}{30}\right)^2=\displaystyle\frac{179}{225}\)

Độ lệch chuẩn của mẫu số liệu là

\(S^{2}=\sqrt{\displaystyle\frac{179}{225}}=\displaystyle\frac{\sqrt{179}}{15}\approx 0{,}89\).

b) Trong trường hợp này, độ lệch chuẩn nhỏ chứng tỏ độ dày của một chi tiết máy không bị sai lệch nhiều.

Câu 5:

Số tiền ghi trên hoá đơn của \(150\) khách hàng lấy ngẫu nhiên trong một ngày được siêu thị ghi lại ở bảng dưới đây

Image

Tính phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm về số tiền ghi trên hóa đơn.

Ta có bảng sau

Image

Ta có cỡ mẫu \(n=150\).

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{6\cdot 75+9\cdot 125+39\cdot 175+66\cdot 225+30\cdot 275}{150}=210. \)

Phương sai của mẫu số liệu là

\(S^2=\displaystyle\frac{1}{150}(6\cdot 75^2+9\cdot 125^2+39\cdot 175^2+66\cdot 225^2+30\cdot 275^2)-210^2=2425.\)

Độ lệch chuẩn của mẫu số liệu là \( S=49{,}244 \).

Câu 6:

Cân nặng của một số quả mít trong một khu vườn được thống kê ở bảng sau

Image

Tính số trung bình và phương sai của mẫu số liệu ghép nhóm.

Ta có bảng thống kê cân nặng của các quả mít theo giá trị đại diện

Image

Cỡ mẫu \( n=6+12+19+9+4=50 \).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}=\displaystyle\frac{6\cdot 5+12\cdot7+19\cdot9+9\cdot11+4\cdot13}{50}=8{,}72.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{50}\left(6\cdot5^2+12\cdot 7^2+19\cdot9^2+9\cdot11^2+4\cdot13^2 \right)-8{,}72^2\approx4{,}80.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là

\( S\approx \sqrt{4{,}80}\approx 2{,}19 \).

Câu 7:

Bảng dưới đây thống kê cự li ném tạ của một vận động viên.

Image

Hãy tính phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.

Ta có bảng sau

Image

Cỡ mẫu là \( n=13+45+24+12+6=100 \).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}=\displaystyle\frac{13\cdot19{,}25+45\cdot 19{,}75+24\cdot 20{,}25+12\cdot 20{,}75+6\cdot 21{,}25}{100}=20{,}015. \)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{100}\left(13\cdot19{,}25^2+45\cdot 19{,}75^2+24\cdot 20{,}25^2+12\cdot 20{,}75^2+6\cdot 21{,}25^2 \right) -20{,}015^2\approx 0{,}277. \)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S\approx\sqrt{0{,}277} \).

Câu 8:

Hãy tính phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm sau

Image

Ta có bảng sau

Image

Ta có cỡ mẫu \( n=21 \).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}=\displaystyle\frac{3\cdot162+5\cdot166+8\cdot170+4\cdot174+1\cdot178}{21}=\displaystyle\frac{3550}{21}. \)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{21}(3\cdot162^2+5\cdot166^2+8\cdot170^2+4\cdot174^2+1\cdot178^2)-\left(\displaystyle\frac{3550}{21} \right)^2\approx18{,}14.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \( S\approx\sqrt{18{,}14} \).

Câu 9:

Mỗi ngày bác Hương đều đi bộ để rèn luyện sức khỏe. Quãng đường đi bộ mỗi ngày (đơn vị km) của bác Hương trong \(20\) ngày được thống kê lại ở bảng sau

Image

Tính độ lệch chuẩn của mẫu số liệu ghép nhóm.

Xét mẫu số liệu ghép nhóm cho bởi bảng sau

Image

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{1}{20}\cdot (2{,}85\cdot 3+3{,}15\cdot 6+3{,}45\cdot 5+3{,}75\cdot 4+4{,}05\cdot 2)=3{,}39.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{20}\left(3\cdot 2{,}85^2+6\cdot 3{,}15^2+5\cdot 3{,}45^2+4\cdot 3{,}45^2+2\cdot 4{,}05^2\right)-3{,}39^2=0{,}1314.\)

Câu 10:

Bảng sau biểu diễn mẫu số liệu ghép nhóm về độ tuổi của cư dân trong một khu phố.

Image

Tính phương sai và độ lệch chuẩn của mẫu số liệu đó.

Số trung bình

\(\bar{x}=\displaystyle\frac{25\cdot 25+35\cdot 20+45\cdot 20+55\cdot 15+65\cdot 14+75\cdot 6}{100}=\displaystyle\frac{585}{11}= 44,1\)

Phương sai của mẫu số liệu

\(\begin{aligned}s^2 =&\frac{1}{100}\left[25\cdot(44,1-25)^2+20\cdot(44,1-35)^2\right.\\ & +20\cdot(44,1-45)^2+15\cdot(44,1-55)^2+6\cdot(44,1-65)^2+4\cdot(44,1-75)^2 \left. \right]\\ & \approx 244,19.\end{aligned}\)

Độ lệch chuẩn \(s\approx 15,62\).

Câu 11:

Hai bảng sau lần lượt biểu diễn mẫu số liệu ghép nhóm thống kê mực lương của hai công ty \(\mathrm{A}, \mathrm{B}\) (đơn vị: triệu đồng).

Image

a) Tính phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm lần lượt biểu diễn mức lương của hai công ty A, B.

b) Công ty nào có mức lương đồng đều hơn?

a)

Số trung bình công ty A:

\(\bar{x}_A=\displaystyle\frac{12,5\cdot 15+17,5\cdot 18+22,5\cdot 10+27,5\cdot 10+32,5\cdot 5+37,5\cdot 2}{60}=\displaystyle\frac{62}{3}\approx 20,7\)

Phương sai của mẫu số liệu công ty A:

\(\begin{aligned}s^2_A =&\frac{1}{60}\left[15\cdot(20,7-12,5)^2+18\cdot(20,7-17,5)^2\right.\\ & +10\cdot(20,7-22,5)^2+10\cdot(20,7-27,5)^2+5\cdot(20,7-32,5)^2+2\cdot(20,7-37,5)^2 \left. \right]\\ & \approx 49,14.\end{aligned}\)

Độ lệch chuẩn công ty A: \(s_A\approx 7\).

Số trung bình công ty B:

\(\bar{x}_B=\displaystyle\frac{12,5\cdot 35+17,5\cdot 15+22,5\cdot 7+27,5\cdot 5+32,5\cdot 5+37,5\cdot 3}{60}=\displaystyle\frac{62}{3}\approx 21,2\)

Phương sai của mẫu số liệu công ty B:

\(\begin{aligned}s^2_A =&\frac{1}{60}\left[25\cdot(21,2-12,5)^2+15\cdot(21,2-17,5)^2\right.\\ & +7\cdot(21,2-22,5)^2+5\cdot(21,2-27,5)^2+5\cdot(21,2-32,5)^2+3\cdot(21,2-37,5)^2 \left. \right]\\ & \approx 62,39.\end{aligned}\)

Độ lệch chuẩn công ty B: \(s_B\approx 7,9\).

b) Vì \(s_A nên mức lương ở công ty \(A\) đồng đều hơn.

Câu 12:

Kết quả khảo sát thời gian sử dụng liên tục (đơn vị: giờ) từ lúc sạc đầy cho đến khi hết của pin một số máy vi tính cùng loại được mô tả bằng biểu đồ bên.

a) Hãy cho biết có bao nhiêu máy vi tính có

thời gian sử dụng pin từ \(7{,}2\) đến dưới \(7{,}4\) giờ?

b) Hãy xác định số trung bình và độ lệch chuẩn của thời gian sử dụng pin.

Image

a) Có \( 2 \) máy vi tính có thời gian sử dụng pin từ \(7{,}2\) đến dưới \( 7{,}4 \) giờ.

b) Ta có bảng sau

Image

Cỡ mẫu là \( n=2+4+7+5=18 \).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}=\displaystyle\frac{2\cdot7{,}3+4\cdot7{,}5+7\cdot7{,}7+5\cdot7{,}9}{18}=\displaystyle\frac{23}{3}. \)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{18}\left(2\cdot7{,}3^2+4\cdot7{,}5^2+7\cdot7{,}7^2+5\cdot7{,}9^2 \right)-\left(\displaystyle\frac{23}{3} \right)^2 \approx 0{,}037.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \(S\approx\sqrt{0{,}037} \).

Câu 13:

Điều tra chi phí thuê nhà ở hằng tháng của một số nhân viên độc thân, công ty \(X\) thu được số liệu dưới đây:

Image

Tính trung bình và độ lệch chuẩn chi phí thuê nhà hằng tháng của những nhân viên được điều tra.

Bổ sung thêm các giá trị đại diện, ta có bảng sau

Image

Từ mẫu số liệu đã cho, ta tính được số trung bình là

\(\overline{x}=\displaystyle\frac{4{,}5\cdot 64 + 7{,}5\cdot 40 + 11{,}5\cdot 84 + 13{,}5 \cdot 56 + 16{,}5\cdot 16}{64+40+84+56+16}=9{,}9.\)

Và trung bình cộng của các bình phương số liệu thống kê là

\(\overline{x^2}=\displaystyle\frac{4{,}5^2\cdot 64 + 7{,}5^2\cdot 40 + 11{,}5^2\cdot 84 + 13{,}5^2 \cdot 56 + 16{,}5^2\cdot 16}{64+40+84+56+16}=\displaystyle\frac{29217}{260}.\)

Từ đó ta có độ lệch chuẩn chi phí thuê nhà hàng tháng của những nhân viên được điều tra là

\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}\approx 14{,}36.\)

Câu 14:

Một nhóm \(20\) học sinh dùng một thiết bị đo đường kính của một nhân tế bào cho kết quả như sau:

Image

a) Tính số trung bình và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.

b) Số trung bình và độ lệch chuẩn cho biết thông tin gì?

a) Ta có

Image

Số đo trung bình

\(\overline{x}=\displaystyle\frac{1}{20}(3\cdot4{,}75+8\cdot5{,}25+7\cdot5{,}75+2\cdot6{,}25)=5{,}45.\)

Độ lệ chuẩn

\(s=\sqrt{\displaystyle\frac{1}{20}\left(3\cdot4{,}75^2+8\cdot5{,}25^2+7\cdot5{,}75^2+2\cdot6{,}25^2\right)-5{,}45^2}=0{,}43012.\)

b) Số trung bình và độ lệch chuẩn cho biết sự chênh lệch về giá trị đo của từng thời điểm đánh giá so với giá trị trung bình.

Câu 15:

Thành tích môn nhảy cao của các vận động viên tại một giải điền kinh dành cho học sinh trung học phổ thông như sau

Image

a) Tính các số đặc trưng đo mức độ phân tán của mẫu số liệu ghép nhóm trên.

b) Độ phân tán của mẫu số liệu cho biết điều gì?

Image

a) Giá trị trung bình của mẫu số liệu trên là

\(\overline{x}=\displaystyle\frac{1}{20}\cdot(3\cdot171+10\cdot 173+6\cdot 175+1\cdot 179)=173{,}6\).

Độ lệch chuẩn của mẫu số liệu trên là

\(s=\sqrt{\displaystyle\frac{1}{20}\cdot(3\cdot171^{2}+10\cdot 173^{2}+6\cdot 175^{2}+1\cdot 179^{2})-173{,}6^{2}}=1{,}8\).

Độ phân tán \( CV=\displaystyle\frac{s}{\overline{x}}=\displaystyle\frac{1{,}8}{173{,}6}=0{,}0104 \).

b) Độ phân tán của mẫu số liệu nhỏ cho biết các vận động viên tham gia nhảy cao là đồng đều.

Câu 16:

Thời gian chạy tập luyện cự li \(100 \mathrm{~m}\) của hai vận động viên được cho trong bảng sau:

Image

Dựa trên độ lệch chuẩn của các mẫu số liệu ghép nhóm, hãy cho biết vận động viên nào có thành tích luyện tập ổn định hơn.

Ta có

Image

Thời gian chạy trung bình củ vận động viên \(A\)\(\overline{x}_A=\displaystyle\frac{1}{20}(2\cdot10{,}15+10\cdot10,45+5\cdot10{,}75+3\cdot11{,}05)=10{,}585\)

Độ lệch chuẩn của vận động viên \(A\). \(s_A=\sqrt{\displaystyle\frac{1}{20}\left(2\cdot10{,}15^2+10\cdot10{,}45^2+5\cdot10{,}75^2+3\cdot11{,}05^2\right)-10{,}585^2}=0{,}25937.\)

Thời gian chạy trung bình củ vận động viên \(B\)\(\overline{x}_A=\displaystyle\frac{1}{25}(3\cdot10{,}15+7\cdot10{,}45+9\cdot10{,}75+6\cdot11{,}05)=10{,}666.\)

Độ lệch chuẩn của vận động viên \(B\). \(s_A=\sqrt{\displaystyle\frac{1}{25}\left(3\cdot10{,}15^2+7\cdot10{,}45^2+9\cdot10{,}75^2+6\cdot11{,}05^2\right)-10{,}666^2}=0{,}288.\)

Vậy độ viên \(B\) có thành tích ổn định hơn.

Câu 17:

Hai bảng dưới đây biểu diễn kết quả đo đường kính (tính theo mm) của một số ổ bi được sản xuất bởi các máy \(X\)\(Y\).

Image

a) Ước tính giá trị trung bình và độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi mỗi máy.

b) Biết rằng đường kính mong muốn cho các ổ bi là \(30{,}4\) mm. Hãy phân tích chất lượng sản phẩm do mỗi máy sản xuất.

Image

a) Ước tính giá trị trung bình và độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi mỗi máy.

Kích thước của hai mẫu số liệu đều là \(N= 60\).

Image

Đường kính trung bình của các ổ bi được sản xuất bởi nhà máy X là \(\overline{x}_X= \displaystyle\frac{28{,} 5 \cdot 2 + 29{,}5 \cdot 23 + 30{,} 5 \cdot 25 + 31{,} 5 \cdot 7 + 32{,} 5 \cdot 3 }{60} \approx 30{,} 27 \text{ mm}.\)

Độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi nhà máy \(X\)\(s_X=\sqrt{\displaystyle\frac{28{,} 5^2 \cdot 2 + 29{,}5^2 \cdot 23 + 30{,} 5^2 \cdot 25 + 31{,} 5^2 \cdot 7 + 32{,} 5^2 \cdot 3 }{60} - \left(\overline{x}_X\right)^2 }\approx 0{,} 88 \text{ mm}.\)

Image

Đường kính trung bình của các ổ bi được sản xuất bởi nhà máy Y là \(\overline{x}_Y= \displaystyle\frac{28{,} 5 \cdot 9 + 29{,}5 \cdot 8 + 30{,} 5 \cdot 20+ 31{,} 5 \cdot 17 + 32{,} 5 \cdot 6 }{60} \approx 30{,} 55 \text{ mm}.\)

Độ lệch chuẩn của đường kính các ổ bi được sản xuất bởi nhà máy \(Y\)\(s_Y=\sqrt{ \displaystyle\frac{28{,} 5 ^2\cdot 9 + 29{,}5^2 \cdot 8 + 30{,} 5^2 \cdot 20+ 31{,} 5^2 \cdot 17 + 32{,} 5^2 \cdot 6 }{60} - \left(\overline{x}_Y\right)^2}\approx 1{,} 19 \text{ mm}.\)

b) Ta có \(\left|\overline{x}_X - 30{,}4 \right| \approx 0{,} 13\)\(\left|\overline{x}_Y- 30{,} 4 \right| \approx 0{,} 15. \)

Suy ra đường kính trung bình của \(60\) ổ bi do nhà máy \(X\) sản xuất gần với đường kính mong muốn là \(30{,} 4\) mm hơn so với nhà máy B.

Đồng thời do \(s_{X} < s_Y\) nên đường kính của mỗi ổ bi do nhà máy \(X\) sản xuất ít phân tán hơn so với nhà máy \(Y\).

Vì vậy, chất lượng sản phẩm do nhà máy \(X\) tốt hơn so với nhà máy \(Y\).

Câu 18:

Hai bảng dưới đây trình bày kết quả thống kê lượng cà phê (tính theo cm\(^3\)) được pha chế trong mỗi cốc do hai máy bán cà phê tự động \(A\), \(B\) thực hiện trong một ngày.

Image

a) Ước tính giá trị trung bình và độ lệch chuẩn của lượng cà phê trong những cốc được pha chế bởi mỗi máy.

b) Giả sử lượng cà phê mong muốn trong mỗi cốc là \(250\) cm\(^3\). Nếu định kinh doanh cà phê bằng hình thức bán hàng tự động thì anh Hùng nên chọn mua loại máy nào?

a) Ước tính giá trị trung bình và độ lệch chuẩn của lượng cà phê trong những cốc được pha chế bởi mỗi máy.

Kích thước của hai mẫu số liệu đều là \(N=50\).

Image

Giá trị trung bình của hàm lượng cà phê trong mỗi cốc do nhà máy \(A\) sản xuất là

\(\overline{x}_A = \displaystyle\frac{ 244 \cdot 6 + 248 \cdot 5 + 252 \cdot 28 + 256 \cdot 7 + 260 \cdot 4}{50} = 251{,}84.\)

Độ lệch chuẩn của hàm lượng cà phê trong mỗi cốc do nhà máy \(A\) sản xuất là

\(\overline{s}_A=\sqrt{ \displaystyle\frac{ 244^2 \cdot 6 + 248^2 \cdot 5 + 252^2 \cdot 28 + 256^2 \cdot 7 + 260^2\cdot4}{50}-251{,}84^2}\approx 4{,}08.\)

Image

Giá trị trung bình của hàm lượng cà phê trong mỗi cốc do nhà máy \(B\) sản xuất là

\(\overline{x}_B= \displaystyle\frac{ 244 \cdot 5 + 248 \cdot 8 + 252 \cdot 17 + 256 \cdot 14 + 260 \cdot 6}{ 50}= 252{,} 64.\)

Độ lệch chuẩn của hàm lượng cà phê trong mỗi cốc do nhà máy \(B\) sản xuất là

\(\overline{s}_B=\sqrt{\displaystyle\frac{ 244^2 \cdot 5 + 248^2 \cdot 8 + 252^2 \cdot 17 + 256^2 \cdot 14 + 260^2 \cdot 6}{50}-252{,}64^2}\approx 4{,}55.\)

b) Ta có \(\left|\overline{x}_A- 250 \right| =1{,} 84\)\(\left|\overline{x}_B- 250 \right| =2{,} 64\).

Suy ra hàm lượng cà phê trung bình trong mỗi cốc do nhà máy \(A\) sản xuất gần với lượng cà phê mong muốn (là \(250\) cm\(^3\)) hơn.

Đồng thời, do \(s_A < s_B\) nên hàm lượng cà phê trong mỗi cốc do nhà máy \(A\) sản xuất ít phân tán hơn so với nhà máy B.

Vậy nếu định kinh doanh cà phê bằng hình thức bán hàng tự động thì anh Hùng nên chọn mua loại máy \(A\).

Câu 19:

Một công ty giống cây trồng đã thử nghiệm hai phương pháp chăm sóc khác nhau cho cây hướng dương. Sau hai tuần, người ta thấy cây được chăm sóc theo cả hai phương pháp đều thấp hơn \(50\) cm.

ImageImage

a) Ước tính số trung bình và độ lệch chuẩn của chiều cao các cây được chăm sóc theo mỗi phương pháp.

b) So sánh hiệu quả của các phương pháp trên hai phương diện

+) Chiều cao trung bình của cây.

+) Sự đồng đều về chiều cao của cây.

a) Ước tính số trung bình và độ lệch chuẩn của chiều cao các cây được chăm sóc theo mỗi phương pháp.

Cỡ mẫu của hai mẫu số liệu thống kê là \(N= 40\).

Ta có bảng tần số ghép nhóm về chiều cao của cây được chăm sóc theo phương pháp A như sau:

Image

Chiều cao trung bình của các cây được chăm sóc theo phương án \(A\)\(\overline{x}_A= \displaystyle\frac{5 \cdot 6 + 15 \cdot 8 + 25 \cdot 12 + 35 \cdot 8 + 45 \cdot 6}{40}=25.\)

Độ lệch chuẩn của chiều cao các cây được chăm sóc theo phương án \(A\)\(s_A =\sqrt{\displaystyle\frac{5^2 \cdot 6 + 15^2 \cdot 8 + 25^2 \cdot 12 + 35^2 \cdot 8 + 45 ^2 \cdot 6}{40} - 25^2}\approx 12{,} 65.\)

Ta có bảng tần số ghép nhóm về chiều cao của cây được chăm sóc theo phương pháp A như sau:

Image

Chiều cao trung bình của các cây được chăm sóc theo phương án \(B\)\(\overline{x}_B= \displaystyle\frac{5 \cdot 13 + 15 \cdot 6 + 25 \cdot 2 + 35 \cdot 6 + 45 \cdot 13}{40}=25 \text{ cm}.\)

Độ lệch chuẩn của chiều cao các cây được chăm sóc theo phương án \(B\)\(s_B =\sqrt{\displaystyle\frac{5^2 \cdot 13 + 15^2 \cdot 6 + 25^2 \cdot 2 + 35^2 \cdot 6+ 45 ^2 \cdot 13}{40} - 25^2}\approx 17{,} 03 \text{ cm}.\)

b) So sánh hiệu quả của các phương pháp

Dựa trên chiều cao trung bình, ta thấy dù có dùng phương pháp nào thì các loại cây đều có chiều cao trung bình giống nhau là \(25\) cm.

Dựa trên sự đồng đều về chiều cao: do \(s_A< s_B\) nên chiều cao của các loại cây được chăm sóc theo phương án \(A\) ít bị chênh lệch hơn so với phương án \(B\).

Câu 20:

Trong \(30\) ngày, một nhà đầu tư đã theo dõi giá cổ phiếu của hai công ty G và H vào phiên mở cửa mỗi ngày. Thông tin được ghi lại ở hai bảng dưới đây:

Image

Giá cổ phiếu của công ty nào ít biến động hơn (làm tròn kết quả đến hàng phần trăm)?

Công ty G:

Bổ sung thêm các giá trị đại diện, ta có bảng sau

Image

Giá trị trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{51\cdot 3 + 53\cdot 7 + 55 \cdot 9 + 57 \cdot 8 + 59 \cdot 3}{30}\approx 55{,}1.\)

Trung bình cộng của các bình phương số liệu thống kê là

\(\overline{x^2}=\displaystyle\frac{51^2\cdot 3 + 53^2\cdot 7 + 55^2 \cdot 9 + 57^2 \cdot 8 + 59^2 \cdot 3}{30}\approx 3037{,}5.\)

Từ đó ta có độ lệch chuẩn của mấu số liệu là

\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}= 5{,}2.\)

Công ty H

Bổ sung thêm các giá trị đại diện, ta có bảng sau

Image

Giá trị trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{41\cdot 6 + 43\cdot 7 + 45 \cdot 5 + 47 \cdot 7 + 49 \cdot 5}{30}\approx 44{,}9.\)

Trung bình cộng của các bình phương số liệu thống kê là

\(\overline{x^2}=\displaystyle\frac{41^2\cdot 6 + 43^2\cdot 7 + 45^2 \cdot 5 + 47^2 \cdot 7 + 49^2 \cdot 5}{30}\approx 2020{,}7.\)

Từ đó ta có độ lệch chuẩn của mấu số liệu là

\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}= 7{,}7.\)

Từ kết quả trên, ta thấy công ty G có giá cổ phiếu ít biến động hơn.

Câu 21:

Trong bài thực hành đo hiệu điện thế của mạch điện, An và Bình đã dùng hai vôn kế khác nhau để đo, mỗi bạn tiến hành đo \( 10 \) lần cho kết quả như sau

Image

Tính độ lệch chuẩn của các mẫu số liệu ghép nhóm cho kết quả đo của An và Bình.

Từ đó kết luận xem vôn kế của bạn nào cho kết quả ổn định hơn.

Kết quả của An đo

Image

Kết quả của Bình đo

Image

Gọi \(\overline{x}_{A} \)\( \overline{x}_{B} \) lần lượt là giá trị trung bình của An và Bình.

a) \(\overline{x}_{A}=\displaystyle\frac{1}{10}\cdot(1\cdot 3{,}875+6\cdot3{,}925+2\cdot 3{,}975+1\cdot 4{,}025)=3{,}94\).

\(\overline{x}_{B}=\displaystyle\frac{1}{10}\cdot(1\cdot 3{,}875+3\cdot3{,}925+4\cdot 3{,}975+2\cdot 4{,}025)=3{,}96 \).

b) Gọi \( s_{A} \)\( s_{B} \) lần lượt là độ lệch chuẩn của An và Bình.

\(s_{A}=\sqrt{\displaystyle\frac{1}{10}\cdot(1\cdot 3{,}875^{2}+6\cdot 3{,}925^{2}+2\cdot 3{,}975^{2}+1\cdot 4{,}025^{2})-3{}94^{2}}=0{,}04 \).

\(s_{B}=\sqrt{\displaystyle\frac{1}{10}\cdot(1\cdot 3{,}875^{2}+3\cdot 3{,}925^{2}+4\cdot 3{,}975^{2}+2\cdot 4{,}025^{2})-3{,}96^{2}}=0{,}334 \).

c) Vôn-kế của An cho độ lệch chuẩn nhỏ hơn nên ổn định hơn.

Câu 22:

Để đánh giá chất lượng một lọa pin điện thoại mới, người ta ghi lại thời gian nghe nhạc liên tục của điện thoại được sạc đầy pin cho đến khi hết pin cho kết quả sau

Image

Tính khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.

Khoảng biến thiên là \( R=7{,}5-5=2{,}5 \).

Ta có cỡ mẫu \( n=40 \).

Giá trị \( x_{10} \), \( x_{11} \) thuộc nhóm \( [5{,}5;6) \)\( [6;6{,}5) \) nên tứ phân vị thứ nhất \(Q_1=6\).

Giá trị \( x_{30} \), \( x_{31} \) thuộc nhóm \( [6{,}5;7) \) nên nhóm \( [6{,}5;7) \) chứa trung vị thứ ba.

\begin{eqnarray*}Q_{3}&=&a_{p}+ \displaystyle\frac{\displaystyle\frac{r\cdot n}{4}-\left(m_{1}+\dots+m_{p-1}\right)}{m_{p}}\cdot \left(a_{p+1}-a_{p}\right)\\ &=&6{,}5 +\displaystyle\frac{\displaystyle\frac{3\cdot 40}{4}-(2+8+15)}{10}\cdot (7-6{,}5)\\ &=&6{,}75.\end{eqnarray*}

Khoảng tứ phân vị \( \Delta_{Q}=Q_{3}-Q_{1}=6{,}25 \).

Image

Số trung bình của mẫu số liệu

\(\overline{x}=\displaystyle\frac{m_{1}\cdot x_{1}+\dots+m_{k}\cdot x_{k}}{n}=\displaystyle\frac{2\cdot5{,}25+8\cdot 5{,}75+15\cdot 6{,}25+10\cdot 6{,}75+5\cdot7{,}25}{40}=6{,}35 \).

Phương sai của mẫu số liệu ghép nhóm

\( s^{2}=\displaystyle\frac{1}{40}\cdot\left(2\cdot 5{,}25^{2}+8\cdot 5{,}75^{2}+15\cdot 6{,}25^{2}+10\cdot 6{,}75^{2}+5\cdot 7{,}25^{2}\right)-6{,}35^{2}=0{,}2775 \).

Độ lệch chuẩn của mẫu số liệu ghép nhóm \(s=\sqrt{s^{2}}=\sqrt{0{,}2775}\approx 0{,}5268\).

Câu 23:

Người ta ghi lại tiền lãi (đơn vị: triệu đồng) của một số nhà đầu tư (với số tiền đầu tư như nhau), khi đầu tư vào hai lĩnh vực \( A \), \( B \) cho kết quả như sau

Image

a) Về trung bình, đầu tư vào lĩnh vực nào đem lại tiền lãi cao hơn?

b) Tính độ lệch chuẩn cho các mẫu số liệu về tiền lãi của các nhà đầu tư ở hai lĩnh vực này và giải thích ý nghĩa của các số thu được.

Lĩnh vực \(A\)

Image

Lĩnh vực \(B\)

Image

a) Giá trị trung bình của hai lĩnh vực A và B là

\( \overline{x}_{A}=\displaystyle\frac{1}{25}\cdot (2\cdot7{,}5+5\cdot12{,}5+8\cdot17{,}5+6\cdot22{,}5+4\cdot27{,}5)=18{,}5 \) (triệu đồng).

\( \overline{x}_{B}=\displaystyle\frac{1}{25}\cdot (8\cdot7{,}5+4\cdot12{,}5+2\cdot17{,}5+5\cdot22{,}5+6\cdot27{,}5)=16{,}9 \) (triệu đồng).

Về độ trung bình đầu tư vào lĩnh vực \(A\) lãi hơn lĩnh vực \(B\).

b) Độ lệch chuẩn của hai lĩnh vực \(A\)\(B\)

\( s_{A}=\sqrt{\displaystyle\frac{1}{25}\cdot (2\cdot7{,}5^{2}+5\cdot12{,}5^{2}+8\cdot17{,}5^{2}+6\cdot22{,}5^{2}+4\cdot27{,}5^{2})-18{,}5^{2}}=5{,}8 \).

\( s_{B}=\sqrt{\displaystyle\frac{1}{25}\cdot (8\cdot7{,}5^{2}+4\cdot12{,}5^{2}+2\cdot17{,}5^{2}+5\cdot22{,}5^{2}+6\cdot27{,}5^{2})-16{,}9^{2}}=8{,}04 \).

Như vậy độ lệch chuẩn của mẫu số liệu thu tiền được hàng tháng khi đầu tư vào lĩnh vực \(B\) cao hơn lĩnh vực \(A\) nên đầu tư vào lĩnh vực \(B\) rủi ro hơn.

Câu 24:

Người ta theo dõi sự thay đổi cân nặng, được tính bằng hiệu cân nặng trước và sau ba tháng áp dụng chế độ ăn kiêng của một số người cho kết quả như sau:

Image

Tính số trung bình, phương sai, độ lệch chuẩn và nhận xét về sự thay đổi cân nặng của người nam, người nữ sau ba tháng áp dụng chế độ ăn kiêng.

Chọn giá trị đại diện cho các nhóm số liệu, ta có

Image

Tổng số người nam là \(n_1=2+3+5+3+2=15\).

Tổng số người nữ là \(n_2=2+7+12+7+2=30\).

Thay đổi cân nặng trung bình của người nam là:

\(\overline{x}_1=\frac{1}{15}[2 \cdot(-0{,}5)+3 \cdot 0{,}5+5 \cdot 1{,}5+3 \cdot 2{,}5+2 \cdot 3{,}5]=1{,}5~(\mathrm{kg}).\)

Thay đổi cân nặng trung bình của người nữ là:

\(\overline{x}_2=\displaystyle\frac{1}{30}[2 \cdot(-0{,}5)+7 \cdot 0{,}5+12 \cdot 1{,}5+7 \cdot 2{,}5+2 \cdot 3{,}5]=1{,}5~(\mathrm{kg}).\)

Phương sai và độ lệch chuẩn của mẫu số liệu về thay đổi cân nặng của người nam là

\(s_1^2=\displaystyle\frac{1}{15}\left[2 \cdot(-0{,}5)^2+3 \cdot 0{,}5^2+5 \cdot 1{,}5^2+3 \cdot 2{,}5^2+2 \cdot 3{,}5^2\right]-1{,}5^2 \approx 1{,}21^2; s_1 \approx 1{,}21.\)

Phương sai và độ lệch chuẩn của mẫu số liệu về thay đổi cân nặng của người nữ là

\(s_2^2=\displaystyle\frac{1}{30}\left[2 \cdot(-0{,}5)^2+7 \cdot 0{,}5^2+12 \cdot 1{,}5^2+7 \cdot 2{,}5^2+2 \cdot 3{,}5^2\right]-1{,}5^2 \approx 2{,}06^2; s_2 \approx 2{,}06.\)

Như vậy, sau ba tháng áp dụng chế độ ăn kiêng này, về trung bình sự thay đổi cân nặng của nam và nữ là như nhau. Tuy nhiên, sự biến động về thay đổi cân nặng của nữ nhiều hơn so với của nam.

Câu 25:

Thống kê lợi nhuận hàng tháng (đơn vị: triệu đồng) trong \(20\) tháng của hai nhà đầu tư được cho như sau:

Image

Tính độ lệch chuẩn của hai mẫu số liệu ghép nhóm trên. Có nên dựa vào độ lệch chuẩn để so sánh độ rủi ro của hai nhà đầu tư này không?

Chọn điểm đại diện cho các nhóm số liệu ta tính được các số đặc trưng như sau

Lợi nhuận trung bình một tháng của các nhà đầu tư tương ứng là

\(\bar{x}_A=\displaystyle\frac{1}{20}(2 \cdot 15+\ldots+2 \cdot 55)=35\) (triệu đồng);

\(\bar{x}_B=\displaystyle\frac{1}{20}(4 \cdot 515+\ldots+4 \cdot 555)=535\) (triệu đồng).

Độ lệch chuẩn của lợi nhuận hàng tháng của hai nhà đầu tư tương ứng là

\(s_A=\sqrt{\displaystyle\frac 1{20}\left(2\cdot 15^2+\ldots+2\cdot 55^2\right)-(35)^2}\approx 10{,}95;\)

\(s_B=\sqrt{\displaystyle\frac 1{20}\left(4\cdot 515^2+\ldots+4\cdot 555^2\right)-(535)^2}\approx 13{,}78.\)

Độ lệch chuẩn cho lợi nhuận hàng tháng của nhà đầu tư lớn cao hơn của nhà đầu tư nhỏ. Lợi nhuận trung bình của hai nhà đầu tư khác nhau rất nhiều, do đó ta không nên dùng độ lệch chuẩn để so sánh mức độ rủi ro của hai nhà đầu tư này.

Câu 26:

Kiểm tra khối lượng của \(30\) bao xi măng (đơn vị: kg) được chọn ngẫu nhiên trước khi xuất xưởng cho kết quả như sau:

Image

a) Thay dấu \(?\) bằng số thích hợp để hoàn thiện mẫu số liệu ghép nhóm sau.

Image

b) Tính phương sai và độ lệch chuẩn của mẫu số liệu gốc và mẫu số liệu ghép nhóm. Giá trị nào là giá trị chính xác? Giá trị nào là giá trị xấp xỉ?

a) Mẫu số liệu hoàn thiện

Image

b) Phương sai và độ lệch chuẩn của mẫu số liệu gốc.

Khối lượng trung bình của \(30\) bao xi măng là

\(\overline{x}=\displaystyle\frac{48{,}6+...+51{,}4}{30}=\displaystyle\frac{1504{,}3}{30}=50{,}1433.\)

Phương sai \(s_x^2=\displaystyle\frac{1}{30}\)\(\left[(48{,}6-50{,}1433)^2+...+(51{,}4-50{,}1433)^2\right]=0{,}871789\).

Độ lệch chuẩn \(s_x=\sqrt{s_x^2}=\sqrt{0{,}871789}=0{,}933696\).

Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm.

Image

Khối lượng trung bình của \(30\) bao xi măng là

\(\overline{x}=\displaystyle\frac{6\cdot48{,}75+2\cdot49{,}25+4\cdot49{,}75+4\cdot20{,}25+6\cdot50{,}75+8\cdot51{,}25}{30}=50{,}18.\)

Phương sai

\(s^2=\displaystyle\frac{1}{30}\left(6\cdot48{,}75^2+2\cdot49{,}25^2+4\cdot49{,}75^2+4\cdot20{,}25^2+6\cdot50{,}75^2+8\cdot51{,}25^2\right)-50{,}18^2=1{,}197.\)

Độ lệch chuẩn \(s_x=\sqrt{s_x^2}=\sqrt{1{,}197}=1{,}094\).

Phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm là các xấp xỉ cho phương sai, độ lệch chuẩn của mẫu số liệu gốc.

Câu 27:

Tuổi thọ của một số linh kiện điện tử (đơn vị: năm) được sản xuất bởi hai phân xưởng được cho như sau:

Image

Tính phương sai và độ lệch chuẩn của mỗi mẫu số liệu ghép nhóm và nhận xét về độ phân tán của tuổi thọ các linh kiện điện tử được sản xuất bởi mỗi phân xưởng.

Phương sai và độ lệch chuẩn của của số linh kiện ở phân xưởng \(1\).

Image

Tuổi thọ trung bình của \(40\) linh kiện là

\(\overline{x}_1=\displaystyle\frac{1}{40}(4\cdot 1{,}75+9\cdot 2{,}25+13\cdot 2{,}75+8\cdot 3{,}25+6\cdot 3{,}75)=2{,}7875.\)

Phương sai và độ lệch chuẩn của nhóm linh kiện ở phân xưởng \(1\)

\(s_1^2=\displaystyle\frac{1}{40}\left(4\cdot 1{,}75^2+9\cdot 2{,}25^2+13\cdot 2{,}75^2+8\cdot 3{,}25^2+6\cdot 3{,}75^2\right)-2{,}7875=0{,}35484. \)

Suy ra \(s_1=\sqrt{0{,}35484}=0{,}59569.\)

Phương sai và độ lệch chuẩn của của số linh kiện ở phân xưởng \(2\).

Image

Tuổi thọ trung bình của \(40\) linh kiện là

\(\overline{x}_2=\displaystyle\frac{1}{40}(2\cdot 1{,}75+8\cdot 2{,}25+20\cdot 2{,}75+7\cdot 3{,}25+3\cdot 3{,}75)=2{,}7625.\)

Phương sai và độ lệch chuẩn của nhóm linh kiện ở phân xưởng \(2\)

\(s_2^2=\displaystyle\frac{1}{40}\left(2\cdot 1{,}75^2+8\cdot 2{,}25^2+20\cdot 2{,}75^2+7\cdot 3,25^2+3\cdot 3{,}75^2\right)-2{,}7625^2=0{,}2186. \)

Suy ra \(s_2=\sqrt{0{,}2186}=0{,}4675.\)

Câu 28:

Bạn Mai dự định đăng kí xét tuyển vào đại học các ngành khối \(A00\) (thi Toán, Vật lí, Hoá học) và \(A01\) (thi Toán, Vật lí, Tiếng Anh). Bạn tìm hiểu điểm chuẩn năm trước của một số trường đóng trên những địa bàn không quá xa nơi gia đình mình sinh sống. Thông tin bạn thu được là

Image

a) Lập mẫu số liệu ghép nhóm cho hai mẫu số liệu bạn Mai thu thập được, với độ dài các nhóm ghép là \(1\) và nhóm đầu tiên là \([19; 20)\).

b) Những trường mà bạn Mai tìm hiểu có điểm chuẩn khối nào ổn định hơn?

a) Mẫu số liệu ghép nhóm của

Khối \(A00\)

Image

Khối \(A01\)

Image

b) Độ lệch chuẩn của các khối

Khối \(A00\)

Giá trị trung bình của số liệu

\(\overline{x}=\displaystyle\frac{19{,}5\cdot 2 + 20{,}5 \cdot 5 + 21{,}5 \cdot 8 + 22{,}5 \cdot 3 + 23{,}5\cdot 2}{20}=21{,}4.\)

Trung bình cộng của các bình phương số liệu thống kê là

\(\overline{x^2}=\displaystyle\frac{19{,}5^2\cdot 2 + 20{,}5^2 \cdot 5 + 21{,}5^2 \cdot 8 + 22{,}5^2 \cdot 3 + 23{,}5^2\cdot 2}{20}=459{,}15.\)

Từ đó ta có độ lệch chuẩn của mấu số liệu là

\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}= 1{,}19.\)

Khối \(A01\)

Giá trị trung bình của số liệu

\(\overline{x}=\displaystyle\frac{19{,}5\cdot 4 + 20{,}5 \cdot 3 + 21{,}5 \cdot 5 + 22{,}5 \cdot 5 + 23{,}5\cdot 3}{20}=21{,}5.\)

Trung bình cộng của các bình phương số liệu thống kê là

\(\overline{x^2}=\displaystyle\frac{19{,}5^2\cdot 4 + 20{,}5^2 \cdot 3 + 21{,}5^2 \cdot 5 + 22{,}5^2 \cdot 5 + 23{,}5^2\cdot 3}{20}=464{,}05.\)

Từ đó ta có độ lệch chuẩn của mấu số liệu là

\(s=\sqrt{\overline{x^2}-\left(\overline{x}\right)^2}= 1{,}8.\)

Từ kết quả trên, ta thấy điểm chuẩn khối \(A00\) ổn định hơn khối \(A01\).

Câu 29:

Chiều cao của \(500\) học sinh của một trường trung học cơ sở được thống kê bởi bảng dưới đây

Image

a) Tính khoảng tứ phân vị, trung bình và độ lệch chuẩn chiều cao của \(500\) học sinh.

b) Kết quả tìm được cho biết điều gì về chiều cao của \(500\) học sinh này?

Ta có cỡ mẫu \(N= 25+ 50+ 200+ 175 + 50=500\).

Image

a) Ta có \(\displaystyle\frac{N}{4}= 125\).

Suy ra nhóm chứa \(Q_1\)\([158; 162)\).

Khi đó \(Q_1 = 158 + \displaystyle\frac{125- 75}{200} \cdot 4= 159.\)

\(\displaystyle\frac{3N }{4 }= 475\).

Suy ra nhóm chứa \(Q_3\)\([166; 170)\).

Khi đó \(Q_3= 166 +\displaystyle\frac{475-450}{50} \cdot 4=168\).

Vậy khoảng tứ phân vị của mẫu số liệu là \(\Delta _Q= Q_3 - Q_1=9\).

Image

Chiều cao trung bình của học sinh là \(\overline{x}= \displaystyle\frac{152 \cdot 25 + 156 \cdot 50 + 160 \cdot 200 + 164 \cdot 175 + 168 \cdot 50}{500}= 161{,} 4 \text{ cm}.\)

Phương sai \(s^2 =\displaystyle\frac{1}{500} \left(152^2 \cdot 25 + 156^2 \cdot 50 + 160 ^2\cdot 200 + 164^2 \cdot 175 + 168 ^2\cdot 50 \right) - \left(161{,} 4 \right)^2=14{,} 84 \text{ cm}^2.\)

Độ lệch chuẩn: \(s=\sqrt{14{,} 84} \approx 3{,} 85 \) cm.

b) Ý nghĩa của các số liệu vừa tính được.

Do \(Q_1= 159\), \(Q_3 = 168\)\(\Delta_Q= 9\) nên ta thấy có \(125\) học sinh có chiều cao trung bình không vượt quá \(159\) cm và có \(125\) học sinh có chiều cao trung bình ít nhất đạt \(168\) cm. Đồng thời \(250\) học sinh còn lại có chiều cao trung bình đạt từ \(159\) cm đến \(168\) cm và như vậy, chiều cao của \(250 \) học sinh này có thể chênh lệch nhau \(9\) cm.\\

Dựa vào các kết quả của chiều cao trung bình và độ lệch chuẩn, ta thấy chiều cao trung bình của \(500\) học sinh là \(161{,} 4\) cm và so với con số này thì chiều cao của mỗi học sinh chênh lệch trung bình khoảng \(3{,} 85\) cm.

Câu 30:

Điều tra thời gian phải làm thêm trung bình hằng tuần của các bác sĩ ở một bệnh viện, người ta thu được số liệu sau:

Image

a) Chuyển mẫu số liệu đã cho về mẫu số liệu ghép nhóm với độ dài các nhóm ghép bằng 2 và nhóm đầu tiên là \([5;7)\).

b) Tính số trung bình, phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm lập ở câu a (làm tròn kết quả đến hàng phần trăm).

c) So sánh và nêu ý nghĩa các kết quả tìm được ở câu b với các kết quả tương ứng của mẫu số liệu gốc.

a) Căn cứ vào giá trị nhỏ nhất và giá trị lớn nhất của mẫu số liệu, ta thấy khoảng biến thiên là \(R=9\) nên nếu muốn mỗi nhóm có độ dài bằng 2 và nhóm đầu tiên là \([5 ; 7)\) thì phải chia số liệu thành 5 nhóm, với 4 nhóm ghép tiếp theo là \([7 ; 9)\), \([9 ; 11)\), \([11 ; 13)\), \([13 ; 15)\). Đếm số lần xuất hiện các giá trị trong mỗi nhóm, ta lập được bảng sau:

Image

b) Bổ sung thêm giá trị đại diện của mỗi nhóm vào bảng lập ở trên, ta có

Image

\(\overline{x}_{N}=\displaystyle\frac{2\cdot6+4\cdot8+9\cdot10+6\cdot12+4\cdot14}{25}=\displaystyle\frac{262}{25}=10{,}48\) (giờ).

Suy ra phương sai \(s_{N}^{2}\) của mẫu số liệu ghép nhóm là:

\begin{eqnarray*}s_{N}^{2} & =&\displaystyle\frac{2(6-10{,}48)^{2}+4(8-10{,}48)^{2}+9(10-10{,}48)^{2}+6(12-10{,}48)^{2}+4(14-10{,}48)^{2}}{25} \\ & =&\frac{130{,}24}{25}=5{,}2096 \approx 5{,}21.\end{eqnarray*}

Độ lệch chuẩn \(s_{N}\) của mẫu số liệu ghép nhóm là \(s_{N}=\sqrt{s_{N}^{2}} \approx 2{,}28\).

c) Gọi \(\overline{x}_{G}\), \(s_{G}^{2}\), \(s_{G}\) tương ứng là trung bình, phương sai, độ lệch chuẩn của mẫu số liệu gốc. Để tính giá trị của các số đặc trưng này, ta lập bảng tần số:

Image

Sử dụng các công thức tính trung bình, phương sai, độ lệch chuẩn của mẫu số liệu không ghép nhóm, ta có:

\(\overline{x}_{G}=\frac{5+6+7+3\cdot8+5\cdot9+4\cdot10+3\cdot11+3\cdot12+2\cdot13+2\cdot14}{25}=10.\)

Phương sai:

\begin{eqnarray*}s_{G}^{2} & =&\frac{1(5-10)^{2}+1(6-10)^{2}+1(7-10)^{2}+\ldots+3(12-10)^{2}+2(13-10)^{2}+2(14-10)^{2}}{25} \\ & =&\frac{132}{25}=5{,}28\end{eqnarray*}

Độ lệch chuẩn: \(s_{G}=\sqrt{s_{G}^{2}}=\sqrt{5{,}28} \approx 2{,}30\).

Quan sát kết quả tìm được ở hai câu \(b\)\(c\), ta thấy \(\overline{x}_{N} \approx \overline{x}_{G}\); \(s_{N}^{2} \approx s_{G}^{2}\); \(s_{N} \approx s_{G}\).

Như vậy số trung bình, phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm tương ứng xấp xỉ với số trung bình, phương sai, độ lệch chuẩn của mẫu số liệu ban đầu, khi chưa ghép nhóm. Nếu chỉ có mẫu số liệu ghép nhóm thì ta có thể kết luận là thời gian làm thêm trung bình hằng tuần của \(25\) bác sĩ được điều tra là \(10{,}48\) giờ và so với số này thì thời gian làm thêm của các bác sĩ chênh lệch trung bình khoảng \(2{,}28\) giờ.

Câu 31:

Điều tra một số hộ gia đình thu nhập ở mức trung bình sinh sống trên hai địa bàn \(A\), \(B\), người ta thấy diện tích nhà ở của họ đều nhỏ hơn \(100\) m\(^2\). Hai biểu đồ dưới biểu diễn kết quả thống kê. Số liệu về diện tích nhà ở của cư dân thuộc địa bàn nào phân tán hơn?

ImageImage

Ta có bảng tần số tích luỹ như sau:

Image

Ta có \(N=100; \displaystyle\frac{N}{4}=25; \displaystyle\frac{N}{2}=50; \displaystyle\frac{3N}{4}=75\).

Dựa vào bảng, nhóm chứa \(Q_1^A\)\([60 ; 70)\).

\(Q_1^A=60+\displaystyle\frac{25-8}{20} \cdot 10 = 68,5 \).

Nhóm chứa \(Q_2^A\)\([70 ; 80)\).

\(Q_2^A=70+\displaystyle\frac{50-28}{50} \cdot 10= 74{,}4\).

Nhóm chứa \(Q_3^A\)\([70;80)\).

\(Q_3^A=70+\displaystyle\frac{75 -28}{50} \cdot 10=79{,}4 \).

Vậy khoảng tứ phân vị ghép nhóm diện tích căn hộ của địa phương A là

\(\Delta_{Q_A} =79{,}4-68{,}5=10{,}9\).

Dựa vào bảng, nhóm chứa \(Q_1^B\)\([60 ; 70)\).

\(Q_1^B=60+\displaystyle\frac{25 -15}{20} \cdot 10=65\).

Nhóm chứa \(Q_2^B\)\([70 ; 80)\).

\(Q_2^B=70+\displaystyle\frac{50-35}{30} \cdot 10= 75\).

Nhóm chứa \(Q_3^B\)\([80;90)\).

\(Q_3^B=80+\displaystyle\frac{75 -65}{20} \cdot 10= 85\).

Vậy khoảng tứ phân vị ghép nhóm diện tích căn hộ của địa phương B là là \(\Delta_{Q_B} =85-65=20\).

Qua khoảng tứ phân vị về diện tích căn hộ người dân hai địa phương, ta thấy địa phương B phân tán hơn.

Câu 32:

Một trang trại phân \(1 \, 000\) quả trứng thành \(5\) loại, tuỳ theo khối lượng (đã được làm tròn) của chúng được thống kê bởi bảng dưới đây:

Image

a) Ước tính khoảng biến thiên, khoảng tứ phân vị, phương sai và độ lệch chuẩn của khối lượng những quả trứng này (làm tròn kết quả đến hàng phần trăm).

b) Hãy phân tích sự đồng đều về khối lượng các quả trứng của trang trại.

Cỡ mẫu \(N= 45+ 190 + 500+ 250 + 15=1\, 000\).

Image

a) Khoảng biến thiên là \(60-30=30\).\\

Ta có \(\displaystyle\frac{N}{4}= 250\).\\

Nhóm chứa \(Q_1\) là nhóm \([42; 48)\).\\

Suy ra \(Q_1= 42 + \displaystyle\frac{250- 235}{500} \cdot 16=42{,} 48\).\\

\(\displaystyle\frac{3N}{4}= 750\).\\

Nhóm chứa \(Q_3\) là nhóm \([48; 54)\).\\

Khi đó \(Q_3 =48 +\displaystyle\frac{750- 735 }{250} \cdot 16 = 48{,} 96\).\\

Suy ra khoảng tứ phân vị \(\Delta_Q = Q_3 - Q_1= 6{,} 48\).

Image

Khối lượng trung bình \(\overline{x}= \displaystyle\frac{33 \cdot 45 + 39 \cdot 190 + 45 \cdot 500 + 51 \cdot 250 + 57 \cdot 15}{1\, 000}= 45\text{ gam}.\)

Độ lệch chuẩn \(s= \sqrt{\displaystyle\frac{33^2 \cdot 45 + 39^2 \cdot 190 + 45^2 \cdot 500 + 51^2 \cdot 250 + 57^2 \cdot 15}{1\, 000} - 45^2} \approx 4{,} 95 \text{ gam}.\)

b) Hãy phân tích sự đồng đều về khối lượng các quả trứng của trang trại.\\

Ta có khối lượng trung bình của \(1000\) quả trứng là \(45\) gam và do \(s \approx 4{,} 95\) gam nên khối lượng của mỗi quả chênh lệch so với giá trị \(45\) gam trung bình khoảng \(4{,} 95\) gam.

Câu 33:

Hàm lượng protein (trong 100 g) của một số loại thực phẩm được cho trong bảng sau:

Image

a) Tìm khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu (làm tròn kết quả đến hàng phần trăm).

b) Nêu ý nghĩa của các kết quả tìm được.

Cỡ mẫu \(N= 4+ 12+ 16+ 14+ 2 + 2= 50\).

Image

a) Khoảng biến thiên là \(20-8=12\).

\(\displaystyle\frac{N}{4}= 12{,}5\).

Nhóm chứa \(Q_1\) là nhóm \([10; 12)\).

Suy ra \(Q_1= 10 + \displaystyle\frac{12{,}5- 4}{12} \cdot 2\approx 11{,} 42\).

\(\displaystyle\frac{3N}{4}= 37{,}5\).

Nhóm chứa \(Q_3\) là nhóm \([14; 16)\).

Khi đó \(Q_3 =14 +\displaystyle\frac{37{,}5- 32 }{14} \cdot 2 \approx 14{,} 79\).

Suy ra khoảng tứ phân vị \(\Delta_Q = Q_3 - Q_1\approx 3{,} 37\).

Image

Hàm lượng protein trung bình là

\(\overline{x}=\displaystyle\frac{9 \cdot 4 + 11 \cdot 12 + 13 \cdot 16 + 15 \cdot 14 + 17 \cdot 12 + 19 \cdot 2 }{50}= 13{,} 16\) gam.

Phương sai

\(s=\sqrt{\displaystyle\frac{9^2 \cdot 4 + 11^2 \cdot 12 + 13^2 \cdot 16 + 15^2 \cdot 14 + 17^2 \cdot 12 + 19^2 \cdot 2 }{50} - 13{,} 16^2}\approx 2{,} 33\) gam.

b) Nêu ý nghĩa của các kết quả tìm được.

Ta có \(25\%\) loại thực phẩm (khoảng \(12\) loại) có hàm lượng protein không vượt quá \(11{,} 42\) gam và \(25\%\) loại thực phẩm có hàm lượng protein đạt ít nhất \(14{,} 79\) gam. Đồng thời có \(50\%\) loại thực phẩm còn lại có hàm lượng protein từ \(11{,} 42\) gam đến \(14{,} 79\) gam và hàm lượng protein của các loại thực phẩm này chênh lệch nhau khoảng \(3{,} 37\) gam.

Hàm lượng protein trung bình của \(50\) loại thực phẩm là \(13{,} 16\) gam và do \(s \approx 2{,} 33\) gam nên so với số này thì hàm lượng protein của mỗi loại thực phẩm chênh lệch khoảng \(2{,} 33\) gam.

Câu 34:

Một bác tài xế thống kê lại độ dài quãng đường (đơn vị km) bác đã lái xe mỗi ngày trong một tháng ở bảng sau

Image

Hãy xác định khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu trên.

Khoảng biến thiên của mẫu số liệu là \(300-50=250\).

Cỡ mẫu \(n=30\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{30}\) là mẫu số liệu gốc gồm thời gian của \(30\) ngày mà bác tài xế đã lái xe mỗi ngày được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(\ldots\), \(x_5\in [50;100)\); \(x_6\); \(\ldots\); \(x_{15}\in [100;150)\); \(x_{16}\); \(\ldots\); \(x_{24}\in [150;200)\); \break\(x_{25}\); \(\ldots\); \(x_{28}\in [200;250)\); \(x_{29}\); \(x_{30}\in [250;300)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_8\in [100;150)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=100+\displaystyle\frac{\displaystyle\frac{30}{4}-5}{10}(150-100)=112{,}5.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{23}\in [150;200)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=150+\displaystyle\frac{\displaystyle\frac{3\cdot 30}{4}-(5+10)}{9}(200-150)=\displaystyle\frac{575}{3}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=\displaystyle\frac{575}{3}-112{,}5=\displaystyle\frac{475}{6}.\)

Xét mẫu số liệu ghép nhóm cho bởi bảng sau

Image

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{1}{30}\cdot (75\cdot 5+125\cdot 10+175\cdot 9+225\cdot 4+275\cdot 2)=155.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{30}\left(5\cdot 75^2+10\cdot 125^2+9\cdot 175^2+4\cdot 225^2+2\cdot 275^2\right)-155^2=3100.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \(S=\sqrt{3100}=10\sqrt{31}\approx 55{,}68\).

Câu 35:

Kết quả khảo sát năng suất (đơn vị tấn/ha) của một số thửa ruộng được minh họa ở biểu đồ sau

Image

a) Có bao nhiêu thửa ruộng được khảo sát?

b) Lập bảng tần số ghép nhóm và tần số tương đối ghép nhóm tương ứng của mẫu số liệu trên.

c) Hãy xác định khoảng biến thiên, khoảng tứ phân vị và độ lệch chuẩn của mẫu số liệu trên.

a) Có tất cả \(n=3+4+6+5+5+2=25\) thửa ruộng được khảo sát.

b) Lập bảng tần số ghép nhóm và tần số tương đối ghép nhóm tương ứng của mẫu số liệu trên.

Image

c) Khoảng biến thiên của mẫu số liệu trên là \(6{,}7-5{,}5=1{,}2\).

Cỡ mẫu \(n=25\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{25}\) là mẫu số liệu gốc gồm năng suất của \(25\) thửa ruộng được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(x_2\), \(x_3\in [5{,}5;5{,}7)\); \(x_4\); \(\ldots\); \(x_7\in [5{,}7;5{,}9)\); \(x_8\); \(\ldots\); \(x_{13}\in [5{,}9;6{,}1)\); \break\(x_{14}\); \(\ldots\); \(x_{18}\in [6{,}1;6{,}3)\); \(x_{19}\); \(\ldots\); \(x_{23}\in [6{,}3;6{,}5)\); \(x_{24}\); \(x_{25}\in [6{,}5;6{,}7)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_6+x_7)\in [5{,}7;5{,}9)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=5{,}7+\displaystyle\frac{\displaystyle\frac{25}{4}-3}{4}(5{,}9-5{,}7)=5{,}8625.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{19}+x_{20})\in [6{,}3;6{,}5)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=6{,}3+\displaystyle\frac{\displaystyle\frac{3\cdot 25}{4}-(3+4+6+5)}{5}(6{,}5-6{,}3)=6{,}33.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=6{,}33-5{,}8625=0{,}4675.\)

Xét mẫu số liệu ghép nhóm cho bởi bảng sau

Image

Số trung bình của mẫu số liệu là

\(\overline{x}=\displaystyle\frac{1}{25}\cdot (5{,}6\cdot 3+5{,}8\cdot 4+6\cdot 6+6{,}2\cdot 5+6{,}4\cdot 5+6{,}6\cdot 2)=6{,}088.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2=\displaystyle\frac{1}{25}\cdot (5{,}6^2\cdot 3+5{,}8^2\cdot 4+6^2\cdot 6+6{,}2^2\cdot 5+6{,}4^2\cdot 5+6{,}6^2\cdot 2)-6{,}088^2=0{,}086656.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \(S=\sqrt{0{,}086656}\approx 0{,}294\).

Câu 36:

Thời gian hoàn thành một bài viết chính tả của một số học sinh lớp \(4\) hai trường \(X\)\(Y\) được ghi lại ở bảng sau

Image

a) Nếu so sánh theo số trung bình thì học sinh trường nào viết nhanh hơn?

b) Nếu so sánh theo khoảng tứ phân vị thì học sinh trường nào có tốc độ viết đồng đều hơn?

c) Nếu so sánh theo độ lệch chuẩn thì học sinh trường nào có tốc độ viết đồng đều hơn?

a) Ta có bảng thống kê thời gian ghi bài của hoc sinh lớp 4 ở hai trường theo giá trị đại diện

Image

Xét mẫu số liệu của học sinh trường \(X\).

Cỡ mẫu là \(n_X=8+10+13+10+9=50\).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_X=\displaystyle\frac{1}{50}\left(8\cdot 6{,}5+10\cdot 7{,}5+13\cdot 8{,}5+10\cdot 9{,}5+9\cdot 10{,}5\right)=8{,}54.\)

Xét mẫu số liệu của học sinh trường \(Y\).

Cỡ mẫu là \(n_Y=8+10+13+10+9=50\).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_Y=\displaystyle\frac{1}{50}\left(4\cdot 6{,}5+12\cdot 7{,}5+17\cdot 8{,}5+14\cdot 9{,}5+3\cdot 10{,}5\right)=8{,}5.\)

Nếu so sánh theo số trung bình thì học sinh trường \(Y\) viết nhanh hơn.

b) Xét mẫu số liệu của học sinh trường \(X\).

Cỡ mẫu \(n=50\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{50}\) là mẫu số liệu gốc gồm thời gian của \(50\) học sinh ghi bài được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(\ldots\), \(x_8\in [6;7)\); \(x_9\); \(\ldots\); \(x_{18}\in [7;8)\); \(x_{19}\); \(\ldots\); \(x_{31}\in [8;9)\); \(x_{32}\); \(\ldots\); \(x_{41}\in [9;10)\); \(x_{42}\); \(\ldots\); \(x_{50}\in [10;11)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_{13}\in [7;8)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=7+\displaystyle\frac{\displaystyle\frac{50}{4}-8}{10}(8-7)=7{,}45.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{38}\in [9;10)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=9+\displaystyle\frac{\displaystyle\frac{3\cdot 50}{4}-(8+10+13)}{10}(10-9)=9{,}65.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=9{,}65-7{,}45=2{,}2.\)

Xét mẫu số liệu của học sinh trường \(Y\).

Cỡ mẫu \(n=50\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{50}\) là mẫu số liệu gốc gồm thời gian của \(50\) học sinh ghi bài được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\), \(\ldots\), \(x_4\in [6;7)\); \(x_5\); \(\ldots\); \(x_{16}\in [7;8)\); \(x_{17}\); \(\ldots\); \(x_{33}\in [8;9)\); \(x_{34}\); \(\ldots\); \(x_{47}\in [9;10)\); \(x_{48}\); \(\ldots\); \(x_{50}\in [10;11)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_{13}\in [7;8)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=7+\displaystyle\frac{\displaystyle\frac{50}{4}-4}{12}(8-7)=\displaystyle\frac{185}{24}.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{38}\in [9;10)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=9+\displaystyle\frac{\displaystyle\frac{3\cdot 50}{4}-(4+12+17)}{14}(10-9)=\displaystyle\frac{261}{28}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=\displaystyle\frac{261}{28}-\displaystyle\frac{185}{24}=\displaystyle\frac{271}{168}\approx 1{,}613.\)

Nếu so sánh theo khoảng tứ phân vị thì học sinh trường \(Y\) có tốc độ viết đồng đều hơn.

c) Xét mẫu số liệu của học sinh trường \(X\).

Phương sai của mẫu số liệu ghép nhóm là

\(S^2_X=\displaystyle\frac{1}{50}\left(8\cdot 6{,}5^2+10\cdot 7{,}5^2+13\cdot 8{,}5^2+10\cdot 9{,}5^2+9\cdot 10{,}5^2\right)-8{,}54^2=1{,}7584.\)

Độ lệch chuẩn của mẫu số liệu là

\(S_X=\sqrt{1{,}7584}\approx 1{,}326.\)

Xét mẫu số liệu của học sinh trường \(Y\).

Phương sai của mẫu số liệu ghép nhóm là

\(S^2_Y=\displaystyle\frac{1}{50}\left(4\cdot 6{,}5^2+12\cdot 7{,}5^2+17\cdot 8{,}5^2+14\cdot 9{,}5^2+3\cdot 10{,}5^2\right)-8{,}5^2=1{,}08.\)

Độ lệch chuẩn của mẫu số liệu là

\(S_Y=\sqrt{1{,}08}\approx 1{,}039.\)

Do \(S_X>S_Y\) nên nếu so sánh theo độ lệch chuẩn thì học sinh trường \(Y\) có tốc độ viết đồng đều hơn.

Câu 37:

Bảng sau thống kê lại tổng số giờ nắng trong tháng \(6\) của các năm từ \(2002\) đến \(2021\) tại hai trạm quan trắc đặt ở Nha Trang và Quy Nhơn

Image

a) Nếu so sánh theo khoảng tứ phân vị thì số giờ nắng trong tháng 6 của địa phương nào đồng đều hơn?

b) Nếu so sánh theo độ lệch chuẩn thì số giờ nắng trong tháng 6 của địa phương nào đồng đều hơn?

a) Xét mẫu số liệu ở Nha Trang.

Cỡ mẫu \(n=20\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{20}\) là mẫu số liệu gốc gồm số giờ nắng trong tháng \(6\) ở Nha Trang được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\in [130;160)\); \(x_2\in [160;190)\); \(x_3\in [190;220)\); \(x_4\); \(\ldots\); \(x_{11}\in [220;250)\);\break \(x_{12}\); \(\ldots\); \(x_{18}\in [250;280)\); \(x_{19}\); \(x_{20}\in [280;310)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_5+x_6)\in [220;250)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=220+\displaystyle\frac{\displaystyle\frac{20}{4}-(1+1+1)}{8}(250-220)=227{,}5.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{15}+x_{16})\in [250;280)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=250+\displaystyle\frac{\displaystyle\frac{3\cdot 20}{4}-(1+1+1+8)}{7}(280-250)=\displaystyle\frac{1870}{7}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=\displaystyle\frac{1870}{7}-227{,}5=\displaystyle\frac{555}{14}\approx 39{,}643.\)

b) Xét mẫu số liệu ở Quy Nhơn.

Cỡ mẫu \(n=20\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{20}\) là mẫu số liệu gốc gồm số giờ năng trong tháng \(6\) ở Quy Nhơn được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\in [160;190)\); \(x_2\); \(x_3\in [190;220)\); \(x_4\); \(\ldots\); \(x_7\in [220;250)\); \(x_{8}\); \(\ldots\); \(x_{17}\in [250;280)\); \(x_{18}\); \(x_{19}\); \(x_{20}\in [280;310)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_5+x_6)\in [220;250)\).

Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=220+\displaystyle\frac{\displaystyle\frac{20}{4}-(1+2)}{4}(250-220)=235.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(\displaystyle\frac{1}{2}(x_{15}+x_{16})\in [250;280)\).

Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=250+\displaystyle\frac{\displaystyle\frac{3\cdot 20}{4}-(1+2+4)}{10}(280-250)=274.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là \(\Delta_Q=274-235=39.\)

Nếu so sánh theo khoảng tứ phân vị thì số giờ nắng trong tháng 6 của Quy Nhơn đồng đều hơn.

c) Ta có bảng thống kê tổng số giờ nắng trong tháng 6 ở hai địa phương theo giá trị đại diện.

Image

Xét mẫu số liệu ở Nha Trang.

Cỡ mẫu là \(n_X=20\).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_X=\displaystyle\frac{1}{20}\left(1\cdot 145+1\cdot 175+1\cdot 205+8\cdot 235+7\cdot 265+2\cdot 295\right)=242{,}5.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2_X=\displaystyle\frac{1}{20}\left(1\cdot 145^2+1\cdot 175^2+1\cdot 205^2+8\cdot 235^2+7\cdot 265^2+2\cdot 295^2\right)-242{,}5^2=1248{,}75.\)

Độ lệch chuẩn của mẫu số liệu là

\(S_X=\sqrt{1248{,}75}\approx 33{,}338.\)

Xét mẫu số liệu ở Quy Nhơn.

Cỡ mẫu là \(n_Y=20\).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_Y=\displaystyle\frac{1}{20}\left(0\cdot 145+1\cdot 175+2\cdot 205+4\cdot 235+10\cdot 265+3\cdot 295\right)=253.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2_Y=\displaystyle\frac{1}{20}\left(0\cdot 145^2+1\cdot 175^2+2\cdot 205^2+4\cdot 235^2+107\cdot 265^2+3\cdot 295^2\right)-253^2=936.\)

Độ lệch chuẩn của mẫu số liệu là

\(S_Y=\sqrt{936}\approx 30{,}594.\)

Nếu so sánh theo độ lệch chuẩn thì số giờ nắng trong tháng 6 của Quy Nhơn đồng đều hơn.

Câu 38:

Biểu đồ sau mô tả kết quả điều tra về điểm trung bình năm học của học sinh hai trường \(A\)\(B\).

Image

a) Hãy xác định giá trị đại diện cho mỗi nhóm và lập bảng tần số ghép nhóm cho mẫu số liệu trên.

b) Nếu so sánh theo khoảng tứ phân vị của mẫu số liệu ghép nhóm thì học sinh trường nào có điểm trung bình đồng đều hơn?

c) Nếu so sánh theo độ lệch chuẩn của mẫu số liệu ghép nhóm thì học sinh trường nào có điểm trung bình đồng đều hơn?

a) Hãy xác định giá trị đại diện cho mỗi nhóm và lập bảng tần số ghép nhóm cho mẫu số liệu trên.

Image

b) Xét mẫu số liệu của học sinh trường \(A\).

Cỡ mẫu \(n=18\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{18}\) là mẫu số liệu gốc gồm điểm trung bình của \(18\) học sinh trường \(A\) được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\); \(\ldots\); \(x_4\in [5;6)\); \(x_5\); \(\ldots\); \(x_9\in [6;7)\); \(x_{10}\); \(x_{11}\); \(x_{12}\in [7;8)\); \(x_{13}\); \(\ldots\); \(x_{16}\in \in [8;9)\); \(x_{17}\); \(x_{18}\in [9;10)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_5\in [6;7)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=6+\displaystyle\frac{\displaystyle\frac{18}{4}-4}{5}(7-6)=6{,}1.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{14}\in [8;9)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=8+\displaystyle\frac{\displaystyle\frac{3\cdot 18}{4}-(4+5+3)}{4}(9-8)=8{,}375.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=8{,}375-6{,}1=2{,}275.\)

b) Xét mẫu số liệu ở trường \(B\).

Cỡ mẫu \(n=15\).

Gọi \(x_1\); \(x_2\);\(\ldots\); \(x_{15}\) là mẫu số liệu gốc gồm điểm trung bình của \(15\) học sinh trường \(B\) được sắp xếp theo thứ tự không giảm.

Ta có \(x_1\); \(x_2\in [5;6)\); \(x_3\); \(\ldots\); \(x_7\in [6;7)\); \(x_8\); \(x_{9}\); \(x_{10}\); \(x_{11}\in [7;8)\); \(x_{12}\); \(x_{13}\); \(x_{14}\in \in [8;9)\); \(x_{15}\in [9;10)\).

Tứ phân vị thứ nhất của mẫu số liệu gốc là \(x_4\in [6;7)\). Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là

\(Q_1=6+\displaystyle\frac{\displaystyle\frac{18}{4}-2}{5}(7-6)=6{,}5.\)

Tứ phân vị thứ ba của mẫu số liệu gốc là \(x_{12}\in [8;9)\). Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là

\(Q_3=8+\displaystyle\frac{\displaystyle\frac{3\cdot 18}{4}-(2+5+4)}{3}(9-8)=\displaystyle\frac{53}{6}.\)

Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là

\(\Delta_Q=\displaystyle\frac{53}{6}-6{,}5=\displaystyle\frac{7}{3}\approx 2{,}333.\)

Nếu so sánh theo khoảng tứ phân vị thì học sinh trường \(A\) có điểm trung bình đồng đều hơn.

c) Ta có bảng thống kê điểm trung bình của học sinh ở hai trường theo giá trị đại diện.

Image

Xét mẫu số liệu học sinh trường \(A\).

Cỡ mẫu là \(n_A=18\).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_A=\displaystyle\frac{1}{18}\left(4\cdot 5{,}5+5\cdot 6{,}5+3\cdot 7{,}5+4\cdot 8{,}5+2\cdot 9{,}5\right)=\displaystyle\frac{65}{9}.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2_A=\displaystyle\frac{1}{18}\left(4\cdot 5{,}5^2+5\cdot 6{,}5^2+3\cdot 7{,}5^2+4\cdot 8{,}5^2+2\cdot 9{,}5^2\right)-\left(\displaystyle\frac{65}{9}\right)^2=1{,}756.\)

Độ lệch chuẩn của mẫu số liệu là

\(S_A=\sqrt{1{,}756}\approx 1{,}325.\)

Xét mẫu số liệu học sinh trường \(B\).

Cỡ mẫu là \(n_B=15\).

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_B=\displaystyle\frac{1}{15}\left(2\cdot 5{,}5+5\cdot 6{,}5+4\cdot 7{,}5+3\cdot 8{,}5+1\cdot 9{,}5\right)=\displaystyle\frac{217}{30}.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S^2_B=\displaystyle\frac{1}{15}\left(2\cdot 5{,}5^2+5\cdot 6{,}5^2+4\cdot 7{,}5^2+3\cdot 8{,}5^2+1\cdot 9{,}5^2\right)-\left(\displaystyle\frac{217}{30}\right)^2=1{,}262.\)

Độ lệch chuẩn của mẫu số liệu là

\(S_B=\sqrt{1{,}262}\approx 1{,}123.\)

Nếu so sánh theo độ lệch chuẩn thì học sinh trường \(B\) có điểm trung bình đồng đều hơn.

Câu 39:

Giá đóng cửa của một cổ phiếu là giá của cổ phiếu đó cuối một phiên giao dịch. Bảng sau thống kê giá đóng cửa (đơn vị: nghìn đồng) của hai mã cổ phiếu \(A\)\(B\) trong \(50\) ngày giao dịch liên tiếp.

Image

Người ta có thể dùng phương sai và độ lệch chuẩn để so sánh mức độ rủi ro của các loại cổ phiếu có giá trị trung bình gần bằng nhau. Cổ phiếu nào có phương sai, độ lệch chuẩn cao hơn thì được coi là có độ rủi ro lớn hơn.

Theo quan điểm trên, hãy so sánh độ rủi ro của cổ phiếu \(A\) và cổ phiếu \(B\).

Ta có bảng thống kê giá đóng cửa theo giá trị đại diện

Image

Xét mẫu số liệu của cổ phiếu A

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_1=\displaystyle\frac{8\cdot121+9\cdot123+12\cdot125+10\cdot127+11\cdot129}{50}=125{,}28.\)

Phương sai của mẫu số liệu ghép nhóm là

\(S_1^2=\displaystyle\frac{1}{50}\left(8\cdot121^2+9\cdot123^2+12\cdot125^2+10\cdot127^2+11\cdot129^2 \right)-125{,}28^2=7{,}5216.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \(S_1=\sqrt{7{,}5216}.\)

Xét mẫu số liệu của cổ phiếu B

Số trung bình của mẫu số liệu ghép nhóm là

\(\overline{x}_2=\displaystyle\frac{16\cdot121+4\cdot123+3\cdot125+6\cdot127+21\cdot129}{50}=125{,}48. \)

Phương sai của mẫu số liệu ghép nhóm là

\(S_2^2=\displaystyle\frac{1}{50}\left(16\cdot121^2+4\cdot123^2+3\cdot125^2+6\cdot127^2+21\cdot129^2 \right)-125{,}48^2=12{,}4096.\)

Độ lệch chuẩn của mẫu số liệu ghép nhóm là \(S_2=\sqrt{12{,}4096}.\)

Vậy nếu đánh giá độ rủi ro theo phương sai và độ lệch chuẩn thì cổ phiếu \(A\) có độ rủi ro thấp hơn cổ phiếu \(B\).