Mẫu số liệu ghép nhóm và Các số đặc trưng đo xu thế trung tâm


MẪU SỐ LIỆU GHÉP NHÓM VÀ CÁC SỐ ĐẶC TRƯNG ĐO XU THẾ TRUNG TÂM

>>Các số đặc trưng đo mức độ phân tán của mẫu số liệu ghép nhóm

1. MẪU SỐ LIỆU GHÉP NHÓM

Khi ta không thể thu thập được số liệu chính xác hoặc do yêu cầu của bài toán ta phải biểu diễn mẫu số liệu dưới dạng ghép nhóm để thuận lợi cho việc tổ chức, đọc và phân tích số liệu.

Mẫu số liệu ghép nhóm là mẫu số liệu cho dưới dạng bảng tần số của các nhóm số liệu. Mỗi nhóm số liệu là tập hợp gồm các giá trị của số liệu được ghép nhóm theo một tiêu chí xác định. Nhóm số liệu thường được cho dưới dạng $[a ; b),$ trong đó $a$ là đầu mút trái, $b$ là đầu mút phải.

Mẫu số liệu ghép nhóm

Trong mẫu số liệu ghép nhóm trên:

+ Có tất cả $k$ nhóm $\left[ {{a}_{1}};{{a}_{2}} \right),\left[ {{a}_{2}};{{a}_{3}} \right),...,\left[ {{a}_{k}};{{a}_{k+1}} \right)$ với tần số tương ứng là ${{m}_{1}},{{m}_{2}},...,{{m}_{k}}$ và nhóm $\left[ {{a}_{i}};{{a}_{i+1}} \right)$ được gọi là nhóm thứ $i$ của mẫu số liệu ghép nhóm.

+ Trong một số trường hợp, nhóm số liệu cuối cùng $\left[ {{a}_{k}};{{a}_{k+1}} \right)$ có thể lấy đầu mút bên phải, tức thay bởi nhóm $\left[ {{a}_{k}};{{a}_{k+1}} \right].$

+ Độ dài của nhóm $\left[ {{a}_{i}};{{a}_{i+1}} \right)$ là ${{a}_{i+1}}-{{a}_{i}}.$

+ Giá trị đại diện của nhóm $\left[ {{a}_{i}};{{a}_{i+1}} \right)$ là ${{x}_{i}}=\dfrac{{{a}_{i}}+{{a}_{i+1}}}{2}.$

+ Tổng $n={{m}_{1}}+{{m}_{2}}+...+{{m}_{k}}$ được gọi là cỡ mẫu.

+ Tổng ${{m}_{1}}+{{m}_{2}}+...+{{m}_{i}}$ được gọi là tần số tích luỹ của nhóm thứ $i.$

Ví dụ 1. Mẫu số liệu sau cho biết phân bố theo độ tuổi của dân số Việt Nam năm 2019.

a) Mẫu số liệu đã cho có là mẫu số liệu ghép nhóm hay không?

b) Nêu các nhóm và tần số tương ứng. Dân số Việt Nam năm 2019 là bao nhiêu?

Giải. a) Mẫu số liệu đã cho là mẫu số liệu ghép nhóm.

b) Có ba nhóm là: Dưới 15 tuổi, Từ 15 đến dưới 65 tuổi, Từ 65 tuổi trở lên.

Có 23371882 người dưới 15 tuổi; 65420451 người từ 15 đến dưới 65 tuổi và 7416651 người từ 65 tuổi trở lên.

Dân số Việt Nam năm 2019 là \[23371882\text{ }+\text{ }65420451\text{ }+\text{ }7416651\text{ }=\text{ }96208984\] người.

2. GHÉP NHÓM MẪU SỐ LIỆU

+ Để chuyển mẫu số liệu không ghép nhóm sang mẫu số liệu ghép nhóm, ta thực hiện theo các bước sau:

Bước 1: Chia miền giá trị của mẫu số liệu thành một số nhóm theo tiêu chí cho trước.

Bước 2: Đếm số giá trị của mẫu số liệu thuộc mỗi nhóm (tần số) và lập bảng thống kê cho mẫu số liệu ghép nhóm.

+ Ta không nên chia thành quá nhiều nhóm hoặc quá ít nhóm. Các nhóm không giao nhau, các nhóm nên có độ dài bằng nhau và tổng độ dài các nhóm lớn hơn khoảng biến thiên.

+ Đối với dữ liệu rời rạc, người ta thường cho các nhóm dưới dạng $k_1-k_2$ trong đó $k_1, k_2 \in \mathbb{N}.$ Nhóm $k_1-k_2$ được hiểu là nhóm gồm các giá trị $k_1, k_1+1, \ldots, k_2.$ Khi đó, ta cần hiệu chỉnh mẫu dữ liệu ghép nhóm trước khi thực hiện tính toán các số đặc trưng bằng cách hiệu chỉnh nhóm $k_1-k_2$ thành nhóm $\left[k_1-0,5 ; k_2+0,5\right).$

3. SỐ TRUNG BÌNH CỦA MẪU SỐ LIỆU GHÉP NHÓM

Số trung bình của mẫu số liệu ghép nhóm kí hiệu là $\overline{x}$ và \[\bar{x}=\dfrac{{{m}_{1}}{{x}_{1}}+{{m}_{2}}{{x}_{2}}+\ldots +{{m}_{k}}{{x}_{k}}}{n}\]

trong đó, $n={{m}_{1}}+\ldots +{{m}_{k}}$ là cỡ mẫu và ${{x}_{i}}=\dfrac{{{a}_{i}}+{{a}_{i+1}}}{2}$ là giá trị đại diện của nhóm $\left[ {{a}_{i}};{{a}_{i+1}} \right).$

Số trung bình của mẫu số liệu ghép nhóm xấp xỉ cho số trung bình của mẫu số liệu gốc, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.

Nhận xét. Nếu chỉ tính số trung bình của mẫu số liệu ghép nhóm thì ta không cần hiệu chỉnh nhóm rời rạc ${{k}_{1}}-{{k}_{2}}$, chọn giá trị đại diện là $\dfrac{{{k}_{1}}+{{k}_{2}}}{2}.$

4. MỐT CỦA MẪU SỐ LIỆU GHÉP NHÓM

Người ta chỉ định nghĩa mốt cho mẫu số liệu ghép nhóm có độ dài các nhóm bằng nhau. Một mẫu số liệu ghép nhóm có thể không có mốt hoặc có nhiều hơn 1 mốt. Khi tần số của các nhóm bằng nhau thì mẫu số liệu ghép nhóm không có mốt.

Để tìm mốt của mẫu số liệu ghép nhóm, ta thực hiện theo các bước sau:

Bước 1. Xác định nhóm có tần số lớn nhất (gọi là nhóm chứa mốt), giả sử là nhóm thứ $j:\left[ {{a}_{j}};{{a}_{j+1}} \right).$

Bước 2. Mốt được xác định là \[{{M}_{\text{o}}}={{a}_{j}}+\dfrac{\left( {{m}_{j}}-{{m}_{j-1}} \right)}{\left( {{m}_{j}}-{{m}_{j-1}} \right)+\left( {{m}_{j}}-{{m}_{j+1}} \right)}\cdot h,\] trong đó ${{m}_{j}}$ là tần số của nhóm thứ $j$ (quy ước ${{m}_{0}}={{m}_{k+1}}=0$) và $h$ là độ dài của nhóm.

Mốt của mẫu số liệu ghép nhóm xấp xỉ cho mốt của mẫu số liệu gốc, nó được dùng để đo xu thế trung tâm của mẫu số liệu.

5. TRUNG VỊ CỦA MẪU SỐ LIỆU GHÉP NHÓM

Để tính trung vị của mẫu số liệu ghép nhóm, ta làm như sau:

Bước 1. Xác định nhóm chứa trung vị. Giả sử đó là nhóm thứ $p:\left[ {{a}_{p}};{{a}_{p+1}} \right).$

Nhóm chứa trung vị là nhóm đầu tiên có tần số tích luỹ không nhỏ hơn $\dfrac{n}{2}.$

Bước 2. Trung vị là ${{M}_{e}}={{a}_{p}}+\dfrac{\dfrac{n}{2}-\left( {{m}_{1}}+\ldots +{{m}_{p-1}} \right)}{{{m}_{p}}}\cdot \left( {{a}_{p+1}}-{{a}_{p}} \right)$, trong đó $n$ là cỡ mẫu, ${{m}_{p}}$ là tần số nhóm thứ $p.$ Với $p=1,$ ta quy ước ${{m}_{1}}+\ldots +{{m}_{p-1}}=0.$

Trung vị chính là tứ phân vị thứ hai ${{Q}_{2}}.$ Trung vị của mẫu số liệu ghép nhóm xấp xỉ cho trung vị của mẫu số liệu gốc, nó chia mẫu số liệu thành hai phần, mỗi phần chứa 50% giá trị.

6. TỨ PHÂN VỊ CỦA MẪU SỐ LIỆU GHÉP NHÓM

Để tính tứ phân vị thứ nhất ${{Q}_{1}}$ của mẫu số liệu ghép nhóm trước hết ta xác đinh nhóm chứa ${{Q}_{1}}$, giả sử đó là nhóm thứ $p:\left[ {{a}_{p}};{{a}_{p+1}} \right).$ Khi đó,

\[{{Q}_{1}}={{a}_{p}}+\dfrac{\dfrac{n}{4}-\left( {{m}_{1}}+\ldots +{{m}_{p-1}} \right)}{{{m}_{p}}}\cdot \left( {{a}_{p+1}}-{{a}_{p}} \right)\]

trong đó $n$ là cỡ mẫu, ${{m}_{p}}$ là tần số nhóm thứ $p.$ Với $p=1,$ ta quy ước ${{m}_{1}}+\ldots +{{m}_{p-1}}=0.$

Tứ phân vị thứ hai ${{Q}_{2}}$ chính là trung vị ${{M}_{e}}.$

Để tính tứ phân vị thứ ba ${{Q}_{3}}$ của mẫu số liệu ghép nhóm trước hết ta xác định nhóm chứa ${{Q}_{3}}.$ Giả sử đó là nhóm thứ $p:\left[ {{a}_{p}};{{a}_{p+1}} \right).$ Khi đó,

\[{{Q}_{3}}={{a}_{p}}+\dfrac{\dfrac{3n}{4}-\left( {{m}_{1}}+\ldots +{{m}_{p-1}} \right)}{{{m}_{p}}}\cdot \left( {{a}_{p+1}}-{{a}_{p}} \right),\]

trong đó $n$ là cỡ mẫu, ${{m}_{p}}$ là tần số nhóm thứ $p.$ Với $p=1,$ ta quy ước ${{m}_{1}}+\ldots +{{m}_{p-1}}=0.$

Nhóm chứa tứ phân vị thứ $r$ là nhóm đầu tiên có tần số tích luỹ không nhỏ hơn $\dfrac{nr}{4}.$

Các tứ phân vị ${{Q}_{1}},{{Q}_{2}},{{Q}_{3}}$ của mẫu số liệu ghép nhóm xấp xỉ cho các tứ phân vị của mẫu số liệu gốc, chúng chia mẫu số liệu thành 4 phần, mỗi phần chứa 25% giá trị.

Combo X Luyện thi 2026 Môn Toán (THPT, ĐG năng lực, ĐG tư duy) (2K8 – Chương trình SGK mới)

Link đăng ký: https://bit.ly/Combox2026

PRO X: Luyện thi THPT 2026 Môn Toán (Luyện mọi dạng bài từ cơ bản đến 10 điểm)

LIVE X: Tổng ôn kiến thức và chữa đề thi THPT 2026 Môn Toán (100 ngày)

Trong quá trình học, các em hỏi mọi bài tập tại địa chỉ: https://askmath.vn/ (chỉ ưu tiên trả lời 100% học sinh vted)

Hệ thống câu hỏi bài tập trong đề thi, đính kèm mỗi bài học cũng như giải đáp tất cả các thắc mắc câu hỏi bài tập đi kèm của khóa học quý thầy cô/phụ huynh/học sinh tham tại đây: https://askmath.vn/cau-hoi (qua tra ID hoặc QR code).

So với Combo X các năm về trước, Vted đã rút gọn lại chỉ gồm hai khóa học:

Khóa học PRO X 2026, được rút gọn lại là tổng hợp của khóa học chuyên đề PRO X đến 9 điểm và khóa học chuyên đề vận dụng cao XMAX nội dụng 9 đến 10 điểm. Điều này cũng phù hợp hơn khi hiện tại các em có thể tham gia nhiều kì thi khác nhau. Các em theo dõi bài học tại website, kết hợp học Live nhóm Facebook chữa bài tập một số dạng toán đáng chú ý (Yêu cầu đăng ký cả Combo X để tham gia).

Khóa học LIVE X vẫn giữ nguyên theo định hướng Tổng ôn và Luyện đề tổng hợp giai đoạn cuối. Các em học Live trực tiếp trong nhóm Facebook.

Khoá học PRO X khai giảng từ ngày 01/03/2025 và Khoá học LIVE X khai giảng dự kiến 100 ngày trước thi hoặc sớm hơn vào tháng 12/2025.

Tất cả các khóa học tại Vted, các em có thể tải đề thi PDF đính kèm bài học (có thể bao gồm phần tóm tắt lý thuyết đi kèm đề thi). Trong quá trình học, phần bài tập các em xem hướng dẫn giải chi tiết thông qua tra ID hoặc QR code rất tiện lợi. Chỉ cần có thiết bị kết nối mạng.

Vted dành tặng tất cả các em học sinh đăng ký COMBO X 2026 khóa học: XMAX: TỔ HỢP – XÁC SUẤT VÀ THỐNG KÊ

Khóa học cung cấp kiến thức, các dạng bài và phương pháp giải của chủ đề Tổ hợp – Xác suất và thống kê (dành cho các em học sinh 10 – 11 – 12)

Mục lục khóa học cũng như các kiến thức bổ trợ Toán 10 - 11 có trong các kì thi các em xem chi tiết tại đây

Các con số thống kê về số lượng câu hỏi đi kèm học:

Khoá học Biên soạn dựa trên:

Sách giáo khoa Toán 12 (tập 1, tập 2) (Kết Nối Tri Thức Với Cuộc Sống) - NXB GD Việt Nam

Sách giáo khoa Toán 12 (tập 1, tập 2) (Chân Trời Sáng Tạo) - NXB GD Việt Nam

Sách giáo khoa Toán 12 (tập 1, tập 2) (Cánh Diều) - NXB ĐH Sư Phạm

Các khoá học được sử dụng kể từ ngày đăng kí đến khi kì thi THPT 2026 kết thúc.

Bình luận

Để bình luận, bạn cần đăng nhập bằng tài khoản Vted.

Đăng nhập
Vted
Xem tất cả
google.com, pub-1336488906065213, DIRECT, f08c47fec0942fa0