🔍 Tổng quan
Scatter Diagrams (Biểu đồ phân tán) là kỹ thuật thuộc nhóm Data Representation Tools and Techniques, được sử dụng để biểu diễn mối quan hệ giữa hai biến số nhằm xác định xem chúng có tương quan với nhau hay không.
Công cụ này giúp nhóm dự án phát hiện xu hướng, mẫu hình (patterns) và mức độ ảnh hưởng giữa các yếu tố như chi phí – chất lượng, thời gian – năng suất, hay lỗi – kinh nghiệm nhân viên.
Biểu đồ phân tán là nền tảng của phân tích thống kê, thường được sử dụng trong kiểm soát chất lượng và phân tích quy trình.
🎯 Mục tiêu sử dụng
- Xác định mức độ tương quan (correlation) giữa hai biến.
- Giúp xác minh hoặc bác bỏ giả thuyết về mối quan hệ nguyên nhân – kết quả.
- Hỗ trợ ra quyết định cải tiến quy trình dựa trên dữ liệu thực tế.
- Dễ dàng trình bày xu hướng và sự biến động dữ liệu.
🧩 Các loại tương quan trong biểu đồ phân tán
| Loại tương quan | Mô tả | Hình dạng xu hướng |
|---|---|---|
| Tương quan dương (Positive Correlation) | Khi giá trị của biến X tăng, Y cũng tăng. | Các điểm dữ liệu đi theo đường chéo hướng lên. |
| Tương quan âm (Negative Correlation) | Khi giá trị của X tăng, Y giảm. | Các điểm dữ liệu đi theo đường chéo hướng xuống. |
| Không tương quan (No Correlation) | Không có mối quan hệ rõ ràng giữa X và Y. | Các điểm phân tán ngẫu nhiên. |
Ví dụ dạng text:
Tương quan dương:
Y ↑ * * *
* * *
* *
X →──────────────────────>
⚙️ Cách thực hiện Scatter Diagram
Bước 1: Thu thập dữ liệu
- Xác định hai biến cần phân tích (ví dụ: thời gian hoàn thành vs. số lỗi phát sinh).
- Thu thập dữ liệu trong cùng giai đoạn, cùng điều kiện đo.
Bước 2: Tạo trục X và Y
- Trục X: biểu thị biến độc lập (nguyên nhân).
- Trục Y: biểu thị biến phụ thuộc (kết quả).
Bước 3: Vẽ các điểm dữ liệu
- Mỗi cặp (X, Y) tương ứng với một điểm trên biểu đồ.
Ví dụ bảng dữ liệu:
| X (Giờ làm việc) | Y (Số lỗi) |
|---|---|
| 2 | 10 |
| 4 | 7 |
| 6 | 5 |
| 8 | 3 |
| 10 | 2 |
Bước 4: Quan sát xu hướng dữ liệu
- Nếu các điểm tạo thành đường xu hướng đi xuống → tương quan âm.
- Nếu đi lên → tương quan dương.
- Nếu phân tán ngẫu nhiên → không có tương quan.
Bước 5: Tính hệ số tương quan (Correlation Coefficient) (tùy chọn)
Công thức Pearson:
r = (nΣXY – ΣXΣY) / sqrt[(nΣX² – (ΣX)²)(nΣY² – (ΣY)²)]
- r ≈ 1 → Tương quan dương mạnh.
- r ≈ -1 → Tương quan âm mạnh.
- r ≈ 0 → Không có tương quan.
💡 Ví dụ minh họa thực tế
Bối cảnh: Phân tích mối quan hệ giữa thời gian kiểm thử (giờ) và số lỗi được phát hiện trong dự án phần mềm.
| Giờ kiểm thử (X) | Lỗi phát hiện (Y) |
|---|---|
| 1 | 2 |
| 2 | 5 |
| 3 | 8 |
| 4 | 10 |
| 5 | 9 |
✅ Phân tích: Khi thời gian kiểm thử tăng, số lỗi phát hiện cũng tăng → có tương quan dương.
Điều này chứng minh việc tăng cường thời gian kiểm thử có thể giúp nâng cao chất lượng sản phẩm.
📘 Ứng dụng trong PMP
- Control Quality: Xác định mối liên hệ giữa nguyên nhân và kết quả của lỗi.
- Manage Quality: Phân tích mối quan hệ giữa chi phí – chất lượng, hoặc thời gian – năng suất.
- Monitor and Control Project Work: Đánh giá xu hướng hiệu suất theo thời gian.
- Plan Risk Management: Phát hiện mối quan hệ tiềm ẩn giữa rủi ro và yếu tố kích hoạt.
⚙️ Lợi ích
- Giúp phát hiện mối quan hệ ẩn trong dữ liệu.
- Cung cấp bằng chứng định lượng cho quyết định quản lý.
- Dễ hiểu và trực quan hóa dữ liệu phức tạp.
- Kết hợp tốt với Regression Analysis để xây dựng mô hình dự báo.
⚡ Lưu ý khi áp dụng
- Cần đủ số lượng mẫu (ít nhất 10–20 cặp dữ liệu).
- Mối tương quan không có nghĩa là nguyên nhân – kết quả (Correlation ≠ Causation).
- Tránh sử dụng khi dữ liệu bị nhiễu hoặc không đồng nhất.
- Có thể sử dụng phần mềm như Excel, Power BI, Minitab hoặc Python để vẽ biểu đồ và tính hệ số tương quan.
📎 Tải Template
👉 Bạn có thể tải Scatter Diagram Template (bao gồm hướng dẫn, bảng dữ liệu mẫu và ví dụ biểu đồ) tại:
🔗 https://nguyenhainam.info/pm-toolbox/
