Bài giảng 14: Khớp Đường Cong Bình Phương Tối Thiểu
(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)
Khi các điểm dữ liệu
trên biểu đồ phân tán không nằm gần một đường thẳng nào, có thể cần đưa ra một mối quan hệ hàm số khác giữa
và
.
Hai ví dụ tiếp theo sẽ minh họa cách khớp dữ liệu bằng các đường cong có dạng tổng quát:
(2) ![]()
trong đó
là các hàm đã biết, còn
là các tham số cần xác định. Như chúng ta sẽ thấy, phương trình (2) mô tả một mô hình tuyến tính, vì nó tuyến tính theo các tham số chưa biết.
Đối với một giá trị cụ thể của
, phương trình (2) cho giá trị dự đoán (hoặc “khớp”) của
. Sự khác biệt giữa giá trị quan sát được và giá trị dự đoán được gọi là phần dư. Các tham số
cần được xác định sao cho tổng bình phương của các phần dư là nhỏ nhất.
Ví dụ 3: Giả sử các điểm dữ liệu
có vẻ nằm dọc theo một đường parabol thay vì một đường thẳng.
Ví dụ: Nếu tọa độ
biểu thị mức sản xuất của một công ty và
biểu thị chi phí trung bình trên một đơn vị khi sản xuất
đơn vị mỗi ngày, thì đường cong chi phí trung bình điển hình trông giống một parabol mở lên (Hình 4).

Trong sinh thái học, một đường parabol mở xuống được sử dụng để mô hình hóa tổng sản xuất sơ cấp của chất dinh dưỡng trong thực vật, dưới dạng hàm số của diện tích bề mặt lá (Hình 5).

Giả sử ta muốn xấp xỉ dữ liệu bằng phương trình dạng:
(3) ![]()
Hãy mô tả mô hình tuyến tính giúp tạo ra đường khớp bình phương tối thiểu cho dữ liệu theo phương trình (3).
Giải: Phương trình (3) mô tả mối quan hệ lý tưởng. Giả sử giá trị thực của các tham số là
. Khi đó, tọa độ của điểm dữ liệu đầu tiên
thỏa mãn phương trình:
![]()
trong đó
là sai số phần dư giữa giá trị quan sát được
và giá trị dự đoán
. Tương tự, mỗi điểm dữ liệu xác định một phương trình tương ứng:

Ta có thể viết hệ phương trình này dưới dạng
. Để xác định ma trận
, ta quan sát các hàng đầu tiên của hệ phương trình và tìm mẫu chung:

Từ đó, mô hình tuyến tính có dạng:
![]()
Ví dụ 4: Nếu các điểm dữ liệu có xu hướng tuân theo một mô hình như trong hình 6, thì một mô hình phù hợp có thể là phương trình dạng:
![]()
Chẳng hạn, dữ liệu này có thể biểu diễn tổng chi phí của một công ty như một hàm của mức sản xuất. Hãy mô tả mô hình tuyến tính cung cấp đường cong bình phương tối thiểu phù hợp nhất với tập dữ liệu
.

Giải: Bằng cách phân tích tương tự như ví dụ 2, ta có thể viết hệ phương trình dưới dạng:

Từ đó, mô hình tuyến tính có dạng:
![]()
- 1 - Bài giảng 1: Tích Trong
- 2 - Bài giảng 2: Độ Dài của Một Vector
- 3 - Bài giảng 3: Các Véc-tơ Trực Giao
- 4 - Bài giảng 4: Tập hợp trực giao
- 5 - Bài giảng 5: Phép chiếu trực giao
- 6 - Bài giảng 6: Tập Hợp Trực Chuẩn
- 7 - Bài giảng 7: Phép chiếu trực giao
- 8 - Bài giảng 8: Tính chất của Phép Chiếu Trực Giao
- 9 - Bài giảng 9: Quy trình Gram–Schmidt
- 10 - Bài giảng 10: Cơ Sở Trực Chuẩn, Phân Tích QR Của Ma Trận
- 11 - Bài giảng 11: Bài toán Bình phương nhỏ nhất
- 12 - Bài giảng 12: Các phương pháp tính cho nghiệm bình phương tối thiểu
- 13 - Bài giảng 13: Học Máy và Mô Hình Tuyến Tính
- 14 - Bài giảng 14: Khớp Đường Cong Bình Phương Tối Thiểu
- 15 - Bài giảng 15: Hồi quy bội
- 16 - Bài giảng 16: Không gian tích trong
- 17 - Bài giảng 17: Quá trình Gram–Schmidt
- 18 - Bài giảng 18: Hai Bất Đẳng Thức
- 19 - Bài giảng 19: Một Tích Vô Hướng cho Không Gian C[a,b]
- 20 - Bài giảng 20: Ứng dụng của Không Gian Tích Trong
- 21 - Bài giảng 21: Ứng dụng của Không Gian Tích Trong (tiếp theo)
- 22 - Bài giảng 22: Chuỗi Fourier
