Bài giảng 20: Ứng dụng của Không Gian Tích Trong
Bình phương tối thiểu có trọng số
Giả sử
là một vectơ gồm nn quan sát,
, và ta muốn xấp xỉ
bằng một vectơ
thuộc về một không gian con xác định nào đó của
. (Trong phần trước,
được viết dưới dạng
, sao cho
nằm trong không gian cột của
.) Gọi các phần tử trong
là
. Khi đó, tổng bình phương sai số SS(E) khi xấp xỉ
bởi
là:
(1) ![]()
Điều này đơn giản là
, sử dụng độ dài chuẩn trong
.
Giờ giả sử các phép đo tạo nên các phần tử trong
không đáng tin cậy như nhau. Các phần tử trong
có thể được tính toán từ các mẫu đo lường khác nhau, với kích thước mẫu không đồng đều. Khi đó, việc gán trọng số cho sai số bình phương trong (1) trở nên phù hợp hơn, theo cách mà những phép đo đáng tin cậy hơn được gán trọng số cao hơn. Nếu các trọng số được ký hiệu là
, thì tổng bình phương sai số có trọng số là:
(2) ![]()
Đây là bình phương độ dài của
, trong đó độ dài được xác định từ một tích vô hướng, cụ thể
![]()
Đôi khi, việc chuyển một bài toán bình phương tối tiểu có trọng số thành một bài toán bình phương tối tiểu thông thường tương đương lại tiện lợi hơn. Gọi
là ma trận đường chéo có các phần tử (dương)
trên đường chéo, sao cho:

và biểu thức tương tự cũng áp dụng cho
. Lưu ý rằng hạng tử thứ
trong biểu thức (2) có thể viết lại dưới dạng:
![]()
Từ đó suy ra rằng tổng bình phương sai số có trọng số (weighted SS(E)) trong biểu thức (2) chính là bình phương độ dài thông thường trong
của
, mà ta ký hiệu là
.
Bây giờ, giả sử vector xấp xỉ
được xây dựng từ các cột của một ma trận
. Khi đó, ta cần tìm một vector
sao cho
gần với
nhất. Tuy nhiên, tiêu chí đo mức độ gần này là sai số có trọng số, cụ thể là:
![]()
Do đó,
là nghiệm bình phương tối tiểu thông thường (ordinary least-squares solution) của phương trình:
![]()
Phương trình chuẩn cho nghiệm bình phương tối tiểu này là:
![]()
Ví dụ 1: Tìm đường thẳng bình phương tối tiểu
phù hợp nhất với tập dữ liệu
.
Giả sử sai số khi đo các giá trị yy ở hai điểm dữ liệu cuối cùng lớn hơn so với các điểm còn lại. Khi đó, gán trọng số cho hai điểm này bằng một nửa so với các điểm còn lại.
Giải: Đặt
là ma trận
, và
là vector
, được:

Với ma trận trọng số, chọn
có các phần tử đường chéo là
.
Nhân bên trái bởi
sẽ làm thay đổi tỷ lệ các hàng của
và
:

Đối với phương trình chuẩn, ta tính:
![]()
và giải hệ:
![]()
Nghiệm của phương trình chuẩn (làm tròn đến hai chữ số có nghĩa) là
. Vậy đường thẳng cần tìm là
![]()
Ngược lại, đường thẳng bình phương tối tiểu thông thường (không có trọng số) với dữ liệu này là:
![]()
Cả hai đường thẳng đều được hiển thị trong hình 1.

- 1 - Bài giảng 1: Tích Trong
- 2 - Bài giảng 2: Độ Dài của Một Vector
- 3 - Bài giảng 3: Các Véc-tơ Trực Giao
- 4 - Bài giảng 4: Tập hợp trực giao
- 5 - Bài giảng 5: Phép chiếu trực giao
- 6 - Bài giảng 6: Tập Hợp Trực Chuẩn
- 7 - Bài giảng 7: Phép chiếu trực giao
- 8 - Bài giảng 8: Tính chất của Phép Chiếu Trực Giao
- 9 - Bài giảng 9: Quy trình Gram–Schmidt
- 10 - Bài giảng 10: Cơ Sở Trực Chuẩn, Phân Tích QR Của Ma Trận
- 11 - Bài giảng 11: Bài toán Bình phương nhỏ nhất
- 12 - Bài giảng 12: Các phương pháp tính cho nghiệm bình phương tối thiểu
- 13 - Bài giảng 13: Học Máy và Mô Hình Tuyến Tính
- 14 - Bài giảng 14: Khớp Đường Cong Bình Phương Tối Thiểu
- 15 - Bài giảng 15: Hồi quy bội
- 16 - Bài giảng 16: Không gian tích trong
- 17 - Bài giảng 17: Quá trình Gram–Schmidt
- 18 - Bài giảng 18: Hai Bất Đẳng Thức
- 19 - Bài giảng 19: Một Tích Vô Hướng cho Không Gian C[a,b]
- 20 - Bài giảng 20: Ứng dụng của Không Gian Tích Trong
- 21 - Bài giảng 21: Ứng dụng của Không Gian Tích Trong (tiếp theo)
- 22 - Bài giảng 22: Chuỗi Fourier
