Bài giảng 11: Bài toán Bình phương nhỏ nhất
(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)
Trong thực tế, các hệ phương trình không tương thích thường xuất hiện. Khi cần tìm nghiệm nhưng không có nghiệm chính xác, cách tốt nhất là tìm một sao cho
gần với
nhất có thể.
Hãy xem như một xấp xỉ của
. Khoảng cách giữa
và
, được đo bằng
, càng nhỏ thì xấp xỉ càng tốt. Bài toán bình phương nhỏ nhất tổng quát là tìm một
sao cho
nhỏ nhất có thể. Thuật ngữ “bình phương nhỏ nhất” xuất phát từ việc
chính là căn bậc hai của tổng các bình phương.
Định nghĩa
Nếulà ma trận
và
thuộc
, thì một nghiệm bình phương nhỏ nhất của phương trình
là một
trong
sao cho:
.
Điểm quan trọng nhất trong bài toán bình phương nhỏ nhất là: dù chọn như thế nào, vector
luôn thuộc vào không gian cột (
) của
. Do đó, ta cần tìm
sao cho
là điểm gần nhất trong không gian cột của
với
. Xem hình 1 để trực quan hóa khái niệm này. (Tất nhiên, nếu
nằm trong
, thì
có thể được biểu diễn dưới dạng
cho một số
, và khi đó
chính là một nghiệm bình phương nhỏ nhất.)
Giải Bài toán Bình phương Nhỏ nhất Tổng quát
Giải Bài toán Bình phương Nhỏ nhất Tổng quát Cho ma trận và vector
như đã đề cập, ta áp dụng định lý xấp xỉ tốt nhất vào không gian con
. Gọi:





Vì thuộc vào không gian cột của
, phương trình
luôn có nghiệm. Do đó, tồn tại một vector
sao cho:
(1)
Vì là điểm gần nhất trong không gian cột của
với
, một vector
là nghiệm bình phương nhỏ nhất của phương trình
nếu và chỉ nếu
thỏa mãn điều kiện (1). Vector
này trong
chính là tập hợp các hệ số dùng để xây dựng
từ các cột của
. Xem hình 2 để minh họa trực quan. (Nếu phương trình có biến tự do, sẽ tồn tại nhiều nghiệm cho phương trình
.)

Giả sử thỏa mãn
. Theo Định lý Phân rã Trực giao, phép chiếu
có tính chất rằng
trực giao với không gian cột của
, do đó
trực giao với từng cột của
. Nếu aja_j là một cột bất kỳ của
, thì
. Vì mỗi
là một hàng của
, ta có:
(2)
Do đó:
Các phép biến đổi trên cho thấy mỗi nghiệm bình phương nhỏ nhất của đều thỏa mãn phương trình:
(3)
Phương trình ma trận (3) biểu diễn một hệ phương trình được gọi là phương trình chuẩn tắc cho . Một nghiệm của (3) thường được ký hiệu là
.
Định lý 13
Tập hợp các nghiệm bình phương nhỏ nhất củatrùng với tập nghiệm không rỗng của phương trình chuẩn tắc
.
Chứng minh: Như đã chỉ ra trước đó, tập nghiệm bình phương nhỏ nhất là không rỗng và mỗi nghiệm bình phương nhỏ nhất đều thỏa mãn phương trình chuẩn tắc. Ngược lại, giả sử
thỏa mãn phương trình
. Khi đó,
thỏa mãn phương trình (2), điều này cho thấy rằng
trực giao với các hàng của
và do đó cũng trực giao với các cột của
. Vì các cột của
sinh ra không gian cột
, nên vectơ
trực giao với toàn bộ
. Do đó, phương trình
là một phép phân rã thành tổng của một vectơ trong
và một vectơ trực giao với
. Theo tính duy nhất của phân rã trực giao,
phải là phép chiếu trực giao của
lên
. Nghĩa là,
, và
là một nghiệm bình phương nhỏ nhất.
Ví dụ 1: Tìm nghiệm bình phương nhỏ nhất của hệ phương trình không tương thích , với
Giải: Để sử dụng phương trình chuẩn (3), trước tiên ta tính
Do đó, phương trình trở thành
Vì là ma trận vuông
và khả nghịch, ta có thể tính nghịch đảo của nó:
Sau đó, nghiệm bình phương nhỏ nhất là
Trong nhiều tính toán, là khả nghịch, nhưng không phải lúc nào cũng vậy. Ví dụ tiếp theo sẽ minh họa trường hợp ma trận xuất hiện trong các bài toán phân tích phương sai trong thống kê.
Ví dụ 2: Tìm nghiệm bình phương nhỏ nhất của phương trình với
Giải: Tính
Ma trận mở rộng của hệ là:
Giải hệ phương trình, ta được nghiệm tổng quát và
là biến tự do. Vậy nghiệm bình phương nhỏ nhất tổng quát của
có dạng:
Định lý tiếp theo đưa ra các tiêu chí hữu ích để xác định khi nào phương trình có duy nhất một nghiệm bình phương nhỏ nhất. (Tất nhiên, hình chiếu trực giao
luôn là duy nhất.)
Định lý 14
Cholà một ma trận
. Các mệnh đề sau là tương đương:
a. Phương trìnhcó duy nhất một nghiệm bình phương nhỏ nhất với mọi
.
b. Các cột củalà độc lập tuyến tính.
c. Ma trậnkhả nghịch.
Khi các mệnh đề này đúng, nghiệm bình phương nhỏ nhấtđược cho bởi:
(4)
Công thức chủ yếu hữu ích cho các mục đích lý thuyết và khi thực hiện tính toán bằng tay với
là ma trận
khả nghịch.
Khi nghiệm bình phương nhỏ nhất được sử dụng để tính
làm xấp xỉ của
, thì khoảng cách từ
đến
được gọi là sai số bình phương nhỏ nhất của phép xấp xỉ này.
Ví dụ 3: Cho và
như trong ví dụ 1, hãy xác định sai số bình phương nhỏ nhất trong nghiệm bình phương nhỏ nhất của phương trình
.
Giải: Từ Ví dụ 1, ta có:
Do đó,
và
Vậy sai số bình phương nhỏ nhất là . Đối với mọi
, khoảng cách giữa
và
luôn lớn hơn hoặc bằng
. Hình 3 minh họa điều này. Lưu ý rằng nghiệm bình phương nhỏ nhất
không xuất hiện trực tiếp trong hình.

- 1 - Bài giảng 1: Tích Trong
- 2 - Bài giảng 2: Độ Dài của Một Vector
- 3 - Bài giảng 3: Các Véc-tơ Trực Giao
- 4 - Bài giảng 4: Tập hợp trực giao
- 5 - Bài giảng 5: Phép chiếu trực giao
- 6 - Bài giảng 6: Tập Hợp Trực Chuẩn
- 7 - Bài giảng 7: Phép chiếu trực giao
- 8 - Bài giảng 8: Tính chất của Phép Chiếu Trực Giao
- 9 - Bài giảng 9: Quy trình Gram–Schmidt
- 10 - Bài giảng 10: Cơ Sở Trực Chuẩn, Phân Tích QR Của Ma Trận
- 11 - Bài giảng 11: Bài toán Bình phương nhỏ nhất
- 12 - Bài giảng 12: Các phương pháp tính cho nghiệm bình phương tối thiểu
- 13 - Bài giảng 13: Học Máy và Mô Hình Tuyến Tính
- 14 - Bài giảng 14: Khớp Đường Cong Bình Phương Tối Thiểu
- 15 - Bài giảng 15: Hồi quy bội
- 16 - Bài giảng 16: Không gian tích trong
- 17 - Bài giảng 17: Quá trình Gram–Schmidt
- 18 - Bài giảng 18: Hai Bất Đẳng Thức
- 19 - Bài giảng 19: Một Tích Vô Hướng cho Không Gian C[a,b]
- 20 - Bài giảng 20: Ứng dụng của Không Gian Tích Trong
- 21 - Bài giảng 21: Ứng dụng của Không Gian Tích Trong (tiếp theo)
- 22 - Bài giảng 22: Chuỗi Fourier