Bài giảng 29: Tối ưu hóa có ràng buộc
Các kỹ sư, nhà kinh tế học, nhà khoa học và toán học thường cần tìm giá trị lớn nhất hoặc nhỏ nhất của một dạng toàn phương
khi
nằm trong một tập hợp xác định. Thông thường, bài toán có thể được sắp xếp sao cho
biến thiên trong tập các vector đơn vị. Bài toán tối ưu hóa có ràng buộc này có một lời giải rất thú vị và tao nhã. Ví dụ 6 sẽ minh họa cách các bài toán như vậy phát sinh trong thực tế.
Yêu cầu rằng một vector
trong ℝⁿ là một vector đơn vị có thể được phát biểu theo nhiều cách tương đương nhau:
![]()
và
(1) ![]()
Dạng triển khai đầy đủ (1) của phương trình
thường được sử dụng trong các ứng dụng thực tế. Khi một dạng toàn phương
không có các hạng tử tích chéo, thì việc tìm giá trị lớn nhất và nhỏ nhất của
với điều kiện
trở nên dễ dàng hơn.
Ví dụ 1: Tìm giá trị lớn nhất và nhỏ nhất của
với điều kiện ràng buộc
.
Giải: Vì
và
là không âm, ta có
và ![]()
Do đó:

khi
. Vì vậy, giá trị lớn nhất của
không vượt quá 9 khi
là một vector đơn vị. Hơn nữa,
khi
. Do đó, 9 là giá trị lớn nhất của
khi
.
Để tìm giá trị nhỏ nhất của
, ta nhận thấy:
![]()
nên:
![]()
khi
. Ngoài ra,
khi
và
. Vậy 3 là giá trị nhỏ nhất của
khi
.
Dễ thấy trong ví dụ 1, ma trận của dạng toàn phương
có các giá trị riêng là 9, 4 và 3, và giá trị riêng lớn nhất và nhỏ nhất chính là giá trị lớn nhất và nhỏ nhất (có ràng buộc) của
. Điều này cũng đúng với mọi dạng toàn phương, như ta sẽ thấy sau.
Ví dụ 2: Cho
, và
với
. Hình 1 hiển thị đồ thị của hàm
. Hình 2 chỉ hiển thị phần của đồ thị nằm bên trong một hình trụ; giao điểm của hình trụ với mặt cong là tập hợp các điểm
sao cho
và
. “Độ cao” của các điểm này chính là giá trị bị ràng buộc của
. Về mặt hình học, bài toán tối ưu có ràng buộc là tìm các điểm cao nhất và thấp nhất trên đường giao nhau đó.
Hai điểm cao nhất trên đường cong cách mặt phẳng
một khoảng 7 đơn vị, xảy ra tại
và
. Những điểm này tương ứng với trị riêng 7 của ma trận
, và các vector riêng tương ứng là
và
. Tương tự, hai điểm thấp nhất trên đường cong cách mặt phẳng
một khoảng 3 đơn vị. Chúng tương ứng với trị riêng 3 và các vector riêng
và
.



và hình trụ
.Mỗi điểm trên đường giao nhau trong hình 2 có tọa độ
nằm giữa 3 và 7, và với bất kỳ số nào
nằm trong khoảng từ 3 đến 7, đều tồn tại một vector đơn vị
sao cho
. Nói cách khác, tập hợp tất cả các giá trị có thể có của
, với
, là đoạn đóng từ 3 đến 7.
Có thể chứng minh rằng, với bất kỳ ma trận đối xứng
, tập hợp tất cả các giá trị của
khi
là một đoạn đóng trên trục số thực. Gọi điểm đầu bên trái và bên phải của đoạn này lần lượt là
và
. Cụ thể:
(2) ![]()
Định lý tiếp theo khẳng định rằng chính
và
cũng là các trị riêng của
, giống như trong ví dụ 2.
Định Lý 6
Cholà một ma trận đối xứng, và định nghĩa
và
như trong biểu thức (2). Khi đó:
•là trị riêng lớn nhất
của
,
•là trị riêng nhỏ nhất của
.
Giá trị củađạt được là
khi
là một vector riêng đơn vị
tương ứng với
.
Tương tự, giá trị củalà
khi
là một vector riêng đơn vị tương ứng với
.
Chứng minh: Chúng ta trực giao hóa đường chéo ma trận
dưới dạng
. Ta biết rằng:
(3) ![]()
Ngoài ra,
![]()
vì
, nên
. Cụ thể,
khi và chỉ khi
. Do đó,
và
nhận cùng một tập giá trị khi
và
chạy qua tất cả các vector đơn vị.
Để đơn giản ký hiệu, giả sử
là ma trận
với các giá trị riêng
. Sắp xếp các vector riêng làm cột của
sao cho
, và:

Với bất kỳ vector đơn vị
có tọa độ
, ta xét:

Và có các bất đẳng thức sau:

Do đó, theo định nghĩa,
. Tuy nhiên,
khi
, nên thật ra
. Theo biểu thức ở trên,
tương ứng với
là eigenvector
của
, vì:
![Rendered by QuickLaTeX.com \mathbf{x}=P\mathbf{e}_1=[\mathbf{u}_1\,\mathbf{u}_2\,\mathbf{u}_3]\begin{bmatrix}1\\0\\0\end{bmatrix}=\mathbf{u}_1](https://kienthuctheonamthang.com/wp-content/ql-cache/quicklatex.com-23e0b4ff78ec625178a9b174a46ec3f5_l3.png)
Vậy nên
, điều này chứng minh phát biểu về
. Tương tự, ta cũng chứng minh được rằng
là giá trị riêng nhỏ nhất,
, và giá trị này của
đạt được khi
.
Ví dụ 3: Cho ma trận
. Hãy tìm giá trị lớn nhất của dạng toàn phương
với điều kiện ràng buộc
, và tìm một vector đơn vị tại đó giá trị lớn nhất này đạt được.
Lời giải: Theo định lý 6, giá trị lớn nhất cần tìm chính là giá trị riêng lớn nhất của ma trận
. Phương trình đặc trưng là:
![]()
Vậy giá trị riêng lớn nhất là 6.
Giá trị lớn nhất có điều kiện của
đạt được khi
là vector riêng đơn vị ứng với giá trị riêng
. Giải
, ta thu được một vector riêng là
. tìm một vector riêng là
. Đặt 
Ở định lý 7 và các ứng dụng sau đó, giá trị của
được tính với các ràng buộc bổ sung lên vector đơn vị
.
ĐỊNH LÝ 7
Giả sử,
, và
được cho như trong Định lý 6. Khi đó, giá trị lớn nhất của
với các ràng buộc:
là giá trị riêng lớn thứ hai,, và giá trị này đạt được khi
là một vector riêng
tương ứng với
.
Định lý 7 có thể được chứng minh bằng một lập luận tương tự như trong Định lý 6, trong đó bài toán được quy về trường hợp ma trận của dạng toàn phương là ma trận đường chéo. Ví dụ tiếp theo sẽ minh họa cho ý tưởng chứng minh trong trường hợp ma trận là ma trận đường chéo.
Ví dụ 4: Tìm giá trị lớn nhất của biểu thức
với các ràng buộc
và
, trong đó
. Lưu ý rằng
là một vector riêng đơn vị tương ứng với giá trị riêng lớn nhất
của ma trận của dạng toàn phương.
Giải: Nếu các tọa độ của
là
, thì ràng buộc
đơn giản có nghĩa là
. Với một vector đơn vị như vậy, ta có
, và biểu thức cần tối đa hóa trở thành:

Vậy giá trị lớn nhất theo ràng buộc là 4. Giá trị này đạt được khi
, tức là một vector riêng tương ứng với giá trị riêng lớn thứ hai của ma trận trong dạng toàn phương.
Ví dụ 5: Cho ma trận
như trong ví dụ 3 và
là một vector riêng đơn vị tương ứng với giá trị riêng lớn nhất của
. Hãy tìm giá trị lớn nhất của
với các điều kiện:
(4) ![]()
Giải: Từ ví dụ 3, ta biết giá trị riêng lớn thứ hai của
là
. Giải phương trình
để tìm một vector riêng, rồi chuẩn hóa nó ta được:

Vector
tự động vuông góc với
vì chúng tương ứng với các giá trị riêng khác nhau. Vậy nên, giá trị lớn nhất của
dưới các ràng buộc đã cho là:
, đạt được khi
.
Định lý tiếp theo là một sự khái quát của định lý 7 và, cùng với định lý 6, cung cấp một cách mô tả hữu ích cho tất cả các giá trị riêng của ma trận
. Phần chứng minh được lược bỏ.
Định lý 8
Giả sửlà một ma trận đối xứng kích thước
, có phân tích trực giao
, trong đó các phần tử trên đường chéo của ma trận
được sắp xếp theo thứ tự
và các cột của
là các vector riêng đơn vị tương ứng
. Khi đó, với mỗi
, giá trị lớn nhất của biểu thức
dưới các ràng buộc:
là giá trị riêng thứ, tức là
, và giá trị này đạt được khi
.
Ví dụ 6: Trong năm tới, chính quyền một quận đang lên kế hoạch sửa chữa
(hàng trăm dặm) đường sá và cầu công cộng, đồng thời cải tạo
(hàng trăm mẫu Anh) công viên và khu vui chơi giải trí. Quận cần quyết định cách phân bổ các nguồn lực (quỹ, thiết bị, nhân công, v.v.) giữa hai dự án này. Nếu việc thực hiện đồng thời cả hai dự án mang lại hiệu quả chi phí cao hơn so với chỉ thực hiện một dự án, thì các giá trị
và
có thể thỏa mãn một ràng buộc như:
![]()
Xem Hình 3.

Mỗi điểm
trong vùng bóng mờ khả thi biểu thị một lịch trình công việc công cộng khả thi trong năm. Các điểm nằm trên đường cong ràng buộc
thể hiện việc sử dụng tối đa nguồn lực sẵn có.
Khi lựa chọn lịch trình công trình công cộng, chính quyền quận muốn xem xét ý kiến của cư dân trong quận. Để đo lường giá trị, hay độ hữu dụng, mà cư dân sẽ gán cho các phương án công việc khác nhau
, các nhà kinh tế học đôi khi sử dụng một hàm như:
![]()
Tập hợp các điểm
tại đó
là một hằng số được gọi là đường bàng quan. Ba đường như vậy được thể hiện trong hình 4. Các điểm nằm trên cùng một đường bàng quan tương ứng với những phương án mà cư dân trong quận, xét trên tổng thể, sẽ thấy có giá trị như nhau. Tìm lịch trình công trình công cộng (tức là giá trị
) sao cho hàm độ hữu dụng
đạt giá trị lớn nhất.

.Giải: Phương trình ràng buộc
không mô tả một tập hợp các vectơ đơn vị, nhưng có thể khắc phục điều này bằng một phép đổi biến. Viết lại phương trình ràng buộc dưới dạng:
![]()
và định nghĩa
và
nghĩa là
và
.
Khi đó phương trình ràng buộc trở thành:
![]()
và hàm tiện ích trở thành
. Gọi
, khi đó bài toán trở thành tìm giá trị cực đại của
với điều kiện
. Lưu ý rằng
, với
![]()
Các giá trị riêng của
là
, với các vectơ riêng tương ứng là
cho
, và
cho
.
Vì vậy, giá trị lớn nhất của
là 3, đạt được khi
và
.
Xét theo các biến ban đầu, lịch trình công trình công cộng tối ưu là:
(tức khoảng 2,1 trăm dặm đường và cầu),
(tức khoảng 1,4 trăm mẫu công viên và khu vui chơi giải trí).
Lịch trình công trình công cộng tối ưu chính là điểm mà đường ràng buộc và đường bàng quan
chỉ vừa tiếp xúc nhau. Những điểm
có mức tiện ích cao hơn nằm trên các đường bàng quan không cắt hoặc không chạm vào đường ràng buộc. Xem hình 4 để hình dung trực quan.
- 1 - Bài giảng 23: Xử lý ảnh đa kênh
- 2 - Bài giảng 24: Chéo hóa ma trận đối xứng
- 3 - Bài giảng 25: Phân tích phổ
- 4 - Bài giảng 26: Dạng Toàn Phương
- 5 - Bài giảng 27: Một góc nhìn hình học về các trục chính
- 6 - Bài giảng 28: Phân loại Dạng Toàn Phương
- 7 - Bài giảng 29: Tối ưu hóa có ràng buộc
- 8 - Bài giảng 30: Phân tích giá trị kỳ dị (Singular Value Decomposition)
- 9 - Bài giảng 31: Phân tích giá trị kỳ dị (tiếp theo)
- 10 - Bài giảng 32: Ứng dụng của Phân Tích Giá Trị Kỳ Dị (SVD)
- 11 - Bài giảng 33: Ứng dụng PCA (SVD) trong Xử Lý Ảnh và Thống Kê
- 12 - Bài giảng 34: Trung bình và hiệp phương sai
- 13 - Bàigiảng 35: Phân tích thành phần chính
- 14 - Bài giảng 36: Giảm số chiều của dữ liệu đa biến
