Bài giảng 32: Ứng dụng của Phân Tích Giá Trị Kỳ Dị (SVD)

Lesson Attachments

(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)

Phân tích SVD thường được sử dụng để ước lượng hạng của một ma trận, như đã đề cập ở trên. Một số ứng dụng số khác được trình bày ngắn gọn dưới đây, và một ứng dụng trong xử lý ảnh.

Ví dụ 5 (Số Điều Kiện): Hầu hết các phép tính số liên quan đến phương trình A\mathbf{x}=\mathbf{b} sẽ đạt độ chính xác cao nhất khi sử dụng phân tích SVD của ma trận A. Hai ma trận trực giao UV không ảnh hưởng đến độ dài của các vectơ hay góc giữa các vectơ. Mọi sự không ổn định tiềm tàng trong tính toán số đều được thể hiện qua ma trận \Sigma . Nếu các giá trị kỳ dị của A quá lớn hoặc quá nhỏ, sai số làm tròn gần như là không thể tránh khỏi, nhưng việc phân tích sai số sẽ thuận lợi hơn khi ta biết các phần tử trong \Sigma V.

Nếu A là một ma trận vuông khả nghịch kích thước n\times n, thì tỉ số \sigma_1/\sigma_n giữa giá trị kỳ dị lớn nhất và nhỏ nhất sẽ cho ta số điều kiện của A. Số điều kiện ảnh hưởng đến độ nhạy của nghiệm của phương trình A\mathbf{x}=\mathbf{b} đối với những thay đổi (hoặc sai số) trong các phần tử của A. (Thực tế, “số điều kiện” của A có thể được định nghĩa theo nhiều cách, nhưng định nghĩa ở đây là cách được sử dụng rộng rãi nhất trong việc nghiên cứu phương trình A\mathbf{x}=\mathbf{b}.)

Ví dụ 6: (Các Cơ Sở Cho Các Không Gian Cơ Bản)

Cho một phân tích SVD của ma trận A kích thước m\times n, gọi \mathbf{u}_1,\dots,\mathbf{u}_m là các vectơ kỳ dị trái, \mathbf{v}_1,\dots,\mathbf{v}_n là các vectơ kỳ dị phải, và \sigma_1,\dots,\sigma_n là các giá trị kỳ dị, và gọi r là hạng của ma trận A. Theo định lý 9:

(5)   \begin{equation*}\{\mathbf{u}_{1},...,\mathbf{u}_{r}\}\end{equation*}

là một cơ sở trực chuẩn cho \text{Col}\,A.

Nhớ lại từ định lý 3 rằng (\text{Col}\,A)^\perp=\text{Nul}\,A^T. Do đó, tập

(6)   \begin{equation*}\{\mathbf{u}_{r+1},\dots,\mathbf{u}_m\}\end{equation*}

là một cơ sở trực chuẩn cho \text{Nul}\,A^T.

\|A\mathbf{v}_i\|=\sigma_i với 1\leq i\leq n, và \sigma_i=0 khi và chỉ khi i>r, nên các vectơ \mathbf{v}_{r+1},\dots,\mathbf{v}_n sinh ra một không gian con của \text{Nul}\,A có số chiều là n-r. Theo Định lý Hạng, ta có \dim\,(\text{Nul}\,A)=n-\text{rank}\,A. Vì vậy, theo Định lý Cơ Sở, tập

(7)   \begin{equation*}\{\mathbf{v}_{r+1},\dots,\mathbf{v}_n\}\end{equation*}

là một cơ sở trực chuẩn cho \text{Nul}\,A.

Từ (5) và (6), phần bù trực giao của \text{Nul}\,A^T chính là \text{Col}\,A. Nếu hoán đổi AA^T, thì ta được (\text{Nul}\,A)^\perp=\text{Col}\,A^T=\text{Row}\,A. Do đó, từ (7), ta suy ra:

(8)   \begin{equation*}\{\mathbf{v}_1,\dots,\mathbf{v}_r\}\end{equation*}

là một cơ sở trực chuẩn cho \text{Row}\,A.

Hình 4 tóm tắt các phương trình (5)–(8), nhưng hiển thị cơ sở trực giao \{\sigma_1\mathbf{u}_1,\dots,\sigma_r\mathbf{u}_r\} cho \text{Col}\,A thay vì cơ sở đã chuẩn hóa, nhằm nhắc bạn rằng A\mathbf{v}_i=\sigma_i\mathbf{u}_i với 1\leq i\leq r. Các cơ sở trực chuẩn tường minh cho bốn không gian cơ bản do ma trận A xác định rất hữu ích trong một số phép tính, đặc biệt là trong các bài toán tối ưu có ràng buộc.

HÌNH 4: Bốn không gian cơ bản và tác động của A.

Bốn không gian cơ bản và khái niệm giá trị kỳ dị cung cấp những phát biểu cuối cùng của Định lý Ma Trận Khả Nghịch.

ĐỊNH LÝ – Định lý Ma Trận Khả Nghịch (phần cuối)
Cho A là một ma trận vuông kích thước n\times n. Khi đó, các mệnh đề sau đây tương đương với mệnh đề "A là một ma trận khả nghịch":

s. (\text{Col}\,A)^\perp=\{\mathbf{0}\}.
t. (\text{Nul}\,A)^\perp=\mathbb{R}^n.
u. \text{Row}\,A=\mathbb{R}^n.
v. An giá trị kỳ dị khác 0.

Ví dụ 7 (Phân tích SVD rút gọn và Ma trận giả nghịch đảo của A)

Khi ma trận \Sigma chứa các hàng hoặc cột toàn số 0, ta có thể thực hiện một phép phân tích gọn hơn cho ma trận A. Sử dụng ký hiệu đã thiết lập ở trên, đặt r=\text{rank}\,(A), và phân hoạch UV thành các ma trận con với khối đầu tiên chứa r cột:

U=[U_r\;\;U_{m-r}] với U_r=[\mathbf{u}_1\;\;\dots\;\;\mathbf{u}_r]

V=[V_r\;\;V_{m-r}] với V_r=[\mathbf{v}_1\;\;\dots\;\;\mathbf{v}_r]

Khi đó, U_r là ma trận m\times rV_r là ma trận n\times r. (Để đơn giản, ta vẫn viết U_{m-r} hay V_{n-r} ngay cả khi một trong hai có thể không có cột nào.) Từ phép nhân ma trận phân hoạch, ta được:

(9)   \begin{equation*}A=[U_r\;\;U_{m-r}]\begin{bmatrix}D&0\\0&0\end{bmatrix}\begin{bmatrix}V_r^T\\V_{n-r}^T\end{bmatrix}=U_r D V_r^T\end{equation*}

Phép phân tích này được gọi là phân tích giá trị kỳ dị rút gọn của A. Vì các phần tử trên đường chéo của D đều khác 0, nên D là khả nghịch. Ma trận sau đây được gọi là ma trận giả nghịch đảo (còn gọi là nghịch đảo Moore–Penrose) của A:

(10)   \begin{equation*}A^+=V_r D^{-1}U_r^T\end{equation*}

Ví dụ 8 (Lời giải bình phương tối thiểu – Least-Squares Solution)

Cho phương trình A\mathbf{x}=\mathbf{b}, ta sử dụng ma trận giả nghịch đảo của A trong biểu thức (10) để định nghĩa:

\hat{\mathbf{x}}=A^+\mathbf{b}=V_r D^{-1}U_r^T\mathbf{b}

Sau đó, từ phép phân tích SVD trong biểu thức (9):

A\hat{\mathbf{x}}=(U D V^T)(V_r D^{-1}U_r^T\mathbf{b})=U_r D D^{-1}U_r^T\mathbf{b}=U_r U_r^T\mathbf{b}

Từ kết quả trong (5), ta biết rằng U_r U_r^T\mathbf{b} chính là hình chiếu trực giao \hat{\mathbf{b}} của \mathbf{b} lên không gian \text{Col A} (cột của A). Do đó, \hat{\mathbf{x}} là lời giải bình phương tối thiểu của phương trình A\mathbf{x}=\mathbf{b}. Thật vậy, \hat{\mathbf{x}} còn là lời giải có độ dài (chuẩn) nhỏ nhất trong tất cả các lời giải bình phương tối thiểu của A\mathbf{x}=\mathbf{b}.

Ghi chú số học

Các ví dụ 1–4 gợi ý cách thực hiện các phép tính bằng tay. Tuy nhiên, trong thực tế, nên tránh việc tính toán ma trận A^T A, vì bất kỳ sai số nào trong các phần tử của A sẽ bị bình phương trong các phần tử của A^T A, làm tăng đáng kể sai số.

Hiện nay, đã có các phương pháp lặp nhanh giúp tính toán giá trị kỳ dị và vector kỳ dị của A một cách chính xác đến nhiều chữ số thập phân.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Hotline: 039.2266.928
Khóa học Toefl
Phone now