Bài giảng 31: Phân tích giá trị kỳ dị (tiếp theo)

Lesson Attachments

(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)

Phân tích của ma trận A bao gồm một ma trận “chéo” \Sigma kích thước m\times n có dạng

(3)   \begin{equation*}\Sigma=\begin{bmatrix}D&0\\0&0\end{bmatrix}\end{equation*}

trong đó D là một ma trận chéo kích thước r\times r, với r không vượt quá giá trị nhỏ hơn trong hai số mn. (Nếu r bằng m, n, hoặc cả hai, thì một phần hoặc toàn bộ các ma trận không phải D trong \Sigma sẽ không xuất hiện.)

Định lý 10 Phân tích giá trị kỳ dị 
Cho A là một ma trận m\times n có hạng r. Khi đó tồn tại một ma trận m\times n ký hiệu là \Sigma , như trong biểu thức (3), sao cho các phần tử trên đường chéo của ma trận Dr giá trị kỳ dị đầu tiên của A, thỏa mãn \sigma_1\geq\sigma_2\geq\dots\geq\sigma_r>0,
và tồn tại hai ma trận trực chuẩn: ma trận U kích thước m\times m và ma trận V kích thước n\times n, sao cho
A=U\Sigma V^T

Bất kỳ phân tích nào có dạng A=U\Sigma V^T, trong đó UV là ma trận trực chuẩn, \Sigma có dạng như trong (3), và các phần tử trên đường chéo của D là các số dương, đều được gọi là phân tích giá trị kỳ dị của A. Các ma trận UV trong phân tích này không được xác định duy nhất bởi A, nhưng các phần tử đường chéo của \Sigma thì nhất định là các giá trị kỳ dị của A. Các cột của U được gọi là vector kỳ dị trái của A, và các cột của V được gọi là vector kỳ dị phải của A.

Chứng minh: Gọi \lambda_i\mathbf{v}_i như trong định lý 9, sao cho tập \{A\mathbf{v}_1,\dots,A\mathbf{v}_r\} là một cơ sở trực giao cho không gian cột của A. Chuẩn hóa từng vector A\mathbf{v}_i để thu được một cơ sở trực chuẩn \{\mathbf{u}_1,\dots,\mathbf{u}_r\}, trong đó:

\mathbf{u}_i=\frac{1}{\|A\mathbf{v}_i\|}A\mathbf{v}_i=\frac{1}{\sigma_i}A\mathbf{v}_i

và do đó:

(4)   \begin{equation*}A\mathbf{v}_i=\sigma_i\mathbf{u}_i,\quad 1\leq i\leq r\end{equation*}

Tiếp theo, mở rộng tập \{\mathbf{u}_1,\dots,\mathbf{u}_r\} thành một cơ sở trực chuẩn đầy đủ \{\mathbf{u}_1,\dots,\mathbf{u}_m\} của \mathbb{R}^m, và đặt:

U=[\mathbf{u}_1\;\mathbf{u}_2\;\dots\;\mathbf{u}_m],\quad V=[\mathbf{v}_1\;\mathbf{v}_2\;\dots\;\mathbf{v}_n]

Theo cách xây dựng, UV là ma trận trực chuẩn. Ngoài ra, từ biểu thức (4), ta có:

AV=[A\mathbf{v}_1\;\dots\;A\mathbf{v}_r\;\mathbf{0}\;\dots\;\mathbf{0}]=[\sigma_1\mathbf{u}_1\;\;\dots\;\sigma_r\mathbf{u}_r\;\mathbf{0}\;\dots\;\mathbf{0}]

Gọi D là ma trận chéo với các giá trị trên đường chéo là \sigma_1,\dots,\sigma_r, và ký hiệu \Sigma là ma trận như trong biểu thức (3) ở trên. Khi đó:

=[\sigma_1\mathbf{u}_1\;\dots\;\sigma_r\mathbf{u}_r\;\mathbf{0}\dots\mathbf{0}]=AV

V là ma trận trực giao nên U\Sigma V^{T}=AVU^{T}=A.

Hai ví dụ tiếp theo tập trung vào cấu trúc bên trong của một phân tích giá trị kỳ dị. Một thuật toán hiệu quả và ổn định về mặt số học để thực hiện phân tích này sẽ sử dụng một phương pháp khác. Xem Ghi chú Số học.

Ví dụ 3: Sử dụng kết quả của ví dụ 1 và 2 để xây dựng một phân tích giá trị kỳ dị của ma trận A=\begin{bmatrix}4&11&14\\8&7&-2\end{bmatrix}.

Giải: Việc xây dựng có thể được chia thành ba bước.

Bước 1: Tìm phân tích trực giao đường chéo của A^TA. Tức là, tìm các giá trị riêng của A^TA và một tập hợp trực chuẩn các vectơ riêng tương ứng. Nếu A chỉ có hai cột thì có thể thực hiện bằng tay. Với các ma trận lớn hơn, thường cần dùng chương trình xử lý ma trận. Tuy nhiên, với ma trận A trong ví dụ này, dữ liệu riêng của A^TA đã được cung cấp ở Ví dụ 1.

Bước 2: Thiết lập ma trận V\Sigma . Sắp xếp các giá trị riêng của A^TA theo thứ tự giảm dần. Trong ví dụ 1, các giá trị riêng đã được liệt kê sẵn theo thứ tự giảm dần: 360,900. Các vectơ riêng đơn vị tương ứng, \mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3, là các vectơ riêng phải của A. Dựa vào ví dụ 1, ta xây dựng:

V=[\mathbf{v}_1\;\mathbf{v}_2\;\mathbf{v}_3]=\begin{bmatrix}1/3&-2/3&2/3\\2/3&-1/3&-2/3\\2/3&2/3&1/3\end{bmatrix}

Căn bậc hai của các giá trị riêng là các giá trị kỳ dị:

\sigma_1=6\sqrt{10};\quad\sigma_2=3\sqrt{10};\quad\sigma_3=0

Các giá trị kỳ dị khác 0 là các phần tử đường chéo của ma trận D. Ma trận \Sigma có cùng kích thước với A, chứa D ở góc trên bên trái và các phần tử còn lại là 0.

D=\begin{bmatrix}6\sqrt{10}&0\\0&3\sqrt{10}\end{bmatrix};\quad\Sigma=\begin{bmatrix}D&0\\\end{bmatrix}=\begin{bmatrix}6\sqrt{10}&0&0\\0&3\sqrt{10}&0\end{bmatrix}

Bước 3. Xây dựng ma trận U. Khi A có hạng r, r cột đầu tiên của U là các vectơ chuẩn hóa từ A\mathbf{v}_1,\dotsc,A\mathbf{v}_r. Trong ví dụ này, A có hai giá trị kỳ dị khác 0, nên \text{rank}\,(A)=2. Nhớ rằng từ công thức (2) và đoạn văn trước ví dụ 2, ta có:

\|A\mathbf{v}_1\|=\sigma_1;\quad\|A\mathbf{v}_2\|=\sigma_2

Vậy nên:

\mathbf{u}_1=\frac{1}{\sigma_1}A\mathbf{v}_1=\frac{1}{6\sqrt{10}}\begin{bmatrix}18\\6\end{bmatrix}=\begin{bmatrix}3/\sqrt{10}\\1/\sqrt{10}\end{bmatrix}

\mathbf{u}_2=\frac{1}{\sigma_2}A\mathbf{v}_2=\frac{1}{3\sqrt{10}}\begin{bmatrix}3\\-9\end{bmatrix}=\begin{bmatrix}1/\sqrt{10}\\-3/\sqrt{10}\end{bmatrix}

Ta thấy \{\mathbf{u}_1,\mathbf{u}_2\} đã tạo thành một cơ sở cho \mathbb{R}^2, nên không cần thêm vectơ nào nữa. Vậy ta có:

U=\begin{bmatrix}3/\sqrt{10}&1/\sqrt{10}\\1/\sqrt{10}&-3/\sqrt{10}\end{bmatrix}

Phân tích giá trị kỳ dị của A là:

A=\begin{bmatrix}3/\sqrt{10}&1/\sqrt{10}\\1/\sqrt{10}&-3/\sqrt{10}\end{bmatrix}\begin{bmatrix}6\sqrt{10}&0&0\\0&3\sqrt{10}&0\end{bmatrix}\begin{bmatrix}1/3&2/3&2/3\\-2/3&-1/3&2/3\\2/3&-2/3&1/3\\\end{bmatrix}

Ví dụ 4: Tìm một phân tích giá trị kỳ dị của A=\begin{bmatrix}1&-1\\-2&2\\2&-2\end{bmatrix}.

Giải: Trước tiên, tính A^T A=\begin{bmatrix}9&-9\\-9&9\end{bmatrix}. Các giá trị riêng của A^T A là 18 và 0 với các vectơ riêng đơn vị tương ứng là

\mathbf{v}_1=\begin{bmatrix}1/\sqrt{2}\\-1/\sqrt{2}\end{bmatrix},\quad\mathbf{v}_2=\begin{bmatrix}1/\sqrt{2}\\1/\sqrt{2}\end{bmatrix}

Các vectơ đơn vị này tạo thành các cột của ma trận V:

V=[\mathbf{v}_1\;\,\mathbf{v}_2]=\begin{bmatrix}1/\sqrt{2}&1/\sqrt{2}\\-1/\sqrt{2}&1/\sqrt{2}\end{bmatrix}

Các giá trị kỳ dị là \sigma_1=\sqrt{18}=3\sqrt{2}\sigma_2=0. Vì chỉ có một giá trị kỳ dị khác 0, “ma trận” D có thể viết thành một số duy nhất. Tức là, D=3\sqrt{2}. Ma trận \Sigma có cùng kích thước với A, với D nằm ở góc trên bên trái:

\Sigma=\begin{bmatrix}D&0\\0&0\\0&0\\\end{bmatrix}=\begin{bmatrix}3\sqrt{2}&0\\0&0\\0&0\end{bmatrix}

Để xây dựng U, đầu tiên tính A\mathbf{v}_1A\mathbf{v}_2:

A\mathbf{v}_1=\begin{bmatrix}2/\sqrt{2}\\-4/\sqrt{2}\\4/\sqrt{2}\end{bmatrix},\quad A\mathbf{v}_2=\begin{bmatrix}0\\0\\0\end{bmatrix}

Để kiểm tra lại phép tính, hãy xác minh rằng \|A\mathbf{v}_1\|=\sigma_1=3\sqrt{2}. Tất nhiên, A\mathbf{v}_2=0\|A\mathbf{v}_2\|=\sigma_2=0. Cột duy nhất đã tìm được cho U cho đến lúc này là:

\mathbf{u}_1=\frac{1}{3\sqrt{2}}A\mathbf{v}_1=\begin{bmatrix}2/3\\-2/3\\2/3\end{bmatrix}

Các cột còn lại của U được tìm bằng cách mở rộng tập \{\mathbf{u}_1\} thành một cơ sở trực chuẩn cho \mathbb{R}^3. Trong trường hợp này, ta cần hai vectơ đơn vị trực giao \{\mathbf{u}_2\}\{\mathbf{u}_3\}, sao cho chúng trực giao với \{\mathbf{u}_1\}. Xem Hình 3.

Mỗi vectơ phải thỏa mãn \mathbf{u}_1^T\mathbf{x}=0, tương đương với phương trình x_1-2x_2+2x_3=0. Một cơ sở cho tập nghiệm của phương trình này là:

\mathbf{w}_1=\begin{bmatrix}2\\1\\0\end{bmatrix},\quad\mathbf{w}_2=\begin{bmatrix}2\\-2\\3\end{bmatrix}

(Hãy kiểm tra rằng \mathbf{w}_1\mathbf{w}_2 đều trực giao với \mathbf{u}_1.) Áp dụng quá trình Gram–Schmidt (kèm theo chuẩn hóa) lên \{\mathbf{w}_1,\mathbf{w}_2\}, ta được:

\mathbf{u}_2=\begin{bmatrix}2/\sqrt{5}\\1/\sqrt{5}\\0\end{bmatrix},\quad\mathbf{u}_3=\begin{bmatrix}-2/\sqrt{45}\\4/\sqrt{45}\\5/\sqrt{45}\end{bmatrix}

Cuối cùng, đặt U=[\mathbf{u}_1\;\,\mathbf{u}_2\;\,\mathbf{u}_3], lấy \Sigma V^T từ trên, và viết:

A=\begin{bmatrix}1&-1\\-2&2\\2&-2\end{bmatrix}=\begin{bmatrix}1/3&2/\sqrt{5}&-2/\sqrt{45}\\-2/3&1/\sqrt{5}&4/\sqrt{45}\\2/3&0&5/\sqrt{45}\end{bmatrix}\begin{bmatrix}3\sqrt{2}&0\\0&0\\0&0\end{bmatrix}\begin{bmatrix}1/\sqrt{2}&-1/\sqrt{2}\\1/\sqrt{2}&1/\sqrt{2}\end{bmatrix}

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Hotline: 039.2266.928
Khóa học Toefl
Phone now