Bài giảng 26: Dạng Toàn Phương

Lesson Attachments

(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)

Cho đến thời điểm này, chúng ta đã chủ yếu tập trung vào các phương trình tuyến tính, ngoại trừ các tổng bình phương đã gặp trong phần 6 khi tính \mathbf{x}^T\mathbf{x}. Những tổng bình phương như vậy và các biểu thức tổng quát hơn, được gọi là dạng toàn phương, xuất hiện thường xuyên trong các ứng dụng của đại số tuyến tính đối với kỹ thuật (chẳng hạn trong tiêu chí thiết kế và bài toán tối ưu), và xử lý tín hiệu (chẳng hạn như công suất nhiễu đầu ra). Chúng cũng xuất hiện, ví dụ, trong vật lý (như thế năng và động năng), hình học vi phân (độ cong pháp tuyến của mặt), kinh tế học (các hàm lợi ích), và thống kê (trong các ellipsoid độ tin cậy). Một phần nền tảng toán học cho những ứng dụng như vậy được xây dựng dễ dàng từ những kết quả liên quan đến ma trận đối xứng.

Một dạng toàn phương trên \mathbb{R}^n là một hàm Q được định nghĩa trên \mathbb{R}^n, sao cho giá trị của Q tại một vectơ \mathbf{x}\in\mathbb{R}^n được tính bởi biểu thức Q(\mathbf{x})=\mathbf{x}^T A\mathbf{x}, trong đó A là một ma trận đối xứng kích thước n\times n. Ma trận A được gọi là ma trận của dạng toàn phương.

Ví dụ đơn giản nhất của một dạng toàn phương khác không là Q(\mathbf{x})=\mathbf{x}^T I\mathbf{x}=\|\mathbf{x}\|^2 . Các ví dụ 1 và 2 sẽ chỉ ra mối liên hệ giữa bất kỳ ma trận đối xứng nào A và dạng toàn phương \mathbf{x}^T A\mathbf{x}.

Ví dụ 1: Cho \mathbf{x}=\begin{bmatrix}x_1\\x_2\end{bmatrix}. Tính \mathbf{x}^T A\mathbf{x} với các ma trận sau:

a) A=\begin{bmatrix}4&0\\0&3\end{bmatrix}

b) A=\begin{bmatrix}3&-2\\-2&7\end{bmatrix}

Giải:

a) \mathbf{x}^T A\mathbf{x}=\begin{bmatrix}x_1&x_2\end{bmatrix}\begin{bmatrix}4&0\\0&3\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=4x_1^2+3x_2^2

b) Có hai phần tử -2 trong ma trận A. Hãy chú ý cách chúng xuất hiện trong quá trình tính toán. Phần tử ở vị trí (1,2) của A được in đậm để nhấn mạnh.

\begin{matrix}\mathbf{x}^T A\mathbf{x}=&\begin{bmatrix}x_1&x_2\end{bmatrix}\begin{bmatrix}3&\mathbf{-2}\\\mathbf{-2}&7\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}x_1&x_2\end{bmatrix}\begin{bmatrix}3x_1-\mathbf{2}x_2\\-2x_1+7x_2\end{bmatrix}\\=&x_1(3x_1-\mathbf{2}x_2)+x_2(-2x_1+7x_2)\\=&3x_1^2-\mathbf{2}x_1x_2-2x_2x_1+7x_2^2\\=&3x_1^2-4x_1x_2+7x_2^2\\\end{matrix}

Việc xuất hiện của -4x_1x_2 trong dạng toàn phương ở ví dụ 1(b) là do các phần tử ngoài đường chéo −2 trong ma trận A. Ngược lại, dạng toàn phương tương ứng với ma trận đường chéo trong ví dụ 1(a) không có tích chéo x_1x_2.

Ví dụ 2: Với \mathbf{x}\in\mathbb{R}^3, cho  Q(\mathbf{x})=5x_1^2+3x_2^2+2x_3^2-x_1x_2+8x_2x_3. Hãy viết dạng toàn phương này dưới dạng Q(\mathbf{x})=\mathbf{x}^T A\mathbf{x}.

Giải: Các hệ số của x_1^2,x_2^2,x_3^2 sẽ nằm trên đường chéo của ma trận A. Để A đối xứng, các hệ số của x_i x_j với i\ne j cần được chia đều cho các phần tử tại vị trí (i,j)(j,i) trong A. Hệ số của x_1 x_3 là 0, nên các phần tử ở vị trí đó cũng sẽ là 0. Dễ thấy rằng ta có thể viết:

A=\begin{bmatrix}5&-\tfrac{1}{2}&0\\-\tfrac{1}{2}&3&4\\0&4&2\end{bmatrix}

Khi đó:

Q(\mathbf{x})=\mathbf{x}^T A\mathbf{x}=\begin{bmatrix}x_1&x_2&x_3\end{bmatrix}\begin{bmatrix}5&-\tfrac{1}{2}&0\\-\tfrac{1}{2}&3&4\\0&4&2\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}

Ví dụ 3: Cho Q(\mathbf{x})=x_1^2-8x_1x_2-5x_2^2 . Tính giá trị của Q(\mathbf{x}) tại các điểm \mathbf{x}=\begin{bmatrix}3\\1\end{bmatrix},\begin{bmatrix}2\\-2\end{bmatrix}\begin{bmatrix}1\\-3\end{bmatrix}.

\begin{matrix}Q(-3,1)=&(-3)^2-8(-3)(1)-5(1)^2&=28\\Q(2,-2)=&(2)^2-8(2)(-2)-5(-2)^2&=16\\Q(1,-3)=&(1)^2-8(1)(-3)-5(-3)^2&=-20\\\end{matrix}

Trong một số trường hợp, dạng toàn phương sẽ dễ sử dụng hơn nếu không có các tích chéo – tức là, khi ma trận của dạng toàn phương là ma trận đường chéo.

Thay đổi biến trong một dạng toàn phương

Nếu \mathbf{x} là một vectơ biến trong \mathbb{R}^n, thì một phép thay đổi biến là một phương trình có dạng:

(1)   \begin{equation*}\mathbf{x}=P\mathbf{y}\quad\Leftrightarrow\quad\mathbf{y}=P^{-1}\mathbf{x}\end{equation*}

trong đó P là một ma trận khả nghịch và \mathbf{y} là vectơ biến mới trong \mathbb{R}^n. Ở đây, \mathbf{y} là vectơ tọa độ của \mathbf{x} đối với cơ sở của \mathbb{R}^n được xác định bởi các cột của ma trận P.

Nếu phép thay đổi biến (1) được áp dụng vào một dạng toàn phương \mathbf{x}^T A\mathbf{x}, thì ta có:

(2)   \begin{equation*}\mathbf{x}^T A\mathbf{x}=(P\mathbf{y})^T A(P\mathbf{y})=\mathbf{y}^T P^T A P\mathbf{y}=\mathbf{y}^T(P^T A P)\mathbf{y}\end{equation*}

Và ma trận mới của dạng toàn phương là P^T A P. Vì A là ma trận đối xứng, Định lý 2 đảm bảo rằng tồn tại một ma trận trực giao P sao cho P^T A P là ma trận chéo D, và khi đó dạng toàn phương trong (2) trở thành \mathbf{y}^T D\mathbf{y}. Đây chính là chiến lược sẽ được sử dụng trong ví dụ tiếp theo.

Ví dụ 4: Thực hiện một phép thay đổi biến để biến đổi dạng toàn phương trong ví dụ 3 thành một dạng toàn phương không có số hạng tích chéo.

Giải: Ma trận của dạng toàn phương trong ví dụ 3 là

A=\begin{bmatrix}1&-4\\-4&-5\\\end{bmatrix}

Bước đầu tiên là chéo hóa trực giao ma trận A. Các giá trị riêng của A\lambda=3 \lambda=-7 . Các vectơ riêng đơn vị tương ứng là:

\lambda=3:\quad\begin{bmatrix}2/\sqrt{5}\\-1/\sqrt{5}\end{bmatrix};\qquad\lambda=-7:\quad\begin{bmatrix}1/\sqrt{5}\\2/\sqrt{5}\end{bmatrix}

Hai vectơ này đương nhiên trực giao với nhau (vì tương ứng với các giá trị riêng khác nhau), và do đó tạo thành một cơ sở trực chuẩn cho \mathbb{R}^2. Đặt:

P=\begin{bmatrix}2/\sqrt{5}&1/\sqrt{5}\\-1/\sqrt{5}&2/\sqrt{5}\end{bmatrix},\quad D=\begin{bmatrix}3&0\\0&-7\end{bmatrix}

Khi đó A=P D P^{-1}D=P^{-1}A P=P^T A P . Như đã trình bày trước đó, một phép thay đổi biến phù hợp là \mathbf{x}=P\mathbf{y}, trong đó \mathbf{x}=\begin{bmatrix}x_1\\x_2\end{bmatrix},\mathbf{y}=\begin{bmatrix}y_1\\y_2\end{bmatrix}.

Vậy:

\begin{matrix}x_1^2-8x_1x_2-5x_2^2=&\mathbf{x}^T A\mathbf{x}=(P\mathbf{y})^T A(P\mathbf{y})\\=&\mathbf{y}^T P^TAP\mathbf{y}=\mathbf{y}^T D\mathbf{y}\\=&3y_1^2-7y_2^2\\\end{matrix}

Để minh họa cho sự tương đương giữa các dạng toàn phương trong ví dụ 4, ta có thể tính Q(\mathbf{x}) với \mathbf{x}=(2,-2) bằng cách sử dụng dạng mới. Vì \mathbf{x}=P\mathbf{y}, nên \mathbf{y}=P^{-1}\mathbf{x}=P^T\mathbf{x}, do P là trực giao. Tính:

\mathbf{y}=P^T\mathbf{x}=\begin{bmatrix}2/\sqrt{5}&-1/\sqrt{5}\\1/\sqrt{5}&2/\sqrt{5}\end{bmatrix}\begin{bmatrix}2\\-2\end{bmatrix}=\begin{bmatrix}6/\sqrt{5}\\-2/\sqrt{5}\end{bmatrix}

Do đó:

Q(\mathbf{x}) =3y_1^2-7y_2^2=3\cdot\left(\frac{6}{\sqrt{5}}\right)^2-7\cdot\left(\frac{-2}{\sqrt{5}}\right)^2=\frac{80}{5}=16

Kết quả này khớp với giá trị Q(\mathbf{x}) ở ví dụ 3 khi \mathbf{x}=(2,-2). (Xem hình 1.)

HÌNH 1 Thay đổi biến trong biểu thức \mathbf{x}^T A\mathbf{x}.

Ví dụ 4 minh họa cho định lý sau đây. Phần chứng minh định lý về cơ bản đã được trình bày trước ví dụ 4.

ĐỊNH LÝ 4 Định lý trục chính 
Cho A là một ma trận đối xứng cấp n\times n. Khi đó tồn tại một phép thay đổi biến trực giao, \mathbf{x}=P\mathbf{y}, biến đổi dạng toàn phương \mathbf{x}^T A\mathbf{x} thành dạng toàn phương \mathbf{y}^T D\mathbf{y} không có số hạng tích chéo.

Các cột của ma trận P trong định lý được gọi là các trục chính của dạng toàn phương \mathbf{x}^T A\mathbf{x}. Vectơ \mathbf{y} là vectơ tọa độ của \mathbf{x} theo cơ sở trực chuẩn của \mathbb{R}^n được tạo bởi các trục chính đó.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Hotline: 039.2266.928
Khóa học Toefl
Phone now