Bài giảng 21: Ứng dụng của Không Gian Tích Trong (tiếp theo)
(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)
Phân Tích Xu Hướng Dữ Liệu
Giả sử
là một hàm chưa biết, nhưng ta biết (có thể chỉ xấp xỉ) các giá trị của nó tại các điểm
. Nếu tồn tại một “xu hướng tuyến tính” trong dữ liệu
, thì ta có thể kỳ vọng rằng các giá trị của
có thể được xấp xỉ bằng một hàm dạng
. Nếu dữ liệu có một “xu hướng bậc hai”, thì ta sẽ thử một hàm dạng
.
Trong một số bài toán thống kê, việc tách riêng xu hướng tuyến tính khỏi xu hướng bậc hai (và có thể cả bậc ba hoặc cao hơn) là điều quan trọng. Ví dụ, giả sử các kỹ sư đang phân tích hiệu suất của một chiếc xe mới, và
là khoảng cách giữa xe và một điểm mốc tại thời điểm
. Nếu xe đang di chuyển với vận tốc không đổi, đồ thị của
sẽ là một đường thẳng, với độ dốc biểu thị vận tốc của xe. Nếu đạp ga đột ngột, đồ thị của
sẽ thay đổi để bao gồm thêm thành phần bậc hai và có thể cả thành phần bậc ba (do gia tốc gây ra). Để phân tích khả năng vượt xe khác, chẳng hạn, các kỹ sư có thể muốn tách riêng các thành phần bậc hai và bậc ba ra khỏi thành phần tuyến tính.
Nếu hàm số được xấp xỉ bằng một đường cong có dạng
, thì hệ số
có thể không cung cấp thông tin mong muốn về xu hướng bậc hai trong dữ liệu, vì nó có thể không “độc lập” về mặt thống kê với các hệ số
khác. Để thực hiện điều được gọi là phân tích xu hướng trong dữ liệu, ta giới thiệu một tích vô hướng trong không gian
. Với
thuộc
, ta định nghĩa:
![]()
Trong thực tế, các nhà thống kê hiếm khi cần xem xét xu hướng trong dữ liệu có bậc cao hơn bậc ba hoặc bậc bốn. Vì vậy, hãy để
là một cơ sở trực giao của không gian con
trong
, được tạo ra bằng quy trình Gram – Schmidt áp dụng cho các đa thức
. Tồn tại một đa thức
sao cho giá trị của nó tại các điểm
trùng với giá trị của hàm chưa biết
. Gọi
là hình chiếu trực giao của gg lên
(theo tích vô hướng đã định nghĩa ở trên), tức là:
![]()
Khi đó,
được gọi là hàm xu hướng bậc ba, và
là các hệ số xu hướng của dữ liệu. Hệ số
biểu thị xu hướng tuyến tính,
biểu thị xu hướng bậc hai, và
biểu thị xu hướng bậc ba. Trong một số trường hợp dữ liệu thỏa điều kiện nhất định, các hệ số này là độc lập về mặt thống kê.
Vì
là trực giao, ta có thể tính từng hệ số xu hướng một cách riêng rẽ, không phụ thuộc vào các hệ số còn lại. (Nhớ rằng:
.) Ta có thể bỏ qua
và
nếu chỉ quan tâm đến xu hướng bậc hai. Và nếu, chẳng hạn, ta muốn xác định xu hướng bậc bốn, ta chỉ cần tìm một đa thức
trực giao với
(sử dụng Gram-Schmidt), rồi tính
.
Ví dụ 2: Ứng dụng đơn giản và phổ biến nhất của phân tích xu hướng xảy ra khi các điểm
có thể được điều chỉnh sao cho cách đều nhau và tổng bằng 0. Hãy tìm một hàm xu hướng bậc hai phù hợp với các dữ liệu
.
Giải: Các tọa độ
đã được chia tỷ lệ phù hợp để sử dụng các đa thức trực giao

Các phép tính chỉ sử dụng các vectơ này, không cần đến công thức cụ thể của các đa thức trực giao. Xấp xỉ tốt nhất cho dữ liệu bằng các đa thức trong
là hình chiếu trực giao được cho bởi:

Và
(3) ![]()
Vì hệ số của
không quá nhỏ, nên có thể kết luận hợp lý rằng dữ liệu có xu hướng ít nhất là bậc hai. Điều này được xác nhận bởi đồ thị trong hình 2.

- 1 - Bài giảng 1: Tích Trong
- 2 - Bài giảng 2: Độ Dài của Một Vector
- 3 - Bài giảng 3: Các Véc-tơ Trực Giao
- 4 - Bài giảng 4: Tập hợp trực giao
- 5 - Bài giảng 5: Phép chiếu trực giao
- 6 - Bài giảng 6: Tập Hợp Trực Chuẩn
- 7 - Bài giảng 7: Phép chiếu trực giao
- 8 - Bài giảng 8: Tính chất của Phép Chiếu Trực Giao
- 9 - Bài giảng 9: Quy trình Gram–Schmidt
- 10 - Bài giảng 10: Cơ Sở Trực Chuẩn, Phân Tích QR Của Ma Trận
- 11 - Bài giảng 11: Bài toán Bình phương nhỏ nhất
- 12 - Bài giảng 12: Các phương pháp tính cho nghiệm bình phương tối thiểu
- 13 - Bài giảng 13: Học Máy và Mô Hình Tuyến Tính
- 14 - Bài giảng 14: Khớp Đường Cong Bình Phương Tối Thiểu
- 15 - Bài giảng 15: Hồi quy bội
- 16 - Bài giảng 16: Không gian tích trong
- 17 - Bài giảng 17: Quá trình Gram–Schmidt
- 18 - Bài giảng 18: Hai Bất Đẳng Thức
- 19 - Bài giảng 19: Một Tích Vô Hướng cho Không Gian C[a,b]
- 20 - Bài giảng 20: Ứng dụng của Không Gian Tích Trong
- 21 - Bài giảng 21: Ứng dụng của Không Gian Tích Trong (tiếp theo)
- 22 - Bài giảng 22: Chuỗi Fourier
