Bài giảng 22: Ứng Dụng Chuỗi Markov
(Nếu công thức chưa load được hoặc mờ, các bạn ấn refresh để công thức hiện và rõ nét hơn nhé!)
Các chuỗi Markov được mô tả trong phần này được sử dụng như các mô hình toán học cho nhiều tình huống khác nhau trong sinh học, kinh doanh, hóa học, kỹ thuật, vật lý và nhiều lĩnh vực khác. Trong mỗi trường hợp, mô hình được dùng để mô tả một thí nghiệm hoặc phép đo được thực hiện nhiều lần theo cùng một cách, trong đó kết quả của mỗi lần thử nghiệm sẽ thuộc một trong số các kết quả có thể được xác định trước, và kết quả của một lần thử nghiệm chỉ phụ thuộc vào lần thử nghiệm ngay trước đó.
Chẳng hạn, nếu dân số của một thành phố và vùng ngoại ô của nó được đo lường hàng năm, thì một vector như:
(1)
có thể biểu thị rằng 60% dân số sống trong thành phố và 40% sống ở vùng ngoại ô. Các số thập phân trong có tổng bằng 1 vì chúng thể hiện toàn bộ dân số của khu vực. Sử dụng tỷ lệ phần trăm thay vì tổng dân số là cách tiếp cận tiện lợi hơn trong trường hợp này.
Định nghĩa
Một vector xác suất là một vector có các phần tử không âm và tổng của chúng bằng 1.
Một ma trận ngẫu nhiên qưlà một ma trận vuông mà các cột của nó là các vector xác suất.
Một chuỗi Markov là một dãy các vector xác suất , cùng với một ma trận ngẫu nhiên
, sao cho:
Do đó, chuỗi Markov được mô tả bằng phương trình sai phân bậc nhất:
Khi một chuỗi Markov với các vector trong mô tả một hệ thống hoặc một dãy thí nghiệm, các phần tử trong
lần lượt thể hiện xác suất mà hệ thống đang ở trong mỗi trạng thái trong số nn trạng thái có thể, hoặc xác suất rằng kết quả của thí nghiệm thuộc một trong nn kết quả có thể. Vì lý do này,
thường được gọi là vector trạng thái.
Ví dụ 1: Trong phần 1, chúng ta đã xem xét một mô hình về sự di chuyển dân số giữa thành phố và vùng ngoại ô. Xem hình 1. Sự di cư hàng năm giữa hai khu vực này trong vùng đô thị được xác định bởi ma trận di cư :
Nói cách khác, mỗi năm có 5% dân số thành phố chuyển đến vùng ngoại ô, và 3% dân số vùng ngoại ô chuyển vào thành phố. Các cột của là vector xác suất, vì vậy
là một ma trận ngẫu nhiên. Giả sử vào năm 2020, dân số của khu vực là 600.000 người ở thành phố và 400.000 người ở vùng ngoại ô. Khi đó, phân bố dân số ban đầu của khu vực được cho bởi
trong (1). Phân bố dân số vào năm 2021 là bao nhiêu? Vào năm 2022 thì sao?

Giải: Trong phần trước, ta đã thấy rằng sau một năm, vector dân số biến đổi thành
Chia cả hai vế của phương trình trên cho tổng dân số 1 triệu, và sử dụng tính chất , ta có:
Vector mô tả phân bố dân số năm 2021. Nghĩa là 58,2% dân số sống trong thành phố và 41,8% sống ở vùng ngoại ô. Tương tự, phân bố dân số năm 2022 được mô tả bởi
, trong đó:
Điều này có nghĩa là vào năm 2022, 56,5% dân số sống trong thành phố và 43,5% sống ở vùng ngoại
Ví dụ 2: Giả sử kết quả bầu cử quốc hội tại một khu vực bỏ phiếu nhất định được biểu diễn bởi một vector trong
:
trong đó
- D (Democratic): là phần trăm bỏ phiếu cho Đảng Dân chủ,
- R (Republican): phần trăm bỏ phiếu cho Đảng Cộng hòa,
- O (Other): phần trăm bỏ phiếu cho đảng khác.
Giả sử chúng ta ghi lại kết quả bầu cử quốc hội cứ mỗi hai năm bằng một vector kiểu này, và kết quả của một cuộc bầu cử chỉ phụ thuộc vào kết quả của cuộc bầu cử trước đó. Khi đó, dãy vector mô tả số phiếu bầu qua từng kỳ bầu cử có thể tạo thành một chuỗi Markov.
Ví dụ, một ma trận xác suất chuyển đổi cho chuỗi này có thể là:

Các phần tử trong cột đầu tiên, được đánh dấu là D, biểu diễn hành vi của những người đã bỏ phiếu cho Đảng Dân chủ trong kỳ bầu cử trước. Ở đây, ta giả định rằng:
- 70% vẫn tiếp tục bầu cho Dân chủ trong kỳ bầu cử tiếp theo.
- 20% chuyển sang bầu cho Cộng hòa.
- 10% chuyển sang bầu cho một đảng khác.
Các cột khác của cũng được diễn giải theo cách tương tự. Sơ đồ mô tả sự thay đổi trong lựa chọn bầu cử qua từng kỳ được thể hiện trong hình 2.

Nếu các tỷ lệ “chuyển đổi” giữa các đảng giữ nguyên trong nhiều năm, từ kỳ bầu cử này sang kỳ bầu cử tiếp theo, thì dãy vector mô tả kết quả bầu cử sẽ tạo thành một chuỗi Markov. Giả sử kết quả của một kỳ bầu cử được cho bởi:
Hãy xác định kết quả có khả năng xảy ra trong kỳ bầu cử tiếp theo và kỳ bầu cử sau đó nữa.
Giải: Kết quả của kỳ bầu cử tiếp theo được mô tả bởi vector trạng thái x1x_1, và kết quả của kỳ bầu cử sau đó được mô tả bởi , trong đó:
Giải thích ý nghĩa của
Giả sử có 1000 người tham gia bỏ phiếu trong cuộc bầu cử đầu tiên, trong đó:
- 550 người bầu cho Dân chủ (D)
- 400 người bầu cho Cộng hòa (R)
- 50 người bầu cho đảng khác (O)
Trong kỳ bầu cử tiếp theo:
- 70% của 550 người tiếp tục bầu cho Dân chủ (D)
- 10% của 400 người chuyển từ Cộng hòa (R) sang Dân chủ (D)
- 30% của 50 người chuyển từ O sang D
Tổng số phiếu bầu cho Dân chủ (D) trong lần bầu cử tiếp theo là:
(2)
Tương ứng với 44% tổng số phiếu.
Phép tính trên thực chất chính là phép nhân ma trận để tính phần tử đầu tiên của . Các phần tử khác của
và
cũng có thể được tính toán tương tự.
- 1 - Bài giảng 1: Hệ thống động lực và Cú mèo đốm
- 2 - Bài giảng 2: Giá trị riêng và Vectơ riêng
- 3 - Bài giảng 3: Giá trị riêng và Vectơ riêng (tiếp theo)
- 4 - Bài giảng 4: Phương Trình Đặc Trưng
- 5 - Bài giảng 5: Ứng dụng giá trị riêng và vector riêng vào hệ động lực
- 6 - Bài giảng 6: Đường chéo hóa
- 7 - Bài giảng 7: Đường chéo hóa ma trận
- 8 - Bài giảng 8: Các ma trận có giá trị riêng không phân biệt
- 9 - Bài giảng 9: Vectơ riêng của các phép biến đổi tuyến tính
- 10 - Bài giảng 10: Ma trận của một phép biến đổi tuyến tính
- 11 - Bài giảng 11: Biến đổi tuyến tính trên
- 12 - Bài giảng 12: Giá trị riêng phức
- 13 - Bài giảng 13: Phần Thực và Phần Ảo của Vector
- 14 - Bài giảng 14: Giá trị riêng và vectơ riêng của một ma trận thực trên Cⁿ
- 15 - Bài giảng 15: Hệ Động Lực Rời Rạc
- 16 - Bài giảng 16: Mô Tả Hình Học của Nghiệm Hệ Động Lực Rời Rạc
- 17 - Bài giảng 17: Giá Trị Riêng Phức
- 18 - Bài giảng 18: Ứng Dụng Phương Pháp Ma Trận Vào Phương Trình Vi Phân
- 19 - Bài giảng 19: Tách Hệ Động Lực Học
- 20 - Bài giảng 20: Ước Lượng Lặp Cho Giá Trị Riêng
- 21 - Bài giảng 21: Ước Lượng Lặp Cho Giá Trị Riêng (tiếp theo)
- 22 - Bài giảng 22: Ứng Dụng Chuỗi Markov
- 23 - Bài giảng 23: Ứng Dụng Chuỗi Markov (tiếp theo)