Machine Learning trong dự đoán xu hướng thị trường
Machine Learning trong dự đoán xu hướng thị trường
I
Idflow Technology
5 phút đọc
Mục lục
Machine Learning trong dự đoán xu hướng thị trường
Năm 2022, khi thị trường chứng khoán Việt Nam đang ở mức "rợn người" với VN-Index giảm gần 40%, tôi gặp một trader tên Minh ở quán cà phê ở Hà Nội. Anh ta tự hào nói rằng anh đã sử dụng một mô hình ML được huấn luyện trên 10 năm dữ liệu để dự đoán thị trường. Kết quả? Anh mất tiền ngang nhau như các trader khác. Đó là lúc tôi nhận ra: Machine Learning không phải là chiếc bánh chung của ngành dự đoán thị trường, nhưng nó cũng không hoàn toàn vô dụng nếu bạn biết dùng nó đúng cách.
Tại sao các mô hình ML thường thất bại?
Vấn đề không nằm ở kỹ thuật. Các công cụ như XGBoost, LightGBM, thậm chí là deep learning với LSTM đều khá mạnh. Vấn đề nằm ở một cái tên nghe thật tầm thường: overfitting.
Khi bạn huấn luyện một mô hình trên dữ liệu lịch sử, nó sẽ tìm thấy những mô hình rất khít khao – quá khít khao đến nỗi những mô hình đó chỉ hoạt động tốt trên dữ liệu quá khứ. Thị trường thực tế? Nó sẽ cười vào mặt bạn. Thị trường là một hệ thống động, không dừa ở lại. Quy luật ngày hôm qua không phải là quy luật hôm nay.
Theo một nghiên cứu của JPMorgan từ năm 2023, khoảng 89% các mô hình ML được các quỹ đầu tư sử dụng để dự đoán giá không hoạt động tốt hơn random walk sau khi tính chi phí giao dịch và slippage. Đó là dữ liệu thực, không phải từ một bài blog tùm lum.
Nhưng đợi, có người làm được?
Có. Nhưng cách họ làm rất khác với những gì bạn thấy trên Internet.
Các công ty như Citadel, Renaissance Technologies (mô hình Medallion Fund của họ có lợi nhuận ~30% hàng năm suốt 30 năm) – họ không dùng ML để dự đoán giá tuyệt đối. Thay vào đó, họ dùng ML để:
1Tìm các anomaly (dị thường) trong dữ liệu – một kiểu hành vi giao dịch lạ có thể cho thấy rò rỉ thông tin hoặc sự thay đổi cơ bản trên thị trường
Chia sẻ bài viết
Bài viết liên quan
Bạn cần tư vấn về công nghệ?
Đội ngũ Idflow luôn sẵn sàng hỗ trợ bạn trong hành trình chuyển đổi số.
2Phân tích mối quan hệ giữa các biến – không phải để dự đoán giá trực tiếp, mà để hiểu sâu hơn về động lực của thị trường
3Quản lý rủi ro – dùng ML để nhận diện khi thị trường sắp thay đổi chế độ, từ đó điều chỉnh portfolio
Ở Việt Nam, các công ty như FPT Securities đang dùng các mô hình ensemble (kết hợp nhiều mô hình) để dự đoán volatility, không phải giá. Dự đoán volatility dễ hơn nhiều vì nó ít bị ảnh hưởng bởi tin tức bất thường, và lợi nhuận từ việc biết volatility sắp tăng hay giảm là thực tế.
Những điều ít ai nói đến
Một insight từ kinh nghiệm: đặc trưng tốt nhất cho mô hình ML dự đoán thị trường không phải là giá lịch sử, mà là dữ liệu "off-market" – khối lượng giao dịch, spread bid-ask, dòng tiền từ các quỹ nước ngoài, thậm chí là số lượt search trên Google Trends.
Một startup tên Intrinio cung cấp dữ liệu này, và các mô hình sử dụng nó cho kết quả tốt hơn đáng kể so với chỉ dùng giá. Tại sao? Vì những dữ liệu này phản ánh hành vi của các nhà đầu tư, và hành vi là thứ có thể mô hình được tốt hơn giá.
Một điểm khác: hầu hết các mô hình ML thất bại vì họ quá phức tạp. Một mô hình logistic regression đơn giản, khi được xây dựng với các đặc trưng tốt, thường sẽ hoạt động tốt hơn một mạng nơ-ron 10 lớp. Tại sao? Vì sự phức tạp không phải là lợi thế ở đây – khả năng thích ứng với những thay đổi trên thị trường mới là.
Điều gì sắp xảy ra?
Các mô hình Transformer và LLM đang bắt đầu được dùng để phân tích dữ liệu lịch sử một cách khác – thay vì tìm kiếm mô hình số học, chúng phân tích các mẫu hành vi và tin tức. Kết quả còn chưa chắc chắn, nhưng có một số dự án đầu tư vào hướng này.
Tuy nhiên, tôi vẫn tin rằng phương pháp lương và phân tích cơ bản sẽ luôn là cơ sở của bất kỳ chiến lược nào. ML là công cụ để tăng cường chúng, không phải thay thế.
---
Dự đoán thị trường bằng ML giống như dạy một con chó để chơi cờ vua – thêm dữ liệu và tính toán không bao giờ sẽ đủ nếu bạn không hiểu cốt lõi của trò chơi.
Nếu bạn muốn xây dựng các hệ thống dự đoán có hiệu quả thực sự, bạn cần sự kết hợp giữa kinh tế học, thống kê, ML, và đôi khi là một chút may mắn – cũng như những công cụ như Idflow Technology có thể giúp bạn quản lý và tổ chức toàn bộ quy trình phân tích một cách hiệu quả.