Sinh viên phát kiến công nghệ dự đoán giá cổ phiếu

GD&TĐ - Dựa vào mô hình học sâu tiên tiến, sinh viên Nguyễn Quốc Anh (Đại học RMIT) đã giải bài toán dự đoán giá cổ phiếu với độ chính xác cao.

Quốc Anh thuyết trình về sản phẩm dự đoán giá cổ phiếu.
Quốc Anh thuyết trình về sản phẩm dự đoán giá cổ phiếu.

Giảm thiểu rủi ro

Nguyễn Quốc Anh chia sẻ, thị trường chứng khoán bị ảnh hưởng bởi nhiều yếu tố, chẳng hạn như tâm lý tiêu dùng, kinh tế vĩ mô và vi mô, cũng như chính sách tiền tệ. Tất cả khiến ngách tài chính này trở nên khó đoán đối với những nhà giao dịch tìm kiếm lợi nhuận ổn định với mức rủi ro thấp.

Vậy nên, câu hỏi “liệu có chỉ báo nào giúp giảm rủi ro trong giao dịch tài chính?” đã khơi gợi ở Quốc Anh hứng thú nghiên cứu giao dịch bằng thuật toán. Đây là khía cạnh vẫn chưa được khai phá nhiều ở Đông Nam Á bởi môi trường giao dịch thiếu linh động và độ thanh khoản thấp so với các nước Bắc Mỹ hoặc châu Âu.

Do đó, các mô hình học máy và học sâu ở khu vực này chưa tiến bộ đáng kể. “Trong tài chính, dù dữ liệu chuỗi giá trị (time series) khá phong phú, phương thức tiếp cận vẫn theo hướng truyền thống”, Quốc Anh nói.

Dưới sự hướng dẫn của TS Hà Xuân Sơn và TS Thái Trung Hiếu - giảng viên ngành Kinh doanh (chuyên ngành Kinh doanh trên ứng dụng Blockchain) tại RMIT Việt Nam, Quốc Anh đã hoàn thành nghiên cứu với tiêu đề: “Mô hình phương trình vi phân cùng Thuyết tái tạo không gian pha trong dự báo giá cổ phiếu”.

Theo đó, Quốc Anh đề xuất một ứng dụng mới của các phương trình vi phân (neural ODE hoặc NODE) trong dự báo giá cổ phiếu. NODE có thể được hiểu là một mô hình học sâu gồm nhiều mạng nơ-ron tinh vi cho mô hình dự đoán.

“Em đặt mục tiêu kiểm tra khả năng dự báo của mô hình dựa trên giá cổ phiếu hằng ngày của 6 công ty Mỹ trong các lĩnh vực công nghệ, tài chính và dược phẩm từ năm 2003 đến năm 2023”, Quốc Anh cho biết.

“Mô hình tuân theo theo tỉ lệ 70:20:10. Trong đó, 70% dữ liệu được phân bổ cho việc huấn luyện, 20% để tinh chỉnh/xác nhận, và 10% còn lại dùng cho quá trình so sánh giữa giá trị thực và giá trị dự báo”, Quốc Anh chia sẻ.

Nghiên cứu đã sử dụng mô hình NODE, tức một mô hình học sâu dạng thần kinh (Neural) có khả năng xử lý các phương trình vi phân (Ordinary Differential Equations) theo thời gian liên tục. Nói một cách đơn giản, hãy tưởng tượng những thăng trầm về giá cổ phiếu hàng ngày như một đoàn tàu lượn siêu tốc.

Việc dự đoán tàu lượn sẽ đi tiếp đến đâu không dễ dàng, nhưng đó là những gì mọi người cố gắng làm khi họ đầu tư vào cổ phiếu. Các mô hình thuật toán có thể học hỏi từ những thăng trầm trong quá khứ của tàu lượn.

Nhưng thay vì chỉ nhìn vào các điểm riêng biệt trên tàu lượn siêu tốc (như giá của một cổ phiếu vào những ngày khác nhau, các đỉnh cổ phiếu…), mô hình NODE nhìn toàn bộ chuyến đi như một dòng chảy trơn tru theo thời gian.

Để tận dụng khả năng dự báo của mô hình, tác giả đã kết hợp một kỹ thuật tiền xử lý dữ liệu gọi là “tái tạo không gian pha” - Phase Space Reconstruction (PSR) từ lý thuyết hỗn loạn để chuyển đổi dữ liệu cổ phiếu ban đầu, gồm giá mở cửa, giá cao, giá thấp, giá đóng cửa, khối lượng giao dịch thành một không gian đa chiều.

Bằng cách đưa dữ liệu vào một không gian đa chiều, PSR cung cấp cho mô hình NODE một cái nhìn toàn diện hơn về thị trường, giúp nó có thể phát hiện ra những quy luật ẩn chứa trong dữ liệu mà người ta khó có thể tìm thấy nếu chỉ dùng phương pháp thống kê truyền thống để nhìn vào từng chỉ số riêng lẻ.

cong nghe du doan gia co phieu (1).jpg
Ảnh minh họa: INT

Dự đoán dài hạn chính xác vượt trội

Để kiểm tra khả năng của mô hình NODE, Nguyễn Quốc Anh đã so sánh mô hình của mình với 6 mô hình học sâu hiện đại khác, gồm: RNN, Transformer, SVR, LSTM, CNN và CNN-LSTM.

Tất cả các mô hình đều được lấy trực tiếp hoặc cảm hứng và sửa đổi từ các nghiên cứu hàng đầu đã công bố. Kết quả, NODE cho thấy độ dự đoán chính xác vượt trội so với đối thủ gần nhất LSTM trong việc dự đoán các giá trị dài hạn với sai số tối thiểu qua 1.000 bước thời gian, giảm lỗi hơn 70% cho mỗi cổ phiếu.

Quốc Anh chia sẻ, nhìn chung, có sự khác nhau giữa các ngành cổ phiếu. Cổ phiếu công nghệ được thúc đẩy bởi sự đổi mới sáng tạo, thường tăng trưởng nhanh và biến động cao, hấp dẫn các nhà đầu tư có khả năng chịu rủi ro.

Cổ phiếu tài chính ổn định hơn, hưởng lợi từ biến động lãi suất và chu kỳ kinh tế, khiến chúng phù hợp với các nhà đầu tư bảo thủ tìm kiếm cổ tức ổn định.

Cổ phiếu dược phẩm, phụ thuộc vào mức độ R&D của công ty sẽ mang lại những rủi ro riêng biệt liên quan đến quá trình phê duyệt theo quy định và hết hạn bằng sáng chế, nhưng có thể mang lại lợi nhuận đáng kể nếu có các lần ra mắt sản phẩm thành công. Những đặc điểm riêng biệt của từng lĩnh vực tạo ra những thách thức khác nhau đối với mô hình dựa trên học sâu trong việc dự đoán.

TS Hà Xuân Sơn cho biết mô hình này giải quyết những hạn chế của các phương pháp học sâu truyền thống trong việc nắm bắt các động lực thị trường chứng khoán phức tạp và phi tuyến.

“Mô hình cho thấy độ dự đoán chính xác dài hạn vượt trội và hiệu quả trong việc nắm bắt những biến động đột ngột trên thị trường như các vụ sụp đổ chớp nhoáng. Không chỉ dự đoán giá cổ phiếu, mô hình còn có triển vọng trong việc dự đoán các hệ thống hỗn mang khác, như được chứng minh qua những bài kiểm tra trên các tập dữ liệu Lorenz và Mackey-Glass”, TS Sơn chia sẻ.

Để tạo ra sản phẩm này, nhóm sinh viên phải tự học các ngôn ngữ như Python, SQL, LaTeX, sử dụng các công cụ GitHub, MongoDB, Lightning AI, kéo dữ liệu từ API, và nắm vững kỹ năng tìm kiếm và đọc hiểu nghiên cứu, chủ yếu qua các diễn đàn công nghệ hoặc các hướng dẫn trên YouTube.

Quốc Anh đặt mục tiêu khám phá các ứng dụng tiên tiến trong khoa học dữ liệu, nghiên cứu sâu hơn về tầm quan trọng của dữ liệu chuỗi thời gian và phát triển các mô hình tự động hoá nhằm giải quyết những nhu cầu xã hội đa dạng, từ nhận dạng mẫu đến phát hiện ung thư sớm.

Tin tiêu điểm

Đừng bỏ lỡ

Minh họa/INT

Cảnh báo người mới

GD&TĐ - Trung Quốc vừa quyết định cấm xuất khẩu kim loại và vật liệu có chứa những nguyên tố hoá học nhất định, trong đó có Gallium và Germanium sang Mỹ.