Tài Chính Ứng Dụng với Python

Author

Mike

Published

February 1, 2026

Lời nói đầu

NoteGhi công

Cuốn sách này là một tác phẩm phái sinh độc lập, được lấy cảm hứng từ các nguyên tắc nghiên cứu có thể tái tạo được phát triển trong Tidy Finance. Nội dung này không liên quan đến, hoặc được cung cấp chính thức bởi những người sáng tạo ra bộ sách Tidy Finance gốc. Tất cả nội dung, mã nguồn và ứng dụng thực nghiệm đều là bản gốc và được điều chỉnh phù hợp với thị trường Việt Nam.

Công trình này được xây dựng trực tiếp trên nền tảng phương pháp luận đã được thiết lập trong:

Chúng tôi xin bày tỏ lòng biết ơn sâu sắc đến các tác giả của Tidy Finance vì đã phát triển một phương pháp tiếp cận tài chính thực nghiệm mở và có thể tái tạo, điều đã giúp cho việc điều chỉnh phù hợp với thị trường cụ thể này trở nên khả thi.

Động lực

Tài chính thực nghiệm đã trải qua một sự chuyển đổi cơ bản trong hai thập kỷ qua. Những tiến bộ về năng lực tính toán, phần mềm thống kê mã nguồn mở và tính sẵn có của dữ liệu đã định hình lại cách thức tiến hành, đánh giá và phổ biến nghiên cứu tài chính. Ngày càng nhiều nghiên cứu thực nghiệm đáng tin cậy được kỳ vọng phải minh bạch, có thể tái tạo và mở rộng, với kết quả được tạo ra thông qua các quy trình làm việc được lập trình sẵn thay vì can thiệp thủ công. Khả năng tái tạo, được định nghĩa là khả năng các nhà nghiên cứu độc lập tạo ra kết quả thực nghiệm bằng cách sử dụng cùng dữ liệu và phương pháp, do đó đã trở thành một chuẩn mực cốt lõi trong kinh tế tài chính hiện đại.

Mặc dù đã có những tiến bộ này, việc áp dụng các phương pháp nghiên cứu có thể tái tạo vẫn chưa đồng đều giữa các thị trường. Trong các hệ thống tài chính phát triển, đặc biệt là những hệ thống có cơ sở dữ liệu lâu đời và chế độ báo cáo tiêu chuẩn hóa, quy trình làm việc thực nghiệm có thể tái tạo hiện nay rất phổ biến. Ngược lại, nghiên cứu về các thị trường mới nổi và thị trường cận biên thường dựa trên các tập dữ liệu rời rạc, các quy trình làm sạch dữ liệu không được ghi chép đầy đủ và các giả định ngầm định của thể chế khó xác minh hoặc mở rộng. Do đó, các phát hiện thực nghiệm ở những thị trường này thường không ổn định, không thể so sánh giữa các nghiên cứu và tốn kém chi phí cập nhật khi có dữ liệu mới.

Cuốn sách này giải quyết khoảng trống đó.

Cuốn sách này phát triển một khuôn khổ tài chính thực nghiệm có thể tái tạo được, được thiết kế đặc biệt cho các thị trường mới nổi và thị trường cận biên, sử dụng Việt Nam làm trường hợp thực nghiệm chính. Thay vì điều chỉnh các quy trình nghiên cứu của thị trường phát triển một cách hậu kỳ, cuốn sách bắt đầu từ thực tế về thể chế và dữ liệu của một thị trường tăng trưởng nhanh, do bán lẻ thống trị và chịu nhiều quy định, và xây dựng các giải pháp phương pháp luận phù hợp. Mục tiêu không chỉ đơn thuần là phân tích thị trường tài chính Việt Nam, mà còn là để chứng minh cách các nguyên tắc tài chính có thể tái tạo được, như đã được phát triển trong khuôn khổ Tài chính Sạch (Tidy Finance), có thể được mở rộng, kiểm tra độ bền và tinh chỉnh trong môi trường đặc trưng bởi sự khan hiếm dữ liệu, tính không đồng nhất về thể chế và sự thay đổi cấu trúc nhanh chóng.

Vì sao thị trường mới nổi đòi hỏi cơ sở hạ tầng thực nghiệm khác biệt?

Phần lớn các nghiên cứu tài chính thực nghiệm hiện đại ngầm giả định sự tồn tại của các bộ dữ liệu ổn định, tần suất cao và được hài hòa về mặt thể chế. Những giả định này hiếm khi được nêu rõ, nhưng chúng lại ăn sâu vào các thiết kế nghiên cứu tiêu chuẩn: lịch sử chứng khoán không có yếu tố tồn tại, chuẩn mực kế toán nhất quán, cơ chế giao dịch không hạn chế và tính thanh khoản dồi dào của các tổ chức.

Các thị trường mới nổi và thị trường cận biên đang thách thức từng giả định này.

Tại Việt Nam, cũng như nhiều nền kinh tế tương đương khác, thị trường chứng khoán có những đặc điểm như giá giao dịch bị giới hạn hàng ngày, tạm ngừng giao dịch định kỳ, sở hữu nhà nước tập trung và nhà đầu tư cá nhân chiếm ưu thế. Thông tin tài chính được công bố phản ánh các chuẩn mực kế toán địa phương và khung pháp lý đang phát triển. Các hoạt động của doanh nghiệp diễn ra thường xuyên, được ghi chép không nhất quán và đôi khi được sửa đổi sau đó.

Những đặc điểm này không phải là những bất tiện cần loại bỏ thông qua việc làm sạch dữ liệu một cách mạnh mẽ. Chúng định hình động lực lợi nhuận, phần bù rủi ro, cấu trúc yếu tố và chính suy luận thống kê. Một khuôn khổ thực nghiệm bỏ qua những đặc điểm thể chế này có nguy cơ tạo ra kết quả không nhất quán nội bộ hoặc gây hiểu lầm bên ngoài. Do đó, một phương pháp có thể tái tạo được cho các thị trường mới nổi phải mã hóa bối cảnh thể chế trực tiếp vào lược đồ dữ liệu, logic chuyển đổi và các lựa chọn mô hình hóa.

Đảm bảo tính tái hiện như một nguyên tắc thiết kế nghiên cứu

Trong cuốn sách này, khả năng tái tạo không chỉ giới hạn ở khái niệm hẹp về tính sẵn có của mã nguồn. Nó được xem như một nguyên tắc tổ chức chi phối toàn bộ chu trình nghiên cứu thực nghiệm.

Thứ nhất, tất cả các tập dữ liệu đều được xây dựng từ dữ liệu đầu vào thô thông qua các phép biến đổi được ghi chép lại và có tính xác định, đảm bảo nguồn gốc dữ liệu rõ ràng. Thứ hai, các phương pháp thực nghiệm được triển khai theo cách làm cho các giả định mô hình trở nên rõ ràng và có thể sửa đổi. Thứ ba, kết quả được tạo ra thông qua các quy trình tự động thay vì phân tích tương tác, đảm bảo rằng các cập nhật về dữ liệu hoặc tham số được lan truyền nhất quán trong suốt quá trình phân tích. Cuối cùng, các thiết kế thực nghiệm có tính mô-đun, cho phép các nhà nghiên cứu thay thế thị trường, khoảng thời gian lấy mẫu hoặc định nghĩa biến mà không cần viết lại toàn bộ quy trình làm việc.

Cách tiếp cận này lấy cảm hứng phương pháp luận từ phong trào nghiên cứu có thể tái tạo rộng lớn hơn trong kinh tế và tài chính (ví dụ, Gentzkow and Shapiro 2014; Vilhuber 2020), đồng thời chủ đích mở rộng nó ra ngoài môi trường thể chế và dữ liệu ban đầu của nó. Mục tiêu không phải là tái tạo các nghiên cứu hiện có, mà là cho phép các nghiên cứu mới—đặc biệt là những nghiên cứu sẽ không khả thi do dữ liệu phân mảnh và sự phức tạp về thể chế.

Việt Nam như một trường hợp, không phải một ngoại lệ

Việt Nam đóng vai trò là trường hợp thực nghiệm trung tâm xuyên suốt cuốn sách, nhưng không được xem như một ngoại lệ cá biệt. Thay vào đó, nó được trình bày như một ví dụ tiêu biểu cho một nhóm thị trường nằm ở vị trí trung gian giữa thị trường mới nổi và thị trường cận biên: đủ lớn để duy trì hoạt động giao dịch cổ phiếu sôi động, nhưng vẫn đang phát triển về quy định, chất lượng công bố thông tin và thành phần nhà đầu tư.

Bằng cách đặt nền tảng cho sự phát triển phương pháp luận trong bối cảnh thị trường Việt Nam, cuốn sách hướng đến việc đưa ra những hiểu biết có thể khái quát hóa cho các bối cảnh khác, bao gồm Đông Nam Á, Nam Á, châu Phi cận Sahara và một số khu vực của Mỹ Latinh. Mỗi chương thực nghiệm đều nhấn mạnh những thành phần nào là đặc thù của thị trường và những thành phần nào có thể áp dụng được, khuyến khích người đọc điều chỉnh khung lý thuyết thay vì áp dụng toàn bộ.

Truy cập dữ liệu

Các phân tích thực nghiệm trong cuốn sách này dựa trên dữ liệu thị trường chứng khoán Việt Nam do Datacore cung cấp. Để đảm bảo tính khả thi trong khi vẫn tuân thủ các quy định về bản quyền dữ liệu, chúng tôi cung cấp các nguồn tài liệu sau:

  • Bộ dữ liệu mẫu: Một tập hợp con các dữ liệu đã được ẩn danh có sẵn trong DataCore’s Sample Dataset để người đọc có thể chạy mã ví dụ.
  • Các tập lệnh xây dựng dữ liệu: Tất cả các tập lệnh được sử dụng để làm sạch và chuyển đổi dữ liệu thô đều được ghi chép đầy đủ và có sẵn trong kho lưu trữ.
  • Hướng dẫn tái tạo: Người đọc có quyền truy cập vào dữ liệu thị trường Việt Nam từ các nhà cung cấp thương mại có thể sử dụng các đoạn mã của chúng tôi để xây dựng các bộ dữ liệu tương đương.

Mọi thắc mắc về việc truy cập hoặc sao chép dữ liệu, vui lòng liên hệ với tác giả.

Đóng góp và Khán giả

Cuốn sách này đóng góp ba điểm chính.

Thứ nhất, bài báo đề xuất một khung lý thuyết tài chính thực nghiệm có thể tái tạo, được thiết kế đặc biệt cho các thị trường mới nổi và thị trường cận biên, tích hợp các chi tiết thể chế vào việc xây dựng dữ liệu và thiết kế mô hình. Thứ hai, bài báo cung cấp bằng chứng thực nghiệm độc đáo về định giá tài sản, thanh khoản và cấu trúc vi mô thị trường tại Việt Nam bằng cách sử dụng các bộ dữ liệu được xây dựng nhất quán. Thứ ba, bài báo cung cấp quy trình nghiên cứu hoàn chỉnh, sẵn sàng cho xuất bản, phù hợp cho nghiên cứu học thuật, phân tích chính sách và tài chính ứng dụng.

Đối tượng mục tiêu bao gồm sinh viên cao học ngành tài chính và kinh tế, các nhà nghiên cứu học thuật nghiên cứu về thị trường các nước đang phát triển, và các chuyên gia quan tâm đến phân tích hệ thống cổ phiếu thị trường mới nổi. Kiến thức cơ bản về lý thuyết định giá tài sản và lập trình thống kê được giả định là cần thiết, nhưng không yêu cầu kinh nghiệm trước đó về thị trường Việt Nam hoặc các thị trường tương tự.

Cấu trúc của cuốn sách

Các chương tiếp theo sẽ trình bày tiến trình từ cơ sở hạ tầng dữ liệu đến ứng dụng thực nghiệm. Cuốn sách bắt đầu với phần giới thiệu về các nguồn dữ liệu và cơ sở hạ tầng được sử dụng xuyên suốt, tiếp theo là các chương về bối cảnh thể chế, xây dựng dữ liệu và thiết kế quy trình làm việc có thể tái tạo. Các chương tiếp theo phát triển các bài kiểm tra định giá tài sản, các biện pháp thanh khoản và phân tích cấu trúc vi mô thị trường được điều chỉnh phù hợp với thị trường chứng khoán Việt Nam. Mỗi chương được thiết kế để độc lập, nhưng tất cả đều được liên kết thông qua một kiến ​​trúc dữ liệu và mã nguồn chung để đảm bảo tính nhất quán nội bộ.

Cuốn sách kết thúc bằng việc suy ngẫm về những hàm ý rộng hơn của tài chính thực nghiệm có thể tái tạo đối với nghiên cứu thị trường mới nổi và vạch ra những hướng đi cho công việc phương pháp luận và thực nghiệm trong tương lai.