Khôi phục những tấm mộc bản thất lạc
Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã phối hợp với Trung tâm Lưu trữ quốc gia IV và Viện Nghiên cứu Hán Nôm thực hiện đề tài hợp tác quốc tế “Nghiên cứu, ứng dụng trí tuệ nhân tạo trong khôi phục mô hình 3D mộc bản triều Nguyễn” giữa Việt Nam và Hàn Quốc.
Mục tiêu nghiên cứu của đề tài là hoàn thiện phương pháp kỹ thuật, quy trình số hóa và thực hiện số hóa mộc bản; xây dựng được bộ cơ sở dữ liệu mộc bản 2D/3D và bộ công cụ dán nhãn dữ liệu phục vụ việc phát triển các kỹ thuật trí tuệ nhân tạo khôi phục mộc bản; đề xuất được phương pháp ứng dụng trí tuệ nhân tạo để khôi phục mô hình 3D mộc bản từ bản in, nhằm khôi phục lại những tấm mộc bản đã mất hoặc khôi phục lại những phần bị mất của một tấm mộc bản.
Mộc bản triều Nguyễn là những tấm gỗ quý được khắc ngược chữ Hán và chữ Nôm, sau đó quét mực rồi ép mặt in ra giấy để nhân bản tài liệu nhằm phổ biến rộng rãi ra công chúng các chuẩn mực xã hội, các điều luật bắt buộc thần dân tuân thủ. Đó cũng là những bản khắc lưu truyền công danh, sự nghiệp của các bậc vua chúa, các sự kiện lịch sử, biến cố thời cuộc, các cuộc tiễu trừ giặc giã.
Loại hình tài liệu này không chỉ đặc biệt về hình thức, nội dung, mà còn nằm ở phương thức chế tác; là bản gốc của các bộ chính văn, chính sử nổi tiếng của Việt Nam. Mộc bản triều Nguyễn đã được UNESCO công nhận là Di sản tư liệu thuộc Chương trình Ký ức thế giới vào ngày 31/7/2009 và trở thành Di sản tư liệu thế giới đầu tiên của Việt Nam.
Nhóm nghiên cứu hướng đến việc hồi phục mộc bản triều Nguyễn dựa trên các công nghệ trí tuệ nhân tạo hiện tại. Để thực hiện được điều này, nhóm nghiên cứu bắt đầu từ việc số hóa 3D mộc bản và các bản in tương ứng. Sau đó bộ dữ liệu về mô hình 3D bản và ảnh 2D sẽ được áp dụng các công đoạn tiền xử lý để làm dữ liệu đầu vào cho việc huấn luyện mô hình học máy.
Các mô hình học máy sau khi được huấn luyện sẽ học cách xây dựng lại các mô hình 3D mộc bản bị mất từ bản in 2D đang được lưu trữ. Phương pháp được đề xuất sẽ hướng đến việc thể hiện được giá trị văn hóa, lịch sử của mộc bản khi được phục dựng lại.
Nhóm đã xây dựng và sử dụng bộ công cụ gán nhãn dữ liệu 2D/3D để tạo bộ dữ liệu gồm hơn 90.000 mẫu (mỗi mẫu gồm một ảnh 3D và một ảnh 2D tương ứng của một ký hiệu trên bề mặt mộc bản). Bên cạnh đó, nhóm đã xây dựng phần mềm dựa trên trí tuệ nhân tạo (AI) để phục dựng mô hình 3D mộc bản từ bản in.
Dùng công nghệ tái hiện chuẩn xác
Theo ông Nguyễn Xuân Hùng, Giám đốc Trung tâm Lưu trữ quốc gia IV, quá trình số hóa được thực hiện dựa trên công nghệ tiên tiến của Phòng thí nghiệm Tương tác Người - Máy thuộc Trường ĐH Công nghệ - ĐH Quốc gia Hà Nội. Tất cả mộc bản đều sử dụng máy ATOS Q 255 MV100 để quét 3D.
Bằng phương pháp này, nhóm đã phục dựng thành công 5 mô hình 3D của các tấm mộc bản triều Nguyễn quý hiếm đã mất, chỉ còn bản in. Các mô hình phục dựng được 19 chuyên gia am hiểu về mộc bản và từng tiếp xúc với mộc bản đánh giá tốt dựa trên 5 tiêu chí: Số ký tự đọc và khớp được với bản in 2D; kích thước và khuôn dạng; chất lượng ký tự; chất lượng nền và chất lượng các thành phần phi ký tự.
Trong thời gian thực hiện đề tài, nhóm nghiên cứu đã phối hợp chặt chẽ với các đối tác Hàn Quốc để trao đổi về các phương pháp xử lý dựa trên dữ liệu 3D như lưới, đám mây điểm, ảnh độ sâu và thực hiện các công bố khoa học chung giữa hai bên.
Từ đó, đối tác Hàn Quốc tập trung vào việc khôi phục 3D các tòa nhà và thành phố thuộc Triều đại Joseon thông qua các kỹ thuật tái tạo 3D tiên tiến sử dụng các bức ảnh lịch sử.
Thành công của đề tài mở ra khả năng tái hiện các di sản đã mất, đặc biệt là các bảo vật quốc gia đã được UNESCO công nhận là di sản tư liệu thế giới, một cách nhanh chóng với số lượng lớn và độ chính xác cao. Đây cũng là tiền đề cho các dự án số hóa có quy mô lớn hơn, góp phần thúc đẩy việc quảng bá, trình diễn các di sản tới người dân và du khách, thúc đẩy ngành du lịch và nghiên cứu lịch sử tại Việt Nam.
Nhóm nghiên cứu kỳ vọng có thể chuyển giao công nghệ cho các đơn vị/tổ chức đang quản lý và khai thác mộc bản, trong đó có hai đơn vị tham gia thực hiện đề tài là Trung tâm Lưu trữ quốc gia IV và Viện Nghiên cứu Hán Nôm.
Trung tâm Lưu trữ quốc gia IV hiện đang quản lý và bảo tồn hơn 34.000 tấm mộc bản triều Nguyễn, và Viện Nghiên cứu Hán Nôm hiện đang lưu trữ hơn 10.000 tấm mộc bản tín ngưỡng.
Trong thời gian tới, các sản phẩm và kỹ thuật hình thành từ nhiệm vụ có thể được nghiên cứu mở rộng và chuyển giao ra nước ngoài, đặc biệt là Hàn Quốc, Nhật Bản và Trung Quốc - những nước rất quan tâm tới việc bảo tồn và phát huy giá trị các mộc bản.