Công cụ ngăn chặn phát tán thông tin sai lệch trên mạng xã hội

Nhật Phong 12/01/2024 07:25

GD&TĐ - Mục tiêu nghiên cứu là các cơ chế và mô hình lan truyền thông tin nói chung và thông tin sai lệch nói riêng trên các mạng xã hội trực tuyến.

Mô hình tổng thể hệ thống.

Theo PGS.TS Nguyễn Việt Anh, đã có nhiều mô hình lan truyền thông tin được đề xuất trên thế giới. Kỹ thuật vô hiệu hóa người dùng hoặc tập liên kết, được hiểu là trên mạng sẽ có một tập người dùng bị cô lập; thông tin sai lệch lan truyền đến trước tập nút này và dừng lại.

Hạn chế lan truyền thông tin sai lệch

PGS.TS Nguyễn Việt Anh và nhóm nghiên cứu Viện Công nghệ thông tin vừa thực hiện thành công đề tài nghiên cứu “Nghiên cứu phát triển các phương pháp hiệu quả ngăn chặn phát tán thông tin sai lệch trên mạng xã hội”.

Mục tiêu của nhóm là nghiên cứu các cơ chế và mô hình lan truyền thông tin nói chung và thông tin sai lệch nói riêng trên các mạng xã hội trực tuyến. Xác định và phân tích các đặc trưng của thông tin sai lệch, các nhân tố ảnh hưởng trên mạng xã hội đóng vai trò quan trọng trong việc phát tán thông tin. Đồng thời, đề xuất các phương pháp, kỹ thuật hiệu quả giúp hạn chế lan truyền thông tin sai lệch.

PGS.TS Nguyễn Việt Anh cho biết, nhóm nghiên cứu tập trung vào bài toán trong đó thông tin được phát tán từ nhiều nguồn, thuộc nhiều chủ đề khác nhau, cơ chế phát tán thay đổi theo thời gian, đồng thời phải thỏa mãn các ràng buộc về chi phí ngăn chặn. Nhóm cũng xây dựng, thử nghiệm, đánh giá hiệu quả các phương pháp đề xuất trên các bộ dữ liệu mô phỏng và dữ liệu từ các mạng xã hội thực.

Theo PGS.TS Nguyễn Việt Anh, đã có nhiều mô hình lan truyền thông tin được đề xuất trên thế giới. Các mô hình này đã phát huy được vai trò trong nghiên cứu lý thuyết cũng như thực hành về lan truyền thông tin với rất nhiều ứng dụng khác nhau.

Trong đó, có ba mô hình lan truyền được áp dụng nhiều nhất là mô hình Ngưỡng tuyến tính - mô hình ngẫu nhiên rời rạc trong đó thông tin được lan truyền theo các bước thời gian rời rạc; mô hình Bậc độc lập với đặc trưng chính là quá trình lan truyền thông tin theo từng cạnh một cách độc lập; mô hình SIR là một mô hình toán học cơ bản về dịch bệnh được áp dụng trong dự báo lan truyền thông tin.

“Nhóm nghiên cứu sử dụng, kế thừa, cải tiến mô hình Ngưỡng tuyến tính và mô hình Bậc độc lập trong các nội dung nghiên cứu để phát triển mô hình hạn chế lan truyền thông tin sai lệch trên mạng xã hội”, PGS.TS Nguyễn Việt Anh nói.

Việc hạn chế lan truyền thông tin sai lệch trên mạng xã hội được thực hiện trên cơ sở phát hiện được các con đường lan truyền thông tin (cơ chế lan truyền, sơ đồ lan truyền), sau đó phải xác định được các nút mạng trung gian đóng vai trò quan trọng trong việc phát tán để tiến hành ngăn chặn.

Có nhiều kỹ thuật hạn chế lan truyền thông tin sai lệch đã được đề xuất, trong đó nổi bật là 3 kỹ thuật: Ngăn chặn ảnh hưởng, vô hiệu hóa người dùng hoặc tập liên kết và tẩy nhiễm thông tin.

Kỹ thuật vô hiệu hóa người dùng

PGS.TS Nguyễn Việt Anh cho biết, trong đề tài này, nhóm nghiên cứu đã thực hiện theo Kỹ thuật vô hiệu hóa người dùng hoặc tập liên kết, được hiểu là trên mạng sẽ có một tập người dùng bị cô lập; thông tin sai lệch lan truyền đến trước tập nút này và dừng lại, không thể lan truyền tiếp đến các nút khác. Tập nút mạng này được xem như là hàng rào chắn, ngăn chặn lan truyền thông tin sai lệch.

Cụ thể, nhóm đã sử dụng phương pháp “Tiêm vắc-xin”, với 2 thuật toán: Thuật toán tham lam có cải tiến IGA và Thuật toán tham lam mở rộng GEA để ngăn chặn lan truyền thông tin sai lệch trên mạng xã hội trực tuyến với tập dữ liệu mô phỏng thử nghiệm.

Nhóm đã tiến hành thử nghiệm, đánh giá kết quả chạy chương trình ngăn chặn lan truyền thông tin sai lệch trên mạng xã hội trực tuyến với đầu vào là các mạng xã hội thực được tinh lọc các yếu tố riêng tư.

Thuật toán có thể tìm kiếm người dùng tại các địa điểm (tỉnh, thành) trong hồ sơ đăng ký tài khoản xác định có quan tâm đến một chủ đề nào đó. Thứ hạng sẽ trả về những người dùng có quan tâm nhiều nhất đến một chủ đề nào đó thông qua việc lọc, thống kê số bài viết, dòng trạng thái, lượt thích, nội dung bình luận hay chia sẻ…

Tìm kiếm các bài viết, các chủ đề theo ngữ nghĩa khác nhau; Tìm kiếm các từ khóa nổi bật, các đường dẫn được các trang mạng/blog và bình luận nhiều nhất cũng như thái độ bình luận của từng người dùng…

Với kết quả nghiên cứu này, nhóm đã công bố 2 bài báo khoa học liên quan đến nội dung nghiên cứu: 1 bài báo quốc tế đăng trên tạp chí Optimization Letter thuộc danh mục SCIE năm 2022 (SCIE Q1); 1 bài báo trên Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng Công nghệ Thông tin và Truyền thông.