Thuật toán muốn thống trị thế giới

TUẤN SƠN - 08:24 04/12/2019
Thuật toán muốn thống trị thế giới

Facebook liên tục điều khiển chúng ta

- Phải chăng Facebook tập hợp dữ liệu và sử dụng các thuật toán để lập hồ sơ người sử dụng?

- Đúng vậy. Facebook phân tích các sở thích của chúng ta: Các thể loại nhạc mà chúng ta muốn nghe; loại xe mà chúng ta muốn mua; loại phim mà chúng ta thích xem... Trên cơ sở đó, Facebook sắp xếp sở thích của chúng ta vào các hạng mục quảng cáo tương ứng.

- Việc lập hồ sơ này phức tạp như thế nào?

- Facebook tìm kiếm cách thức đo lường trạng thái tình cảm của bạn dựa trên cơ sở các post (các dòng trạng thái đăng trên trang cá nhân hay trang của các hội nhóm mà người dùng Faceboook tham gia), các cảm xúc thể hiện trên khuôn mặt trong các bức ảnh hay mức độ tham gia theo tần số tương tác với màn hình.

Bạn tôi, Tiến sĩ Michal Kosinski ở Trường ĐH Thương mại Stanford Graduate (Mỹ) nhấn mạnh rằng, mọi người nghĩ về người khác trong một số ít “chiều kích” - tuổi tác, chủng tộc, giới tính và có thể cá tính (nếu biết nhiều hơn về người đó). Trong khi đó các thuật toán tái tạo hàng tỷ dữ liệu và phân loại vào hàng trăm file. Chúng ta đã không còn khả năng hiểu đầy đủ các kết quả thuật toán mà chúng ta tạo ra.

Trong cuốn sách “Bị bao vây bởi các con số” của mình, tôi đã sắp xếp những người quen trên Facebook vào 3 hạng mục: “Tôi đây”, “Tôi nghĩ là…” và “Con người không chỉ sống bằng công việc”. Đây là những hạng mục khá rộng, liên quan đến cách mà mọi người sử dụng Facebook.

Nhờ cách đánh giá này, Facebook liên tục điều khiển chúng ta trong chọn lựa sản phẩm thương mại, hiệp hội hay nơi làm việc. Nếu bạn thường xuyên sử dụng Facebook, Instagram, Snapchat, Twitter hoặc mạng xã hội hội khác, thì bạn sẽ bị “xỏ mũi”.

- Vậy chúng ta có nên lo ngại là “họ” (Facebook) biết quá nhiều về chúng ta”?

- Không. Tuy nhiên có vài vấn đề. Về nguyên tắc, các công ty Internet đã tìm ra cách bán sản phẩm cho chúng ta một cách rất hiệu quả, nghĩa là định hướng sự quan tâm của chúng ta trên cơ sở những gì chúng ta công bố (post) lên mạng xã hội.

Họ không biết chúng ta trong vai trò con người và không thể điều khiển chúng ta. Một chuyên gia của Công ty dịch vụ truyền dữ liệu âm nhạc Spotify nói với tôi rằng, anh ta muốn được gọi là nhà giả kim thuật dữ liệu, chứ không phải là nhà khoa học, bởi anh ta đã thử tạo ra “ma thuật” đáp ứng nhu cầu người dùng.

Điều tương tự cũng xảy ra với Facebook. Họ không biết chúng ta, không hiểu chúng ta, mà chỉ đơn thuần tìm được những thứ để chúng ta giải trí.

Chúng ta có nên sợ Internet không?


 Nhà toán học David Sumpter 

- Trên Internet có nhiều nội dung tiêu cực như phân biệt chủng tộc hay khiêu dâm. Vậy các thuật toán có phân biệt chủng tộc hoặc khiêu dâm không?

- Có thể là như vậy. Tôi đã phân tích công cụ trí tuệ nhân tạo do Google sử dụng. Trí tuệ nhân tạo này học hỏi từ chúng ta. Vì vậy những gì mà chúng ta viết trở thành một phần của các thuật toán. Một số người viết nhiều thứ mang tính phân biệt chủng tộc hoặc khiêu dâm trên Internet, còn các thuật toán thu thập các thứ đó “một cách vô tư”. Tôi cho rằng các thuật toán trí tuệ nhân tạo không đánh giá nổi dữ liệu đầu vào.

- Vậy thuật toán trí tuệ nhân tạo có góp phần vào thành công của cuộc vận động bầu cử Tổng thống Mỹ của ông Donald Trump không?

- Sau cuộc bầu cử tổng thống Mỹ năm 2016, Công ty Cambridge Analytica thông báo, chiến dịch vận động bầu cử dựa trên các dữ liệu máy tính, do công ty thực hiện, là chủ chốt thúc đẩy chiến thắng của ông Donald Trump. Họ cho biết đã dùng marketing trực tuyến hướng tới khách hàng mục tiêu và sử dụng dữ liệu từ các cuộc trưng cầu ý kiến để gây ảnh hưởng đến cử tri. Điều đó có nghĩa là nếu như Cambridge Analytica tiếp xúc với hồ sơ các cử tri trên Facebook, thì họ có thể xác định được loại quảng cáo có ảnh hưởng lớn nhất đến cử tri.

Đây là điều đáng sợ. Dữ liệu từ Facebook có thể được sử dụng để phát hiện sở thích, chỉ số IQ và cá tính của chúng ta. Các phát hiện này, sau đó, có thể được sử dụng để hướng chúng ta đến với “những thông tin mang tính chất điều khiển, áp đặt”.

- Có bao nhiêu phần trăm sự thật về gây ảnh hưởng đối với cử tri như nói trên?

- Có rất ít. Nếu như phương pháp của Cambridge Analytica hiệu quả hơn giải pháp của các đối thủ 10%, thì tôi vẫn tin rằng phương pháp đó không có nhiều ý nghĩa.

- Vậy có đúng là Cambridge Analytica đã tạo ra thuật toán phục vụ việc phân loại cá tính con người?

- Không hẳn như vậy. Các nhà khoa học ở ĐH Cambridge chỉ ra rằng, các phép đo lường do các nhà tâm lý học sử dụng để hiểu cá tính của chúng ta có liên quan tới một số sở thích. Chẳng hạn như những người tự cho mình là thân mật thì yêu thích nữ ca sĩ Lady Gaga. Đây là phát hiện thú vị nhưng chưa đủ để hiểu chúng ta trong vai trò con người.

Sau “cơn hoảng loạn” có liên quan đến Cambridge Analytica, người ta mới thấy rằng, Cambridge Analytica sử dụng phương pháp đã lạc hậu, gọi là phương pháp hồi quy dựa trên tuổi và địa chỉ nơi ở để dự đoán xem các cử tri sẽ bỏ phiếu như thế nào.

- Hoạt động của những người “thích ném đá” và Internet troll (những người thích đăng các thông điệp gây tranh cãi) có ảnh hưởng như thế nào đến kết quả bầu cử?

- Chính các cử tri quyết định kết qủa bầu cử. Phần lớn các nghiên cứu mà tôi phân tích, đều gợi ý rằng mọi người phớt lờ các bot (các robot mạng). Cũng không có bất kỳ chứng cớ cụ thể nào cho thấy việc lan truyền các tin giả (fake news) ảnh hưởng đến quá trình bầu cử. Việc đẩy các tin giả lên mạng là hành động của một số ít người, không phải là của đại chúng.

Thế này hay thế khác, không ai nhớ kỹ các câu chuyện (fake news) đó cả. Chúng ta không sống trong thời đại hậu - sự thật (post-truth; liên quan đến các tình huống mà trong đó sự thật kháchquan có ít ảnh hưởng đến việc hình thành quan điểm). Các nghiên cứu chỉ ra rằng, các bot chủ yếu trò chuyện cùng nhau và với một số ít người có quan điểm cực tả.

- Vậy chúng ta có nên sợ Internet không?

- Không. Chúng ta đang sống trong thời đại đầy ắp thông tin và vì thế có rất nhiều lý do để vui mừng.

Theo Tuấn Sơn
Nauka

Bình luận của bạn đọc