“Nghiên cứu của chúng tôi được đề ra nhằm mục đích tìm hiểu rõ hơn về những động lực cơ bản của xã hội và phát triển mô hình của sự tiến hóa trong cộng đồng ngôn ngữ… Như một yêu cầu bắt buộc của nghiên cứu, chúng tôi cần thu thập một lượng thông tin khổng lồ từ các lưu trữ của mạng xã hội, trên tất cả các quốc gia và sử dụng tất cả các ngôn ngữ mà mạng xã hội hỗ trợ”, Hải quân Mỹ giải thích.
Theo những lời giới thiệu, dữ liệu sẽ được lấy từ cùng một trang mạng xã hội, dù chưa được công bố tên cụ thể, và toàn bộ thông tin đã đăng tải được chọn sẽ là các bài được ấn định ở chế độ công khai. Các thông tin cá nhân của người dùng cùng các bài đăng ẩn sẽ không được lưu trữ. Thêm vào đó, tất cả những thông tin trong hồ sơ đều được yêu cầu phải được giữ nguyên bản, nghĩa là phải ở đúng ngôn ngữ, quốc gia, thời gian và đường link liên kết mà người đăng đã sử dụng. Các bài đăng được lưu trữ cũng phải có đầy đủ nội dung, không bị cắt xén hay dùng trích đoạn.
Hải quân Mỹ cho biết thêm, tập hồ sơ nghiên cứu sẽ bao gồm đóng góp của 200 triệu người dùng trên 100 quốc gia, với không dưới 60 ngôn ngữ được lưu trữ. Đây là lần thứ hai trong hai năm, các quan chức Chính phủ Mỹ có kế hoạch phát triển những dự án theo dõi người sử dụng mạng. Hồi tháng 4 năm ngoái, Lầu Năm Góc cũng công bố kế hoạch phát triển một hệ thống lưu trữ thông tin của ít nhất 290.000 nguồn tin trên 100 ngôn ngữ.