Tân binh Grok 4 'vượt mặt' nhiều đối thủ

Trọng Dương 19/08/2025 07:36

GD&TĐ - Theo tỷ phú Elon Musk, Grok 4 có khả năng đưa ra câu trả lời thông minh hơn trình độ tiến sĩ trong mọi môn học.

Phiên bản Grok 4 Heavy có khả năng xử lý nhiều giả thuyết cùng lúc. Ảnh: INT

Trên bảng xếp hạng LMArena công bố giữa tháng 7/2025, mô hình Grok 4 vượt qua nhiều đối thủ nặng ký như DeepSeek và Claude.

Công cụ vượt trội

Trong buổi phát trực tiếp kéo dài một giờ, vào trung tuần tháng 7 này, tỷ phú Elon Musk cùng Công ty xAI chính thức ra mắt Grok 4 - phiên bản mới nhất của chatbot AI dựa trên dữ liệu mạng xã hội X. Đây là sản phẩm chủ lực của xAI nhằm cạnh tranh với các mô hình như ChatGPT của OpenAI hay Gemini của Google, với khả năng phân tích hình ảnh và phản hồi các câu hỏi ở mức độ cao.

xAI đang chuẩn bị gọi thêm vốn từ các nhà đầu tư trong thương vụ có thể định giá công ty này lên tới 200 tỷ USD - gấp 10 lần giá trị của nó vào đầu năm ngoái. Vòng gọi vốn này, hiện được thảo luận và có thể chính thức bắt đầu vào tháng 8, sẽ là lần bán cổ phần lớn thứ ba của xAI trong chưa đầy 2 tháng.

Công ty đã huy động 10 tỷ USD thông qua các khoản vay và đầu tư tiền mặt vào tháng 7. Đồng thời, bán 300 triệu USD cổ phần trong một đợt chào bán thứ cấp vào tháng 6. Thương vụ cũng sẽ đánh dấu sự tăng trưởng “chóng mặt” trong định giá của xAI, từ mức 18 tỷ USD được xác lập trong vòng gọi vốn “Series B” vào tháng 5/2024.

Ngay sau khi trình làng, Grok 4 nhận được kỳ vọng lớn. Mô hình trí tuệ nhân tạo (AI) này được đánh giá có tiềm năng sánh ngang, thậm chí vượt qua cả GPT-5 - phiên bản mới từ OpenAI dự kiến ra mắt cuối mùa Hè năm nay.

“Đối với các câu hỏi học thuật, Grok 4 thậm chí còn cho câu trả lời thông minh hơn trình độ tiến sĩ trong mọi môn học, không ngoại lệ. Nó vẫn chưa phát minh ra công nghệ hay khám phá vật lý mới, nhưng đó chỉ là vấn đề thời gian”, tỷ phú Elon Musk phát biểu.

Cụ thể, Grok 4 đạt những kết quả ấn tượng trong bài kiểm tra Humanity’s Last Exam - thước đo khả năng AI trả lời hàng nghìn câu hỏi về các lĩnh vực như toán học, nhân văn và khoa học tự nhiên. Theo đó, Grok 4 đạt 25,4% (không dùng công cụ hỗ trợ) và Grok 4 Heavy đạt 44,4% (có dùng công cụ).

Thành tích này vượt trội so với Gemini 2.5 Pro và o3 của OpenAI. Ngoài ra, Grok 4 cũng lập kỷ lục mới trong bài kiểm tra ARC-AGI-2 về khả năng giải đố với điểm số 16,2%, gần gấp đôi so với mô hình Claude Opus 4.

Trên bảng xếp hạng LMArena được công bố giữa tháng 7 - nền tảng cộng đồng do Đại học California, Berkeley phát triển - Grok 4 vượt qua các đối thủ như DeepSeek và Claude. LMArena cho phép người dùng đánh giá song song nhiều mô hình AI thông qua các bài kiểm tra mù và là một trong những bảng xếp hạng AI phổ biến nhất hiện nay.

Theo thống kê, Grok 4 nằm trong top 3 ở hầu hết các hạng mục: Hạng nhất về toán, hạng nhì về viết mã, viết sáng tạo, tuân thủ hướng dẫn và truy vấn dài. Trong xếp hạng tổng thể, Grok 4 đồng hạng ba với GPT-4.5 của OpenAI; ChatGPT o3 và 4o đồng hạng nhì, còn Gemini 2.5 Pro của Google dẫn đầu.

Grok 4 được đánh giá sở hữu nhiều tính năng vượt trội. Ảnh: INT

Lợi thế độc đáo

Một trong những điểm nổi bật của Grok 4 là khả năng ngày càng thông minh hơn nhờ cơ chế học tăng cường liên tục theo thời gian thực. Elon Musk khẳng định mô hình này không ngừng cải thiện, vượt ra khỏi giới hạn học tập thông thường sau giai đoạn huấn luyện.

Ông Paul Roetzer - nhà sáng lập, CEO Viện Marketing AI và SmarterX - nhận định: “Dù xAI chưa công bố nghiên cứu kỹ thuật cụ thể, nhưng tuyên bố về học tăng cường liên tục mang ý nghĩa rất lớn. Thay vì dừng lại khi huấn luyện kết thúc, mô hình có thể tiếp tục học và phát triển theo thời gian”.

xAI đã tận dụng cụm siêu máy tính Colossus với 200.000 GPU để huấn luyện Grok 4, giúp tăng hiệu suất tính toán gấp sáu lần so với trước và mở rộng đáng kể dữ liệu đầu vào.

Nếu như Grok 3 Reasoning lần đầu ứng dụng học tăng cường ở quy mô lớn, thì Grok 4 còn tiến xa hơn khi mở rộng huấn luyện ra ngoài dữ liệu toán học và lập trình, bao gồm cả dữ liệu kiểm chứng được từ nhiều lĩnh vực khác nhau. Nhờ đó, hiệu suất suy luận của mô hình được cải thiện đáng kể.

Grok 4 cũng giới thiệu khả năng sử dụng công cụ gốc - tự động quyết định thời điểm chạy mã, duyệt web hoặc phân tích phương tiện trực quan. Trong phiên bản Grok 4 Heavy, mô hình có thể đồng thời xem xét nhiều giả thuyết, sử dụng tính toán song song để suy luận như một nhóm chuyên gia, vượt xa vai trò một chatbot đơn lẻ.

Dù xAI chưa công bố chi tiết về dữ liệu huấn luyện, song theo giới chuyên gia, họ đang tận dụng luồng dữ liệu độc quyền từ nền tảng X - lợi thế mà các đối thủ chưa thể có được.

Dữ liệu do con người tạo ra theo thời gian thực này mang đến lợi thế rõ rệt cho việc đào tạo mô hình. Bên cạnh đó, tốc độ phát triển nhanh và khả năng chấp nhận rủi ro cao của xAI cũng được xem là yếu tố quyết định trong cuộc đua AI.

Ông Paul Roetzer nhận định: “xAI sẵn sàng thực hiện những điều mà các phòng thí nghiệm khác e ngại - thúc đẩy đổi mới và phát hành mô hình mà ít quan tâm đến rào cản an toàn. Tuy nhiên, điều đó không phải lúc nào cũng tích cực”.

Theo các chuyên gia, Grok 4 không ngừng học sau huấn luyện. Ảnh: INT

Cập nhật để bảo đảm an toàn

Khả năng chấp nhận rủi ro cao của xAI khiến nhiều người lo ngại. Dù vậy, không thể phủ nhận rằng xAI đang tăng tốc mạnh mẽ trong cuộc đua AI toàn cầu. “Họ sẽ tiếp tục huy động hàng tỷ, thậm chí hàng chục tỷ USD, xây dựng các trung tâm dữ liệu khổng lồ và liên tục nâng cấp mô hình, khiến nó ngày càng mạnh mẽ và thông minh hơn”, ông Roetzer đánh giá.

Tuy nhiên, cũng chính đặc điểm này khiến Grok 4 đối mặt với một số chỉ trích. Theo TechCrunch, nhiều người dùng phát hiện Grok 4 sử dụng các bài đăng từ chính tài khoản X của Elon Musk để trả lời các câu hỏi liên quan đến những chủ đề nhạy cảm như phá thai, chính trị hay xung đột Israel - Palestine. Điều này gây tranh cãi bởi ngay chính Elon Musk từng nói rằng các bài viết của ông không nên được xem xét một cách nghiêm túc.

Trong chế độ “Suy nghĩ” (Thought Mode), người dùng có thể xem cách Grok hình thành phản hồi. Nhiều trường hợp cho thấy Grok 4 trích dẫn trực tiếp các bài đăng của Elon Musk làm nguồn, khiến một bộ phận người dùng đặt câu hỏi về độ tin cậy và tính khách quan của mô hình, nếu mục tiêu cuối cùng là “tìm kiếm sự thật tối đa”.

Grok 4 được phát hành chỉ chưa đầy một ngày sau bài phát biểu gây tranh cãi của Grok 3. Trước đó, xAI từng cập nhật Grok 3 để “giả định rằng các quan điểm truyền thông là phiến diện” và “không ngại đưa ra những tuyên bố không chính xác về mặt chính trị”. Bản cập nhật nhằm phản ứng với cáo buộc rằng chatbot thể hiện thiên kiến và thiếu công bằng.

Tỷ phú Musk thì thừa nhận: “Grok quá tuân thủ yêu cầu của người dùng, mong muốn làm hài lòng và dễ bị thao túng. Điều này đang được khắc phục”.

Trong một thông báo, xAI nhấn mạnh: “xAI đang huấn luyện các mô hình chỉ tìm kiếm sự thật. Nhờ hàng triệu người dùng trên X, chúng tôi có thể nhanh chóng phát hiện và điều chỉnh mô hình khi cần”.

xAI được thành lập vào năm 2023, ngay sau khi OpenAI ra mắt chatbot ChatGPT, vốn đã trở nên nổi tiếng mạnh mẽ. Tỷ phú Musk là đồng sáng lập OpenAI vào năm 2015 nhưng rời công ty vào năm 2018. Kể từ đó, ông trở thành một trong những người chỉ trích mạnh mẽ nhất đối với OpenAI và Giám đốc điều hành Sam Altman.

Theo Mashable, Futurism, Marketing AI Institute