DeepSeek-R1 'khuynh đảo' giới công nghệ

Trọng Dương 23/02/2025 09:05

GD&TĐ - Công ty trí tuệ nhân tạo DeepSeek được thành lập vào năm 2023 tại thành phố Hàng Châu, Trung Quốc.

R1 được coi là 'một bước tiến xuất sắc của AI'. Ảnh: INT

Công ty khởi nghiệp DeepSeek của Trung Quốc đã khiến cả thế giới sửng sốt khi ra mắt DeepSeek-R1, một mô hình trí tuệ nhân tạo (AI) mã nguồn mở có thể sánh ngang với các sản phẩm tiên tiến nhất từ OpenAI của Mỹ, nhưng với chi phí chỉ bằng một phần nhỏ.

Gây tiếng vang lớn

Công ty trí tuệ nhân tạo DeepSeek được thành lập vào năm 2023 tại thành phố Hàng Châu, Trung Quốc. Người sáng lập công ty này là Lương Văn Phong, sinh năm 1985, tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử và thông tin tại Đại học Chiết Giang.

DeepSeek tìm kiếm cơ hội trong lĩnh vực AI, khi xu hướng AI đang bùng nổ trên toàn cầu. Giống các công ty khởi nghiệp AI khác, DeepSeek cũng đã phát triển và thử nghiệm nhiều mô hình AI khác nhau, nhưng không thực sự tạo được sự chú ý.

Chỉ đến khi ra mắt mô hình AI mang tên R1 vào cuối năm ngoái và chính thức phát hành đến người dùng từ ngày 20/1 năm nay, DeepSeek mới tạo được tiếng vang và gây sốt trên toàn cầu nhờ vào trí thông minh và khả năng xử lý ấn tượng của nó.

Các chuyên gia và người dùng thậm chí còn đánh giá DeepSeek-R1 đưa ra câu trả lời thông minh, chính xác và phản hồi nhanh hơn so với các công cụ AI khác như ChatGPT, Gemini hay Llama… Điểm khiến DeepSeek gây kinh ngạc nhất đó là mô hình AI này chỉ mất 5,6 triệu USD để xây dựng và vận hành. Trong khi đó, các hãng công nghệ của Mỹ đang chi ra hàng trăm, thậm chí hàng tỷ USD để phát triển và vận hành mô hình AI của riêng họ.

Một điểm khác khiến DeepSeek thu hút sự chú ý của giới công nghệ đó là công cụ AI này được ra đời và phát triển vào thời điểm Chính phủ Mỹ đang áp dụng các lệnh trừng phạt, ngăn chặn nguồn cung cấp chip AI hiệu suất cao cho các công ty Trung Quốc. Điều đó có nghĩa là DeepSeek được phát triển và hoạt động dựa trên các chip AI hiệu suất thấp, nhưng vẫn thể hiện được sức mạnh đáng nể.

Ứng dụng DeepSeek trên kho ứng dụng App Store dành cho các thiết bị iOS đã có sự nhảy vọt về số lượng tải, vượt qua ChatGPT khi trở thành ứng dụng AI được tải về nhiều nhất trong thời gian gần đây.

AI “R1” của DeepSeek đã nhận được hàng loạt lời khen ngợi từ các 'gã khổng lồ' công nghệ Mỹ. Ảnh: INT

Sự công nhận từ thế giới

Với sức mạnh vượt trội, AI “R1” của DeepSeek đã nhận được hàng loạt lời khen ngợi từ các “gã khổng lồ” công nghệ Mỹ, từ Microsoft, Meta, Google đến Amazon.

Giám đốc điều hành (CEO) của Microsoft, ông Satya Nadella, ghi nhận những đổi mới thực sự mà DeepSeek mang lại. Ông đồng thời đề cao tính hiệu quả đáng kinh ngạc của mô hình AI mã nguồn mở này. Microsoft thậm chí đã tích hợp mô hình R1 vào các nền tảng phát triển của mình như Azure và GitHub.

CEO Meta Mark Zuckerberg cũng bày tỏ sự thán phục trước cách DeepSeek tối ưu hóa hạ tầng AI và cho biết, Meta có thể học hỏi từ những cải tiến này và thậm chí áp dụng vào các sản phẩm của mình.

Trong khi đó, dù cổ phiếu có chút biến động khi DeepSeek ra mắt, nhưng Nvidia vẫn phải thừa nhận, R1 là “một bước tiến xuất sắc của AI”. Công ty này đánh giá cao cách tiếp cận của DeepSeek trong việc mở rộng quy mô của kỹ thuật “test-time scaling”.

Đây là kỹ thuật cho phép mô hình AI suy nghĩ nhiều hơn trước khi đưa ra câu trả lời - một trong ba phương pháp tối ưu hóa quan trọng trong ngành AI hiện nay. CEO của Google - ông Sundar Pichai - cũng bày tỏ sự ấn tượng về AI của Deepseek. Ông nhận định, sự đổi mới của công nghệ này sẽ giúp giảm chi phí phát triển, mang lại lợi ích không chỉ cho Google, mà còn cho toàn ngành công nghiệp.

Không chỉ các “ông lớn” công nghệ, DeepSeek còn thu hút sự chú ý từ các đối thủ trực tiếp trong ngành AI. CEO OpenAI - ông Sam Altman - dùng từ “đầy ấn tượng” để mô tả R1, đặc biệt là khi xét về hiệu suất so với chi phí. Sự xuất hiện của DeepSeek đã tạo động lực để OpenAI đẩy nhanh tiến độ ra mắt các mô hình AI mới.

Các kỹ sư AI hàng đầu tại Mỹ, nghiên cứu của DeepSeek đã nêu ra những cách thông minh và ấn tượng để xây dựng công nghệ AI với ít chip hơn. Các kỹ sư của công ty khởi nghiệp này đã chứng minh một phương pháp hiệu quả hơn để phân tích dữ liệu bằng cách sử dụng chip.

Những hệ thống AI hàng đầu học các kỹ năng của chúng bằng cách xác định mẫu trong lượng dữ liệu khổng lồ, bao gồm văn bản, hình ảnh và âm thanh. DeepSeek đã mô tả một cách để phân phối phân tích dữ liệu này trên một số mô hình AI chuyên biệt. Đồng thời, giảm thiểu thời gian di chuyển dữ liệu từ nơi này sang nơi khác.

Ông Tim Dettmers - nhà nghiên cứu tại Viện Trí tuệ nhân tạo Allen ở Seattle và là Giáo sư khoa học máy tính tại Đại học Carnegie Mellon (Mỹ), người chuyên xây dựng các hệ thống AI hiệu quả, nhận định: “Rõ ràng là các công ty khác, không chỉ một công ty như OpenAI, có thể xây dựng những hệ thống như vậy. DeepSeek đã sử dụng các phương pháp mà bất kỳ ai cũng có thể sao chép”.

Mô hình AI của DeepSeek chỉ mất 5,6 triệu USD để xây dựng và vận hành. Ảnh: INT

Lời cảnh tỉnh cho ngành công nghiệp Mỹ

Nghiên cứu của DeepSeek đã đặt ra câu hỏi về việc liệu các công ty lớn của Mỹ có thể duy trì vị thế dẫn đầu đáng kể trong lĩnh vực AI. Nhiều chuyên gia tin rằng, công nghệ AI sẽ trở thành một mặt hàng, với nhiều công ty bán cùng một sản phẩm.

Giống như nhiều công ty khác, DeepSeek đã “mở nguồn” hệ thống AI mới nhất của mình. Điều đó có nghĩa là công ty đã chia sẻ mã máy tính cơ bản với các doanh nghiệp và nhà nghiên cứu khác.

Điều này cho phép những công ty khác xây dựng và phân phối sản phẩm của riêng họ bằng cùng công nghệ. Đây là một phần lý do khiến DeepSeek và những công ty khác ở Trung Quốc có thể xây dựng các hệ thống AI cạnh tranh một cách nhanh chóng và không tốn kém.

Trong thế giới AI, mã nguồn mở lần đầu tiên phát triển mạnh vào năm 2023 khi Meta chia sẻ miễn phí một hệ thống AI có tên là Llama. Vào thời điểm đó, nhiều người cho rằng, hệ sinh thái mã nguồn mở chỉ phát triển mạnh nếu các doanh nghiệp như Meta - những công ty khổng lồ với các trung tâm dữ liệu khổng lồ chứa đầy chip chuyên dụng - tiếp tục mở nguồn công nghệ của họ.

Tuy nhiên, DeepSeek và những công ty khác đã chứng minh rằng, hệ sinh thái này có thể phát triển theo cách vượt ra ngoài các công ty công nghệ khổng lồ của Mỹ. Nhiều chuyên gia đã lập luận rằng, các công ty lớn của Mỹ không nên mở nguồn công nghệ của họ vì chúng có thể được sử dụng để phát tán thông tin sai lệch hoặc gây ra tác hại nghiêm trọng khác. Một số nhà lập pháp Mỹ đã khám phá khả năng ngăn chặn hoặc hạn chế hoạt động này.

Trong khi đó, các chuyên gia khác lại cho rằng, nếu cơ quan quản lý kìm hãm sự tiến triển của công nghệ nguồn mở tại Mỹ, Trung Quốc sẽ giành được lợi thế đáng kể. Các chuyên gia này cho rằng, nếu các công nghệ nguồn mở tốt nhất đến từ Trung Quốc, nhà nghiên cứu và công ty Mỹ sẽ xây dựng hệ thống của họ dựa trên các công nghệ đó.

Về lâu dài, điều đó có thể đưa Trung Quốc trở thành trung tâm nghiên cứu và phát triển AI. Thành công của DeepSeek đặt ra câu hỏi về sự thống trị của các công ty Mỹ trong hệ sinh thái AI, vốn phụ thuộc vào các khoản đầu tư lớn về chip và trung tâm dữ liệu.

Tổng thống Mỹ Donald Trump tuyên bố: “Việc một công ty Trung Quốc phát hành DeepSeek sẽ là lời cảnh tỉnh cho các ngành công nghiệp của chúng ta, rằng chúng ta cần tập trung cao độ vào việc cạnh tranh để giành chiến thắng, bởi vì chúng ta có những nhà khoa học vĩ đại nhất thế giới”.

Nhà lãnh đạo Mỹ chia sẻ đã tìm hiểu về Trung Quốc và một số công ty trong ngành AI của nước này. “Chuyện một công ty Trung Quốc cụ thể đưa ra mô hình AI nhanh hơn, ít tốn kém hơn nhiều là một điều tốt vì chúng ta không phải tốn quá nhiều tiền”, ông Trump nêu vấn đề.

Vừa trấn an nhưng cũng đặt ra yêu cầu cho các doanh nghiệp Mỹ, Tổng thống Trump chia sẻ các nhà lãnh đạo Trung Quốc đã nói với ông rằng, Mỹ có những nhà khoa học lỗi lạc nhất thế giới. Do đó, nếu ngành công nghiệp Trung Quốc có thể đưa ra công nghệ AI rẻ hơn, các công ty Mỹ hoàn toàn có thể làm được.

“Chúng ta luôn có những ý tưởng. Chúng ta luôn đi đầu. Vì vậy, tôi cho rằng việc vừa qua là một điều tích cực, có thể là một sự phát triển rất tích cực. Thay vì chi hàng tỷ USD, ta sẽ chi ít hơn và hy vọng là các anh sẽ đưa ra được giải pháp tương tự”, ông Trump nhắn gửi.

Thành công của DeepSeek được dự báo có thể tái cân bằng sân chơi AI toàn cầu, khi các công ty nhỏ gọn và sáng tạo vẫn có thể cạnh tranh trong cuộc đua AI, ngay cả khi họ có ít tiền hoặc hạn chế về khả năng tiếp cận các con chip tiên tiến nhất.

Theo phân tích của Công ty KPMG, DeepSeek có thể tái định hình toàn bộ ngành công nghiệp AI nhờ 3 yếu tố chính: Hiệu suất cạnh tranh với các mô hình độc quyền hàng đầu, chi phí phát triển thấp và mô hình mã nguồn mở giúp cộng đồng toàn cầu có thể nghiên cứu, cải tiến. Một báo cáo từ MIT Technology Review cho thấy các kỹ thuật học tăng cường (reinforcement learning) của DeepSeek đã giúp loại bỏ phần lớn nhu cầu phản hồi từ con người, giảm đáng kể chi phí phát triển. Điều này mở ra cơ hội để các công ty nhỏ và startup AI có thể cạnh tranh với những “gã khổng lồ” trong ngành, thúc đẩy một môi trường đổi mới và hợp tác chưa từng có.

Theo The Guardians; Foreign Policy; NY Times