Một năm sau cú sốc DeepSeek, làn sóng mô hình AI giá rẻ Trung Quốc sắp bùng nổ

DeepSeek đã tăng trưởng thần tốc vào đầu năm 2025, làm đảo lộn ngành AI trong nước và đưa các mô hình mã nguồn mở, chi phí thấp lên vị trí trung tâm trong hệ sinh thái AI của Trung Quốc.

Lần này, DeepSeek sẽ cùng với một số công ty khác sẽ ra mắt các sản phẩm mới trong kỳ nghỉ lễ dài nhất và bận rộn nhất của Trung Quốc, chính thức bắt đầu vào ngày 15/2.

Trong khi ngành công nghiệp đã rất ngạc nhiên khi DeepSeek đột phá với mô hình AI mạnh mẽ bất chấp các biện pháp kiểm soát xuất khẩu của Mỹ hạn chế tiếp cận các chất bán dẫn tiên tiến, thì giờ đây thị trường muốn xem các công ty Trung Quốc sẽ cho ra mắt những sản phẩm gì tiếp theo.

"Sẽ là bất ngờ nếu một số mô hình mới này lại không đạt được kỳ vọng. Tôi nghĩ rằng kỳ vọng ở đây rất cao”, Alfredo Montufar-Helu, Giám đốc điều hành tại Ankura Consulting cho biết.

Mới đây, Zhipu AI đã phát hành mô hình AI mới nhất, được cho là có khả năng lập trình nâng cao và khả năng thực hiện các tác vụ kéo dài mà không cần bất kỳ sự can thiệp nào của người dùng.

ByteDance vừa chính thức công bố Seedance 2.0, mô hình AI tạo video "có khả năng tạo ra các bộ phim bom tấn điện ảnh chỉ trong vài giây”.

Theo QuestMobile, ByteDance cũng dự kiến sẽ tung ra các bản nâng cấp cho chatbot Doubao, hiện là ứng dụng AI phổ biến nhất Trung Quốc với 155,2 triệu người dùng hoạt động hàng tuần.

DeepSeek cũng đang chuẩn bị phát hành mẫu thế hệ tiếp theo V4 và đối thủ Alibaba dự kiến sẽ ra mắt dòng Qwen 3.5, với khả năng suy luận toán học và lập trình được cải tiến.

Tuy nhiên, Alibaba, ByteDance và DeepSeek vẫn chưa công bố ngày phát hành chính thức cho các mẫu được nâng cấp của họ.

Mã nguồn mở giá rẻ trở thành tiêu chuẩn

Việc DeepSeek cho ra mắt mô hình AI mới vào tháng 1/2025 đã gây ra một đợt bán tháo công nghệ toàn cầu và làm giảm 593 tỷ USD giá trị thị trường của nhà sản xuất chip AI Nvidia chỉ trong một ngày, đồng thời thúc đẩy các đối thủ Trung Quốc tung ra các bản nâng cấp cho mô hình của riêng mình.

Trong hai năm qua, các mô hình của DeepSeek đã liên tục đưa giá thành thấp hơn so với các đối thủ cạnh tranh, đẩy chi phí sử dụng xuống thấp hơn đáng kể so với nhiều sản phẩm của Mỹ.

Tại Mỹ, các nhà đầu tư xem tuyên bố của DeepSeek rằng họ đã xây dựng một mô hình tương đương với mô hình tốt nhất của OpenAI nhưng với chi phí thấp hơn nhiều, như một thách thức đối với giả định rằng chỉ những công ty chi hàng chục tỷ đô la cho cơ sở hạ tầng điện toán mới có thể tạo ra AI tiên tiến.

Một báo cáo của nhóm nghiên cứu RAND về cạnh tranh AI giữa Mỹ và Trung Quốc cho thấy các mô hình của Trung Quốc hoạt động với chi phí chỉ bằng khoảng một phần sáu đến 1/4 so với các hệ thống tương đương của Mỹ.

“DeepSeek đã cho ngành công nghiệp thấy rằng chúng ta có thể tạo ra một mô hình rất tốt ngay cả khi bị hạn chế về nguồn lực… Sự kết hợp giữa quyền truy cập mã nguồn mở, khả năng suy luận mạnh mẽ và chi phí triển khai thấp đã trở thành mô hình định hình cách các nhà cung cấp Trung Quốc hiện nay tiếp cận các mô hình nền tảng”, Lian Jye Su, nhà phân tích trưởng tại công ty nghiên cứu công nghệ Omdia cho biết.

Trong khi DeepSeek vẫn tập trung vào việc nâng cao hiệu suất của các mô hình cốt lõi, các đối thủ cạnh tranh lại đang chuyển hướng sang tích hợp AI vào các dịch vụ tiêu dùng. Chatbot Qwen của Alibaba gần đây đã thử nghiệm cho phép người dùng mua hàng trực tiếp thông qua các câu lệnh hội thoại.

Sự điều chỉnh này cho thấy các doanh nghiệp đang phải đối mặt với tình hình kinh doanh thực tế. Những công ty như Alibaba đang chịu áp lực từ cổ đông phải sớm tạo ra doanh thu từ các khoản đầu tư vào AI, thông qua các ứng dụng cho người tiêu dùng và doanh nghiệp, đồng thời vẫn phải tiếp tục chi mạnh cho việc mở rộng hạ tầng tốn kém.

Trong khi đó, DeepSeek có cấu trúc hoạt động khác biệt. Công ty mẹ của DeepSeek là một quỹ phòng hộ định lượng do nhà sáng lập Liang Wenfeng chi phối, điều này cho phép DeepSeek ưu tiên nghiên cứu hơn là thương mại hóa và tránh được áp lực từ các nhà đầu tư bên ngoài.

Hạc Hiên
Theo báo chí nước ngoài