Alibaba tăng tốc trong cuộc đua phát triển mô hình AI

(ĐTCK) Hôm thứ Hai (16/2), Alibaba Cloud vừa công bố mô hình trí tuệ nhân tạo (AI) mã nguồn mở thế hệ tiếp theo được gọi Qwen-3.5, động thái được dự đoán sẽ có tác động lớn đến cuộc đua AI toàn cầu giữa Trung Quốc và Mỹ.

Việc ra mắt đúng vào đêm trước Tết Nguyên đán đã khép lại một tuần sôi động khi hầu hết các nhà phát triển AI lớn của Trung Quốc đều tung ra các mô hình chủ lực mới.

Theo các điểm chuẩn do chính Alibaba Cloud công bố, mô hình mới Qwen-3.5-Open-Source với 397 tỷ tham số đã cho thấy sự cải thiện đáng kể so với mô hình chủ lực trước đó là Qwen-3-Max-Thinking, mặc dù mô hình cũ có quy mô lớn hơn nhiều với hơn 1.000 tỷ tham số.

Mô hình này cũng tự hào có hiệu suất ngang bằng với các mô hình hàng đầu từ OpenAI, Anthropic và Google DeepMind, mặc dù sự so sánh không phải với các mô hình mới nhất của ba ông lớn công nghệ đến từ Mỹ. Trong khi đó, phiên bản mã nguồn đóng có tên Qwen-3.5-Plus đạt hiệu suất được mô tả là “ngang tầm với các mô hình hàng đầu hiện nay” và có cửa sổ ngữ cảnh (lượng dữ liệu có thể xử lý trong một lần) lên tới 1 triệu token — thuộc hàng lớn nhất trong ngành.

Lần đầu tiên, Qwen-3.5 được xây dựng với khả năng đa phương thức tích hợp sẵn, cho phép mô hình hiểu và xử lý văn bản, hình ảnh, âm thanh và video trong cùng một hệ thống. Dòng mô hình này cũng áp dụng kiến trúc mới nhất của công ty, lần đầu được giới thiệu thử nghiệm vào tháng 9 thông qua hệ thống mang tính thử nghiệm có tên Qwen3-Next, nhằm cải thiện hiệu quả tính toán và giảm chi phí vận hành. Theo công ty, điều này giúp mô hình đạt được “một chuẩn mực mới về năng lực trên mỗi đơn vị chi phí suy luận”.

Trong năm qua, Trung Quốc đã định vị là một lực lượng dẫn đầu trong lĩnh vực AI mã nguồn mở, tạo sự khác biệt so với chiến lược mô hình đóng được nhiều tập đoàn lớn tại Thung lũng Silicon ưa chuộng.

Dữ liệu tải xuống từ Hugging Face cho thấy các mô hình mở của Trung Quốc đã vượt qua các mô hình tương tự của Mỹ vào năm ngoái về mức độ áp dụng toàn cầu, với DeepSeek và Qwen chiếm phần lớn sự tăng trưởng.

Đặc biệt, Qwen đã thu hút được sự chú ý nhờ phạm vi ứng dụng rộng rãi, vì Alibaba thường phát hành nhiều phiên bản của cùng một mô hình cơ bản với các kích thước khác nhau để thúc đẩy việc sử dụng trong giới phát triển và doanh nghiệp, cũng như khả năng hỗ trợ đa ngôn ngữ.

Các mô hình Qwen-3.5 mới đã bổ sung 82 ngôn ngữ và phương ngữ mới so với thế hệ Qwen trước đó, nâng tổng số ngôn ngữ và phương ngữ hỗ trợ lên 201, bao gồm cả các ngôn ngữ chuyên biệt như tiếng Hawaii và tiếng Fiji. Theo chuyên gia về mô hình mở Nathan Lambert, những tính năng này đã giúp Qwen trở thành một “tiêu chuẩn mô hình mở” trên thực tế.

Sự nổi lên ngày càng tăng của Trung Quốc trong hệ sinh thái mô hình mở đã khiến chính quyền Tổng thống Donald Trump đặt mục tiêu ưu tiên việc phổ biến toàn cầu các mô hình mở do Mỹ phát triển.

Tuy nhiên, Lennart Heim, nhà phân tích AI và bán dẫn theo dõi cạnh tranh Mỹ-Trung cho biết thước đo đáng tin cậy hơn sẽ là việc triển khai thực tế chứ không chỉ là số lượt tải xuống.

“Số lượt tải xuống mô hình không nói lên điều gì về việc sử dụng thực tế…những tác động đến an ninh quốc gia của các mô hình mã nguồn mở của Trung Quốc vẫn chưa chắc chắn, ngay cả khi một số công ty khởi nghiệp và tổ chức học thuật của Mỹ đã triển khai chúng tại địa phương”, ông cho biết.

Đáng chú ý, Alibaba không chia sẻ mã nguồn cho toàn bộ các hệ thống AI của mình. Những mô hình lớn nhất tính theo số lượng tham số - được gọi là dòng Max - vẫn là mô hình đóng và được tích hợp chặt chẽ với ứng dụng chủ lực của công ty là Qwen.

Đồng thời, công ty theo đuổi chiến lược thương mại hóa mạnh mẽ, đưa các mô hình mã nguồn mở vào vị trí trung tâm trong hoạt động kinh doanh điện toán đám mây bằng cách cung cấp trọn gói dịch vụ lưu trữ dữ liệu và suy luận mô hình cho các nhà phát triển và doanh nghiệp trên toàn thế giới.

Hạc Hiên
Theo báo chí nước ngoài

Tin liên quan

Tin cùng chuyên mục