Trung Quốc đạt được nhiều bước tiến trong lĩnh vực AI

AI đã trở thành chiến trường mới nhất giữa Mỹ và Trung Quốc khi cả hai quốc gia đều xem đây là công nghệ chiến lược. Mỹ tiếp tục hạn chế quyền truy cập của Trung Quốc vào các chip tiên tiến được thiết kế để hỗ trợ AI trong bối cảnh lo ngại rằng công nghệ này có thể đe dọa đến an ninh quốc gia của Mỹ.

Điều này khiến Trung Quốc theo đuổi cách tiếp cận riêng để thúc đẩy sức hấp dẫn và hiệu suất của các mô hình AI, bao gồm cả việc dựa vào công nghệ nguồn mở và phát triển phần mềm và chip siêu nhanh.

Trung Quốc đang tạo ra các LLM phổ biến

Giống như một số công ty hàng đầu của Mỹ trong lĩnh vực này, các công ty AI của Trung Quốc đang phát triển các mô hình ngôn ngữ lớn (LLM) được đào tạo trên một lượng lớn dữ liệu và hỗ trợ các ứng dụng như chatbot.

Tuy nhiên, không giống như các mô hình của OpenAI cung cấp năng lượng cho ChatGPT cực kỳ phổ biến, nhiều công ty Trung Quốc này đang phát triển LLM nguồn mở mà các nhà phát triển có thể tải xuống và xây dựng miễn phí mà không cần yêu cầu cấp phép nghiêm ngặt từ nhà phát minh.

“Trên kho lưu trữ LLM của Hugging Face, LLM của Trung Quốc là loại được tải xuống nhiều nhất”, Tiezhen Wang, kỹ sư tại Hugging Face nói và cho biết, Qwen - mô hình AI do Alibaba tạo ra là loại phổ biến nhất trên Hugging Face. Qwen đang nhanh chóng trở nên phổ biến do hiệu suất vượt trội trên các tiêu chuẩn cạnh tranh.

Công ty khởi nghiệp DeepSeek cũng đã tạo nên làn sóng gần đây với một mô hình có tên là DeepSeek-R1. Tháng trước, DeepSeek cho biết mô hình R1 của họ cạnh tranh với o1 của OpenAI - mô hình được thiết kế để suy luận hoặc giải quyết các nhiệm vụ phức tạp hơn.

Các công ty này tuyên bố rằng, các mô hình AI của họ có thể cạnh tranh với các dịch vụ nguồn mở khác như Llama của Meta, cũng như các LLM đóng của OpenAI trên nhiều chức năng khác nhau.

“Trong năm ngoái, chúng tôi đã chứng kiến sự gia tăng các đóng góp nguồn mở của Trung Quốc vào AI với hiệu suất thực sự mạnh mẽ, chi phí phục vụ thấp và thông lượng cao”, Grace Isford, đối tác tại Lux Capital cho biết.

Trung Quốc thúc đẩy nguồn mở vươn ra toàn cầu

Việc cung cấp nguồn mở cho một công nghệ phục vụ một số mục đích, bao gồm thúc đẩy sự đổi mới khi nhiều nhà phát triển có quyền truy cập vào công nghệ đó, cũng như xây dựng cộng đồng xung quanh một sản phẩm.

Không chỉ các công ty Trung Quốc mới ra mắt LLM nguồn mở. Meta cũng như công ty khởi nghiệp Mistral của châu Âu cũng có các phiên bản mô hình AI nguồn mở.

Nhưng với ngành công nghệ đang bị cuốn vào cuộc chiến địa chính trị giữa Mỹ và Trung Quốc, LLM nguồn mở mang lại cho các công ty Trung Quốc một lợi thế khác, đó là cho phép các mô hình của họ được sử dụng trên toàn cầu.

Paul Triolo, đối tác tại công ty tư vấn toàn cầu DGA Group cho biết: "Các công ty Trung Quốc muốn thấy các mô hình của họ được sử dụng bên ngoài Trung Quốc, vì vậy đây chắc chắn là cách để các công ty trở thành những người chơi trong lĩnh vực AI trên toàn cầu".

Trong khi trọng tâm hiện tại là các mô hình AI, cũng có cuộc tranh luận về những ứng dụng nào sẽ được xây dựng dựa trên chúng và ai sẽ thống trị bối cảnh internet toàn cầu này trong tương lai.

Các mô hình AI ngày nay đã được so sánh với các hệ điều hành, chẳng hạn như Windows của Microsoft, Android của Google và iOS của Apple, với tiềm năng thống trị thị trường giống như những công ty này làm trên thiết bị di động và PC.

Nếu đúng như vậy, điều này sẽ khiến lượng tiền sử dụng nhằm xây dựng một LLM thống trị trở nên cao hơn.

“Các công ty Trung Quốc xem LLM là trung tâm của hệ sinh thái công nghệ tương lai”, Xin Sun, giảng viên cao cấp về kinh doanh Trung Quốc và Đông Á tại King’s College London nói và cho biết, các mô hình kinh doanh trong tương lai của họ sẽ dựa vào việc các nhà phát triển tham gia hệ sinh thái, phát triển các ứng dụng mới dựa trên LLM, thu hút người dùng và dữ liệu, sau đó có thể tạo ra lợi nhuận thông qua nhiều phương tiện khác nhau, nhưng không chỉ giới hạn ở việc hướng dẫn người dùng sử dụng dịch vụ đám mây.

Các hạn chế về chip gây nghi ngờ về tương lai AI của Trung Quốc

Các mô hình AI được đào tạo trên lượng dữ liệu khổng lồ, đòi hỏi lượng lớn sức mạnh tính toán. Hiện tại, Nvidia là nhà thiết kế hàng đầu về các chip cần thiết cho việc này, được gọi là bộ xử lý đồ họa (GPU).

Hầu hết các công ty AI hàng đầu đang đào tạo hệ thống của họ trên các chip hiệu suất cao nhất của Nvidia, nhưng không phải ở Trung Quốc.

Trong khoảng một năm trở lại đây, Mỹ đã tăng cường các hạn chế xuất khẩu đối với thiết bị sản xuất chip và chất bán dẫn tiên tiến sang Trung Quốc. Điều đó có nghĩa là các chip tiên tiến của Nvidia không thể được xuất khẩu sang nước này và Nvidia đã phải tạo ra các chất bán dẫn tuân thủ lệnh trừng phạt để xuất khẩu.

Tuy nhiên, bất chấp những hạn chế này, các công ty Trung Quốc vẫn có thể tung ra các mô hình AI tiên tiến.

“Các nền tảng công nghệ lớn của Trung Quốc hiện có đủ quyền truy cập vào sức mạnh tính toán để tiếp tục cải thiện các mô hình. Điều này là do họ đã tích trữ một lượng lớn GPU Nvidia và cũng đang tận dụng GPU trong nước từ Huawei và các công ty khác", Paul Triolo, đối tác tại công ty tư vấn toàn cầu DGA Group cho biết.

Thật vậy, các công ty Trung Quốc đã và đang thúc đẩy các nỗ lực để tạo ra các giải pháp thay thế khả thi cho Nvidia. Huawei là một trong những công ty hàng đầu theo đuổi mục tiêu này tại Trung Quốc, trong khi các công ty như Baidu và Alibaba cũng đã đầu tư vào thiết kế bán dẫn.

"Tuy nhiên, khoảng cách về mặt tính toán phần cứng tiên tiến sẽ ngày càng lớn hơn theo thời gian, đặc biệt là vào năm tới khi Nvidia tung ra các hệ thống dựa trên GPU Blackwell bị hạn chế xuất khẩu sang Trung Quốc", ông Paul Triolo cho biết.

Theo bà Grace Isford, Trung Quốc đã "đầu tư và phát triển toàn bộ cơ sở hạ tầng AI trong nước một cách có hệ thống bên ngoài Nvidia bằng các chip AI hiệu suất cao từ các công ty như Baidu".

"Việc chip Nvidia có bị cấm ở Trung Quốc hay không sẽ không ngăn cản Trung Quốc đầu tư và xây dựng cơ sở hạ tầng của riêng mình để xây dựng và đào tạo các mô hình AI", bà cho biết thêm.

Hạc Hiên
Theo báo chí nước ngoài