Alibaba cho biết, hai mô hình trí tuệ nhân tạo mới là Qwen-VL và Qwen-VL-Chat sẽ là nguồn mở - nghĩa là các nhà nghiên cứu, học giả và công ty trên toàn thế giới có thể sử dụng chúng để tạo ứng dụng AI mang tính cá nhân hoá mà không cần phải đào tạo hệ thống của riêng họ, do đó tiết kiệm thời gian và chi phí.
Alibaba cho biết, Qwen-VL có thể trả lời các truy vấn mở liên quan đến các hình ảnh khác nhau và tạo chú thích cho ảnh.
Trong khi đó, Qwen-VL-Chat phục vụ cho “sự tương tác phức tạp” hơn, chẳng hạn như so sánh nhiều hình ảnh đầu vào và trả lời nhiều câu hỏi. Một số nhiệm vụ mà Alibaba cho biết Qwen-VL-Chat có thể thực hiện bao gồm viết truyện và tạo hình ảnh dựa trên ảnh mà người dùng nhập vào, cũng như giải các phương trình toán học hiển thị trong ảnh.
Cho đến nay, phần lớn AI tạo sinh đã tập trung vào việc phản hồi văn bản. Phiên bản mới nhất của ChatGPT của OpenAI cũng có khả năng hiểu hình ảnh và phản hồi bằng văn bản, giống như Qwen-VL-Chat.
Hai mô hình trí tuệ nhân tạo mới nhất của Alibaba được xây dựng dựa trên mô hình ngôn ngữ lớn (LLM) của công ty có tên Tongyi Qianwen được phát hành vào đầu năm nay. LLM là một mô hình trí tuệ nhân tạo được đào tạo dựa trên lượng dữ liệu khổng lồ và làm nền tảng cho các ứng dụng chatbot.
Meta đầu năm nay đã cung cấp mô hình ngôn ngữ lớn Llama cho các nhà nghiên cứu và đang hợp tác với các công ty công nghệ khác để thúc đẩy việc áp dụng chúng. Tháng trước, Microsoft cho biết họ đang cung cấp Llama 2 của Meta trên dịch vụ điện toán đám mây Azure của mình.
Alibaba vẫn chưa công bố mối quan hệ hợp tác như vậy, nhưng nếu mô hình ngôn ngữ lớn của họ đạt được thành công trên thị trường, thì việc các nhà cung cấp dịch vụ đám mây cung cấp dịch vụ này cho khách hàng có thể trở nên hấp dẫn. Cung cấp mô hình ngôn ngữ lớn để phát triển ứng dụng AI là một lợi thế cạnh tranh tiềm năng cho những công ty trong lĩnh vực điện toán đám mây.