DeepSeek và các tác nhân AI thế hệ tiếp theo có thể làm xói mòn giá trị của các mô hình ngôn ngữ lớn

Tuần trước, công ty AI khởi nghiệp của Trung Quốc DeepSeek đã phát hành mô hình lý luận nguồn mở R1 và tuyên bố có thể cạnh tranh với mô hình o1 của OpenAI về cả chi phí lẫn hiệu suất. Nguồn mở đề cập đến phần mềm có mã nguồn được cung cấp miễn phí trên web để có thể sửa đổi và phân phối lại.

Nhận thức ngày càng tăng về mô hình mới của DeepSeek đã dẫn đến sự sụt giảm nghiêm trọng về giá cổ phiếu của Nvidia và các công ty công nghệ khổng lồ khác, vì các nhà đầu tư lo ngại về khả năng cắt giảm chi tiêu cho các đơn vị xử lý đồ họa cần thiết để đào tạo và chạy khối lượng công việc AI tiên tiến.

Trong khi đó, các giám đốc điều hành và nhà khoa học tại các phòng phát triển AI hàng đầu đều đang nhắc tới sự thay đổi từ LLM sang "tác nhân AI" (AI Agents) có thể thực hiện các hành động thay mặt con người.

LLM là công nghệ nền tảng đằng sau các ứng dụng AI tạo ra ngày nay. Tuy nhiên, các chuyên gia tin rằng việc thúc đẩy các hệ thống AI tác nhân kết hợp công nghệ LLM trong năm nay sẽ làm xói mòn giá trị của các mô hình này.

Thương mại hóa LLM

LLM dự kiến sẽ trở thành một loại hàng hóa nhiều hơn trong tương lai gần khi công nghệ ngày càng tiên tiến và chi phí liên quan đến đào tạo và vận hành chúng tiếp tục giảm.

Thomas Wolf, đồng sáng lập kiêm giám đốc khoa học của Hugging Face cho rằng, LLM sẽ được tích hợp nhiều hơn vào các hệ thống thông minh được liên kết với cơ sở dữ liệu của công ty.

"Tôi nghĩ mọi người đang thoát khỏi sự điên rồ này xung quanh LLM nhờ có mã nguồn mở... rất nhiều mô hình này sẽ miễn phí và có sẵn miễn phí", ông cho biết. Trong đó, Hugging Face là kho lưu trữ mã phổ biến cho các dự án AI mã nguồn mở.

Sự ra đời của mô hình R1 của DeepSeek vào tuần trước được một số giám đốc điều hành công nghệ xem là một chỉ báo nữa cho thấy LLM đang ngày càng trở nên phổ biến.

"Khi AI trở nên hiệu quả và dễ tiếp cận hơn, chúng ta sẽ thấy việc sử dụng nó tăng vọt, biến nó thành một loại hàng hóa mà chúng ta không thể ngừng sử dụng", CEO Satya Nadella của Microsoft cho biết.

Trong khi đó, Matt Calkins, CEO của công ty phần mềm Appian cho rằng thành công của DeepSeek chỉ đơn giản cho thấy rằng các mô hình AI sẽ trở thành một loại hàng hóa trong tương lai.

"Theo tôi, chúng ta sẽ thấy AI trở thành hàng hóa. Nhiều công ty sẽ đạt được AI có tính cạnh tranh và việc thiếu sự khác biệt sẽ không tốt cho những người đi đầu trong chi tiêu đầu tư", ông cho biết.

Tác nhân AI là gì?

Trong hai năm qua, phần lớn sự tập trung đều hướng đến các sản phẩm do LLM cung cấp, từ các chatbot AI tạo ra như ChatGPT của OpenAI cho đến các công cụ có thể tạo ra hình ảnh và nội dung video.

Các ứng dụng tạo ra dựa trên LLM như ChatGPT dựa vào một lượng hỗ trợ nhất định từ người dùng để liên tục nhắc họ cung cấp đầu ra, trong khi ngược lại, các tác nhân AI được thiết kế để hướng đến hành động nhiều hơn.

Ví dụ, nếu muốn đặt lịch hẹn với bác sĩ, chúng có thể yêu cầu ChatGPT cung cấp thông tin về các phòng khám gần nhất, tương tự như cách truy vấn web bằng công cụ tìm kiếm của Google.

Trong tương lai, các giám đốc điều hành công nghệ dự đoán rằng AI thế hệ tiếp theo sẽ bao gồm các tác nhân AI có thể tìm ra vị trí của phòng khám gần nhất, cung cấp thời gian rảnh cho bác sĩ lẫn đặt lịch hẹn - tất cả đều trực tiếp trong một nền tảng duy nhất. Điều này dự kiến sẽ thay đổi cách chúng ta tương tác với web.

Sự chuyển dịch từ mô hình AI sang tác nhân AI

Arthur Mensch, CEO của Mistral cho biết ông nghĩ rằng "nên chuyển sang các hệ thống" tích hợp cả mô hình ngôn ngữ và dữ liệu kinh doanh theo ngữ cảnh.

“Điều đó cũng có nghĩa là ngành công nghiệp đang áp dụng nó sẽ chắt lọc chuyên môn của mình vào các hệ thống đó, và đó là nơi cần thiết để thực sự thúc đẩy giá trị của AI vào các ngành công nghiệp đó”, ông cho biết.

Xu hướng tác nhân AI đã đạt được sức hút đáng kể. Tuần trước, OpenAI đã ra mắt tác nhân AI có tên là Operator. OpenAI mô tả tác nhân này là "một tác nhân có thể truy cập web để thực hiện các tác vụ cho bạn", đồng thời tác nhân này được đào tạo để tương tác với "các nút, menu và trường văn bản mà mọi người sử dụng hàng ngày" trên web.

Microsoft cũng đã tự triển khai các tác nhân AI vào tháng 11.

Anthropic (công ty khởi nghiệp AI dưới sự hậu thuẫn của Amazon) đã giới thiệu "sử dụng máy tính", đây là khả năng cho phép các tác nhân AI của công ty sử dụng máy tính như con người để hoàn thành các tác vụ phức tạp.

Khả năng sử dụng máy tính của Anthropic cho phép công nghệ này diễn giải những gì trên màn hình máy tính, chọn nút, nhập văn bản, điều hướng trang web và thực hiện tác vụ thông qua bất kỳ phần mềm nào và duyệt internet theo thời gian thực.

Dario Amodei, CEO của Anthropic cho biết, sử dụng máy tính nên được xem là tiền thân của "tầm nhìn rộng hơn" tích hợp các tác nhân này với các ứng dụng thường dùng.

"Chúng tôi đang lên kế hoạch trong năm nay vào năm 2025 để xây dựng thứ mà chúng tôi gọi là cộng tác viên ảo”, ông cho biết.

Paul O'Sullivan, Giám đốc công nghệ của Salesforce tại Anh và Ireland dự đoán rằng giao tiếp bằng lời nói sẽ trở nên quan trọng hơn trong thế giới mới của các tác nhân AI. Salesforce có thể được cho là đã sớm tham gia vào AI tác nhân, khi đã ra mắt hệ thống Agentforce vào tháng 9 trước Microsoft, OpenAI và Anthropic.

Hạc Hiên
Theo báo chí nước ngoài