
Google Meet sẽ là nền tảng đầu tiên tích hợp công nghệ này.
Ông Pichai cho biết tính năng có khả năng tái hiện giọng nói, ngữ điệu và biểu cảm của người nói gần như tức thì. “Công nghệ này giúp các cuộc trò chuyện trở nên tự nhiên và liền mạch hơn giữa các ngôn ngữ,” ông chia sẻ.
Trong video minh họa, lời nói tiếng Tây Ban Nha được AI dịch sang tiếng Anh một cách mượt mà và ngược lại. Đặc biệt, bản dịch sử dụng chính giọng nói gốc của người nói, trong khi âm thanh ban đầu vẫn giữ ở mức nền thấp, tạo cảm giác chân thực và liền mạch.
Tính năng này được đánh giá sẽ hữu ích trong nhiều tình huống, từ kết nối gia đình xuyên quốc gia đến hỗ trợ giao tiếp trong doanh nghiệp đa ngôn ngữ. Theo Google, hệ thống có độ trễ cực thấp – điểm mà các giải pháp hiện tại chưa thể đạt được.
Trong giai đoạn đầu, tính năng chỉ hỗ trợ dịch giữa tiếng Anh và tiếng Tây Ban Nha, dành riêng cho người dùng gói Google AI Pro và Ultra. Google cho biết sẽ sớm bổ sung thêm nhiều ngôn ngữ và mở rộng thử nghiệm cho người dùng Google Workspace doanh nghiệp trong năm nay.
Tính năng dịch trực tiếp là một phần trong dự án Starline mà Google khởi xướng từ năm 2021, nhằm mang lại trải nghiệm gọi điện chân thực như trò chuyện trực tiếp. Bên cạnh công nghệ ngôn ngữ, Google còn phát triển hệ thống camera 3D và thiết bị phần cứng Google Beam để hỗ trợ các cuộc gọi sống động và chân thực hơn.