Trong video được Figure AI công bố ngày 13/3, robot hình người Figure 01 của công ty có thể nói chuyện liền mạch với con người. Công ty cho biết robot tích hợp Mô hình ngôn ngữ hình ản🍌h (VLM) mới nhất do OpenAI phát triển, có t🍸hể tương tác lời nói - lời nói (speech-to-speech) để giao tiếp.
Trong đó, VLM sử dụng mô hình đa phương thức của OpenAI với khả năng hiểu hình ảnh, văn bản thu nhận từ camera trên robot, dựa trên cuộc trò chuyện bằng giọng nói theo thời gian thực. Những dữ liệu này được robot 🐻phân tích để phản hồi ngược trở lại cho người đối diện. Điều này khác với GPT-4, vốn tập trung vào các lời nhắc bằng văn bản.
Bên cạnh đó, robot cũng sử dụng "thao tác tay dựa trên những gì học được". Hệ thống thu nhận và điều khiển các cánh tay một cách nhuần nhuyễn. "Mạng lưới xử lý hình ả෴nh thu được ở tần số 10 Hz và tạo ra các hành động 24-DOF (tư thế cổ tay và góc khớp ngón tay) ở tần số 200 Hz", theo Figure AI.
Video demo cho thấy Figure 01 có thể tương tác với con người khá tự nhiên, dù phản hồi chưa đủ nhanh. Business Insider đánh giá việc robot hình người được trang bị AI của công ty hàng đầu như OpenAI là "sự kết hợp mạnh mẽ", nhưng "có thể khiến mọi người kinh ngạꦐc xen lẫn sợ hãi".
Figure AI♈ khẳng định nội dung trong video đều dựa trên quá trình học hỏi của hệ thống và không bị điều khiển từ xa.
"Nếu không tận mắt chứng kiến, thật khó xác minh những tuyên bố của Figure AI. Hoặc cũng có thể công ty đã làm đi làm lại hàng trăm lần để có kết quả như vậy", TechRadar bình luận🧸. "Nhưng nếu đó là sự thật 100% sẽ thật tu💖yệt vời".
Figure AI là startup mới thành lập năm 2022 tại Mỹ nhưng đã tạo ấn tượng mạnh với giới đầu tư, trở thành kỳ lân được định giá 2🍰,6 tỷ USD nhờ trình làng và liên tục cải tiến robot hình người Figure 01. Robot này dự kiến được giao nhiệm vụ trong sản xuất, vận chuyển, hậu cần, kho bãi và bán lẻ - những🤪 lĩnh vực đang thiếu hụt lao động.
Bảo Lâm