:quality(75)/google_deepmind_ra_mat_mo_hinh_gemini_robotics_15_giup_robot_thuc_hien_nhiem_vu_phuc_tap_hon_34c509b388.jpg)
Google DeepMind ra mắt mô hình Gemini Robotics 1.5 giúp robot thực hiện nhiệm vụ phức tạp hơn
Đây là một phần trong loạt cập nhật mới nhất dành cho hai mô hình Gemini Robotics 1.5 và Gemini Robotics-ER 1.5, phiên bản nâng cấp từ Gemini Robotics 1.0 ra mắt hồi tháng 3.
Robot có thể suy nghĩ trước nhiều bước và tra cứu thông tin trực tuyến
Theo bà Carolina Parada, giám đốc mảng robot tại Google DeepMind, các mô hình mới cho phép robot “suy nghĩ nhiều bước trước khi hành động” thay vì chỉ xử lý từng lệnh đơn lẻ như trước. Nhờ đó, robot có thể tự thực hiện các công việc phức tạp như phân loại quần áo sáng và tối khi giặt, sắp xếp vali dựa trên tình hình thời tiết ở London hay phân loại rác theo quy định địa phương sau khi tự tìm kiếm thông tin trên Google.
Hệ thống hoạt động theo mô hình phối hợp: Gemini Robotics-ER 1.5 quan sát môi trường, tìm kiếm thông tin trực tuyến, sau đó chuyển thành hướng dẫn bằng ngôn ngữ tự nhiên cho Gemini Robotics 1.5. Mô hình này sẽ sử dụng thị giác máy tính cùng khả năng hiểu ngôn ngữ để trực tiếp thực hiện các hành động cụ thể. Nhờ cách tiếp cận này, robot không chỉ dừng lại ở việc “nghe và làm” mà có thể hiểu bối cảnh, lập kế hoạch và hành động thông minh hơn.

Một trong những cải tiến nổi bật là robot có thể chia sẻ kỹ năng cho nhau, bất kể sự khác biệt về phần cứng. Chẳng hạn, kỹ năng được học từ robot ALOHA2 có thể áp dụng cho Franka hoặc thậm chí là Apollo (robot hình người của Apptronik). Việc một mô hình duy nhất có thể điều khiển nhiều loại robot và chuyển giao kỹ năng giữa chúng được xem là bước ngoặt quan trọng, giúp rút ngắn đáng kể thời gian cũng như chi phí huấn luyện robot.
Google cho biết Gemini Robotics-ER 1.5 đã được phát hành cho lập trình viên thông qua Gemini API trên nền tảng Google AI Studio. Trong khi đó, Gemini Robotics 1.5 hiện mới chỉ được cung cấp cho một số đối tác được lựa chọn.
Xem thêm:
- Qualcomm Snapdragon 8 Gen 5 lộ sẽ có CPU Oryon, tiến trình 3nm, cải tiến AI mạnh mẽ
- ROG Xbox Ally và Ally X mở đặt trước toàn cầu, giá từ 599 USD (~16 triệu đồng)
Nguồn: The Verge
:quality(75)/estore-v2/img/fptshop-logo.png)
:quality(75)/google_home_sap_duoc_tich_hop_gemini_voi_giao_dien_moi_dieu_khien_thong_minh_hon_39a04d8fed.jpg)
:quality(75)/gemini_sap_co_mat_tren_google_tv_voi_nhieu_tinh_nang_ai_tu_gemini_2_62df42f7ad.jpg)
:quality(75)/vi_sao_cong_cu_chinh_anh_nano_banana_cua_google_gemini_dang_gay_sot_toan_cau_7da7b567ca.jpg)
:quality(75)/google_ra_mat_tro_ly_ai_ask_gemini_trong_google_meet_953bb0bbd7.png)
:quality(75)/google_chinh_thuc_cong_bo_gioi_han_su_dung_gemini_cho_tung_goi_tai_khoan_a4319bf1bf.jpg)