Ứng dụng Gemini bổ sung tính năng tải lên và phân tích video

Trước đó, Gemini đã hỗ trợ người dùng tải lên tài liệu và hình ảnh, nhưng việc bổ sung khả năng tiếp nhận video đánh dấu một giai đoạn mới, nơi người dùng có thể yêu cầu phân tích nội dung trực quan phức tạp hơn. Việc này mở ra tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực, từ giáo dục, truyền thông đến nghiên cứu và sáng tạo nội dung.

Cách thức hoạt động của tính năng mới

Để sử dụng tính năng này, người dùng chỉ cần truy cập vào menu trong ứng dụng và chọn mục Gallery hoặc Files. Nếu tài khoản đã được cập nhật ứng dụng, tuỳ chọn tải video sẽ hiển thị rõ ràng. Ngược lại, nếu tính năng chưa khả dụng, lựa chọn này sẽ bị làm mờ và không thể thao tác. Việc kích hoạt theo giai đoạn giúp Google kiểm soát quá trình triển khai và đảm bảo tính ổn định trong những ngày đầu ra mắt.

Ứng dụng Gemini bổ sung tính năng tải lên và phân tích video

Điểm nổi bật nhất của tính năng này không chỉ nằm ở khả năng tiếp nhận video mà còn ở năng lực phân tích nội dung thông minh. Người dùng có thể đặt câu hỏi về các chi tiết trong video, từ những yếu tố cụ thể như nội dung hiển thị trên màn hình Nest Hub cho đến cảm nhận tổng thể của từng cảnh quay.

Khi được hỏi về một cảnh trong rừng mùa thu, Gemini đã đưa ra mô tả: “Đây là một cảnh yên bình từ một khu rừng vào mùa thu. Một con đường hẹp, được phủ đầy lá rụng với các sắc thái của màu cam, nâu và vàng, uốn lượn qua những cây cối.” Câu trả lời này cho thấy hệ thống không chỉ nhận diện hình ảnh mà còn có khả năng mô tả sinh động và có chiều sâu.

Hiện tại, tính năng phân tích video chỉ mới được triển khai hạn chế và chưa áp dụng đại trà cho toàn bộ người dùng. Những người sử dụng phiên bản Gemini 2.5 Flash hoặc 2.5 Pro trên thiết bị Android và iOS có thể là nhóm đầu tiên tiếp cận chức năng này. Tuy nhiên, phiên bản web vẫn chưa hỗ trợ tải lên video. Khi thử nghiệm trên trình duyệt, người dùng sẽ nhận được thông báo rằng loại tệp chưa được hỗ trợ, cho thấy khả năng xử lý video vẫn đang trong giai đoạn phát triển tiếp theo.

Tính năng mới giúp ứng dụng Gemini tiến thêm một bước trong cuộc đua giữa các nền tảng trí tuệ nhân tạo tích hợp. Khả năng hiểu được nội dung video không chỉ làm phong phú hơn cách người dùng giao tiếp với AI mà còn mở đường cho nhiều tình huống sử dụng linh hoạt trong tương lai, từ phân tích hình ảnh y tế, nhận diện cảnh báo trong video giám sát đến hỗ trợ học tập đa phương tiện.

Với giao diện trực quan, tốc độ phản hồi nhanh và độ chính xác cao, Gemini đang chứng tỏ mình là một trong những ứng dụng tiên phong trong việc kết hợp trí tuệ nhân tạo với trải nghiệm người dùng thực tế. Việc bổ sung tính năng phân tích video không chỉ giúp Gemini vượt qua giới hạn của một chatbot thông thường mà còn đưa ứng dụng tiến gần hơn đến mô hình trợ lý số toàn diện mà Google đang theo đuổi.

Xem thêm: Google ra mắt mô hình AI mới nhất, Gemini 2.5 Pro, cho tất cả người dùng

Nguồn: 9to5Google