Gemini Omni ra mắt: Khám phá công cụ AI tạo video từ văn bản, ảnh và âm thanh
https://fptshop.com.vn/https://fptshop.com.vn/
Ngọc Mi
14 ngày trước

Gemini Omni ra mắt: Khám phá công cụ AI tạo video từ văn bản, ảnh và âm thanh

Google tiếp tục mở rộng cuộc đua AI sáng tạo với Gemini Omni, mô hình mới có thể biến ý tưởng của người dùng thành video thông qua ngôn ngữ tự nhiên. Không chỉ tạo video từ nhiều dữ liệu đầu vào, Gemini Omni còn ghi nhớ yêu cầu trước đó để giữ sự đồng nhất về nhân vật và bối cảnh.
Chia sẻ:
Cỡ chữ nhỏ
Cỡ chữ nhỏ
Cỡ chữ lớn
Nội dung bài viết
Gemini Omni là gì?
Những tính năng mới của Gemini Omni 
Gemini Omni giá bao nhiêu?
Tạm kết

Gemini Omni là dòng mô hình AI mới được Google giới thiệu tại Google I/O 2026, nổi bật với khả năng tạo và chỉnh sửa video bằng văn bản, hình ảnh, video hoặc giọng nói. Công cụ này hứa hẹn giúp quá trình sáng tạo nội dung trở nên trực quan hơn khi người dùng có thể trò chuyện trực tiếp với AI để thay đổi bối cảnh, nhân vật hay chuyển động. Hãy cùng tìm hiểu chi tiết hơn trong bài viết dưới đây.

Gemini Omni là gì?

Gemini Omni là dòng mô hình AI mới của Google, được phát triển để kết hợp khả năng suy luận của Gemini với năng lực sáng tạo nội dung đa phương tiện. Thay vì chỉ tạo nội dung từ văn bản, Omni có thể tiếp nhận nhiều loại dữ liệu đầu vào như hình ảnh, âm thanh, video và văn bản để tạo ra video chất lượng cao, bám sát kiến thức thực tế của Gemini.

Điểm nổi bật của Gemini Omni là khả năng tạo và chỉnh sửa video thông qua hội thoại. Người dùng có thể trò chuyện trực tiếp với AI để yêu cầu thay đổi nội dung, điều chỉnh bối cảnh, thêm hiệu ứng, thay đổi phong cách hoặc biến đổi cảnh quay theo ý tưởng mong muốn. Điều này giúp quá trình sáng tạo video trở nên đơn giản hơn, đặc biệt với những người không có nhiều kinh nghiệm dựng phim chuyên nghiệp.

Mô hình đầu tiên thuộc dòng Omni là Gemini Omni Flash, hiện được triển khai trên ứng dụng Gemini, Google Flow và YouTube Shorts. Ban đầu, Omni tập trung vào khả năng tạo video, sau đó Google dự kiến mở rộng thêm các dạng đầu ra khác như hình ảnh và âm thanh trong thời gian tới.

Gemini Omni là gì?

Những tính năng mới của Gemini Omni 

Video chân thực và có chiều sâu

Gemini Omni không chỉ tạo ra các cảnh quay có hình ảnh chân thực mà còn vận dụng kiến thức về vật lý, lịch sử, khoa học và bối cảnh văn hóa để xây dựng nội dung hợp lý hơn. Mô hình có thể hiểu các yếu tố như trọng lực, chuyển động hay sự tương tác giữa vật thể với môi trường, từ đó tạo video tự nhiên hơn và có tính kể chuyện rõ ràng. Điều này giúp người dùng dễ dàng tạo ra những video phức tạp cần kết hợp giữa hình ảnh, chuyển động và kiến thức thực tế.

Xây dựng video có cấu trúc rõ ràng

Gemini Omni có khả năng hiểu yêu cầu của người dùng theo ngữ cảnh thay vì chỉ nhận diện từ khóa đơn thuần. Nhờ đó, mô hình có thể liên kết ngôn ngữ với hình ảnh, sắp xếp các chi tiết theo trình tự logic và tạo video có cấu trúc rõ ràng hơn. Với những nội dung nhiều chi tiết hoặc có nhịp kể nhanh, Omni vẫn có thể duy trì sự nhất quán giữa các cảnh quay và truyền tải đúng thông điệp người dùng muốn thể hiện.

Xây dựng video có cấu trúc rõ ràng

Biến ý tưởng phức tạp thành hình ảnh dễ hiểu

Một điểm nổi bật khác của Gemini Omni là khả năng trực quan hóa các ý tưởng khó bằng video minh họa sinh động. Người dùng chỉ cần nhập prompt ngắn, AI có thể tạo ra các video giải thích về khoa học, giáo dục hoặc quy trình phức tạp theo nhiều phong cách khác nhau như claymation hay stop motion. Mô hình cũng được tối ưu để giữ tính chính xác cho những nội dung cần yếu tố chuyên môn hoặc mô phỏng khoa học.

Tạo video từ nhiều nguồn dữ liệu đầu vào

Gemini Omni có thể kết hợp nhiều loại dữ liệu tham chiếu như hình ảnh, văn bản, video và âm thanh để tạo ra một video hoàn chỉnh. Các nguồn đầu vào này sẽ được AI pha trộn thành nội dung có phong cách và chuyển động liền mạch hơn. 

Google cho biết giai đoạn đầu Omni sẽ ưu tiên hỗ trợ tham chiếu giọng nói, sau đó tiếp tục mở rộng sang các loại âm thanh khác nhằm phục vụ tốt hơn cho quy trình sáng tạo đa phương tiện.

Tạo video từ nhiều nguồn dữ liệu đầu vào

Tạo video từ nội dung có sẵn

Người dùng có thể sử dụng ảnh nhân vật, bối cảnh, bản vẽ hoặc concept art làm dữ liệu tham chiếu để Gemini Omni tạo video đúng với định hướng ban đầu. Nhờ khả năng giữ lại phong cách, màu sắc và không khí từ hình ảnh gốc, mô hình giúp quá trình sáng tạo trở nên nhanh hơn mà không cần mô tả lại toàn bộ ý tưởng bằng văn bản. Điều này đặc biệt hữu ích với các nhà sáng tạo nội dung hoặc người làm video cần duy trì tính đồng nhất về hình ảnh.

Tạo video từ nội dung có sẵn

Tùy chỉnh phong cách và hiệu ứng linh hoạt

Gemini Omni cho phép người dùng định hình phong cách video bằng ngôn ngữ tự nhiên hoặc dữ liệu tham chiếu có sẵn. AI có thể tạo video theo nhiều phong cách khác nhau như sci-fi, retro futuristic, stop motion hay claymation, đồng thời thêm hiệu ứng ánh sáng, chuyển động hoặc đồng bộ với âm thanh. Khi kết hợp nhiều nguồn dữ liệu đầu vào, Omni vẫn có thể tạo ra video có cảm giác thống nhất về hình ảnh, hiệu ứng và nhịp chuyển động.

Gemini Omni giá bao nhiêu?

Hiện tại, Google chưa công bố mức giá riêng cho Gemini Omni mà công cụ này đang được triển khai thông qua các gói dịch vụ AI của hãng. Cụ thể, Gemini Omni Flash - mô hình đầu tiên thuộc dòng Omni - đã bắt đầu xuất hiện trên ứng dụng Gemini và Google Flow dành cho người dùng đăng ký các gói Google AI Plus, Pro và Ultra tại nhiều thị trường trên toàn cầu.

Ngoài ra, Google cũng cho phép người dùng trải nghiệm Gemini Omni Flash miễn phí trên một số nền tảng như YouTube Shorts và ứng dụng YouTube Create. Điều này giúp người dùng phổ thông có cơ hội tiếp cận các tính năng tạo và chỉnh sửa video bằng AI mà không cần đăng ký gói dịch vụ riêng trong giai đoạn đầu.

Gemini Omni giá bao nhiêu?

Tạm kết

Việc ra mắt Gemini Omni cho thấy Google đang tiếp tục mở rộng tham vọng trong lĩnh vực AI sáng tạo, đặc biệt là tạo và chỉnh sửa video bằng ngôn ngữ tự nhiên. Với Gemini Omni Flash được triển khai trên ứng dụng Gemini, Google Flow và YouTube Shorts, người dùng sẽ có thêm công cụ mới để biến ý tưởng thành video nhanh hơn, trực quan hơn và dễ tiếp cận hơn.

Để khai thác tốt các công cụ AI phục vụ học tập, làm việc và sáng tạo, bạn có thể tham khảo các mẫu laptop AI tại FPT Shop. Ghé ngay FPT Shop để chọn thiết bị phù hợp và nhận nhiều ưu đãi hấp dẫn hôm nay.

Xem thêm:

Chủ đề
Thương hiệu đảm bảo

Thương hiệu đảm bảo

Nhập khẩu, bảo hành chính hãng

Đổi trả dễ dàng

Đổi trả dễ dàng

Theo chính sách đổi trả tại FPT Shop

Giao hàng tận nơi

Giao hàng tận nơi

Trên toàn quốc

Sản phẩm chất lượng

Sản phẩm chất lượng

Đảm bảo tương thích và độ bền cao