Google Gemma 4 ra mắt mô hình AI mã nguồn mở thế hệ mới

Đa dạng phiên bản, phủ rộng nhiều nền tảng

Gemma 4 được phát hành với bốn cấu hình, phục vụ nhiều nhu cầu triển khai. Bản 31B Dense đứng thứ ba và bản 26B MoE đứng thứ sáu trên bảng xếp hạng Arena AI dành cho mô hình mở. Hai phiên bản còn lại là Effective 4B và Effective 2B, hướng đến khả năng vận hành gọn nhẹ.

Các phiên bản 31B và 26B phù hợp với GPU laptop, máy trạm và hệ thống tăng tốc cho các tác vụ chuyên sâu. Hai bản E4B và E2B được tối ưu để chạy trực tiếp trên điện thoại, Raspberry Pi và Jetson Nano.

Google cho biết đã phối hợp cùng đội Pixel, Qualcomm và MediaTek để tinh chỉnh hai phiên bản 2B và 4B. Nhờ đó, mô hình có thể xử lý ngay trên thiết bị với độ trễ gần như bằng 0, giúp mở rộng khả năng triển khai AI cục bộ và giảm phụ thuộc vào hạ tầng đám mây.

Xử lý linh hoạt từ hội thoại đến tác vụ phức tạp

Gemma 4 hỗ trợ nhiều cấp độ, từ trò chuyện cơ bản đến các quy trình tự động hóa dựa trên tác nhân. Theo Google, trong một số bài kiểm tra, mô hình có thể vượt qua những hệ thống lớn hơn gấp 20 lần về hiệu quả xử lý.

Các bản edge sở hữu context window 128K, trong khi phiên bản cao hơn đạt 256K, cho phép xử lý tài liệu dài hoặc toàn bộ kho mã nguồn chỉ trong một lần nhập lệnh.

Hỗ trợ đa phương thức và hơn 140 ngôn ngữ

Toàn bộ dòng Gemma 4 có khả năng xử lý trực tiếp hình ảnh và video, phục vụ các tác vụ như nhận dạng ký tự và phân tích biểu đồ. Hai phiên bản E2B và E4B còn hỗ trợ đầu vào âm thanh, cho phép nhận diện và hiểu giọng nói.

Mô hình được huấn luyện trên hơn 140 ngôn ngữ, giúp mở rộng phạm vi ứng dụng trên nhiều thị trường.

Nâng cấp mạnh về suy luận và tự động hóa

Gemma 4 cải thiện rõ rệt khả năng lập luận nhiều bước và xử lý logic sâu. Mô hình đạt kết quả cao hơn trong các bài kiểm tra toán học và nhiệm vụ yêu cầu tuân thủ chỉ dẫn. Hệ thống cũng hỗ trợ gọi hàm, xuất dữ liệu JSON có cấu trúc và xử lý chỉ dẫn hệ thống, giúp xây dựng các agent có thể tương tác với công cụ và API một cách ổn định.

Google định vị Gemma 4 như một trợ lý lập trình chạy cục bộ. Mô hình có thể tạo mã chất lượng cao ngay cả khi không kết nối mạng, biến máy trạm thành môi trường phát triển AI độc lập và tăng kiểm soát dữ liệu.

Giấy phép Apache 2.0, linh hoạt cho doanh nghiệp

Gemma 4 được phát hành theo giấy phép Apache 2.0, cho phép sử dụng trong môi trường thương mại. Nhà phát triển có thể toàn quyền kiểm soát dữ liệu, hạ tầng và mô hình, đồng thời triển khai trên cả hệ thống nội bộ lẫn đám mây.

Hiện Gemma 4 đã có trên Google AI Studio với các bản 31B và 26B MoE, cũng như Google AI Edge Gallery cho bản E2B và E4B. Trọng số mô hình được cung cấp qua Hugging Face, Kaggle và Ollama, hỗ trợ triển khai nhanh trong thực tế.

Hãy theo dõi FPT Shop để cập nhật nhanh tin tức công nghệ và xu hướng AI mới nhất. Tại đây, bạn có thể tham khảo các mẫu điện thoại, laptop chính hãng hiệu năng mạnh, hỗ trợ khai thác hiệu quả hệ sinh thái số, giúp quản lý dữ liệu và làm việc linh hoạt hơn mỗi ngày.

Xem thêm:

Nguồn: 9to5google

Gemma 4 ra mắt, AI mở vượt mô hình lớn hơn gấp 20 lần ở một số tác vụ

Đa dạng phiên bản, phủ rộng nhiều nền tảng

Xử lý linh hoạt từ hội thoại đến tác vụ phức tạp

Hỗ trợ đa phương thức và hơn 140 ngôn ngữ

Nâng cấp mạnh về suy luận và tự động hóa

Giấy phép Apache 2.0, linh hoạt cho doanh nghiệp