Google Gemma 4 là gì? Mọi thứ cần biết về AI mã nguồn mở mới của Google

Google vừa công bố Gemma 4 , thế hệ mới nhất trong dòng mô hình AI mã nguồn mở của hãng. Đây được xem là bộ mô hình mở mạnh mẽ nhất mà Google từng phát hành, đồng thời cho phép sử dụng thương mại miễn phí.

Gemma 4 được xây dựng dựa trên nền tảng nghiên cứu tương tự như Gemini 3. Tuy nhiên, khác với Gemini là mô hình độc quyền, Gemma 4 được phát hành dưới dạng mã nguồn mở với giấy phép Apache 2.0, cho phép nhà phát triển và doanh nghiệp sử dụng tự do trong các sản phẩm thương mại.

Sự xuất hiện của Gemma 4 đánh dấu bước tiến mới trong chiến lược AI của Google, khi hãng bắt đầu đẩy mạnh các mô hình mở nhằm cạnh tranh trực tiếp với những đối thủ như dòng Llama của Meta.

Gemma 4 là gì?

Gemma 4 là một họ mô hình AI mã nguồn mở được thiết kế để hoạt động linh hoạt trên nhiều môi trường khác nhau, từ thiết bị cục bộ đến hệ thống AI quy mô lớn. Mục tiêu của Google là mang khả năng của các mô hình tiên tiến như Gemini đến với cộng đồng phát triển thông qua nền tảng mở.

Một trong những điểm nổi bật của Gemma 4 là việc hỗ trợ mạnh mẽ các agentic workflows . Các mô hình mới này hỗ trợ sẵn function calling, structured JSON output và system instructions. Nhờ đó, nhà phát triển có thể xây dựng các AI agent tự động thực hiện nhiệm vụ phức tạp, xử lý logic nhiều bước và tương tác với API bên ngoài ngay trên môi trường cục bộ.

Điều này cho thấy Google đang định hướng Gemma 4 không chỉ là một mô hình AI đơn thuần, mà còn là nền tảng để xây dựng hệ thống AI tự động.

Hiệu năng của Gemma 4 mạnh đến đâu?

Theo Google, các mô hình Gemma 4 đạt hiệu năng rất cao trong các bảng xếp hạng AI mã nguồn mở. Phiên bản 31B Dense hiện đứng thứ ba trên bảng xếp hạng Arena AI, trong khi phiên bản 26B đứng thứ sáu. Đáng chú ý, các mô hình này có thể vượt qua nhiều đối thủ có kích thước lớn hơn tới 20 lần.

Một điểm đáng chú ý khác là các mô hình 26B và 31B có thể chạy trên một GPU NVIDIA H100 80GB duy nhất. Điều này giúp giảm đáng kể yêu cầu phần cứng, khiến việc triển khai trở nên dễ dàng hơn.

Ngoài ra, Google cũng giới thiệu phiên bản 26B Mixture of Experts (MoE), được tối ưu cho độ trễ thấp. Mô hình này chỉ kích hoạt khoảng 3.8 tỷ tham số trong quá trình suy luận, giúp tăng tốc độ tạo nội dung. Nhờ vậy, Gemma 4 có thể được sử dụng để xây dựng trợ lý lập trình cục bộ hoặc các ứng dụng AI thời gian thực ngay trên phần cứng phổ thông.

Gemma 4 cũng được nâng cấp mạnh về khả năng đa phương thức. Toàn bộ dòng mô hình có thể xử lý hình ảnh độ phân giải cao và video. Các phiên bản edge như E2B và E4B còn hỗ trợ đầu vào âm thanh, cho phép nhận diện giọng nói với độ trễ rất thấp.

Bên cạnh đó, Gemma 4 cũng có cửa sổ ngữ cảnh lớn. Các phiên bản edge hỗ trợ ngữ cảnh 128K token, trong khi các mô hình lớn hơn như 26B và 31B có thể xử lý tới 256K token. Điều này giúp mô hình xử lý tài liệu dài hoặc tác vụ phức tạp hiệu quả hơn.

Khả năng tương thích và hệ sinh thái

Một điểm thay đổi quan trọng của Gemma 4 nằm ở giấy phép Apache 2.0. Các phiên bản Gemma trước đây có điều khoản sử dụng riêng, khiến chúng không thực sự là mã nguồn mở hoàn toàn.

Với Gemma 4, Google cho phép sử dụng thương mại, tùy chỉnh mô hình, phân phối lại và tích hợp vào sản phẩm mà không bị hạn chế. Điều này khiến Gemma 4 trở thành đối thủ trực tiếp của các mô hình mã nguồn mở như Llama.

Động thái này cũng cho thấy Google đang nghiêm túc hơn với chiến lược AI mã nguồn mở.

Gemma 4 hiện đã tương thích với nhiều nền tảng phổ biến như Hugging Face, Ollama và vLLM. Đồng thời, Google cũng tối ưu mô hình cho nhiều nền tảng phần cứng khác nhau như NVIDIA, AMD, Qualcomm và MediaTek.

Đối với nhà phát triển mobile, Gemma 4 đã có thể thử nghiệm thông qua AICore Developer Preview. Google cũng cho biết các mô hình này sẽ tương thích với Gemini Nano 4 trong tương lai, mở ra khả năng triển khai AI mạnh mẽ trên thiết bị di động.

Với hiệu năng cao, khả năng hỗ trợ AI agent, đa phương thức và giấy phép mã nguồn mở thực sự, Gemma 4 đang trở thành một trong những mô hình AI đáng chú ý nhất hiện nay.

Google không chỉ tung ra một bản nâng cấp, mà còn đang mở rộng hệ sinh thái AI của mình theo hướng mở hơn. Điều này giúp nhà phát triển tiếp cận các công cụ mạnh mẽ hơn và mở ra nhiều ứng dụng AI mới trong tương lai.

Thứ Hai, 06/04/2026 12:30
31 👨 151
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Làm chủ AI