gpt-oss là gì?

OpenAI một lần nữa quay trở lại với các mô hình AI mã nguồn mở. Nhà phát triển ChatGPT đã phát hành thêm hai mô hình ngôn ngữ lớn (LLM) theo giấy phép mở lần đầu tiên kể từ GPT-2 năm 2019. Cách đặt tên khá khó hiểu, nhưng lần này có thể bỏ qua vì gpt-oss-120b và gpt-oss-20b là những mô hình vô cùng thú vị.

gpt-oss là gì?

gpt-oss là một họ các mô hình AI mở, được phát hành theo giấy phép Apache 2.0 cho phép sử dụng tự do. Chúng là các mô hình suy luận tiên tiến mà bất kỳ ai cũng có thể tải xuống, tinh chỉnh và sử dụng cho hầu hết mọi mục đích - mặc dù OpenAI đã thực hiện các bước để hạn chế cách chúng có thể được sử dụng cho mục đích xấu hoặc để tạo ra thông tin có hại.

Đây là một bước tiến lớn vì kể từ năm 2019, tất cả các mô hình GPT và o-series đều là độc quyền. Với gpt-oss, OpenAI đã vén bức màn bí mật.

Cũng cần lưu ý rằng gpt-oss-120b và gpt-oss-20b là các mô hình mở có hiệu suất cao nhất từ ​​những phòng thí nghiệm AI của Bắc Mỹ và Châu Âu. Đối với những người lo ngại về cách các mô hình của Trung Quốc được huấn luyện và sự kiểm duyệt vốn có trong dữ liệu huấn luyện của chúng, điều này làm cho những mô hình mới nhất của OpenAI thậm chí còn quan trọng hơn.

gpt-oss-120b và gpt-oss-20b

gpt-oss-120b và gpt-oss-20b là hai mô hình đầu tiên trong dòng sản phẩm này, và ngoài việc chúng không phải là sản phẩm độc quyền như các mô hình khác của OpenAI, chúng trông khá giống với phần còn lại:

  • Cả hai mô hình đều sử dụng kiến ​​trúc Mixture-of-Experts. Mô hình lớn hơn, gpt-oss-120b, có tổng cộng 117 tỷ tham số trên 128 mạng con (expert), 5,1 tỷ tham số còn lại sẽ được kích hoạt tại một thời điểm nào đó. Mô hình nhỏ hơn, gpt-oss-20b, có 21 tỷ tham số trên 32 mạng con (expert), 3,6 tỷ tham số còn lại sẽ được kích hoạt tại một thời điểm nào đó.
  • Cả hai mô hình đều là mô hình suy luận, vì vậy chúng có khả năng sử dụng suy luận chuỗi tư duy (CoT) để giải quyết các vấn đề phức tạp. Chúng có 3 cấp độ suy luận: Thấp, Trung bình và Cao.
  • Cả hai mô hình đều là LLM (Learning Language Module), không phải mô hình đa phương thức lớn (LMM), vì vậy chúng chỉ hỗ trợ văn bản - không hỗ trợ âm thanh, hình ảnh hoặc bất kỳ phương thức nào khác.
  • Cả hai mô hình đều hỗ trợ độ dài ngữ cảnh là 128k token.
  • Cả hai mô hình đều có khả năng sử dụng công cụ, vì vậy chúng có thể được sử dụng để duyệt web, viết code và làm việc trong các hệ thống agentic.

Hai mô hình chủ yếu được huấn luyện trên văn bản tiếng Anh tập trung vào nội dung STEM, lập trình và kiến ​​thức tổng quát. Dữ liệu liên quan đến các mối đe dọa hóa học, sinh học, phóng xạ và hạt nhân (CBRN) đã được lọc bỏ để đảm bảo an toàn tối đa.

Ngoài việc lọc dữ liệu huấn luyện, OpenAI đã huấn luyện lại các mô hình bằng cách sử dụng căn chỉnh có chủ đích và hệ thống phân cấp hướng dẫn để chúng từ chối trả lời những prompt không an toàn và hạn chế rủi ro bị chèn mã độc vào prompt. Đây là những kỹ thuật tương tự mà OpenAI sử dụng để đảm bảo an toàn cho các mô hình độc quyền của mình.

gpt-oss tốt đến mức nào?

Các mô hình ngôn ngữ mở đang có một thời điểm bùng nổ. Đặc biệt, các phòng nghiên cứu của Trung Quốc như DeepSeek, Qwen, Moonshot và Z.ai đang phát hành các mô hình mở có tính cạnh tranh đáng kinh ngạc. Mặc dù các mô hình độc quyền tốt nhất vẫn vượt trội hơn các mô hình mã nguồn mở tốt nhất, nhưng khoảng cách đã thu hẹp đáng kể. Vậy gpt-oss-120b và gpt-oss-20b nằm ở vị trí nào trong bảng xếp hạng?

Biểu đồ cột của Artificial Analysis so sánh các mô hình mã nguồn mở và độc quyền khác nhau
Biểu đồ cột của Artificial Analysis so sánh các mô hình mã nguồn mở và độc quyền khác nhau

OpenAI tuyên bố rằng gpt-oss-120b cung cấp hiệu năng tương tự như o4-mini và gpt-oss-20b cung cấp hiệu năng tương tự như o3-mini trên các bài kiểm tra hiệu năng chính, và những phân tích độc lập phần lớn ủng hộ điều này. Nói cách khác, chúng thực sự là những mô hình suy luận hiện đại rất tốt.

Nhưng phân tích này bỏ sót một chi tiết quan trọng.

Hiện tại, gpt-oss-120b là mô hình thông minh nhất có thể chạy trên một card đồ họa NVIDIA H100 duy nhất, và gpt-oss-20b là mô hình thông minh nhất có thể chạy trên GPU dành cho người tiêu dùng (hoặc thậm chí là laptop chỉ với 16GB RAM). Các mô hình này không được tối ưu hóa cho hiệu năng thô, mà thay vào đó được thiết kế để cực kỳ thông minh so với số lượng tham số và mạng con của chúng.

Ví dụ, DeepSeek R1 có hiệu năng vượt trội hơn gpt-oss-120b, nhưng nó có tổng cộng 671 tỷ tham số và 37 tỷ tham số active (so với 117 tỷ tham số và 5,1 tỷ tham số active), khiến nó tiêu tốn bộ nhớ gấp hơn 10 lần. Bạn phải thực sự muốn từng chút hiệu năng bổ sung thì chi phí bổ sung mới đáng giá.

Trong khi không gian mô hình ngôn ngữ mở đang phát triển nhanh chóng, có thể khẳng định rằng cả gpt-oss-120b và gpt-oss-20b đều là những mô hình hiệu năng cao, hiện đại với hiệu quả vượt trội. Nếu OpenAI tiếp tục hỗ trợ chúng hoặc phát hành thêm các mô hình trong họ gpt-oss, chúng có khả năng vẫn sẽ phù hợp trong tương lai gần.

Cách sử dụng gpt-oss-120b và gpt-oss-20b

Giống như hầu hết các mô hình mã nguồn mở, bạn có thể tải xuống gpt-oss-120b và gpt-oss-20b từ Hugging Face ngay bây giờ. Trong khi gpt-oss-120b yêu cầu GPU cấp máy chủ để chạy, bạn có thể chạy gpt-oss-20b trên nhiều máy MacBook hiện đại.

OpenAI cũng đã hợp tác với các nhà cung cấp suy luận như Azure, vLLM, Ollama, LM Studio, AWS, Fireworks, Databricks, Vercel và OpenRouter để cung cấp gpt-oss-120b và gpt-oss-20b cho những nhà phát triển. Họ cung cấp hai mô hình này dưới dạng API với nhiều mức giá khác nhau và một loạt các tính năng phù hợp với những nhu cầu ứng dụng khác nhau.

Là các mô hình trọng số mở, gpt-oss-120b và gpt-oss-20b có thể được tinh chỉnh cho những mục đích cụ thể. Điều này có thể thực hiện bằng cách tự tải xuống các mô hình hoặc sử dụng nhà cung cấp suy luận của bên thứ ba.

Thứ Sáu, 27/03/2026 17:00
31 👨 7
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ AI cho người mới