Claude Opus 4.7 là mô hình mạnh mẽ nhất hiện có của Anthropic cho đến nay. Nó có tính tự chủ cao và hoạt động đặc biệt tốt trong các tác vụ agentic dài hạn, tác vụ tri thức, tác vụ thị giác và tác vụ bộ nhớ. Bài viết sau đây sẽ tóm tắt tất cả những tính năng mới của Claude Opus 4.7 khi ra mắt.
Claude Opus 4.7: Mô hình AI mới nhất từ Anthropic vừa ra mắt
| Mô hình | ID mô hình API | Mô tả |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | Mô hình mạnh mẽ nhất hiện có của Anthropic dành cho suy luận phức tạp và lập trình agentic |
Claude Opus 4.7 hỗ trợ cửa sổ ngữ cảnh 1 triệu token, 128 nghìn token đầu ra tối đa, chế độ Adaptive thinking và cùng bộ công cụ và tính năng nền tảng như Claude Opus 4.6.
Những tính năng mới của Claude Opus 4.7

Hỗ trợ hình ảnh độ phân giải cao
Claude Opus 4.7 là mô hình Claude đầu tiên của Anthropic hỗ trợ hình ảnh độ phân giải cao. Độ phân giải hình ảnh tối đa đã tăng lên 2576px / 3.75MP (tăng từ giới hạn trước đó là 1568px / 1.15MP). Thay đổi này sẽ giúp tăng hiệu suất cho các tác vụ xử lý hình ảnh nặng, và đặc biệt quan trọng đối với việc sử dụng máy tính và những quy trình hiểu ảnh chụp màn hình/vật thể/tài liệu.
Ngoài ra, các thao tác như ánh xạ tọa độ vào hình ảnh giờ đây đơn giản hơn - tọa độ của mô hình tỷ lệ 1:1 với các pixel thực tế, vì vậy không cần tính toán hệ số tỷ lệ.
Hình ảnh độ phân giải cao sử dụng nhiều token hơn. Nếu độ phân giải hình ảnh cao hơn không cần thiết, hãy giảm độ phân giải hình ảnh trước khi gửi đến Claude để tránh tăng mức sử dụng token.
Ngoài độ phân giải, Claude Opus 4.7 cũng cải thiện:
- Nhận thức cấp thấp - chỉ trỏ, đo lường, đếm và các tác vụ tương tự.
- Định vị hình ảnh - cải thiện khả năng định vị và phát hiện hộp giới hạn hình ảnh tự nhiên.
Mức effort xhigh mới
Tham số effort cho phép bạn điều chỉnh trí thông minh của Claude theo chi phí token, đánh đổi khả năng để có tốc độ nhanh hơn và chi phí thấp hơn. Bắt đầu với mức effort xhigh mới cho các trường hợp sử dụng lập trình và agent, sử dụng mức effort high tối thiểu cho hầu hết những trường hợp sử dụng nhạy cảm với trí thông minh.
Task budgets (beta)
Claude Opus 4.7 giới thiệu Task budgets. Task budgets cung cấp cho Claude ước tính sơ bộ về số lượng token cần nhắm mục tiêu cho một vòng lặp agent hoàn chỉnh, bao gồm suy luận, gọi công cụ, kết quả công cụ và đầu ra cuối cùng. Mô hình sẽ thấy một bộ đếm ngược đang chạy và sử dụng nó để ưu tiên công việc và hoàn thành nhiệm vụ một cách hiệu quả khi budget được sử dụng hết. Để sử dụng, hãy đặt tiêu đề beta task-budgets-2026-03-13 và thêm đoạn sau vào cấu hình đầu ra của bạn:
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
},
messages=[
{"role": "user", "content": "Review the codebase and propose a refactor plan."}
],
betas=["task-budgets-2026-03-13"],
)Bạn có thể cần thử nghiệm với các task budget khác nhau cho trường hợp sử dụng của mình. Nếu mô hình được cấp task budget quá hạn chế cho một tác vụ cụ thể, nó có thể hoàn thành tác vụ kém kỹ lưỡng hơn hoặc từ chối thực hiện tác vụ hoàn toàn.
Đối với các tác vụ tự động không giới hạn, nơi chất lượng quan trọng hơn tốc độ, không nên thiết lập task budget. Hãy dành task budget cho các khối lượng công việc mà bạn cần mô hình giới hạn phạm vi công việc của nó trong giới hạn token. Giá trị tối thiểu cho một task budget là 20.000 token.
Đây không phải là giới hạn cứng; đó là một gợi ý mà mô hình biết đến. Điều này khác với `max_tokens`, là giới hạn cứng trên mỗi yêu cầu đối với số token được tạo ra (`max_tokens` không được truyền cho mô hình và mô hình không biết đến nó), trong khi `task_budget` là giới hạn mang tính tư vấn trên toàn bộ vòng lặp tự động. Sử dụng `task_budget` khi bạn muốn mô hình tự điều chỉnh và `max_tokens` làm giới hạn cứng trên mỗi yêu cầu để hạn chế việc sử dụng.
Thay đổi gây ảnh hưởng đến khả năng tương thích ngược
Những thay đổi gây ảnh hưởng đến khả năng tương thích ngược này chỉ áp dụng cho Messages API. Nếu bạn sử dụng Claude Managed Agents, sẽ không có thay đổi API nào gây ảnh hưởng đến khả năng tương thích ngược với Claude Opus 4.7.
Extended thinking budgets đã bị loại bỏ
Extended thinking budgets đã bị loại bỏ trong Claude Opus 4.7. Việc thiết lập thinking: {"type": "enabled", "budget_tokens": N} sẽ trả về lỗi 400. Adaptive thinking là chế độ tư duy duy nhất được kích hoạt và trong các đánh giá nội bộ của Anthropic, nó luôn hoạt động tốt hơn Extended thinking.
# Before (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}
# After (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Chế độ Adaptive thinking bị tắt theo mặc định trên Claude Opus 4.7. Các yêu cầu không có trường thinking sẽ chạy mà không có quá trình tư duy. Hãy thiết lập rõ ràng `thinking: {type: "adaptive"}` để bật chế độ này.
Các tham số Sampling đã bị loại bỏ
Bắt đầu từ Claude Opus 4.7, việc đặt `temperature`, `top_p` hoặc `top_k` thành bất kỳ giá trị nào không phải giá trị mặc định sẽ trả về lỗi 400. Phương án chuyển đổi an toàn nhất là bỏ hoàn toàn các tham số này khỏi những yêu cầu và sử dụng prompt để hướng dẫn hành vi của mô hình. Nếu bạn đang sử dụng `temperature = 0` để đảm bảo tính xác định, hãy lưu ý rằng nó không bao giờ đảm bảo đầu ra giống hệt nhau.
Thinking content bị bỏ qua theo mặc định
Bắt đầu từ Claude Opus 4.7, Thinking content bị bỏ qua khỏi phản hồi theo mặc định. Các Thinking block vẫn xuất hiện trong luồng phản hồi, nhưng trường thinking của chúng sẽ trống, trừ khi người gọi chọn bật một cách rõ ràng. Đây là một thay đổi âm thầm - không có lỗi nào được đưa ra - và độ trễ phản hồi sẽ được cải thiện một chút. Nếu cần đầu ra suy luận, bạn có thể đặt `display` thành `summarized` và chọn bật lại bằng thay đổi một dòng:
thinking = {
"type": "adaptive",
"display": "summarized", # or "omitted" (default)
}Nếu sản phẩm của bạn truyền tải quá trình suy luận đến người dùng, cài đặt mặc định mới sẽ hiển thị dưới dạng một khoảng dừng dài trước khi bắt đầu xuất ra. Hãy đặt "display": "summarized" để khôi phục tiến trình hiển thị trong quá trình suy luận.
Cập nhật cách đếm token
Claude Opus 4.7 sử dụng một tokenizer mới, góp phần cải thiện hiệu suất trên nhiều tác vụ. Tokenizer mới này có thể sử dụng số lượng token nhiều hơn khoảng 1 đến 1,35 lần khi xử lý văn bản so với các mô hình trước đó (lên đến ~35% nhiều hơn, tùy thuộc vào nội dung), và /v1/messages/count_tokens sẽ trả về số lượng token khác nhau cho Claude Opus 4.7 so với Claude Opus 4.6. Hiệu quả sử dụng token của Claude Opus 4.7 có thể thay đổi tùy thuộc vào hình dạng khối lượng công việc. Các can thiệp prompt, task_budget và effort có thể giúp kiểm soát chi phí và đảm bảo sử dụng token phù hợp. Hãy nhớ rằng những biện pháp kiểm soát này có thể đánh đổi trí thông minh của mô hình.
Anthropic khuyên bạn nên cập nhật các tham số max_tokens để có thêm khoảng trống, bao gồm cả các trình kích hoạt nén. Claude Opus 4.7 cung cấp cửa sổ ngữ cảnh 1 triệu dòng với giá API tiêu chuẩn mà không tính phí phụ thu cho ngữ cảnh dài.
Cải tiến khả năng của Claude Opus 4.7
Công việc trí tuệ
Claude Opus 4.7 cho thấy những cải tiến đáng kể trong các tác vụ của người lao động trí tuệ, đặc biệt là khi mô hình cần xác minh trực quan đầu ra của chính nó:
- Chỉnh sửa .docx và .pptx - được cải thiện trong việc tạo và tự kiểm tra các thay đổi được theo dõi và bố cục slide.
- Phân tích biểu đồ và hình ảnh - được cải thiện trong việc gọi công cụ lập trình với các thư viện xử lý hình ảnh (ví dụ: PIL) để phân tích biểu đồ và hình ảnh, bao gồm cả việc sao chép dữ liệu ở cấp độ pixel.
Nếu các prompt hiện có có các biện pháp giảm thiểu trong những lĩnh vực này (ví dụ: "kiểm tra kỹ bố cục slide trước khi quay lại"), hãy thử loại bỏ cấu trúc đó và thiết lập lại đường cơ sở.
Bộ nhớ
Claude Opus 4.7 tốt hơn trong việc ghi và sử dụng bộ nhớ dựa trên hệ thống file. Nếu một agent duy trì một bảng nháp, file ghi chú hoặc kho lưu trữ bộ nhớ có cấu trúc trong suốt các lượt, agent đó sẽ cải thiện khả năng ghi chú cho chính nó và tận dụng những ghi chú đó trong các tác vụ trong tương lai. Để cung cấp cho Claude một bộ nhớ tạm được quản lý mà không cần tự xây dựng, hãy sử dụng công cụ bộ nhớ phía client.
Thay đổi hành vi
Đây không phải là những thay đổi làm gián đoạn API nhưng có thể yêu cầu cập nhật nhanh chóng.
- Tuân thủ hướng dẫn chính xác hơn, đặc biệt ở mức độ nỗ lực thấp hơn. Mô hình sẽ không tự động khái quát hóa một hướng dẫn từ mục này sang mục khác và sẽ không suy ra các yêu cầu mà bạn không đưa ra.
- Độ dài phản hồi được điều chỉnh theo độ phức tạp của nhiệm vụ được nhận thức thay vì mặc định ở độ dài cố định.
- Ít lệnh gọi công cụ hơn theo mặc định, sử dụng lý luận nhiều hơn. Tăng nỗ lực sẽ làm tăng việc sử dụng công cụ.
- Giọng điệu trực tiếp hơn, mang tính chủ quan hơn với cách diễn đạt ít tập trung vào xác thực và ít biểu tượng cảm xúc hơn so với phong cách ấm áp hơn của Claude Opus 4.6.
- Cập nhật tiến độ thường xuyên hơn cho người dùng trong suốt các dấu vết agent dài. Nếu bạn đã thêm khung để buộc hiển thị thông báo trạng thái tạm thời, hãy thử xóa nó.
- Ít subagent được tạo ra hơn theo mặc định. Có thể điều khiển thông qua prompt.
- Các biện pháp bảo vệ an ninh mạng theo thời gian thực: Những yêu cầu liên quan đến các chủ đề bị cấm hoặc có rủi ro cao có thể dẫn đến việc bị từ chối. Đối với các công việc an ninh hợp pháp, hãy đăng ký chương trình Cyber Verification Program..
Nếu bạn sử dụng Claude Code hoặc Agent SDK, API skill của Claude có thể tự động áp dụng các bước di chuyển sang Claude Opus 4.7 vào mã nguồn của bạn.
Hướng dẫn AI
Học IT










Hàm Excel