Tính toán chi phí: Từ $25/triệu token xuống còn $3.48

Trần Mến

Chi phí thực tế cho một giờ lập trình hiện nay là bao nhiêu?

🔄 Từ bài học trước: Bạn đã chạy truy vấn xác minh đầu tiên đối với V4-Pro thông qua Claude Code. Việc tích hợp hoạt động. Bảng điều khiển DeepSeek của bạn hiển thị mức sử dụng sắp tới

Bây giờ, chúng ta sẽ cụ thể hóa điều đó. Số liệu thực tế. Từ những người vận hành thực tế. Cộng với cách thiết lập giới hạn ngân sách để biến "việc này chắc hẳn sẽ rẻ" thành "Tôi có hóa đơn và công tắc tắt khẩn cấp".

Những gì bạn sẽ học được

Đến cuối bài học này, bạn sẽ biết chi phí thực tế mỗi giờ sử dụng V4-Pro cường độ cao, mô hình định giá 4 cấp, 60-80% khoản tiết kiệm của bạn đến từ đâu, cách thiết lập giới hạn ngân sách để ngăn chặn các phiên làm việc vượt quá giới hạn, cũng như cách xây dựng mức chi phí cơ bản cho mỗi nhiệm vụ.

4 cấp độ định giá

DeepSeek định giá V4 theo 4 cấp độ khác nhau — và bạn đã cấu hình Claude Code để tự động phân bổ công việc trên 3 cấp độ đầu tiên:

Cấp độ	Đầu vào ($/M)	Đầu ra ($/M)	Trường hợp sử dụng
V4-Pro	$1.74	$3.48	Lý luận cơ bản, vòng lặp agent phức tạp, công cụ làm việc chính của bạn
V4-Flash	$0.14	$0.28	Các lần gọi sub-agent, điều phối Claude Code nội bộ, phương án dự phòng tiết kiệm chi phí
Cached input	$0.03	n/a	Khối lượng công việc lặp lại tiền tố (cùng một prompt hệ thống, cùng một file, các truy vấn khác nhau)
Anthropic Opus 4.6 (để so sánh)	~$15	~$25	Số tiền bạn đã trả trước đây

Hãy đọc kỹ những con số này:

V4-Pro rẻ hơn khoảng 7,2 lần so với Opus 4.6 về chi phí đầu ra. Đây là điểm nổi bật.
V4-Flash rẻ hơn khoảng 89 lần so với Opus 4.6 về chi phí đầu ra. Đây là nơi mà khoản tiết kiệm thực sự nằm ở đó.
Chi phí đầu vào được lưu vào cache rẻ hơn khoảng 500 lần so với chi phí đầu vào của Opus 4.6. Khi quy trình làm việc của bạn có tiền tố ổn định (một prompt hệ thống lặp lại, cùng một tài liệu tham khảo lớn), đây là mức giá áp dụng.

Trong thời gian thử nghiệm, bạn đang nhận được V4-Pro với giá khoảng 0,43 USD/0,87 USD cho chi phí đầu vào/đầu ra — rẻ hơn khoảng 30 lần so với Opus về chi phí đầu ra. Ngay cả ở mức giá đầy đủ, sự khác biệt vẫn là có thật.

Chi phí thực tế của các phiên làm việc

Ba công ty đã đăng ảnh chụp màn hình hóa đơn trong tuần ra mắt. Đây là những số liệu tham khảo đáng tin cậy.

Antirez — mức chi phí cơ bản 1 USD/giờ

@antirez (24 tháng 4, 291 lượt thích, 34 nghìn lượt xem):

"Tôi đã tiêu khoảng 1 USD mỗi giờ sử dụng cường độ cao".

Đó là con số thực tế cho các vòng lặp agent Claude Code ở mức tối đa trên V4-Pro. Không phải là những tương tác thông thường kiểu "chức năng này làm gì vậy" — đây là cường độ làm việc đa file, nhiều công cụ, và thực sự cần xử lý một dự án lớn. Các bình luận trong chủ đề đã tranh luận liệu mức 1 USD/giờ có bền vững hay không; ý kiến chung là "có, nếu bạn không bất cẩn về việc lưu vào bộ nhớ đệm."

Đối với một lập trình viên sử dụng Claude Code 4 giờ mỗi ngày trên một codebase thực tế:

1$/giờ × 4 giờ × ~22 ngày làm việc = ~88$/tháng
So sánh với Anthropic Pro với giá 200$/tháng (vẫn bị giới hạn số lần sử dụng)
Tiết kiệm: ~112$/tháng cộng thêm việc bạn không còn bị giới hạn số lần sử dụng

Đối với người dùng sử dụng nhiều hơn (8 giờ/ngày): ~176$/tháng, vẫn ít hơn Anthropic với giá 200$ mà không bị giới hạn số lần sử dụng.

Tur24Tur — 6,84 USD cho cả ngày làm việc bảo mật chuyên sâu

@Tur24Tur (25 tháng 4, 131+91 lượt thích, 37K lượt xem):

"Tổng cộng 412 lần gọi công cụ. 3 bài kiểm tra web PortSwigger cấp chuyên gia + 1 ứng dụng Android thực tế. Tổng chi phí cho cả ngày: 6,84$ trên deepseek-v4-pro."

Tur24Tur đã chuyển đổi một hệ thống kiểm thử multi-agent từ Opus 4.6/4.7 sang V4-Pro. Khối lượng công việc tương tự trên Opus trước đây đã tiêu tốn từ 50 đến 200 USD mỗi ngày tùy thuộc vào kích thước phiên và mức phạt do giới hạn tốc độ.

Tóm lại, đối với các nhà nghiên cứu bảo mật độc lập, các đội CTF, những người săn lỗi bảo mật: mức giá trần cho các công cụ bảo mật dựa trên agent vừa giảm đi một bậc. Các quy trình làm việc trước đây chỉ dành cho những nhóm được tài trợ giờ đây đã có thể tiếp cận được với các nhà nghiên cứu cá nhân và sinh viên.

koffuxu — Phân tích Android AOSP

@koffuxu (25 tháng 4):

"Nó đã thực hiện tác vụ này với giá khoảng 1 USD — và đó là trong thời gian giảm giá chính thức chỉ với 1/4 giá gốc. Với giá đầy đủ, khoảng 5 USD. Để so sánh với các mô hình của Claude, điều này hoàn toàn tiết kiệm chi phí."

Phân tích code quy mô Android AOSP với giá từ 1 USD (khuyến mãi ra mắt) đến 5 USD (sau khuyến mãi). Để dễ hình dung, cùng một tác vụ trên Opus 4.7 thường tốn từ 30 đến 60 USD tùy thuộc vào kích thước ngữ cảnh.

Định tuyến sub-agent: Nơi bạn thực sự tiết kiệm được những đồng tiền quý giá

Đây là phần mà hầu hết các bài viết với quan điểm "DeepSeek rẻ" đều bỏ qua.

Khi Claude Code chạy một vòng lặp agent, nó thực hiện rất nhiều lệnh gọi nội bộ mà bạn không nhìn thấy với tư cách là người dùng. Nó đọc các file, tóm tắt những phần thân hàm, điều phối sub-agent để xử lý những phần của một tác vụ và nén các ngữ cảnh dài.

Các lệnh gọi nội bộ này diễn ra ở tầng Haiku theo mặc định — nghĩa là mô hình Anthropic rẻ hơn, nhanh hơn. Nhưng một khi bạn đã thiết lập:

export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash

Các lệnh gọi nội bộ đó giờ đây được định tuyến đến V4-Flash với giá 0,14 USD/triệu byte đầu vào thay vì Opus với giá 15 USD/triệu byte.

Trong một phiên làm việc kéo dài 4 giờ, các cuộc gọi nội bộ thường chiếm 60-80% tổng lượng token bạn sử dụng. Đó là nơi phần lớn khoản tiết kiệm trong ví của bạn thực sự được tích lũy. Nhiều người dùng chuyển sang V4-Pro báo cáo mức tiết kiệm gần gấp 10-15 lần thay vì con số 7 lần được quảng cáo, và đây là lý do.

Để kiểm tra lại, hãy chạy một phiên làm việc thực tế và so sánh bảng điều khiển DeepSeek của bạn với mức sử dụng token:

Xem tổng số token Pro so với tổng số token Flash
Tỷ lệ lý tưởng: 20-40% Pro, 60-80% Flash
Nếu bạn thấy hơn 95% Pro, việc định tuyến sub-agent của bạn không có hiệu lực — hãy xác minh các biến môi trường ANTHROPIC_DEFAULT_HAIKU_MODEL và CLAUDE_CODE_SUBAGENT_MODEL đã được thiết lập.

Xây dựng cơ sở chi phí mỗi tác vụ cá nhân

Đừng dựa vào các tiêu chuẩn ngành cho công việc cụ thể của bạn. Hãy chạy chính xác quy trình này một lần, sau đó chạy lại hàng tuần cho đến khi các con số ổn định.

Chọn 3 tác vụ tham khảo từ quy trình làm việc thông thường của bạn. Ví dụ:
1. Tái cấu trúc hàm lớn nhất trong codebase để dễ kiểm thử hơn
2. Viết các bài test tích hợp cho một endpoint API
3. Điều tra một lỗi thực tế (đã đóng) trong trình theo dõi lỗi của bạn — tạo
  một bản mô tả về nguyên nhân gây ra lỗi và cách khắc phục

Đối với mỗi tác vụ, hãy chạy quy trình làm việc trên cả hai công cụ:
- Phiên A: V4-Pro thông qua DeepSeek (cấu hình hiện tại của bạn)
- Phiên B: Opus 4.7 thông qua Anthropic (tạm thời bỏ thiết lập các biến môi trường)

Đối với mỗi phiên, hãy ghi lại:
- Thời gian thực từ khi bắt đầu đến khi kết thúc
- Tổng số token đã sử dụng (hiển thị trên bảng điều khiển nền tảng)
- Tổng số tiền đã thanh toán
- Đánh giá chất lượng chủ quan (1-5: đã giải quyết đúng nhiệm vụ chưa?)

Xây dựng ma trận 3×2. 6 điểm dữ liệu. Cập nhật hàng tuần trong một tháng.

Cách sử dụng prompt này:

Nơi dán: Mở terminal — đây là giao thức quy trình làm việc, không phải prompt AI; hãy đọc nó như một danh sách kiểm tra và thực hiện thủ công. Hãy lưu trữ quy trình này trong tài liệu Notion/Obsidian bên cạnh nhật ký kỹ thuật của bạn.
Cách sao chép: Nhấp vào block code, Cmd+A/Ctrl+A, Cmd+C/Ctrl+C — dán vào công cụ theo dõi tác vụ bạn chọn.
Điền thông tin chi tiết của bạn: Thay thế các tác vụ ví dụ bằng 3 tác vụ từ danh sách công việc thực tế của bạn. Đừng chọn những tiêu chuẩn giả tạo — điểm mấu chốt là các tiêu chuẩn quy trình làm việc thực tế.
Những gì bạn sẽ thấy: Một ma trận 3×2 gồm (tác vụ, công cụ) → (thời gian, token, USD, chất lượng). Sau 4 tuần cập nhật hàng tuần, bạn sẽ có 24 điểm dữ liệu.
Cách sử dụng kết quả: Sử dụng ma trận trong quá trình xem xét code khi bảo vệ lựa chọn mô hình. Sử dụng nó trong cuộc họp giao ban khi người quản lý sản phẩm hỏi tại sao chi phí suy luận AI giảm 60%.
Nếu kết quả không ổn: Nếu V4-Pro liên tục được đánh giá thấp hơn về chất lượng so với Opus, đó có thể là do loại khối lượng công việc mà V4 không xử lý tốt — xem Bài học 4 về việc ra quyết định. Nếu V4-Pro có chi phí cao hơn dự kiến, việc định tuyến sub-agent của bạn không hoạt động — hãy kiểm tra lại các biến môi trường.

Thiết lập giới hạn ngân sách để ngăn chặn các phiên hoạt động vượt quá giới hạn

V4-Pro có chi phí mỗi lần gọi thấp. Một vòng lặp agent vượt quá giới hạn với hàng nghìn lần thử lại gọi công cụ vẫn có thể tiêu tốn 20-50 USD trong vài phút. Hai lớp bảo vệ:

Lớp 1 — Giới hạn chi tiêu hàng ngày trên DeepSeek

Trong cài đặt tài khoản DeepSeek (platform.deepseek.com/usage), bạn có thể đặt giới hạn chi tiêu hàng ngày. Giới hạn ban đầu được đề xuất:

Người dùng thông thường: Giới hạn 5 USD/ngày
Người dùng thường xuyên: Giới hạn 20 USD/ngày
Giám sát sản xuất: Giới hạn 50 USD/ngày

Nếu bạn đạt đến giới hạn, DeepSeek sẽ trả về lỗi giới hạn tỷ lệ thay vì cho phép bạn tiếp tục chi tiêu. Tốt hơn nhiều so với việc bị trừ 200 USD bất ngờ vào thẻ của bạn.

Lớp 2 — Tự kiểm soát việc theo dõi token ở cấp độ phiên

Theo dõi đầu ra REPL của Claude Code. Mỗi khi agent gọi một công cụ, bạn sẽ thấy một bản cập nhật trạng thái nhỏ. Nếu bạn thấy cùng một công cụ được gọi lặp đi lặp lại với các tham số tương tự, hãy dừng phiên (Ctrl+C), kiểm tra điều gì đang xảy ra và khởi động lại với hướng dẫn rõ ràng hơn hoặc quay lại vòng lặp chặt chẽ hơn.

Đây cũng là nơi biến môi trường CLAUDE_CODE_EFFORT_LEVEL=max có ý nghĩa — tư duy xen kẽ của V4 đôi khi có thể dành nhiều chu kỳ hơn để "cân nhắc" hơn là thực thi. Nếu bạn nhận thấy điều này, hãy giảm xuống CLAUDE_CODE_EFFORT_LEVEL=normal cho phiên đó.

Kiểm tra nhanh

Đặt giới hạn chi tiêu hàng ngày của DeepSeek là 10 USD ngay bây giờ. Bạn có thể tăng nó sau nếu quy trình làm việc thực tế của bạn cần. Giới hạn này là kill switch cho phép bạn thử nghiệm tự do mà không phải chịu các hóa đơn bất ngờ tiềm tàng.

Điều này có nghĩa gì đối với ngân sách hàng tháng của bạn?

Nếu bạn là một kỹ sư đang làm việc theo phong cách Claude Code, thì phép tính sơ bộ hàng tháng như sau:

Mức sử dụng	Giờ/ngày	Chi phí hàng tháng của V4-Pro	so với Anthropic Pro (200 USD)
Ít	1	~$22	Rẻ hơn 9 lần
Trung bình	3	~$66	Rẻ hơn 3 lần
Nhiều	6	~$132	Rẻ hơn 1,5 lần
Rất nhiều	10+	~$220+	Giá gần như bằng nhau, nhưng không có giới hạn

Để so sánh, Anthropic Pro với giá 200 USD/tháng cung cấp cho bạn quyền truy cập theo mức sử dụng với giới hạn tốc độ cao hơn so với những gì bảng điều khiển hiển thị (theo phân tích sau sự cố ngày 23 tháng 4). DeepSeek thông qua Claude Code với mức sử dụng thông thường rẻ hơn đáng kể và loại bỏ được vấn đề giới hạn tốc độ.

Mô hình lai từ Bài học 8 thực sự tiết kiệm hơn — việc giữ Opus 4.7 khả dụng cho các khối lượng công việc cụ thể (Bài học 4 đề cập đến khi nào) trong khi chuyển phần lớn công việc của bạn qua V4-Pro cho phép bạn duy trì mức giá dưới 100 USD/tháng cho hầu hết các trường hợp sử dụng chuyên nghiệp.

Những điểm chính cần lưu ý

DeepSeek định giá V4 theo 4 cấp độ: Pro (3,48 USD/triệu MB đầu ra), Flash (0,28 USD/triệu MB), Đầu vào được lưu vào cache (0,03 USD/triệu MB) và mức so sánh với Anthropic (25 USD/triệu MB) — V4-Pro rẻ hơn Opus khoảng 7 lần, V4-Flash rẻ hơn khoảng 89 lần.
Mức cơ bản của Antirez: 1 USD/giờ sử dụng cường độ cao; Tur24Tur: 6,84 USD/ngày cho các lần gọi công cụ 412 + công việc bảo mật nặng; koffuxu: 1-5 USD cho phân tích Android AOSP
60-80% khoản tiết kiệm của bạn đến từ việc định tuyến sub-agent đến V4-Flash thông qua ANTHROPIC_DEFAULT_HAIKU_MODEL và CLAUDE_CODE_SUBAGENT_MODEL
Xây dựng ma trận chi phí mỗi tác vụ 3×2 cá nhân; cập nhật hàng tuần trong một tháng
Đặt giới hạn chi tiêu mỗi ngày cho DeepSeek (5-50 USD tùy thuộc vào profile) để bảo vệ khỏi chi phí vượt quá mức
Theo dõi tỷ lệ token Pro/Flash trong bảng điều khiển của bạn — tỷ lệ lý tưởng là 20-40% Pro, 60-80% Flash

Thứ Sáu, 22/05/2026 14:02

5 ★ 1 👨 35

#Claude Code #DeepSeek

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Claude Code

Cũ vẫn chất

Xem thêm

Học Claude Code

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Tính toán chi phí: Từ $25/triệu token xuống còn $3.48

Những gì bạn sẽ học được

4 cấp độ định giá

Chi phí thực tế của các phiên làm việc

Antirez — mức chi phí cơ bản 1 USD/giờ

Tur24Tur — 6,84 USD cho cả ngày làm việc bảo mật chuyên sâu

koffuxu — Phân tích Android AOSP

Định tuyến sub-agent: Nơi bạn thực sự tiết kiệm được những đồng tiền quý giá

Xây dựng cơ sở chi phí mỗi tác vụ cá nhân

Thiết lập giới hạn ngân sách để ngăn chặn các phiên hoạt động vượt quá giới hạn

Lớp 1 — Giới hạn chi tiêu hàng ngày trên DeepSeek

Lớp 2 — Tự kiểm soát việc theo dõi token ở cấp độ phiên

Kiểm tra nhanh

Điều này có nghĩa gì đối với ngân sách hàng tháng của bạn?

Những điểm chính cần lưu ý

Kết quả luyện tập

Bạn nên đọc

Khắc phục câu trả lời sai trong 10 giây trong phiên Claude Code

Nguyên nhân làm quá trình nén dữ liệu Claude Code có chất lượng kém (và cách phòng tránh)

Xây dựng chiến lược phiên Claude Code cá nhân của bạn

So sánh Routines với GitHub Actions, Zapier, n8n và Cron

Framework quyết định 5 bước sau mỗi phiên Claude Code

Khi nào nên dùng V4-Pro? Khi nào nên chọn Opus 4.7?

Subagent trong Claude Code: Phân công công việc mà không làm ảnh hưởng đến bối cảnh của bạn

Sử dụng MCP connector đúng cách

So sánh phiên Compact và Fresh trong Claude Code: Khi nào nên sử dụng mỗi loại?

Cũ vẫn chất

Cách xóa Fanpage Facebook trên điện thoại, máy tính

Cách dùng Emojimix ghép biểu tượng cảm xúc độc lạ

Hình nền trắng, ảnh nền trắng đẹp

Lập trình game Mèo Đuổi Chuột cùng Scratch

Mẹo kiếm 7500 lượt quay Coin Master từ Trade Card

Cài Ultraviewer cho Win 10, cách sử dụng UltraViewer trên máy tính

Số hữu tỉ là gì? Số vô tỉ là gì?

Code Vô Địch Tu Tiên Giới mới nhất và cách đổi code lấy thưởng

10 vị tướng vĩ đại nhất trong lịch sử thế giới do Hội đồng khoa học Hoàng gia Anh xét phong

Công thức tính diện tích hình lập phương, thể tích khối lập phương