Tính toán chi phí: Từ $25/triệu token xuống còn $3.48

Chi phí thực tế cho một giờ lập trình hiện nay là bao nhiêu?

🔄 Từ bài học trước: Bạn đã chạy truy vấn xác minh đầu tiên đối với V4-Pro thông qua Claude Code. Việc tích hợp hoạt động. Bảng điều khiển DeepSeek của bạn hiển thị mức sử dụng sắp tới

Bây giờ, chúng ta sẽ cụ thể hóa điều đó. Số liệu thực tế. Từ những người vận hành thực tế. Cộng với cách thiết lập giới hạn ngân sách để biến "việc này chắc hẳn sẽ rẻ" thành "Tôi có hóa đơn và công tắc tắt khẩn cấp".

Những gì bạn sẽ học được

Đến cuối bài học này, bạn sẽ biết chi phí thực tế mỗi giờ sử dụng V4-Pro cường độ cao, mô hình định giá 4 cấp, 60-80% khoản tiết kiệm của bạn đến từ đâu, cách thiết lập giới hạn ngân sách để ngăn chặn các phiên làm việc vượt quá giới hạn, cũng như cách xây dựng mức chi phí cơ bản cho mỗi nhiệm vụ.

4 cấp độ định giá

DeepSeek định giá V4 theo 4 cấp độ khác nhau — và bạn đã cấu hình Claude Code để tự động phân bổ công việc trên 3 cấp độ đầu tiên:

Cấp độĐầu vào ($/M)Đầu ra ($/M)Trường hợp sử dụng
V4-Pro$1.74$3.48Lý luận cơ bản, vòng lặp agent phức tạp, công cụ làm việc chính của bạn
V4-Flash$0.14$0.28Các lần gọi sub-agent, điều phối Claude Code nội bộ, phương án dự phòng tiết kiệm chi phí
Cached input$0.03n/aKhối lượng công việc lặp lại tiền tố (cùng một prompt hệ thống, cùng một file, các truy vấn khác nhau)
Anthropic Opus 4.6 (để so sánh)~$15~$25Số tiền bạn đã trả trước đây

Hãy đọc kỹ những con số này:

  • V4-Pro rẻ hơn khoảng 7,2 lần so với Opus 4.6 về chi phí đầu ra. Đây là điểm nổi bật.
  • V4-Flash rẻ hơn khoảng 89 lần so với Opus 4.6 về chi phí đầu ra. Đây là nơi mà khoản tiết kiệm thực sự nằm ở đó.
  • Chi phí đầu vào được lưu vào cache rẻ hơn khoảng 500 lần so với chi phí đầu vào của Opus 4.6. Khi quy trình làm việc của bạn có tiền tố ổn định (một prompt hệ thống lặp lại, cùng một tài liệu tham khảo lớn), đây là mức giá áp dụng.

Trong thời gian thử nghiệm, bạn đang nhận được V4-Pro với giá khoảng 0,43 USD/0,87 USD cho chi phí đầu vào/đầu ra — rẻ hơn khoảng 30 lần so với Opus về chi phí đầu ra. Ngay cả ở mức giá đầy đủ, sự khác biệt vẫn là có thật.

Chi phí thực tế của các phiên làm việc

Ba công ty đã đăng ảnh chụp màn hình hóa đơn trong tuần ra mắt. Đây là những số liệu tham khảo đáng tin cậy.

Antirez — mức chi phí cơ bản 1 USD/giờ

@antirez (24 tháng 4, 291 lượt thích, 34 nghìn lượt xem):

"Tôi đã tiêu khoảng 1 USD mỗi giờ sử dụng cường độ cao".

Đó là con số thực tế cho các vòng lặp agent Claude Code ở mức tối đa trên V4-Pro. Không phải là những tương tác thông thường kiểu "chức năng này làm gì vậy" — đây là cường độ làm việc đa file, nhiều công cụ, và thực sự cần xử lý một dự án lớn. Các bình luận trong chủ đề đã tranh luận liệu mức 1 USD/giờ có bền vững hay không; ý kiến ​​chung là "có, nếu bạn không bất cẩn về việc lưu vào bộ nhớ đệm."

Đối với một lập trình viên sử dụng Claude Code 4 giờ mỗi ngày trên một codebase thực tế:

  • 1$/giờ × 4 giờ × ~22 ngày làm việc = ~88$/tháng
  • So sánh với Anthropic Pro với giá 200$/tháng (vẫn bị giới hạn số lần sử dụng)
  • Tiết kiệm: ~112$/tháng cộng thêm việc bạn không còn bị giới hạn số lần sử dụng

Đối với người dùng sử dụng nhiều hơn (8 giờ/ngày): ~176$/tháng, vẫn ít hơn Anthropic với giá 200$ mà không bị giới hạn số lần sử dụng.

Tur24Tur — 6,84 USD cho cả ngày làm việc bảo mật chuyên sâu

@Tur24Tur (25 tháng 4, 131+91 lượt thích, 37K lượt xem):

"Tổng cộng 412 lần gọi công cụ. 3 bài kiểm tra web PortSwigger cấp chuyên gia + 1 ứng dụng Android thực tế. Tổng chi phí cho cả ngày: 6,84$ trên deepseek-v4-pro."

Tur24Tur đã chuyển đổi một hệ thống kiểm thử multi-agent từ Opus 4.6/4.7 sang V4-Pro. Khối lượng công việc tương tự trên Opus trước đây đã tiêu tốn từ 50 đến 200 USD mỗi ngày tùy thuộc vào kích thước phiên và mức phạt do giới hạn tốc độ.

Tóm lại, đối với các nhà nghiên cứu bảo mật độc lập, các đội CTF, những người săn lỗi bảo mật: mức giá trần cho các công cụ bảo mật dựa trên agent vừa giảm đi một bậc. Các quy trình làm việc trước đây chỉ dành cho những nhóm được tài trợ giờ đây đã có thể tiếp cận được với các nhà nghiên cứu cá nhân và sinh viên.

koffuxu — Phân tích Android AOSP

@koffuxu (25 tháng 4):

"Nó đã thực hiện tác vụ này với giá khoảng 1 USD — và đó là trong thời gian giảm giá chính thức chỉ với 1/4 giá gốc. Với giá đầy đủ, khoảng 5 USD. Để so sánh với các mô hình của Claude, điều này hoàn toàn tiết kiệm chi phí."

Phân tích code quy mô Android AOSP với giá từ 1 USD (khuyến mãi ra mắt) đến 5 USD (sau khuyến mãi). Để dễ hình dung, cùng một tác vụ trên Opus 4.7 thường tốn từ 30 đến 60 USD tùy thuộc vào kích thước ngữ cảnh.

Định tuyến sub-agent: Nơi bạn thực sự tiết kiệm được những đồng tiền quý giá

Đây là phần mà hầu hết các bài viết với quan điểm "DeepSeek rẻ" đều bỏ qua.

Khi Claude Code chạy một vòng lặp agent, nó thực hiện rất nhiều lệnh gọi nội bộ mà bạn không nhìn thấy với tư cách là người dùng. Nó đọc các file, tóm tắt những phần thân hàm, điều phối sub-agent để xử lý những phần của một tác vụ và nén các ngữ cảnh dài.

Các lệnh gọi nội bộ này diễn ra ở tầng Haiku theo mặc định — nghĩa là mô hình Anthropic rẻ hơn, nhanh hơn. Nhưng một khi bạn đã thiết lập:

export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash

Các lệnh gọi nội bộ đó giờ đây được định tuyến đến V4-Flash với giá 0,14 USD/triệu byte đầu vào thay vì Opus với giá 15 USD/triệu byte.

Trong một phiên làm việc kéo dài 4 giờ, các cuộc gọi nội bộ thường chiếm 60-80% tổng lượng token bạn sử dụng. Đó là nơi phần lớn khoản tiết kiệm trong ví của bạn thực sự được tích lũy. Nhiều người dùng chuyển sang V4-Pro báo cáo mức tiết kiệm gần gấp 10-15 lần thay vì con số 7 lần được quảng cáo, và đây là lý do.

Để kiểm tra lại, hãy chạy một phiên làm việc thực tế và so sánh bảng điều khiển DeepSeek của bạn với mức sử dụng token:

  • Xem tổng số token Pro so với tổng số token Flash
  • Tỷ lệ lý tưởng: 20-40% Pro, 60-80% Flash
  • Nếu bạn thấy hơn 95% Pro, việc định tuyến sub-agent của bạn không có hiệu lực — hãy xác minh các biến môi trường ANTHROPIC_DEFAULT_HAIKU_MODELCLAUDE_CODE_SUBAGENT_MODEL đã được thiết lập.

Xây dựng cơ sở chi phí mỗi tác vụ cá nhân

Đừng dựa vào các tiêu chuẩn ngành cho công việc cụ thể của bạn. Hãy chạy chính xác quy trình này một lần, sau đó chạy lại hàng tuần cho đến khi các con số ổn định.

Chọn 3 tác vụ tham khảo từ quy trình làm việc thông thường của bạn. Ví dụ:
1. Tái cấu trúc hàm lớn nhất trong codebase để dễ kiểm thử hơn
2. Viết các bài test tích hợp cho một endpoint API
3. Điều tra một lỗi thực tế (đã đóng) trong trình theo dõi lỗi của bạn — tạo
  một bản mô tả về nguyên nhân gây ra lỗi và cách khắc phục

Đối với mỗi tác vụ, hãy chạy quy trình làm việc trên cả hai công cụ:
- Phiên A: V4-Pro thông qua DeepSeek (cấu hình hiện tại của bạn)
- Phiên B: Opus 4.7 thông qua Anthropic (tạm thời bỏ thiết lập các biến môi trường)

Đối với mỗi phiên, hãy ghi lại:
- Thời gian thực từ khi bắt đầu đến khi kết thúc
- Tổng số token đã sử dụng (hiển thị trên bảng điều khiển nền tảng)
- Tổng số tiền đã thanh toán
- Đánh giá chất lượng chủ quan (1-5: đã giải quyết đúng nhiệm vụ chưa?)

Xây dựng ma trận 3×2. 6 điểm dữ liệu. Cập nhật hàng tuần trong một tháng.

Cách sử dụng prompt này:

  1. Nơi dán: Mở terminal — đây là giao thức quy trình làm việc, không phải prompt AI; hãy đọc nó như một danh sách kiểm tra và thực hiện thủ công. Hãy lưu trữ quy trình này trong tài liệu Notion/Obsidian bên cạnh nhật ký kỹ thuật của bạn.
  2. Cách sao chép: Nhấp vào block code, Cmd+A/Ctrl+A, Cmd+C/Ctrl+C — dán vào công cụ theo dõi tác vụ bạn chọn.
  3. Điền thông tin chi tiết của bạn: Thay thế các tác vụ ví dụ bằng 3 tác vụ từ danh sách công việc thực tế của bạn. Đừng chọn những tiêu chuẩn giả tạo — điểm mấu chốt là các tiêu chuẩn quy trình làm việc thực tế.
  4. Những gì bạn sẽ thấy: Một ma trận 3×2 gồm (tác vụ, công cụ) → (thời gian, token, USD, chất lượng). Sau 4 tuần cập nhật hàng tuần, bạn sẽ có 24 điểm dữ liệu.
  5. Cách sử dụng kết quả: Sử dụng ma trận trong quá trình xem xét code khi bảo vệ lựa chọn mô hình. Sử dụng nó trong cuộc họp giao ban khi người quản lý sản phẩm hỏi tại sao chi phí suy luận AI giảm 60%.
  6. Nếu kết quả không ổn: Nếu V4-Pro liên tục được đánh giá thấp hơn về chất lượng so với Opus, đó có thể là do loại khối lượng công việc mà V4 không xử lý tốt — xem Bài học 4 về việc ra quyết định. Nếu V4-Pro có chi phí cao hơn dự kiến, việc định tuyến sub-agent của bạn không hoạt động — hãy kiểm tra lại các biến môi trường.

Thiết lập giới hạn ngân sách để ngăn chặn các phiên hoạt động vượt quá giới hạn

V4-Pro có chi phí mỗi lần gọi thấp. Một vòng lặp agent vượt quá giới hạn với hàng nghìn lần thử lại gọi công cụ vẫn có thể tiêu tốn 20-50 USD trong vài phút. Hai lớp bảo vệ:

Lớp 1 — Giới hạn chi tiêu hàng ngày trên DeepSeek

Trong cài đặt tài khoản DeepSeek (platform.deepseek.com/usage), bạn có thể đặt giới hạn chi tiêu hàng ngày. Giới hạn ban đầu được đề xuất:

  • Người dùng thông thường: Giới hạn 5 USD/ngày
  • Người dùng thường xuyên: Giới hạn 20 USD/ngày
  • Giám sát sản xuất: Giới hạn 50 USD/ngày

Nếu bạn đạt đến giới hạn, DeepSeek sẽ trả về lỗi giới hạn tỷ lệ thay vì cho phép bạn tiếp tục chi tiêu. Tốt hơn nhiều so với việc bị trừ 200 USD bất ngờ vào thẻ của bạn.

Lớp 2 — Tự kiểm soát việc theo dõi token ở cấp độ phiên

Theo dõi đầu ra REPL của Claude Code. Mỗi khi agent gọi một công cụ, bạn sẽ thấy một bản cập nhật trạng thái nhỏ. Nếu bạn thấy cùng một công cụ được gọi lặp đi lặp lại với các tham số tương tự, hãy dừng phiên (Ctrl+C), kiểm tra điều gì đang xảy ra và khởi động lại với hướng dẫn rõ ràng hơn hoặc quay lại vòng lặp chặt chẽ hơn.

Đây cũng là nơi biến môi trường CLAUDE_CODE_EFFORT_LEVEL=max có ý nghĩa — tư duy xen kẽ của V4 đôi khi có thể dành nhiều chu kỳ hơn để "cân nhắc" hơn là thực thi. Nếu bạn nhận thấy điều này, hãy giảm xuống CLAUDE_CODE_EFFORT_LEVEL=normal cho phiên đó.

Kiểm tra nhanh

Đặt giới hạn chi tiêu hàng ngày của DeepSeek là 10 USD ngay bây giờ. Bạn có thể tăng nó sau nếu quy trình làm việc thực tế của bạn cần. Giới hạn này là kill switch cho phép bạn thử nghiệm tự do mà không phải chịu các hóa đơn bất ngờ tiềm tàng.

Điều này có nghĩa gì đối với ngân sách hàng tháng của bạn?

Nếu bạn là một kỹ sư đang làm việc theo phong cách Claude Code, thì phép tính sơ bộ hàng tháng như sau:

Mức sử dụngGiờ/ngàyChi phí hàng tháng của V4-Proso với Anthropic Pro (200 USD)
Ít1~$22Rẻ hơn 9 lần
Trung bình3~$66Rẻ hơn 3 lần
Nhiều6~$132Rẻ hơn 1,5 lần
Rất nhiều10+~$220+Giá gần như bằng nhau, nhưng không có giới hạn

Để so sánh, Anthropic Pro với giá 200 USD/tháng cung cấp cho bạn quyền truy cập theo mức sử dụng với giới hạn tốc độ cao hơn so với những gì bảng điều khiển hiển thị (theo phân tích sau sự cố ngày 23 tháng 4). DeepSeek thông qua Claude Code với mức sử dụng thông thường rẻ hơn đáng kể và loại bỏ được vấn đề giới hạn tốc độ.

Mô hình lai từ Bài học 8 thực sự tiết kiệm hơn — việc giữ Opus 4.7 khả dụng cho các khối lượng công việc cụ thể (Bài học 4 đề cập đến khi nào) trong khi chuyển phần lớn công việc của bạn qua V4-Pro cho phép bạn duy trì mức giá dưới 100 USD/tháng cho hầu hết các trường hợp sử dụng chuyên nghiệp.

Những điểm chính cần lưu ý

  • DeepSeek định giá V4 theo 4 cấp độ: Pro (3,48 USD/triệu MB đầu ra), Flash (0,28 USD/triệu MB), Đầu vào được lưu vào cache (0,03 USD/triệu MB) và mức so sánh với Anthropic (25 USD/triệu MB) — V4-Pro rẻ hơn Opus khoảng 7 lần, V4-Flash rẻ hơn khoảng 89 lần.
  • Mức cơ bản của Antirez: 1 USD/giờ sử dụng cường độ cao; Tur24Tur: 6,84 USD/ngày cho các lần gọi công cụ 412 + công việc bảo mật nặng; koffuxu: 1-5 USD cho phân tích Android AOSP
  • 60-80% khoản tiết kiệm của bạn đến từ việc định tuyến sub-agent đến V4-Flash thông qua ANTHROPIC_DEFAULT_HAIKU_MODELCLAUDE_CODE_SUBAGENT_MODEL
  • Xây dựng ma trận chi phí mỗi tác vụ 3×2 cá nhân; cập nhật hàng tuần trong một tháng
  • Đặt giới hạn chi tiêu mỗi ngày cho DeepSeek (5-50 USD tùy thuộc vào profile) để bảo vệ khỏi chi phí vượt quá mức
  • Theo dõi tỷ lệ token Pro/Flash trong bảng điều khiển của bạn — tỷ lệ lý tưởng là 20-40% Pro, 60-80% Flash
  • Câu 1:

    Tur24Tur đã chạy 412 lần gọi công cụ cộng với 3 cuộc thi CTF PortSwigger cộng với 1 phân tích ứng dụng Android trên V4-Pro với tổng chi phí trong một ngày là 6,84 USD. Điều này có ý nghĩa gì đối với những nhà nghiên cứu bảo mật độc lập và các đội CTF?

    GIẢI THÍCH:

    Mức giá 6,84 USD/ngày được hỗ trợ bởi ảnh chụp màn hình của Tur24Tur cho 412 lệnh gọi công cụ cộng với công việc CTF nặng đã thay đổi hiệu quả kinh tế đơn vị cho nghiên cứu bảo mật độc lập. Khối lượng công việc tương tự trên Opus 4.7 có giá từ 50-200 USD trở lên tùy thuộc vào quy mô bối cảnh — một rào cản lớn đối với các nhà nghiên cứu độc lập, sinh viên và những công ty tư vấn nhỏ. Với mức giá dưới 10 USD/ngày, quy trình làm việc bảo mật dựa trên agent trở nên dễ tiếp cận hơn với nhiều người hơn. Anthropic có các chương trình cấp chứng chỉ nghiên cứu, nhưng chúng chỉ dành cho những người đăng ký và không đáp ứng được nhu cầu của đông đảo người dùng độc lập hiện đang sử dụng V4-Pro.

  • Câu 2:

    Tại sao việc thiết lập giới hạn ngân sách mỗi phiên lại quan trọng ngay cả khi V4-Pro có giá 1 USD/giờ?

    GIẢI THÍCH:

    Các vòng lặp agent đôi khi rơi vào trạng thái lỗi — một lệnh gọi công cụ trả về lỗi không mong muốn sẽ kích hoạt các lần thử lại, những lần thử lại kích hoạt nhiều lệnh gọi công cụ hơn và vòng lặp nhanh chóng đốt cháy token. Mặc dù V4-Pro có giá thành rẻ cho mỗi lần gọi, nhưng một vòng lặp không kiểm soát với hàng nghìn lần thử lại có thể tiêu tốn từ 20 đến 50 USD chỉ trong vài phút. Bảng điều khiển thanh toán của DeepSeek hỗ trợ giới hạn chi tiêu mỗi ngày; việc thiết lập giới hạn ở mức, ví dụ, 20 USD/ngày sẽ giúp phát hiện hành vi không kiểm soát trước khi nó trở thành hóa đơn 200 USD. Anthropic không yêu cầu gì cả; đây chỉ là một biện pháp kỹ thuật hợp lý.

  • Câu 3:

    Antirez báo cáo chi tiêu khoảng 1 USD mỗi giờ khi sử dụng Claude Code cường độ cao trên V4-Pro. Đối với một nhà phát triển sử dụng Claude Code 4 giờ/ngày, chi phí hàng tháng sẽ như thế nào so với gói đăng ký Anthropic 200 USD?

    GIẢI THÍCH:

    Với mức sử dụng cơ bản 1 USD/giờ của Antirez, 4 giờ/ngày × 22 ngày làm việc/tháng = 88 USD/tháng cho việc sử dụng Claude Code V4-Pro không giới hạn. So với gói đăng ký Anthropic 200 USD/tháng vẫn giới hạn số lần sử dụng, V4-Pro rẻ hơn khoảng 2,3 lần đối với mức sử dụng cao thông thường. Với mức sử dụng nhẹ hơn (1-2 giờ/ngày), V4-Pro trở nên rẻ hơn 4-8 lần. Ngay cả khi thêm tùy chọn dự phòng Opus 4.7 cho các khối lượng công việc cụ thể mà V4 không phù hợp (Bài học 4), hệ thống lai vẫn rẻ hơn đáng kể so với chỉ sử dụng Anthropic.

  • Câu 4:

    Trong bảng so sánh giá 4 cấp (Opus 4.6, V4-Pro, V4-Flash, đầu vào được lưu vào cache), mô hình nào mang lại mức giảm chi phí sâu nhất cho các khối lượng công việc có tiền tố lặp lại như phân tích file?

    GIẢI THÍCH:

    Giá đầu vào được lưu vào cache của DeepSeek là $0.03 cho mỗi triệu token — rẻ hơn khoảng 500 lần so với mức cơ bản $15/triệu đầu vào của Opus 4.6. Điều này áp dụng khi các prompt của bạn có chung tiền tố (hướng dẫn hệ thống, định nghĩa công cụ, template tài liệu được load một lần và sử dụng lại). Đối với các quy trình làm việc như 'đọc cùng một file lớn và trả lời những câu hỏi khác nhau về nó', tầng xử lý dữ liệu đầu vào được lưu vào cache là nơi mang lại khoản tiết kiệm lớn nhất. V4-Flash với giá $0,14/MB cũng rẻ hơn đáng kể nhưng tầng xử lý dữ liệu đầu vào được lưu vào cache lại vượt trội hơn trong trường hợp sử dụng phù hợp.

Thứ Sáu, 22/05/2026 14:02
51 👨 35
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Claude Code