Chạy DeepSeek V4-Pro trong Claude Code

Trần Mến

Chạy DeepSeek V4-Pro bên trong Claude Code với chi phí chỉ bằng 1/7 so với Opus. 8 bài học bao gồm cấu hình 4 biến môi trường, vấn đề với hậu tố [1m], tính toán chi phí, định tuyến sub-agent và cây quyết định trung thực về thời điểm V4-Pro vượt trội so với thời điểm Opus vẫn tốt hơn.

Khoảnh khắc mà hầu hết các kỹ sư chưa đề cập đến

23 tháng 4 năm 2026: Anthropic công bố báo cáo phân tích sau sự cố của Claude Code — ba thay đổi sản phẩm được xác nhận đã làm giảm chất lượng code trong vòng 6 tuần.

24 tháng 4 năm 2026: DeepSeek phát hành V4-Pro với 80,6% trên SWE-bench Verified (trong phạm vi 0,2 điểm so với Claude Opus 4.6) với giá 3,48 USD cho mỗi triệu token đầu ra so với 25 USD của Opus.

24 tháng 4 + 6 giờ: Tài liệu của DeepSeek cung cấp một công thức cấu hình Claude Code rõ ràng — 4 biến môi trường và bạn đang định tuyến CLI Claude Code hiện có của mình thông qua endpoint tương thích với Anthropic của DeepSeek.

Nếu bạn đã sử dụng Claude Code hàng ngày, đây là khoảng thời gian 24 giờ quan trọng nhất trong lĩnh vực công cụ AI dựa trên agent kể từ khi Claude Code được ra mắt. Hầu hết các kỹ sư đang làm việc vẫn chưa thực hiện cấu hình này. Những người đã sử dụng báo cáo mức sử dụng cao với chi phí $1/giờ (@antirez, 291 lượt thích) và $6,84 cho cả ngày làm việc bảo mật với 412 lệnh gọi công cụ (@Tur24Tur).

Khóa học này là một chương trình học có hệ thống gồm 8 bài học dành cho các kỹ sư muốn tận dụng sự khác biệt về chi phí mà không cần học một bộ công cụ mới. Bạn vẫn giữ Claude Code, chỉ thêm DeepSeek V4 vào bên dưới. Bạn có được một quy trình làm việc kết hợp có khả năng bảo vệ cao.

Những gì bạn sẽ xây dựng

Qua 8 bài học (~2,5 giờ tổng cộng), bạn sẽ:

Cấu hình Claude Code để định tuyến đến DeepSeek V4-Pro thông qua 4 biến môi trường — bao gồm cả hậu tố [1m] mà không ai đưa vào tài liệu chính thức
Thiết lập định tuyến sub-agent để các lệnh gọi nội bộ Claude Code giá rẻ của bạn (đọc file, tóm tắt, điều phối sub-agent) được chuyển đến V4-Flash với giá $0,14/M đầu vào
Xây dựng cơ sở chi phí cho mỗi tác vụ để bạn biết mỗi vòng lặp agent thực sự tốn bao nhiêu
Phát triển cây quyết định của bạn về việc công việc nào được định tuyến đến V4-Pro so với công việc nào vẫn ở lại Opus 4.6/4.7 — bao gồm cả các chế độ lỗi (API ảo trong quá trình tái cấu trúc công cụ tùy chỉnh, sự khác biệt về mẫu từ chối, sự trôi dạt phiên rất dài)
Sử dụng cửa sổ ngữ cảnh 1M cho công việc monorepo và codebase lớn mà 6 tháng trước không khả thi về mặt kinh tế
Nắm vững chế độ Think-Max để suy luận sâu với phương án dự phòng giá rẻ cho các lệnh gọi công cụ
Xử lý quyền riêng tư và tuân thủ khi code khách hàng nằm trong phạm vi (Thực tế cơ sở hạ tầng, định tuyến OpenRouter, Ollama cục bộ)
Xây dựng dự án thiết lập lai hai công cụ hoạt động mà bạn có thể bảo vệ trong quá trình đánh giá code

Ghi chú trung thực về dữ liệu

Khóa học này ra mắt hai ngày sau DeepSeek V4. Một số chi tiết cụ thể sẽ thay đổi. Ở những nơi dữ liệu đáng tin cậy, khóa học trích dẫn các nguồn chính: Tài liệu tương thích Anthropic chính thức của DeepSeek, bài đánh giá V4 của Simon Willison và các bài đăng của nhà điều hành với số liệu tương tác có thể kiểm chứng và ảnh chụp màn hình thanh toán.

Ở những nơi dữ liệu mang tính kinh nghiệm cá nhân — số liệu chi phí ấn tượng ban đầu, so sánh điểm chuẩn trong thời gian ngắn, các chế độ lỗi cụ thể của mô hình — khóa học sẽ nói rõ điều đó. Sự trung thực thực sự trong kỹ thuật: Bạn và những người khác đang thực hiện cùng một thí nghiệm trong thời gian thực. Khóa học cung cấp cho bạn khuôn khổ và thói quen đo lường để việc ra quyết định được cải thiện khi dữ liệu thay đổi.

V4 là một sự bổ sung, không phải là một sự thay thế. Ý kiến đồng thuận đang nổi lên từ các bài đăng trong tuần ra mắt: Hai công cụ trong bộ công cụ của bạn, thay đổi dựa trên khối lượng công việc, trả tiền cho những gì bạn sử dụng. Đó là những gì khóa học này sẽ dạy bạn.

Điều kiện tiên quyết

Đây là khóa học trung cấp. Bạn nên có:

Thành thạo sử dụng dòng lệnh — bash/zsh, biến môi trường, npm install -g
Một số kinh nghiệm với Claude Code, Cursor, hoặc các công cụ lập trình AI tương tự — bạn không cần phải là người dùng thành thạo, nhưng bạn nên biết vòng lặp agent trông như thế nào
Một codebase thực tế để kiểm thử — ngay cả một dự án phụ với hơn 5000 dòng code cũng được

Nếu bạn hoàn toàn mới làm quen với Claude Code, hãy tham gia khóa học Thành thạo Claude Code trước. Khóa học này giả định bạn đã có kiến thức cơ bản về Claude Code và đi sâu vào lớp định tuyến V4 bên dưới.

Những gì bạn sẽ học được

Cấu hình Claude Code để định tuyến đến DeepSeek V4-Pro thông qua 4 biến môi trường (với điểm cần lưu ý là hậu tố `[1m]`)
Theo dõi chi phí cho mỗi vòng lặp agent và định tuyến các cuộc gọi sub-agent đến V4-Flash để tiết kiệm 60-80% phiên
Quyết định khối lượng công việc nào nên được định tuyến đến V4-Pro so với việc giữ nguyên Opus 4.6/4.7 bằng cách sử dụng cây quyết định trung thực
Sử dụng cửa sổ ngữ cảnh 1 triệu token cho monorepo và việc tái cấu trúc codebase lớn
Thiết lập chế độ Think-Max để suy luận sâu với phương án dự phòng tiết kiệm chi phí cho các cuộc gọi công cụ
Xử lý các ràng buộc về quyền riêng tư và định tuyến dữ liệu khi client code nằm trong phạm vi
Xây dựng quy trình làm việc hai công cụ lai bền vững mà bạn có thể bảo vệ trong quá trình xem xét code

Sau khóa học này, bạn có thể:

Giảm chi phí lập trình AI của bạn từ 60-80% mỗi phiên bằng cách định tuyến đúng công việc đến V4-Pro và V4-Flash mà không làm mất đi quy trình làm việc Claude Code mà bạn đã sử dụng
Vượt qua tình trạng mệt mỏi do giới hạn tỷ lệ của Claude Code bằng cách thêm một công cụ song song mà bạn có thể chuyển đổi trong 30 giây khi Anthropic bị giới hạn tốc độ
Giành được kinh nghiệm "kỹ sư đa công cụ" trong sơ yếu lý lịch — bảo vệ các quyết định về chi phí trong cuộc họp giao ban với những con số USD cụ thể
Chạy các quy trình làm việc dựa trên agent trên những kho lưu trữ đơn 1 triệu token mà trước đây không thể thực hiện được với mức giá đầu ra 25 USD/triệu token 6 tháng trước
Xây dựng một kiến trúc lai có thể bảo vệ được mà bạn có thể trình bày cho CTO của mình mà không nghe giống như quảng cáo thổi phồng của nhà cung cấp

Những gì bạn sẽ xây dựng

File cấu hình Claude Code lai

Một file `settings.json` hoạt động cùng với script xuất shell định tuyến Claude Code đến DeepSeek V4-Pro cho công việc chính và V4-Flash cho các sub-agent — với phương án dự phòng Opus được ghi lại và có thể chuyển đổi bằng một lệnh.

Báo cáo so sánh chi phí mỗi tác vụ

Một báo cáo so sánh được ghi lại về 5 tác vụ lập trình thực tế (tái cấu trúc TypeScript, gỡ lỗi nhiều file, tối ưu hóa SQL, tạo bài test, đánh giá bảo mật) được chạy trên cả V4-Pro và Opus 4.7 — với số liệu về chi phí mỗi tác vụ, thời gian hoàn thành và đánh giá chất lượng.

Chứng chỉ Claude Code với DeepSeek V4

Một chứng chỉ có thể xác minh chứng minh bạn có thể cấu hình, quản lý chi phí và vận hành quy trình làm việc kết hợp Claude Code + DeepSeek V4 ở chất lượng sản xuất.

Điều kiện tiên quyết

Thành thạo sử dụng dòng lệnh (bash/zsh, biến môi trường)
Có kinh nghiệm với Claude Code, Cursor hoặc các công cụ lập trình AI tương tự
Một codebase thực tế để thử nghiệm — thậm chí một dự án phụ cũng được

Đối tượng phù hợp

Các kỹ sư phần mềm đang làm việc và sử dụng Claude Code hàng ngày và cảm thấy khó khăn do giới hạn tốc độ
Các kỹ sư cấp cao và trưởng nhóm công nghệ đang đánh giá những giải pháp lập trình AI tiết kiệm chi phí cho nhóm của họ
Các nhà phát triển độc lập và những doanh nhân cá nhân đang vận hành các vòng lặp agent ở quy mô lớn
Các kỹ sư trong những công ty khởi nghiệp nhạy cảm về chi phí, nơi chi phí suy luận AI hiện là một khoản mục thực sự
Các nhà phát triển đã đạt đến mức giá trần của Claude Opus và muốn có một giải pháp thay thế đáng tin cậy mà không cần từ bỏ quy trình làm việc của Claude Code

Khoảnh khắc: Phân tích sau sự cố ngày 23 tháng 4 gặp gỡ sự ra mắt phiên bản V4

Lý do khóa học này tồn tại. Khoảng thời gian 24 giờ khi Anthropic xác nhận sự suy giảm chất lượng của Claude Code và DeepSeek tung ra một giải pháp thay thế rẻ hơn gấp 7 lần với hỗ trợ rõ ràng cho Claude Code.

Hai ngày thay đổi cục diện công cụ

Hầu hết các tuần trong lĩnh vực công cụ AI, bạn thức dậy với một thay đổi nhỏ. Đôi khi một mô hình trở nên rẻ hơn 20%. Đôi khi cửa sổ ngữ cảnh tăng thêm 50.000 token. Quyết định hầu như không thay đổi.

Ngày 23 tháng 4 năm 2026. Anthropic đã công bố một bài phân tích sau sự cố về Claude Code: 3 thay đổi sản phẩm nội bộ đã làm giảm chất lượng code trong 6 tuần trước đó. Các kỹ sư làm việc đã báo cáo điều này từ đầu tháng 3 - những lời phàn nàn mơ hồ trên Slack về việc "Claude gần đây trở nên kém thông minh hơn", các cuộc gọi sub-agent thường xuyên thất bại hơn, việc tái cấu trúc nhiều file bị nhầm lẫn. Thông báo ngày 23 tháng 4 đã chính thức hóa điều này. Nó cũng thừa nhận rằng giới hạn tỷ lệ đã gây ra nhiều khó khăn hơn so với những gì bảng điều khiển hiển thị.

Ngày 24 tháng 4 năm 2026. DeepSeek phát hành V4. V4-Pro đạt 80,6% trên SWE-bench Verified — chỉ kém 0,2 điểm so với Claude Opus 4.6 — với giá 3,48 USD cho mỗi triệu token đầu ra so với 25 USD của Opus. Rẻ hơn khoảng 7 lần. Giấy phép MIT. Cửa sổ ngữ cảnh một triệu token. Và điều mà không ai ngờ tới: Một API endpoint tương thích với Anthropic cho phép Claude Code giao tiếp với DeepSeek bằng cách thay đổi 4 biến môi trường.

Quyết định của các kỹ sư đang làm việc đã thay đổi trong 24 giờ. Khóa học này là một chuỗi 8 bài học có hệ thống về những việc cần làm để giải quyết vấn đề này.

Chi phí được tính toán chi tiết trong một bức tranh

Ba nhà mạng đã công bố những con số thực tế trong tuần ra mắt. Chúng đáng được xem xét cùng một lúc vì bảng giá trừu tượng không thể tự nói lên tất cả.

@antirez (24 tháng 4) — 291 lượt thích, 34K lượt xem — đã sử dụng V4-Pro bên trong Claude Code để có những ấn tượng ban đầu:

"Tôi đã tiêu tốn khoảng 1 USD mỗi giờ sử dụng cường độ cao."

Đó là mức cơ bản thực tế. Cường độ cao ở đây có nghĩa là các vòng lặp agent hoạt động hết công suất của Antirez, chứ không phải những tương tác thông thường. Một USD mỗi giờ cho việc lập trình không giới hạn theo kiểu Claude Code — để dễ hình dung, cùng cường độ đó trên gói của Anthropic đã đạt đến giới hạn tỷ lệ nhiều lần.

@Tur24Tur (25 tháng 4) — 131 + 91 lượt thích trên bài đăng tiếp theo, hơn 37.000 lượt xem — đã chuyển đổi một nhóm agent bảo mật đa nhiệm:

"Tổng cộng 412 lượt gọi công cụ. 3 thử thách web PortSwigger cấp chuyên gia + 1 ứng dụng Android thực tế. Tổng chi phí cho cả ngày: 6,84 USD trên deepseek-v4-pro."

412 lượt gọi công cụ. Ba thử thách cấp độ CTF. Một phân tích ứng dụng Android thực tế. Chưa đến 7 USD.

@koffuxu (25 tháng 4) — Phân tích code Android AOSP ở mức giá khoảng 1 USD trong thời gian khuyến mãi ra mắt, dự kiến khoảng 5 USD ở giá đầy đủ.

Lý do khóa học này tồn tại

Tài liệu DeepSeek cung cấp cho bạn các biến môi trường. Nguồn cấp dữ liệu X cung cấp cho bạn các câu chuyện về chi phí. r/ClaudeCode đang hỏi chính xác câu hỏi mà khóa học này trả lời, trong một chủ đề mà tại thời điểm đó không có bất kỳ hướng dẫn toàn diện nào của bên thứ ba. viết.

4 biến môi trường che giấu một chi tiết thứ năm mà không ai ghi lại. Hậu tố [1m] model-name mở khóa cửa sổ ngữ cảnh 1M đầy đủ. Nếu không có nó, bạn sẽ bị kẹt ở 200K. Sao chép và dán nguyên văn tài liệu chính thức sẽ cho bạn một cấu hình hoạt động nhưng bị hạn chế.
Định tuyến sub-agent là nơi kiếm được nhiều tiền nhất. Thiết lập ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash chuyển hướng 60–80% các lần gọi nội bộ của Claude Code đến V4-Flash với giá $0.14/M đầu vào. Đây là khoản mục tích lũy trong suốt một phiên. Không có hướng dẫn nào đề cập đến điều này.
Cây quyết định quan trọng hơn cấu hình. Khi nào V4-Pro thắng? Khi nào Opus 4.7 vẫn thắng? Nếu không có framework đó, bạn sẽ hoặc từ bỏ V4 ngay lần đầu tiên nó tạo ra một phương thức API (một chế độ lỗi thực sự — xem Bài học 4) hoặc bạn sẽ tiếp tục sử dụng... Opus khi sự đánh đổi giữa chi phí và tính nhất quán đã thay đổi.
Thực tế về giới hạn tốc độ mới là yếu tố thực sự thúc đẩy hầu hết các chuyển đổi. Các kỹ sư không chạy bảng tính so sánh chi phí. Họ đang gặp phải giới hạn tốc độ thứ ba của Claude Code trong ngày và tìm kiếm các giải pháp thay thế trên Google. Khóa học nêu rõ điều này bởi vì giả vờ như không biết gì là không trung thực.

Những thứ bạn cần

Một bản cài đặt Claude Code hoạt động. Nếu bạn chưa có: npm install -g @anthropic-ai/claude-code
Một API key DeepSeek. Miễn phí tại platform.deepseek.com/api_keys. Người dùng mới nhận được 5 USD credit. Chương trình khuyến mãi ra mắt giảm giá 75% đến ngày 5 tháng 5, vì vậy hãy thử ngay bây giờ.
Một codebase thực tế để thử nghiệm. Ngay cả một dự án phụ với hơn 5000 dòng code cũng được. Cửa sổ ngữ cảnh 1M chỉ quan trọng nếu bạn có thứ gì đó để điền vào đó.
Khoảng 2-3 giờ tổng thời gian. Chia đều vào sáng thứ Bảy và giờ nghỉ trưa thứ Ba, hoặc làm tất cả cùng một lúc. Tùy bạn quyết định.

Kiểm tra sơ bộ

Trước khi tiếp tục, hãy chạy lệnh này để xác nhận môi trường của bạn đã sẵn sàng:

which claude && claude --version

Nếu nhận được đường dẫn và số phiên bản, bạn đã sẵn sàng. Nếu không tìm thấy claude, hãy cài đặt ngay:

npm install -g @anthropic-ai/claude-code

Cách sử dụng prompt này:

Nơi dán: Mở terminal (mở Claude Code thông qua claude) — cùng một terminal mà bạn thường chạy claude trong thư mục dự án.
Cách sao chép: Nhấp vào block code, nhấn Cmd+A (Mac) hoặc Ctrl+A (Windows), sau đó nhấn Cmd+C / Ctrl+C để sao chép lệnh.
Điền thông tin của bạn: Không có trình giữ chỗ ở đây — đây là lệnh xác minh, hãy chạy nguyên trạng. Cá nhân hóa sẽ được trình bày trong Bài học 2 khi bạn thiết lập các biến môi trường.
Những gì bạn sẽ thấy: Trong vòng vài giây, công cụ AI sẽ in ra đường dẫn đến file nhị phân claude và chuỗi phiên bản như claude-code 0.4.x.
Việc cần làm với kết quả: Nếu cả hai đều thành công, bạn đã sẵn sàng cho Bài học 2. Lưu lại đường dẫn; chúng ta sẽ tham chiếu đến nó.
Nếu có vẻ không ổn: Nếu AI đặt câu hỏi làm rõ hoặc không tìm thấy claude, hãy chạy lệnh `npm install` ở trên và thử lại. Nếu đang sử dụng proxy của công ty, bạn có thể cần thiết lập registry npm.

Một số điểm cần lưu ý

Một vài lưu ý chân thành:

Không phải "DeepSeek đã đánh bại Claude". Đối với một số khối lượng công việc, V4-Pro thắng tuyệt đối, đối với những khối lượng công việc khác, Opus vẫn là lựa chọn đúng đắn.
Một số chi tiết cụ thể sẽ thay đổi. Khóa học cung cấp cho bạn khung sườn để bạn có thể thích ứng khi dữ liệu thay đổi.
Không phải là sự thay thế cho việc đo lường. Không có tiêu chuẩn ngành nào thay thế được dữ liệu phễu của riêng bạn. Chúng ta sẽ thiết lập theo dõi chi phí trong Bài học 3 — hãy tự chịu trách nhiệm về số liệu của mình.
Không dành cho công việc khách hàng trong lĩnh vực chăm sóc sức khỏe/tài chính/pháp lý mà không có đánh giá tuân thủ. Bài học 7 đề cập trực tiếp đến vấn đề này. API mặc định của DeepSeek chạy thông qua cơ sở hạ tầng đặt tại Trung Quốc; Nếu phương án đó không khả thi đối với khách hàng của bạn, thì các đường dẫn định tuyến cục bộ qua Ollama hoặc OpenRouter là những giải pháp thay thế.

Bước tiếp theo

Hãy mở Bài học 2 khi bạn đã mở cửa sổ dòng lệnh và có sẵn API key DeepSeek trong clipboard. Chúng ta sẽ thiết lập 4 biến môi trường, thêm hậu tố [1m] mà tài liệu chính thức bỏ qua, và chạy lệnh claude với DeepSeek lần đầu tiên.

Thời gian thiết lập là 5 phút.

Thứ Sáu, 22/05/2026 10:37

5 ★ 1 👨 60

#Claude Code

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Claude Code

Cũ vẫn chất

Xem thêm

Học Claude Code

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Chạy DeepSeek V4-Pro trong Claude Code

Khoảnh khắc mà hầu hết các kỹ sư chưa đề cập đến

Những gì bạn sẽ xây dựng

Ghi chú trung thực về dữ liệu

Điều kiện tiên quyết

Những gì bạn sẽ học được

Những gì bạn sẽ xây dựng

File cấu hình Claude Code lai

Báo cáo so sánh chi phí mỗi tác vụ

Chứng chỉ Claude Code với DeepSeek V4

Điều kiện tiên quyết

Đối tượng phù hợp

Khoảnh khắc: Phân tích sau sự cố ngày 23 tháng 4 gặp gỡ sự ra mắt phiên bản V4

Hai ngày thay đổi cục diện công cụ

Chi phí được tính toán chi tiết trong một bức tranh

Lý do khóa học này tồn tại

Những thứ bạn cần

Một số điểm cần lưu ý

Bước tiếp theo

Kết quả luyện tập

Bạn nên đọc

Workflow ngữ cảnh dài cho cửa sổ 1 triệu token

Subagent trong Claude Code: Phân công công việc mà không làm ảnh hưởng đến bối cảnh của bạn

Workflow cho người dùng Claude Code thành thạo: Nhật ký, quy tắc CLAUDE.md và khả năng mở rộng

Nguyên nhân làm quá trình nén dữ liệu Claude Code có chất lượng kém (và cách phòng tránh)

Cấu hình 5 phút (và vấn đề khó xử với hậu tố [1m])

Khi nào nên dùng V4-Pro? Khi nào nên chọn Opus 4.7?

Tính toán chi phí: Từ $25/triệu token xuống còn $3.48

Định tuyến sub-agent và chế độ Think-Max

Xây dựng chiến lược phiên Claude Code cá nhân của bạn

Cũ vẫn chất

Lập trình game Mèo Đuổi Chuột cùng Scratch

Cách xóa Fanpage Facebook trên điện thoại, máy tính

Cách dùng Emojimix ghép biểu tượng cảm xúc độc lạ

Công thức tính diện tích hình lập phương, thể tích khối lập phương

Số hữu tỉ là gì? Số vô tỉ là gì?

Hình nền trắng, ảnh nền trắng đẹp

Công thức tính đường chéo hình thoi

Những lời cảm ơn mẹ hay và chân thành nhất

Mẹo kiếm 7500 lượt quay Coin Master từ Trade Card

Code Vô Địch Tu Tiên Giới mới nhất và cách đổi code lấy thưởng