Quy trình làm việc nhiều bước trong OpenClaw

Một agent là chưa đủ

🔄 Tóm tắt nhanh: Trong bài học trước, bạn đã học cách kiểm tra skill với Promptfoo và Cisco Skill Scanner. Bây giờ, hãy xây dựng các skill quá phức tạp cho một bước duy nhất - những quy trình công việc cần nhiều agent cùng hoạt động.

OpenObserve, một công ty giám sát, đã xây dựng 8 AI subagent chuyên biệt cho quy trình QA của họ. Mỗi agent có một vai trò rõ ràng: Một agent phân tích lỗi test, một agent tạo ra các bài test mới, một agent xem xét độ phủ code, v.v... Kết quả? Các bài test không ổn định giảm 85%, và độ phủ tăng từ 380 lên hơn 700 bài test.

Bài học quan trọng: Các agent có vai trò rõ ràng hoạt động tốt hơn những agent đa năng. Thay vì một agent biết tất cả mọi thứ, hãy tạo ra các chuyên gia tập trung làm việc cùng nhau.

Nhóm kỹ thuật của Anthropic đã nói như sau: "Giống như lập trình với các luồng, việc điều phối rõ ràng những bước nào được giao cho các subagent sẽ mang lại kết quả tốt nhất".

Mẫu 1: Các subagent

Các subagent là nguyên tắc điều phối chính. Mỗi tác vụ chạy trong cửa sổ ngữ cảnh riêng với:

  • Prompt hệ thống tùy chỉnh (hướng dẫn cụ thể)
  • Quyền truy cập công cụ cụ thể (quyền hạn được giới hạn)
  • Quyền hạn độc lập (phạm vi ảnh hưởng hạn chế)

Ví dụ: Quy trình nghiên cứu

Skill chính của bạn điều phối 3 subagent:

# Quy trình nghiên cứu thị trường

Khi người dùng yêu cầu nghiên cứu thị trường về một chủ đề:

## Bước 1: Thu thập dữ liệu (Subagent)
Khởi chạy một subagent với hướng dẫn:
"Tìm kiếm trên web dữ liệu mới nhất về [chủ đề]. Tìm 5-10 nguồn gần đây
với số liệu thống kê, quy mô thị trường, tốc độ tăng trưởng và các đối thủ chính.
Trả về một danh sách kết quả được cấu trúc với URL nguồn."

## Bước 2: Phân tích cạnh tranh (Subagent)
Khởi chạy một subagent với hướng dẫn:
"Sử dụng dữ liệu thu thập được ở Bước 1, xác định 5 đối thủ cạnh tranh hàng đầu
trong lĩnh vực này. Đối với mỗi đối thủ, hãy ghi lại: tên công ty, thị phần,
sản phẩm chính, điểm mạnh, điểm yếu."

## Bước 3: Tổng hợp (Agent chính)
Sử dụng kết quả từ Bước 1 và 2, tạo báo cáo cuối cùng với:
- Tóm tắt điều hành (3 câu)
- Tổng quan thị trường (số liệu thống kê và xu hướng chính)
- Bức tranh cạnh tranh (bảng so sánh)
- Cơ hội (dựa trên khoảng trống của đối thủ cạnh tranh)
- Các bước tiếp theo được đề xuất

Mỗi subagent hoạt động độc lập - nó không thể thấy các cuộc hội thoại của những subagent khác. Agent chính điều phối kết quả.

Ràng buộc chính: Các subagent không thể tạo ra những subagent khác. Nếu bước 2 cần ủy quyền thêm, nó phải xử lý nội bộ hoặc agent chính cần chia nhỏ nó thành các bước bổ sung.

Kiểm tra nhanh: Tại sao lại chạy Bước 1 và 2 dưới dạng các subagent riêng biệt thay vì để một agent thực hiện tất cả nghiên cứu?

Đáp án: Các subagent tập trung sẽ cho kết quả tốt hơn - agent thu thập dữ liệu chỉ tập trung vào việc tìm kiếm nguồn, agent phân tích chỉ tập trung vào phân tích cạnh tranh. Mỗi agent đều có một cửa sổ ngữ cảnh rõ ràng mà không bị nhầm lẫn với tác vụ khác.

Mẫu 2: Chuỗi prompt

Chuỗi prompt là quá trình xử lý tuần tự, trong đó mỗi bước biến đổi đầu ra của bước trước đó. Không giống như các subagent (có thể chạy song song), chuỗi prompt vốn dĩ là tuần tự.

Ví dụ: Quy trình xử lý nội dung

# Quy trình viết bài đăng blog

Xử lý bản nháp của người dùng qua các giai đoạn sau:

## Giai đoạn 1: Phân tích cấu trúc
Phân tích bản nháp để tìm các vấn đề về cấu trúc: thiếu phần giới thiệu,
kết luận yếu, những phần không rõ ràng. Đưa ra một bài phê bình có cấu trúc.

## Giai đoạn 2: Cải thiện nội dung
Sử dụng bài phê bình từ Giai đoạn 1, viết lại các phần yếu.
Giữ nguyên giọng văn của tác giả và các phần mạnh.

## Giai đoạn 3: Tối ưu hóa SEO
Sử dụng bản nháp được cải thiện từ Giai đoạn 2, thêm các yếu tố SEO:
- Thẻ tiêu đề (dưới 60 ký tự)
- Mô tả meta (dưới 160 ký tự)
- Tối ưu hóa tiêu đề phụ (H1, H2, H3)
- Kiểm tra mật độ từ khóa

## Giai đoạn 4: Xem xét cuối cùng
So sánh phiên bản cuối cùng với bản nháp ban đầu.
Xuất bản tóm tắt các thay đổi đã thực hiện ở mỗi giai đoạn.

Tại sao lại thực hiện theo chuỗi thay vì làm tất cả cùng một lúc? Bởi vì mỗi giai đoạn có một trọng tâm khác nhau. Việc kết hợp phê bình cấu trúc với tối ưu hóa SEO trong một yêu cầu sẽ tạo ra kết quả tầm thường ở cả hai. Thực hiện theo chuỗi cho phép mỗi giai đoạn làm tốt một việc.

Nâng cao: Các mô hình khác nhau cho mỗi giai đoạn. Bạn có thể sử dụng một mô hình nhanh, tiết kiệm cho Giai đoạn 1 (cấu trúc đơn giản) và một mô hình mạnh mẽ cho Giai đoạn 2 (viết lại đòi hỏi sự tinh tế). Điều này tối ưu hóa cả chi phí và chất lượng.

Mẫu 3: Task DAG (Directed Acyclic Graph)

Đối với các quy trình công việc phức tạp có sự phụ thuộc, hệ thống tác vụ cho phép bạn xác định những bước nào có thể chạy song song và bước nào phải chờ các bước khác.

# Chuẩn bị phát hành

Chuẩn bị một bản phát hành với các tác vụ sau:

Tác vụ 1: Chạy thử nghiệm → Phải hoàn thành trước Tác vụ 4
Tác vụ 2: Cập nhật nhật ký thay đổi → Phải hoàn thành trước Tác vụ 4
Tác vụ 3: Kiểm tra cú pháp code → Phải hoàn thành trước Tác vụ 4
Tác vụ 4: Xây dựng gói → Phụ thuộc vào các Tác vụ 1, 2, 3
Tác vụ 5: Tạo ghi chú phát hành → Phụ thuộc vào Tác vụ 2
Tác vụ 6: Xuất bản → Phụ thuộc vào các Tác vụ 4 và 5

Các tác vụ 1, 2 và 3 có thể chạy song song.
Tác vụ 4 chờ cả ba tác vụ.
Tác vụ 5 chỉ cần Tác vụ 2.
Tác vụ 6 chờ tất cả các tác vụ.

Agent có thể thực hiện đồng thời Tác vụ 1, 2 và 3, sau đó chuyển sang Tác vụ 4 và 5, và cuối cùng là Tác vụ 6. Đây là thứ tự thực hiện nhanh nhất có thể trong khi vẫn tuân thủ các mối quan hệ phụ thuộc.

Kiểm tra nhanh: Trong ví dụ chuẩn bị phát hành, điều gì xảy ra nếu Tác vụ 1 (Chạy thử nghiệm) thất bại?

Đáp án: Tác vụ 4 (Xây dựng gói) và Tác vụ 6 (Xuất bản) không thể tiếp tục vì chúng phụ thuộc vào Tác vụ 1. Tác vụ 2, 3 và 5 vẫn có thể hoàn thành. Quy trình công việc báo cáo lỗi và chờ giải quyết.

Nguyên tắc thiết kế cho các skill nhiều bước

1. Mỗi bước phải được test độc lập. Nếu bạn không thể test một bước riêng biệt, nó đang thực hiện quá nhiều việc.

2. Xác định đầu vào và đầu ra rõ ràng. Bước 2 phải biết chính xác định dạng mong đợi từ Bước 1.

3. Xử lý lỗi ở mỗi bước. Điều gì xảy ra nếu tìm kiếm trên web không trả về kết quả nào? Nếu API bị lỗi? Đừng để một lỗi làm sập toàn bộ quy trình công việc.

4. Giảm thiểu sự phụ thuộc giữa các bước. Càng ít kết nối giữa các bước, quy trình công việc càng mạnh mẽ. Sự liên kết chặt chẽ có nghĩa là một lỗi sẽ lan truyền khắp mọi nơi.

5. Sử dụng mô hình đơn giản nhất có hiệu quả.

Độ phức tạpTrường hợp sử dụng
Một bướcSkill cơ bản (không cần phối hợp)
Các bước tuần tựChuỗi prompt
Các bước song songSubagent
Các mối quan hệ phụ thuộc + tính song songTask DAG
Nhiều vai trò chuyên mônNhóm subagent với khả năng điều phối

Ví dụ thực tế: Công cụ tạo báo cáo hàng tuần

Kết hợp tất cả các mẫu:

# Tự động hóa báo cáo hàng tuần

## Giai đoạn 1 (Các subagent song song):
- Subagent A: Lấy các Tác vụ đã hoàn thành từ công cụ quản lý dự án
- Subagent B: Thu thập các chỉ số chính từ bảng điều khiển phân tích
- Subagent C: Thu thập các cập nhật trạng thái nhóm từ kênh chia sẻ

## Giai đoạn 2 (Chuỗi prompt):
- Bước 1: Hợp nhất tất cả đầu ra của Giai đoạn 1 thành một tập dữ liệu duy nhất
- Bước 2: Xác định các chủ đề và điểm nổi bật trong dữ liệu
- Bước 3: Định dạng theo mẫu báo cáo hàng tuần

## Giai đoạn 3 (Agent chính):
- Xem lại báo cáo đã định dạng để đảm bảo độ chính xác
- Tạo bản tóm tắt điều hành gồm 3 câu
- Soạn thảo email gửi kèm báo cáo
- Lưu vào thư mục báo cáo (KHÔNG gửi email - chỉ lưu bản nháp)

Phương pháp này sử dụng các subagent để thu thập dữ liệu song song, chuỗi prompt để xử lý tuần tự và agent chính để tổng hợp cuối cùng.

Những điểm chính cần ghi nhớ:

  • Các agent chuyên biệt hoạt động hiệu quả hơn những agent đa năng - nghiên cứu trường hợp OpenObserve đã chứng minh điều này trên quy mô lớn
  • Các subagent chạy trong những cửa sổ ngữ cảnh riêng biệt với quyền hạn được giới hạn (nhưng không thể tạo ra subagent)
  • Chuỗi prompt xử lý dữ liệu theo trình tự - mỗi bước tinh chỉnh đầu ra trước đó
  • Task DAG quản lý các dependency - song song khi có thể, tuần tự khi cần thiết
  • Sử dụng mô hình đơn giản nhất giải quyết được vấn đề của bạn (không cần điều phối khi một skill duy nhất hoạt động)
  • Mỗi bước phải được test độc lập với đầu vào và đầu ra rõ ràng với đầu vào và đầu ra rõ ràng
  • Câu 1:

    Nghiên cứu trường hợp OpenObserve cho thấy các agent giới hạn với vai trò rõ ràng hoạt động tốt hơn những agent đa năng. Điều này có ý nghĩa gì đối với thiết kế skill?

    GIẢI THÍCH:

    8 subagent chuyên biệt của OpenObserve đã giảm 85% số lượng bài kiểm tra không ổn định và tăng phạm vi bao phủ từ 380 lên hơn 700 bài kiểm tra. Bài học: Các agent chuyên biệt làm tốt một việc, được phối hợp với nhau, hoạt động hiệu quả hơn một agent đa năng cố gắng làm mọi thứ.

  • Câu 2:

    Khi nào bạn nên sử dụng chuỗi lời nhắc thay vì subagent?

    GIẢI THÍCH:

    Chuỗi prompt được thiết kế theo trình tự - bước 2 sử dụng đầu ra của bước 1. Điều này lý tưởng khi bạn cần xử lý, chuyển đổi và tinh chỉnh dữ liệu qua nhiều giai đoạn, hoặc khi các bước khác nhau được hưởng lợi từ những mô hình AI khác nhau (ví dụ: một mô hình nhanh để trích xuất, một mô hình mạnh mẽ để phân tích).

  • Câu 3:

    Hạn chế chính của subagent là gì?

    GIẢI THÍCH:

    Subagent không thể tạo ra các subagent khác - nó không có tính lồng ghép. Nếu bạn cần ủy quyền sâu hơn, hãy xâu chuỗi các subagent từ cuộc hội thoại chính hoặc sử dụng các skill trong ngữ cảnh subagent. Hạn chế này ngăn chặn sự lan truyền không kiểm soát của các agent.

Thứ Hai, 20/04/2026 13:57
51 👨
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Học OpenClaw