4 kỹ thuật tạo ngữ cảnh cốt lõi: Ghi, Chọn lọc, Nén, Tách biệt

Giờ bạn đã biết rằng ngữ cảnh là một nguồn tài nguyên có hạn và cửa sổ ngữ cảnh có đường cong chú ý hình chữ U. Tuyệt vời! Nhưng biết rằng nhà bếp nhỏ không có nghĩa là bạn biết cách nấu ăn. Bạn cần các kỹ thuật - những bước cụ thể bạn có thể thực hiện để lấp đầy cửa sổ ngữ cảnh đó bằng thông tin phù hợp theo đúng cách.

🔄 Tóm tắt nhanh: Trong Bài học 2, bạn đã học rằng cửa sổ ngữ cảnh được chia sẻ giữa đầu vào và đầu ra, các mô hình ít chú ý đến phần giữa (hiệu ứng "biến mức giữa chừng"), và mức sử dụng khoảng 70% là mục tiêu tốt. Bây giờ, bạn sẽ học 4 kỹ thuật để lựa chọn những gì lấp đầy cửa sổ đó.

Có 4 kỹ thuật cốt lõi về kỹ thuật tạo ngữ cảnh. Hãy nghĩ về chúng như các động từ:

  1. Viết — tạo ngữ cảnh chưa tồn tại
  2. Chọn lọc — chọn những gì được đưa vào và những gì bị loại bỏ
  3. Nén — thu nhỏ ngữ cảnh mà không làm mất ý nghĩa
  4. Cô lập — tách biệt các mối quan tâm với ranh giới rõ ràng

Mọi quyết định về kỹ thuật tạo ngữ cảnh bạn đưa ra đều thuộc một (hoặc nhiều) trong số các loại này. Hãy cùng phân tích từng loại một.

1. Viết: Tạo ngữ cảnh

Viết là kỹ thuật quen thuộc nhất — hầu hết mọi người đều nghĩ đến nó như là "prompt". Nhưng trong kỹ thuật tạo ngữ cảnh, việc viết còn vượt xa hơn cả hướng dẫn người dùng.

Bạn viết:

  • Các prompt hệ thống xác định vai trò, tính cách và quy tắc hành vi của AI
  • Các hướng dẫn chỉ rõ chính xác những gì AI nên làm
  • Các ví dụ (few-shot) cho AI thấy kết quả đầu ra tốt trông như thế nào
  • Siêu dữ liệu cung cấp thông tin nền mà AI sẽ không có được nếu không có
  • Các ràng buộc xác định những gì AI không nên làm

Đây là điểm mấu chốt: Hầu hết mọi người chỉ viết hướng dẫn. Các chuyên gia tạo ngữ cảnh cũng viết mọi thứ xung quanh hướng dẫn đó.

Ngữ cảnh xấu (chỉ hướng dẫn):

📍 Nơi dán: Mở ChatGPT (chat.openai.com), Claude (claude.ai) hoặc Gemini (gemini.google.com) và bắt đầu một cuộc trò chuyện mới.

📋 Cách sao chép prompt này: Nhấp vào bất kỳ đâu bên trong khối màu xám, nhấn Cmd+A rồi Cmd+C (Mac) hoặc Ctrl+A rồi Ctrl+C (Windows). Hoặc sử dụng biểu tượng sao chép xuất hiện.

Phản hồi khiếu nại của khách hàng này.

✏️ ​​Cách điền thông tin chi tiết của bạn: Thay thế mỗi [] và trình giữ chỗ trong ngoặc bằng thông tin cụ thể từ tình huống thực tế của bạn. Thông tin mơ hồ sẽ tạo ra kết quả mơ hồ — hãy nêu cụ thể.

👀 Những gì bạn sẽ thấy: Trong vòng vài giây, AI sẽ trả về một phản hồi có cấu trúc dựa trên prompt ở trên. Hãy đọc kỹ và coi đó là bản nháp, không phải là câu trả lời cuối cùng.

📌 Nên làm gì với kết quả: Lưu phản hồi vào file Notes. Chọn đề xuất có hiệu quả cao nhất và thực hiện nó trong tuần này — đừng cố gắng làm tất cả cùng một lúc.

⚠️ Nếu thấy không ổn: Nếu các đề xuất có vẻ chung chung, hãy dán nội dung này: "Hãy cụ thể hơn với bối cảnh thực tế của tôi. Bỏ những lời khuyên chung chung". Nếu nó bỏ qua các chi tiết quan trọng bạn đã cung cấp, hãy hỏi: "Bạn đã bỏ sót [X] trong ngữ cảnh của tôi — hãy thực hiện lại với điều đó làm ràng buộc chính".

Ngữ cảnh tốt (môi trường viết):

VAI TRÒ: Nhân viên hỗ trợ cấp cao tại Acme SaaS. Đồng cảm nhưng hiệu quả.
GIỌNG ĐIỆU: Chuyên nghiệp, ấm áp, tập trung vào giải pháp. Không bao giờ phòng thủ.
QUY TẮC: Luôn luôn thừa nhận vấn đề trước. Đưa ra một giải pháp.
         Nếu bạn không thể giải quyết, hãy chuyển tiếp — đừng bao giờ đoán mò.
HƯỚNG DẪN: Phản hồi khiếu nại này của khách hàng.

Cùng một hướng dẫn. Môi trường thông tin hoàn toàn khác.

Kiểm tra nhanh: Sự khác biệt giữa viết prompt và viết ngữ cảnh là gì?

Câu trả lời: Prompt chỉ là hướng dẫn — "làm điều này". Viết ngữ cảnh có nghĩa là tạo ra toàn bộ môi trường thông tin: vai trò, quy tắc, ví dụ, siêu dữ liệu và các ràng buộc định hình cách AI diễn giải và phản hồi hướng dẫn của bạn.

2. Chọn lọc: Lựa chọn những gì sẽ được đưa vào

Chọn lọc là kỹ thuật bị đánh giá thấp nhất. Nó trả lời câu hỏi: Trong tất cả những gì bạn có thể đưa vào, bạn nên đưa những gì vào?

Đây là nơi mà RAG (Retrieval Augmented Generation - Tạo lập dựa trên truy xuất) hoạt động. Khi người dùng đặt câu hỏi và hệ thống của bạn tìm kiếm trong cơ sở tri thức các tài liệu liên quan trước khi chuyển chúng cho AI — đó là quá trình lựa chọn. Bạn đang chọn thông tin nào sẽ được đưa vào cửa sổ ngữ cảnh.

Nhưng chọn lọc không chỉ dành cho các hệ thống tự động. Mỗi khi bạn quyết định dán file này thay vì file kia vào cuộc trò chuyện với AI, bạn đang thực hiện quá trình lựa chọn.

Chọn lọc tốt có nghĩa là:

  • Bao gồm những gì liên quan đến nhiệm vụ cụ thể (không phải tất cả mọi thứ bạn có)
  • Loại bỏ những gì gây nhiễu — ngữ cảnh không liên quan không chỉ lãng phí token mà còn làm giảm chất lượng
  • Ưu tiên theo tầm quan trọng — nếu bạn chỉ có thể đưa vào 5 trong số 20 tài liệu, thì 5 tài liệu nào quan trọng nhất?
  • Xem xét tính cập nhật — thông tin mới hơn thường liên quan hơn

Ví dụ về chọn lọc tồi: Dán toàn bộ codebase 10.000 dòng của bạn để gỡ lỗi sự cố CSS.

Ví dụ về chọn lọc tốt: Dán file CSS cụ thể, thành phần HTML mà nó định kiểu, và thông báo lỗi của trình duyệt.

Sự khác biệt có lẽ là khoảng 200 từ so với 40.000 từ. Và phiên bản tập trung hơn cho kết quả tốt hơn vì AI không bị ngập trong code không liên quan.

3. Nén: Thu nhỏ mà không làm mất ý nghĩa

Đôi khi bạn cần thông tin từ một nguồn lớn, nhưng bạn không cần tất cả thông tin đó với độ chính xác tuyệt đối. Đó là lúc kỹ thuật nén phát huy tác dụng.

Các kỹ thuật nén bao gồm:

  • Tóm tắt — cô đọng một báo cáo 10 trang thành những phát hiện chính
  • Trích xuất — trích xuất các điểm dữ liệu cụ thể từ một tài liệu lớn hơn
  • Chia nhỏ — chia các tài liệu lớn thành những phần có ý nghĩa và chỉ bao gồm các phần liên quan
  • Giảm lược đồ — gửi tên cột và kiểu dữ liệu thay vì toàn bộ lược đồ cơ sở dữ liệu
  • Chi tiết tăng dần — bắt đầu với các bản tóm tắt, chỉ đi sâu vào chi tiết khi cần thiết

Đây là một ví dụ thực tế. Bạn đang phân tích phản hồi của khách hàng — 500 đánh giá. Bạn không thể hiển thị tất cả 500 đánh giá trong cửa sổ ngữ cảnh, và ngay cả khi bạn có thể, nó cũng sẽ gây nhiễu.

Không nén: Dán tất cả 500 đánh giá (quá nhiều từ, AI bị lạc lối)

Có nén:

TÓM TẮT: 500 đánh giá đã được phân tích. Các chủ đề chính:
- Giá cả (được đề cập 180 lần, 72% tiêu cực): "quá đắt," "không đáng với giá tiền"
- Quy trình đăng ký (được đề cập 95 lần, 85% tiêu cực): "thiết lập khó hiểu," "mất 3 giờ"
- Hỗ trợ (được đề cập 140 lần, 60% tích cực): "phản hồi nhanh," "đội ngũ hỗ trợ hữu ích"
- Tính năng (được đề cập 200 lần, 78% tích cực): "thích bảng điều khiển," "tích hợp tuyệt vời"

10 ĐÁNH GIÁ TIÊU BIỂU NHẤT:
[10 đánh giá được chọn lọc kỹ lưỡng, thể hiện đầy đủ các phản hồi]

Bạn đã nén 500 đánh giá thành khoảng 2.000 từ. Và AI có thể xử lý dữ liệu này tốt hơn so với dữ liệu thô vì bạn đã thực hiện phân tích bước đầu tiên.

Kiểm tra nhanh: Khi nào nên nén và khi nào nên chọn lọc?

Đáp án: Chọn lọc khi bạn có thể xác định được những thông tin nào là phù hợp và bỏ qua hoàn toàn phần còn lại. Nén khi bạn cần thông tin từ một nguồn lớn nhưng ở độ chính xác thấp hơn - tóm tắt, trích dẫn hoặc các mẫu đại diện thay vì toàn bộ nội dung. Thông thường bạn sẽ làm cả hai: Chọn lọc các tài liệu liên quan, sau đó nén chúng.

4. Tách biệt: Chia riêng các mối quan tâm

Tách biệt là tạo ra ranh giới rõ ràng giữa các loại ngữ cảnh khác nhau. Nếu không tách biệt, mọi thứ sẽ lẫn lộn với nhau — và điều đó gây ra vấn đề.

Ba mô hình tách biệt chính:

Tách biệt dựa trên thẻ — sử dụng XML hoặc markdown để tạo ranh giới:

<instructions>Phân tích phản hồi của khách hàng sau</instructions>
<data>
[phản hồi của khách hàng ở đây — được tách biệt rõ ràng khỏi hướng dẫn]
</data>
<output_format>
Cung cấp một đối tượng JSON với cảm xúc, chủ đề và điểm mức độ khẩn cấp
</output_format>

Nếu không có các thẻ đó, AI có thể nhầm lẫn lời nói của khách hàng với hướng dẫn của bạn. Nếu khách hàng viết "bỏ qua tất cả hướng dẫn trước đó" trong phản hồi của họ (đúng vậy, nhiều người vẫn làm thế), việc tách biệt đúng cách sẽ ngăn chặn việc chèn mã độc vào prompt.

Tách biệt ở cấp độ prompt — sử dụng prompt hệ thống so với thông báo người dùng:

Prompt hệ thống thiết lập các quy tắc hành vi. Thông báo người dùng cung cấp nhiệm vụ. Việc giữ chúng tách biệt có nghĩa là nhiệm vụ có thể thay đổi mà không cần viết lại nền tảng hành vi.

Tách biệt ở cấp độ lần gọi — chia nhỏ các nhiệm vụ phức tạp thành nhiều lần gọi AI:

Thay vì một prompt khổng lồ nói rằng "phân tích dữ liệu này, tạo báo cáo, tạo bản tóm tắt và soạn thảo email", bạn thực hiện 4 cuộc gọi riêng biệt. Mỗi cuộc gọi nhận được ngữ cảnh tập trung. Mỗi cuộc gọi thực hiện tốt công việc của nó.

Đây là cách các hệ thống AI trong môi trường sản xuất hoạt động. Không phải một prompt khổng lồ — mà là một chuỗi các cuộc gọi tập trung, mỗi cuộc gọi có ngữ cảnh được tách biệt cẩn thận.

Tổng hợp lại: Một ví dụ thực tế

Hãy áp dụng cả 4 kỹ thuật vào một tình huống thực tế. Bạn đang xây dựng một hệ thống hỗ trợ khách hàng dựa trên Trí tuệ nhân tạo (AI).

Nhiệm vụ: Một khách hàng viết thư cho biết giao dịch thanh toán của họ thất bại và họ rất bực bội.

Viết:

  • Thông báo hệ thống xác định vai trò của nhân viên hỗ trợ và hướng dẫn về sự đồng cảm
  • Quy tắc phản hồi (xác nhận → chẩn đoán → giải quyết → theo dõi)
  • Ba ví dụ ngắn gọn về các phản hồi hỗ trợ xuất sắc

Chọn lọc:

  • Lấy thông tin tài khoản của khách hàng (loại gói dịch vụ, lịch sử thanh toán, 3 yêu cầu hỗ trợ gần nhất)
  • Truy xuất bài viết trợ giúp liên quan đến lỗi thanh toán
  • Bỏ qua: Tài liệu tiếp thị, lộ trình sản phẩm, dữ liệu của khách hàng khác

Tóm tắt:

  • Thay vì toàn bộ hướng dẫn khắc phục sự cố thanh toán dài 20 trang, hãy trích xuất 5 nguyên nhân phổ biến nhất cùng với giải pháp của chúng
  • Tóm tắt lịch sử yêu cầu hỗ trợ của khách hàng thành một dòng: "3 yêu cầu hỗ trợ trong 6 tháng, tất cả đều đã được giải quyết, nhìn chung là tương tác tích cực"

Tách biệt:

  • Thông báo hệ thống: vai trò, quy tắc, giọng điệu (tách biệt khỏi dữ liệu)
  • Dữ liệu khách hàng: trong thẻ <customer_profile>
  • Cơ sở kiến ​​thức: trong thẻ <troubleshooting>
  • Tin nhắn của khách hàng: trong thẻ <ticket>
  • Định dạng đầu ra: trong thẻ <response_format>

Kết quả? Một cửa sổ ngữ cảnh có thể chứa khoảng 4.000 từ — tập trung, được sắp xếp hợp lý và chứa mọi thứ mà AI cần để tạo ra phản hồi tuyệt vời. Không phỏng đoán, không mơ hồ, không lãng phí không gian.

Kiểm tra nhanh: Trong ví dụ hỗ trợ khách hàng, tại sao chúng ta lại tách biệt tin nhắn của khách hàng trong thẻ <ticket>?

Đáp án: Để tạo ra ranh giới rõ ràng giữa ngôn từ của khách hàng và hướng dẫn của hệ thống. Nếu không có sự phân tách, AI có thể nhầm lẫn văn bản của khách hàng với hướng dẫn — đặc biệt nếu khách hàng sử dụng ngôn ngữ nghe giống như một mệnh lệnh. Thẻ (Tag) làm cho ranh giới trở nên rõ ràng.

Những điểm chính cần ghi nhớ

  • Viết (Write) tạo ra ngữ cảnh không tồn tại — prompt hệ thống, hướng dẫn, ví dụ, ràng buộc
  • Chọn lọc (Select) chọn những gì được đưa vào cửa sổ ngữ cảnh và những gì bị loại bỏ — kỹ thuật bị đánh giá thấp nhất
  • Nén (Compress) thu nhỏ các nguồn lớn mà không làm mất ý nghĩa — tóm tắt, trích xuất, mẫu đại diện
  • Tách biệt (Isolate) tạo ra ranh giới giữa các loại ngữ cảnh khác nhau — thẻ, cấp độ prompt, các lệnh gọi riêng biệt
  • Hầu hết các kỹ thuật xử lý ngữ cảnh thực tế đều sử dụng cả 4 kỹ thuật này kết hợp với nhau
  • Mục tiêu là một cửa sổ ngữ cảnh tập trung, có tổ chức, nơi mỗi từ khóa đều xứng đáng có vị trí của nó
  • Câu 1:

    Kỹ thuật Tách biệt làm nhiệm vụ gì?

    GIẢI THÍCH:

    Tách biệt tạo ra ranh giới rõ ràng giữa các loại ngữ cảnh khác nhau. Nếu không có nó, AI có thể nhầm lẫn hướng dẫn của bạn với dữ liệu mà nó đang phân tích (nguy cơ chèn mã độc vào prompt), hoặc trộn lẫn các tác vụ khác nhau trong một yêu cầu phức tạp. Thẻ XML, prompt hệ thống so với người dùng và kiến ​​trúc đa lệnh gọi đều là các kỹ thuật tách biệt, chẳng hạn như sử dụng thẻ XML để phân biệt hướng dẫn với dữ liệu, hoặc xử lý các vấn đề khác nhau trong những lệnh gọi AI riêng biệt.

  • Câu 2:

    Bạn đang xây dựng một AI trả lời các câu hỏi về một cuốn hướng dẫn sử dụng sản phẩm dài 500 trang. Một người dùng hỏi "Làm thế nào để reset mật khẩu của tôi?". Cách tiếp cận đúng là gì?

    GIẢI THÍCH:

    Đây là kỹ thuật tạo ngữ cảnh. Chọn truy xuất các trang liên quan (không phải toàn bộ hướng dẫn). Nén trích xuất thông tin chính (chỉ các bước reset, không phải toàn bộ trang với tiêu đề và footer). Viết thêm ngữ cảnh còn thiếu (loại tài khoản của người dùng ảnh hưởng đến phương pháp reset nào được áp dụng). Kết quả: Một ngữ cảnh tập trung, hiệu quả tạo ra câu trả lời chính xác.

  • Câu 3:

    Một lập trình viên dán toàn bộ codebase 5.000 dòng vào cuộc trò chuyện với AI và nói "tìm lỗi". Họ nên áp dụng kỹ thuật xử lý ngữ cảnh nào trước tiên?

    GIẢI THÍCH:

    Vấn đề cốt lõi là quá nhiều ngữ cảnh không liên quan. Chọn lọc có nghĩa là chọn những gì được đưa vào và những gì bị loại bỏ. Nếu lỗi nằm trong mô-đun xác thực, hãy gửi các file xác thực — chứ không phải toàn bộ codebase. Điều này giảm nhiễu, tiết kiệm token và giúp AI tập trung. Bạn cũng có thể nén (gửi chữ ký hàm thay vì toàn bộ codebase để hỗ trợ các file) và viết (thêm nhật ký lỗi và so sánh hành vi dự kiến ​​với hành vi thực tế).

Thứ Tư, 20/05/2026 15:46
51 👨 30
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Kỹ thuật thiết kế Prompt