Bốn cổng kiểm soát để agent ship việc thật

TL;DR

Khi giao việc thật cho agent, đừng chỉ nói "làm cẩn thận". Hãy đặt bốn cổng: bắt nó plan rồi dừng, chia việc thành checkpoint, kiểm tra tác động trước khi đổi đồ chung, và chỉ tin "xong" khi có output thật.

Bạn cần bài này khi agent đã làm được việc, nhưng bạn vẫn thấy phải ngồi canh: nó hay sửa rộng hơn yêu cầu, tự chọn hướng hơi liều, báo "xong" mà chưa chạy, hoặc làm một thay đổi nhìn đúng nhưng vài ngày sau mới lòi lỗi.

Làm ngay với task tiếp theo:

Trước khi agent code, bắt nó viết plan và dừng.
Nếu việc lớn hơn một lượt review, chia thành chặng nhỏ.
Trước khi đổi hàm, field, API, file dùng chung, bắt nó liệt kê ai đang phụ thuộc.
Trước khi nhận "xong", yêu cầu lệnh đã chạy và output thật.

Nếu chỉ nhớ một câu, nhớ câu này: agent được chạy tự do giữa các cổng, nhưng phải dừng ở cổng.

Plan rồi dừng

"Nêu hướng làm, file sẽ đụng, chỗ chưa chắc. Dừng lại, chưa code tới khi tôi đồng ý."

Chia checkpoint

"Làm chặng một trước. Xong thì dừng cho tôi xem, rồi mới qua chặng kế."

Kiểm tác động

"Trước khi đổi thứ dùng chung, liệt kê nơi đang gọi hoặc phụ thuộc vào nó."

Đưa bằng chứng

"Chạy thật và dán output. Đừng mô tả thứ bạn nghĩ sẽ xảy ra."

Đây là phiên bản ngắn để dùng ngay. Phần còn lại giải thích vì sao bốn cổng này chặn đúng những chỗ agent hay ngã nhất.

01Khi nào dùng bốn cổng này

Không phải việc nào cũng cần đủ bốn cổng. Nếu bạn nhờ agent đổi một câu chữ, đặt tên biến, hay phác vài ý tưởng nháp, cứ để nó chạy. Bốn cổng đáng dùng khi việc có một trong các dấu hiệu sau:

Agent sẽ sửa file/code/tài liệu mà người khác còn dùng.
Việc có nhiều bước, bước sau dựa vào bước trước.
Sai thì không thấy ngay: build vẫn xanh, bài vẫn đọc được, dashboard vẫn hiện số.
Bạn không thể tự review toàn bộ trong vài phút.

Đó là vùng nguy hiểm: agent làm nhanh hơn bạn, nhưng cũng đi sai nhanh hơn bạn. Vấn đề không phải nó ngu. Vấn đề là bạn đang giao việc như giao cho một cái máy biết nghe lời, trong khi thực tế nó giống một người rất nhanh, rất gan, và rất hay quên.

Cực nhanhgõ code gấp 10× bạn

Gan lìviệc gì cũng dám đụng

Mất trí nhớsáng dậy quên sạch hôm qua

Bạn không sai khiến một cái máy. Bạn đang kèm một đứa em — cực giỏi, và hay quên.

Đừng hiểu metaphor này theo kiểu văn vẻ. Nó là checklist quản trị: nhanh thì cần cổng; gan thì cần phạm vi; hay quên thì cần context và bằng chứng.

Bạn không cần đứng nhìn từng dòng. Nếu làm vậy, tốc độ của agent bốc hơi sạch. Việc của bạn là chọn đúng chỗ nó phải dừng. Hầu hết task có cùng một dòng đời: nhận việc, làm, đụng ranh giới dùng chung, rồi báo xong. Bốn cổng nằm đúng trên dòng đời đó.

DÒNG ĐỜI MỘT TASK

giao task

Kế hoạchtrước khi bắt đầu

Checkpointgiữa các chặng

Tác độngtrước khi đụng đồ chung

Kiểm chứngtrước khi tin "xong"

ship →

Bốn cổng không phải bốn mẹo rời nhau. Chúng là bốn khoảnh khắc bạn chen vào trước khi cái sai trở nên đắt.

02Cổng 1: bắt nó plan rồi dừng

Sai nặng thường bắt đầu trước dòng code đầu tiên. Agent hiểu lệch phạm vi, chọn hướng quá to, hoặc định đụng vào chỗ bạn không ngờ. Nếu bạn để nó vừa nghĩ vừa làm, tới lúc thấy lệch thì nó đã dựng được nửa cái nhà trên nền sai.

Prompt dùng ngay:

Before doing the work, state:
- what you think the goal is
- your approach
- files/areas you will touch
- anything uncertain or needing my confirmation

Then STOP. Do not edit anything until I approve.

Kết quả đúng: bạn đọc plan và không bất ngờ. Nếu plan làm bạn giật mình, cổng vừa cứu bạn.

03Cổng 2: chia việc thành checkpoint

Một việc lớn làm trong một phát là nơi agent đi lạc xa nhất. Mỗi bước của nó dựa trên bước trước. Bước hai lệch một chút, bước ba sẽ xây rất hợp lý trên cái lệch đó, rồi bước bốn tiếp tục hợp lý hơn nữa. Đến cuối, output trông có mạch nhưng sai gốc.

Chia việc thành checkpoint để cái sai lộ sớm. Một checkpoint tốt có ba đặc điểm: nhỏ đủ để bạn review trong một lần ngồi, có output nhìn được, và nếu bỏ đi thì không kéo cả việc sập theo.

Prompt dùng ngay:

Split this into 2-4 stages.
Each stage must produce output I can inspect.
After stage 1, stop and report:
- what changed
- what I should check
- whether you deviated from the original plan

Kết quả đúng: bạn không cần đọc toàn bộ cuối cùng mới biết nó sai. Bạn bắt được lệch ở chặng gần nhất.

04Cổng 3: kiểm tác động trước khi đổi đồ chung

Đồ chung là mọi thứ người khác đang dựa vào: tên field, chữ ký hàm, schema, API, config, format file, route, template, prompt nền. Agent có thể nhìn thấy file trước mặt mà không thấy hết nơi đang phụ thuộc vào nó.

Trước khi đổi đồ chung, bắt nó vẽ bán kính ảnh hưởng. Không cần diễn văn. Cần danh sách cụ thể.

Prompt dùng ngay:

Before changing this, list what depends on it:
- files/functions/routes/templates that call or read it
- data shapes or formats affected
- tests or smokes to run afterward

If you're not sure you found everything, say exactly where you're unsure.

Kết quả đúng: nếu nó đổi một ranh giới, nó cũng đổi hoặc kiểm những nơi phụ thuộc vào ranh giới đó.

05Cổng 4: chỉ tin "xong" khi có bằng chứng

"Done" là lời khai, không phải bằng chứng. Agent có thể nói rất tự tin dù chưa chạy lệnh, chưa mở trang, chưa kiểm output. Câu nguy hiểm nhất thường không phải "tôi không biết", mà là "việc này nên chạy được".

Prompt dùng ngay:

Before calling this done, show real evidence:
- command/test/smoke you ran
- key output
- if you couldn't run it, say why and what remains unverified

Kết quả đúng: bạn nhìn thấy bằng chứng ngoài lời kể của agent. Không có bằng chứng thì trạng thái không phải "xong"; chỉ là "đã sửa".

06Khi nào đừng dùng đủ bốn cổng

Đừng biến mọi việc nhỏ thành quy trình nặng. Nếu output dùng để tham khảo, dễ bỏ, hoặc bạn có thể kiểm trong vài giây, dùng một cổng là đủ: thường là verify. Nếu việc sáng tạo cần nhiều phương án, đừng bắt plan quá cứng từ đầu; hãy để nó phân kỳ trước, rồi đặt cổng khi bắt đầu chọn hướng thật.

Điểm chính không phải lúc nào cũng dùng đủ bốn. Điểm chính là biết cổng nào khớp với rủi ro nào:

Rủi ro hiểu sai → plan gate.
Rủi ro đi lạc giữa chừng → checkpoint.
Rủi ro làm vỡ chỗ khác → impact gate.
Rủi ro báo xong giả → verify gate.

07Cái khung đáng giá hơn cái model

Bốn cổng này không làm bạn chậm. Cái làm bạn chậm là hậu quả của việc không có chúng: agent làm bậy một lần, bạn mất lòng tin, rồi từ đó phải soi từng dòng nó viết. Tốc độ vừa mua được bốc hơi vì bạn không còn dám giao nữa.

Chen vào lúc này ~30 giây

Dọn dẹp nếu bỏ qua một buổi chiều · một cú gọi 2h sáng

Cái rẻ là dừng đúng lúc. Cái đắt là dọn sau khi agent đã chạy xa qua chỗ sai.

Model càng mạnh, bốn cổng càng quan trọng. Không phải vì model mạnh thì nguy hiểm hơn theo nghĩa xấu; mà vì khi nó đi sai, nó đi rất nhanh và rất thuyết phục. Một agent giỏi không cần bạn ngồi cạnh từng bước. Nó cần một hệ thống nhỏ buộc nó dừng ở đúng chỗ.

Vậy lần tới đừng mở đầu bằng "làm giúp tôi cái này" rồi hy vọng. Mở đầu bằng: plan rồi dừng. Từ đó, bạn không còn giao việc bằng niềm tin; bạn giao việc bằng một đường chạy có cổng.

Bốn cánh cổng, mỗi cái xứng đáng một bài riêng: Cổng 1 — chặn, đừng chỉ hỏi · Cổng 2 — chia chặng & checkpoint · Cổng 3 — đọc bán kính ảnh hưởng · Cổng 4 — "Done!" chỉ là lời khai.

Bốn cổng kiểm soát để agent ship việc thật

01Khi nào dùng bốn cổng này

02Cổng 1: bắt nó plan rồi dừng

03Cổng 2: chia việc thành checkpoint

04Cổng 3: kiểm tác động trước khi đổi đồ chung

05Cổng 4: chỉ tin "xong" khi có bằng chứng

06Khi nào đừng dùng đủ bốn cổng

07Cái khung đáng giá hơn cái model

Đây là bài đầu cụm

Đừng hỏi agent kế hoạch — hãy chặn nó lại

01Khi nào dùng bốn cổng này

02Cổng 1: bắt nó plan rồi dừng

03Cổng 2: chia việc thành checkpoint

04Cổng 3: kiểm tác động trước khi đổi đồ chung

05Cổng 4: chỉ tin "xong" khi có bằng chứng

06Khi nào đừng dùng đủ bốn cổng

07Cái khung đáng giá hơn cái model

Đây là bài đầu cụm

Đừng hỏi agent kế hoạch — hãy chặn nó lại

Nhận bài mới qua email