Bạn dán hai trăm dòng log vào và nhờ agent "đếm xem có bao nhiêu lỗi 500". Nó đọc, suy nghĩ một lúc, rồi đáp "khoảng 14". Khoảng. Một việc chỉ có đúng một con số đáp án, mà bạn nhận về một phỏng đoán — tốn token để mua một câu trả lời kém chính xác hơn grep " 500 " | wc -l.
Đây là loại việc bị giao nhầm nhiều nhất, và sửa nó tiết kiệm nhiều nhất. Một dòng lệnh đếm chính xác, tức thì, 0 token — và không bao giờ "khoảng".
01Ba dấu hiệu đây là việc của script
Đếm, tổng, lọc theo điều kiện rõ. Chỉ một kết quả đúng — và máy cho ra nó chắc chắn hơn một phỏng đoán.
Việc bạn sẽ làm mười lần với mười input khác nhau. Viết một lần thành script, chạy mãi — đừng gõ lại lời nhờ mỗi lần.
Đổi định dạng, tách cột, gom theo khoá. Chỉ là biến đổi dữ liệu — không cần ai "hiểu" nó nói gì.
Đủ một trong ba dấu hiệu là gần như chắc: đẩy cho script. Đủ cả ba thì khỏi nghĩ.
02Đừng để "tiện" che mất "phí"
Cái bẫy là agent làm được mấy việc đó, và làm ngay trong khung chat đang mở — nên đẩy cho nó tiện hơn mở terminal viết lệnh. Nhưng "tiện một lần" giấu đi cái giá thật: lần nào cũng tốn token, lần nào cũng có thể sai lệch, và bạn không bao giờ có một công cụ tái dùng — chỉ có một chuỗi lời nhờ gõ lại mãi.
Mẹo phân định cho nhanh: hỏi "việc này có cần hiểu, hay chỉ cần tính?". Cần hiểu — nghĩa, ý, ngữ cảnh, đánh đổi — thì đó là việc của AI, để nó lên bàn. Chỉ cần tính — ra một kết quả xác định từ input — thì đó là việc của một dòng lệnh. Và mỗi việc-tính bạn đẩy đi là một khoảng trống trên bàn trả lại cho việc-hiểu, thứ duy nhất đáng để agent bận tâm.