Bạn mở bill API cuối tháng và thấy con số cao hơn kỳ vọng rất nhiều. Trong khi bạn chỉ nghĩ mình chat với bot vài chục lần.
Chuyện gì đã xảy ra?
Câu trả lời nằm trong cơ chế hoạt động bên trong của Clawdbot — và khi bạn hiểu nó, bạn sẽ không muốn chạy bot mà không có visibility nữa.
Sự Thông Minh Của Clawdbot Đến Từ Đâu?
Clawdbot không "nhớ" theo nghĩa thông thường. Nó thông minh vì context injection — mỗi lần gọi API, toàn bộ workspace files được nạp vào prompt:
- SOUL: Personality, behavior rules, cách bot phản hồi
- USER: Thông tin cá nhân hóa — sở thích, lịch sử, ngữ cảnh của bạn
- MEMORY: Các ghi chú và insight tích lũy theo thời gian
- TASKS, CALENDAR, HABITS...: Các module khác tùy cấu hình
Kết quả? Bot hoạt động như thể nó "biết" bạn. Nhưng về mặt kỹ thuật, nó chỉ đang đọc lại toàn bộ hồ sơ của bạn trong mỗi lần bạn chat.
Mỗi API call = load toàn bộ workspace vào context window. Bạn đang trả tiền để bot đọc, không phải để bot viết.
Đây chính là lý do tỷ lệ token input:output có thể đạt 232:1 — nghĩa là với mỗi 232 token bạn gửi vào (context + câu hỏi), bot chỉ cần viết ra 1 token. Và input tokens lại được tính phí.
3 Cơ Chế Chi Phí Ngầm Bạn Cần Biết
Hầu hết mọi người nghĩ chi phí AI = độ dài câu trả lời. Thực tế ngược lại:
Ví dụ thực tế từ production:
- Input tokens: 23,200
- Output tokens: 100
- Tỷ lệ: 232:1
→ Một câu trả lời ngắn vẫn tốn nhiều vì phần ĐỌC context mới là khoản chi lớn
Workspace càng phình to → mỗi call càng đắt → tỷ lệ càng tệ hơn. Đây là vòng lặp tự khuếch đại.
2. Heartbeat — Kẻ Ngốn Tiền Thầm Lặng
Clawdbot có cơ chế heartbeat: cứ mỗi 30 phút, bot tự kích hoạt để kiểm tra tasks, review trạng thái, và cập nhật lịch.
Vấn đề? Mỗi heartbeat call đều:
- Load toàn bộ workspace vào context
- Xử lý hàng nghìn input tokens
- Trả về...
HEARTBEAT_OK
Kết quả thực tế: 80%+ số lần gọi API của bạn là heartbeat — những call bạn không bao giờ nhìn thấy kết quả, nhưng vẫn trả tiền đầy đủ.
Trong 24 giờ: 48 heartbeat calls. Nếu mỗi call tốn $0.02 → $0.96/ngày → $28.8/tháng chỉ từ heartbeat, chưa kể bạn thực sự chat.
3. Vòng Xoáy Chi Phí
Đây là cơ chế nguy hiểm nhất, và ít ai để ý:
Bạn dùng Clawdbot nhiều hơn
↓
Bot học, lưu thêm thông tin vào workspace (MEMORY, USER profile...)
↓
Workspace files phình to hơn
↓
Mỗi API call (kể cả heartbeat) phải load nhiều token hơn
↓
Chi phí mỗi call tăng
↓
Bạn tiếp tục dùng...
Không có gì sai về mặt tính năng — đây chính xác là cách Clawdbot trở nên thông minh hơn theo thời gian. Nhưng nếu không theo dõi, bạn chỉ biết khi nhận bill.
Và Clawdbot không có dashboard mặc định.
Giải Pháp: Build Dashboard /billing Trong 5 Phút
Để có visibility, mình build một billing skill cho Clawdbot. Gõ /billing trên Telegram, thấy ngay toàn bộ bức tranh chi phí.
Cài Đặt
git clone https://github.com/sherlock-126/clawdbot-billing-skill
Làm theo hướng dẫn trong repo, sau đó restart Clawdbot. Toàn bộ quá trình dưới 5 phút.
Giải Thích Các Chỉ Số
📊 Cost & Turns
- Tổng chi phí USD trong kỳ + tổng số API calls
- Baseline để so sánh tuần này với tuần trước, tháng này với tháng trước
💬 Avg/user turn
- Chi phí trung bình mỗi lần chat thực sự (đã loại heartbeat khỏi tính toán)
- Cho bạn biết mỗi cuộc hội thoại thực sự tốn bao nhiêu — không bị heartbeat làm nhiễu
⚡ Productive vs Heartbeat
- Phần trăm calls là chat thực sự vs heartbeat tự động
- Heartbeat thường chiếm 80%+ tổng calls
- Nếu con số này quá cao → bạn đang trả tiền cho bot ngồi chờ nhiều hơn làm việc
📈 Token In/Out Ratio
- Tổng input tokens vs output tokens với tỷ lệ thực tế (vd: 232:1)
- Theo dõi chỉ số này theo thời gian — tăng đột biến = workspace đang phình nhanh
💾 Cache Hit Rate
- Phần trăm token tiết kiệm được nhờ prompt caching
- Mục tiêu: 60%+ là tốt
- Thấp = cấu hình caching chưa optimal, hoặc workspace thay đổi quá thường xuyên
🔥 Top Sessions
- Danh sách sessions tiêu tốn nhiều tiền nhất
- Dùng để pinpoint task hoặc workflow nào đang có vấn đề về efficiency
Đọc Dashboard Như Thế Nào?
Giả sử dashboard của bạn hiển thị:
Total cost: $12.40 (30 ngày)
Productive calls: 18%
Heartbeat calls: 82%
Token ratio: 287:1
Cache hit: 34%
Top session: "daily_review" — $0.89/ngày
Diễn giải thực tế:
- 82% heartbeat → ~$10 trong $12.40 là bot tự check việc, không phải bạn chat. Cân nhắc tăng interval lên 60-120 phút.
- Ratio 287:1 → Workspace đã khá phình. Nên trim MEMORY entries cũ.
- Cache hit 34% → Còn nhiều room để cải thiện. Kiểm tra SOUL file có bị thay đổi thường xuyên không.
- daily_review $0.89/ngày → $26.7/tháng chỉ cho một workflow. Đáng để review và optimize.
Tối Ưu Sau Khi Có Dashboard
Khi đã có số liệu, đây là các bước thực chiến:
Giảm Workspace Bloat
- Review MEMORY file định kỳ — xóa entries không còn relevant
- Cấu hình auto-summarize thay vì append không giới hạn
- MEMORY của bạn nên là "intelligence", không phải "log file"
Điều Chỉnh Heartbeat
- Tăng interval từ 30 phút lên 60-120 phút nếu không cần real-time tracking
- Tắt hoàn toàn trong giờ ngủ (ví dụ: 23:00-07:00)
- Một heartbeat mỗi giờ thay vì 30 phút = tiết kiệm 50% heartbeat cost
Cải Thiện Cache Hit Rate
- Giữ SOUL file ổn định — thay đổi thường xuyên invalidate cache
- Mark các workspace files ít thay đổi để cache lâu hơn
- Mục tiêu: cache hit trên 60% = tiết kiệm đáng kể
Monitor Top Sessions
- Một session ngốn tiền bất thường → review workflow đó
- Tách task phức tạp thành nhiều bước nhỏ hơn
- Xem xét có nên dùng model nhỏ hơn/rẻ hơn cho một số task không
Kết Luận
Clawdbot là một trong những AI assistant mạnh nhất vì nó thực sự hiểu context của bạn — nhưng đó cũng là lý do chi phí có thể vượt kỳ vọng nếu không theo dõi.
Dashboard /billing không phải để làm bạn sợ dùng AI. Nó để bạn biết mình đang trả tiền cho cái gì, từ đó tối ưu hợp lý thay vì cắt giảm mù quáng — hoặc ngạc nhiên với bill cuối tháng.
Repo: github.com/sherlock-126/clawdbot-billing-skill
Cài đặt mất dưới 5 phút. Sau lần đầu gõ /billing, bạn sẽ không bao giờ muốn chạy Clawdbot mà không có nó nữa.
Muốn hiểu sâu hơn về cách AI agent quản lý bộ nhớ và context? Xem kiến trúc bộ nhớ 3 lớp của AI agent và cách Human-in-the-Loop giúp bạn kiểm soát agent tốt hơn.