Mọi cuộc trò chuyện với AI hiện nay thường kết thúc trong sự thất vọng: Sau 40 phút giải thích ngữ cảnh, phong cách và mục tiêu, mô hình bắt đầu “quên” và quay lại giọng văn máy móc như một bản thông cáo báo chí.
Vấn đề không nằm ở AI, mà nằm ở cách chúng ta cung cấp thông tin. Chào mừng bạn đến với kỷ nguyên của Context Engineering và khái niệm Personal Brain OS – một hệ thống giúp AI Agent thực sự sở hữu “bộ não” của bạn.
1. Từ Prompt Engineering đến Context Engineering
Trong giới AI tự trị (Autonomous Agents), chúng ta đang chứng kiến một sự dịch chuyển quan trọng: Context (Ngữ cảnh) quan trọng hơn Prompt (Câu lệnh).
Hầu hết người dùng cố gắng viết những câu prompt thật dài, nhưng LLM có “ngân sách chú ý” (Attention Budget) hữu hạn. Khi bạn nhồi nhét quá nhiều vào System Prompt, hiệu suất của mô hình sẽ giảm sút do hiện tượng “Lost in the Middle” (Mất tập trung ở giữa).
Key Takeaway: Agentic AI không cần một câu lệnh hoàn hảo; nó cần một cấu trúc thông tin hoàn hảo để tự đưa ra quyết định.
2. Cấu trúc Personal Brain OS: “Hệ điều hành” dựa trên File
Thay vì dùng Database phức tạp hay Vector Store (RAG truyền thống), Personal Brain OS sử dụng hệ thống file phẳng (Flat files) được quản lý bằng Git.
Kiến trúc Progressive Disclosure (Tiết lộ dần)
Để tối ưu hóa cửa sổ ngữ cảnh, hệ thống được chia thành 3 cấp độ tải dữ liệu:
- Cấp 1 – Routing (Định tuyến): File
SKILL.mdđóng vai trò như cảnh sát giao thông, chỉ dẫn AI biết nhiệm vụ này thuộc module nào (Nội dung, Quan hệ, hay Vận hành). - Cấp 2 – Instructions (Hướng dẫn Module): Chỉ load các quy tắc riêng biệt cho lĩnh vực đó (Ví dụ: Các từ cấm dùng khi viết blog).
- Cấp 3 – Data (Dữ liệu cụ thể): Chỉ truy xuất các dòng dữ liệu cần thiết từ file JSONL hoặc YAML.
3. Tại sao nên dùng JSONL, YAML và Markdown?
Việc chọn định dạng file là một quyết định chiến lược trong điều phối LLM:
- JSONL (JSON Lines): Hoàn hảo cho Logs và Memory. AI có thể đọc từng dòng (stream) mà không cần parse toàn bộ file nặng nề. Đặc biệt, tính chất append-only giúp ngăn chặn việc AI vô tình ghi đè dữ liệu lịch sử.
- YAML: Dùng cho Configuration (Cấu hình). YAML dễ đọc cho cả người và máy, hỗ trợ comment để bạn giải thích cho AI tại sao một cài đặt lại quan trọng.
- Markdown: Dành cho nội dung kể chuyện và hướng dẫn giọng văn (Voice Guide).
4. Agentic AI vs. Chatbot truyền thống
Sự khác biệt cốt lõi nằm ở Autonomy (Tính tự trị) và Reasoning Loops (Vòng lặp suy luận).
| Tính năng | Chatbot truyền thống | Agentic AI (Personal OS) |
| Lưu trữ | Không có hoặc dựa vào Session | Bộ nhớ dài hạn (Git/JSONL) |
| Xử lý ngữ cảnh | Nhập thủ công mỗi lần | Tự động truy xuất (Context Engineering) |
| Hành động | Chỉ trả lời văn bản | Sử dụng công cụ (Tool-use), tự thực hiện workflow |
| Kiến trúc | Đơn luồng | Đa tầng (Routing -> Module -> Data) |
5. Hệ thống Kỹ năng và Giọng văn (Agent Skills)
Để AI viết giống bạn, đừng chỉ dùng tính từ mơ hồ như “chuyên nghiệp”. Hãy mã hóa nó:
- Chỉ số hóa phong cách: Đánh giá giọng văn trên thang điểm 1-10 (Ví dụ: Technical: 7/10, Playful: 4/10).
- Anti-patterns: Danh sách 50+ từ bị cấm và các lỗi cấu trúc (như lạm dụng dấu gạch ngang).
- Episodic Memory (Bộ nhớ sự kiện): Lưu lại cả những thất bại (
failures.jsonl) và các quyết định quan trọng (decisions.jsonl). Khi AI đối mặt với tình huống tương tự, nó sẽ tra cứu xem bạn đã từng giải quyết thế nào.
6. Lời kết: Tương lai của AI tự trị
Xây dựng một Personal Brain OS không phải là lập trình phần mềm, mà là thiết kế kiến trúc thông tin. Đây chính là cách bạn biến một AI “trợ giúp chung chung” thành một trợ lý chuyên sâu, hiểu rõ từng chân tơ kẽ tóc trong công việc và tư duy của bạn.
Bài viết tham khảo dựa trên các bài viết của Muratcan Koylan – Context Engineer tại Sully.ai, nơi anh thiết kế hệ thống context engineering cho AI y tế. Công việc open-source về context engineering của anh (hơn 8.000 sao GitHub) được trích dẫn trong nghiên cứu học thuật cùng với Anthropic. Trước đó là AI Agent Systems Manager tại 99Ravens AI.Framework: Agent Skills for Context Engineering
