3 cấp độ AI cần lưu ý
Từ các mô hình ngôn ngữ lớn (LLM) cơ bản đến quy trình làm việc AI (AI workflows) và cuối cùng là tác nhân AI
1. Mô hình Ngôn ngữ Lớn (LLM)
Khái niệm: Các chatbot phổ biến như ChatGPT, Google Gemini, Claude là ứng dụng được xây dựng trên LLM. Chúng xuất sắc trong việc tạo và chỉnh sửa văn bản.
Cách hoạt động: Bạn cung cấp đầu vào (prompt), LLM tạo ra đầu ra dựa trên dữ liệu đã được huấn luyện.
Hạn chế:
Kiến thức hạn chế: LLM không có quyền truy cập vào thông tin độc quyền (ví dụ: lịch cá nhân, dữ liệu nội bộ công ty).
Thụ động: Chúng chỉ phản hồi khi có prompt từ người dùng.
2. Quy trình làm việc AI (AI Workflows)
Khái niệm: Để khắc phục hạn chế của LLM, chúng ta có thể tạo ra các quy trình làm việc AI. Điều này có nghĩa là con người hướng dẫn LLM thực hiện các bước cụ thể, thường bao gồm việc truy cập các công cụ bên ngoài.
Ví dụ: Nếu bạn muốn LLM biết lịch hẹn, bạn có thể thiết lập một quy trình để nó tìm kiếm thông tin từ Google Calendar trước khi trả lời.
Đặc điểm chính:
Đường dẫn được xác định trước: LLM chỉ có thể tuân theo các đường dẫn (logic điều khiển) do con người thiết lập.
Con người là người ra quyết định: Dù có bao nhiêu bước, nếu con người vẫn là người đưa ra quyết định cuối cùng, đó vẫn là một quy trình làm việc AI.
Mẹo: "Retrieval Augmented Generation" (RAG) là một loại quy trình làm việc AI, giúp mô hình AI tìm kiếm thông tin trước khi trả lời (ví dụ: truy cập lịch hoặc dịch vụ thời tiết).
Ví dụ thực tế: Một quy trình làm việc có thể tự động tổng hợp tin tức từ Google Sheets, tóm tắt bằng Perplexity, sau đó tạo bài đăng LinkedIn/Instagram bằng Claude và lên lịch đăng bài. Con người vẫn phải điều chỉnh prompt nếu kết quả không như ý.
3. Tác nhân AI (AI Agents)
Khái niệm: Điểm khác biệt lớn nhất giữa quy trình làm việc AI và tác nhân AI là LLM trở thành người ra quyết định, thay thế con người.
Đặc điểm chính:
Lý luận (Reason): Tác nhân AI phải có khả năng suy nghĩ về cách tốt nhất để đạt được mục tiêu (ví dụ: cách hiệu quả nhất để tổng hợp tin tức).
Hành động (Act): Tác nhân AI phải có khả năng thực hiện các hành động thông qua các công cụ (ví dụ: sử dụng Google Sheets để tổng hợp liên kết, Perplexity để tóm tắt).
Lặp lại (Iterate): Tác nhân AI có thể tự động lặp lại và cải thiện kết quả của mình. Ví dụ, nó có thể tự đánh giá một bài đăng LinkedIn và điều chỉnh cho đến khi đạt được tiêu chí mong muốn.
Mẹo chuyên nghiệp: Cấu hình phổ biến nhất cho tác nhân AI là khung "React" (Reason và Act).
Ví dụ thực tế: Một tác nhân AI có thể được giao nhiệm vụ tìm kiếm "skier" trong video. Nó sẽ tự lý luận (skier trông như thế nào), sau đó hành động (quét các clip video, xác định, lập chỉ mục) và trả về kết quả mà không cần con người gắn thẻ thủ công.
Tổng hợp nhanh các cấp độ AI:
Cấp độ 1 (LLM): Bạn cung cấp đầu vào, LLM phản hồi đầu ra.
Cấp độ 2 (Quy trình làm việc AI): Bạn cung cấp đầu vào và hướng dẫn LLM theo một đường dẫn được xác định trước, có thể liên quan đến việc truy xuất thông tin từ các công cụ bên ngoài. Con người lập trình đường dẫn.
Cấp độ 3 (Tác nhân AI): Bạn cung cấp mục tiêu, LLM tự lý luận, hành động bằng công cụ, quan sát kết quả, lặp lại nếu cần và tạo ra đầu ra cuối cùng. LLM là người ra quyết định trong quy trình làm việc.