Làm thế nào để tôi đảm bảo sự thành công của dự án trợ lý AI của mình?

Để đảm bảo sự thành công của dự án trợ lý AI, hãy xác định rõ ràng công việc chỉ bằng một câu và quyết định mức độ tự chủ mà bạn cảm thấy thoải mái. Ngoài ra, hãy triển khai các lược đồ công cụ, ghi nhật ký và xác thực nghiêm ngặt để ngăn ngừa các lỗi thường gặp và cho phép khắc phục sự cố tốt hơn.

Tôi cần cân nhắc những gì khi thiết kế các công cụ cho trợ lý AI của mình?

Khi thiết kế công cụ cho tác nhân AI của bạn, hãy đảm bảo chúng có phạm vi chức năng hẹp, được phân loại rõ ràng và có quyền truy cập cụ thể. Tránh các công cụ chung chung có thể thực hiện bất kỳ hành động nào. Thay vào đó, hãy tạo các lệnh gọi hàm cụ thể mà tác nhân có thể sử dụng để duy trì tính an toàn và độ tin cậy.

Làm thế nào để thiết lập các điều kiện dừng rõ ràng cho tác nhân AI của tôi?

Để thiết lập các điều kiện dừng rõ ràng cho tác nhân AI của bạn, hãy xác định số bước tối đa mà nó có thể thực hiện, cùng với thời gian chờ và kiểm tra hoàn thành. Điều này sẽ giúp ngăn tác nhân bị kẹt trong vòng lặp và đảm bảo nó có thể chuyển tiếp các vấn đề khi cần thiết.

Cách tốt nhất để quản lý bộ nhớ trong một tác nhân AI là gì?

Quản lý bộ nhớ trong trợ lý AI của bạn bằng cách phân chia nó thành các thành phần ngắn hạn và dài hạn. Giữ bộ nhớ ngắn hạn gọn nhẹ, tập trung vào các bước và kế hoạch hiện tại, trong khi sử dụng bộ nhớ dài hạn cho các thông tin ổn định như tùy chọn người dùng và các quy tắc tổ chức.

Liệu có những quy luật cụ thể nào trong việc lập kế hoạch nhiệm vụ đối với một tác nhân AI?

Đúng vậy, có thể sử dụng nhiều mô hình lập kế hoạch khác nhau, chẳng hạn như danh sách kiểm tra cho các nhiệm vụ có thể dự đoán được, vòng lặp ReAct để phản hồi thích ứng với đầu ra của công cụ và mô hình giám sát-nhân viên cho phép phân tách vai trò đối với các dự án phức tạp. Hãy chọn phương pháp lập kế hoạch dựa trên các yêu cầu cụ thể của nhân viên bạn.

Làm thế nào tôi có thể đánh giá hiệu quả hoạt động của trợ lý AI của mình?

Để đánh giá hiệu suất của tác nhân AI, hãy tạo một bộ kịch bản bao gồm các trường hợp thành công, trường hợp ngoại lệ và yêu cầu không rõ ràng. Chấm điểm kết quả dựa trên các chỉ số như tỷ lệ hoàn thành nhiệm vụ, thời gian phản hồi và khả năng phục hồi sau lỗi để liên tục cải thiện khả năng của nó.

Cách xây dựng một tác nhân AI

Câu trả lời ngắn gọn: Để xây dựng một tác nhân AI hoạt động hiệu quả trong thực tế, hãy coi nó như một vòng lặp được kiểm soát: nhận đầu vào, quyết định hành động tiếp theo, gọi một công cụ có phạm vi giới hạn, quan sát kết quả và lặp lại cho đến khi vượt qua kiểm tra "hoàn thành" rõ ràng. Nó phát huy tác dụng khi nhiệm vụ có nhiều bước và được điều khiển bởi công cụ; nếu chỉ cần một thao tác đơn giản là giải quyết được vấn đề, hãy bỏ qua tác nhân. Thêm các lược đồ công cụ nghiêm ngặt, giới hạn bước, ghi nhật ký và bộ xác thực/phê bình để khi các công cụ thất bại hoặc đầu vào không rõ ràng, tác nhân sẽ leo thang thay vì lặp lại.

Những điểm chính cần ghi nhớ:

Vòng lặp điều khiển: Thực hiện chu trình lặp lại đầu vào → hành động → quan sát với các điều kiện dừng rõ ràng và số bước tối đa.

Thiết kế công cụ: Giữ cho các công cụ có phạm vi hẹp, được phân loại rõ ràng, có quyền truy cập và được kiểm tra tính hợp lệ để tránh tình trạng hỗn loạn "làm bất cứ điều gì".

Vệ sinh bộ nhớ: Sử dụng trạng thái nhớ ngắn hạn cô đọng kết hợp với khả năng truy xuất nhớ dài hạn; tránh lưu trữ toàn bộ bản ghi.

Khả năng chống lạm dụng: Thêm danh sách cho phép, giới hạn tỷ lệ, tính bất biến và "chạy thử" cho các hành động rủi ro.

Khả năng kiểm thử: Duy trì một bộ kịch bản (lỗi, sự mơ hồ, tấn công chèn) và chạy lại mỗi khi có thay đổi.

Làm thế nào để xây dựng một tác nhân AI? (Infographic)

Những bài viết bạn có thể muốn đọc sau bài này:

🔗 Cách đo lường hiệu suất AI
Tìm hiểu các chỉ số thực tiễn để đánh giá tốc độ, độ chính xác và độ tin cậy.

🔗 Cách nói chuyện với AI
Hãy sử dụng gợi ý, ngữ cảnh và các câu hỏi tiếp theo để nhận được câu trả lời tốt hơn.

🔗 Cách đánh giá các mô hình AI
So sánh các mô hình bằng cách sử dụng các bài kiểm tra, tiêu chí đánh giá và kết quả thực tế của nhiệm vụ.

🔗 Cách tối ưu hóa mô hình AI
Nâng cao chất lượng và giảm chi phí thông qua việc tinh chỉnh, cắt tỉa và giám sát.

1) Theo cách hiểu của người bình thường, trí tuệ nhân tạo (AI) là gì? 🧠

Một tác nhân AI là một vòng lặp. Tài liệu về “Tác nhân” của LangChain.

Vậy thôi. Một vòng lặp với bộ não ở giữa.

Đầu vào → suy nghĩ → hành động → quan sát → lặp lại. Bài tập ReAct (lý luận + hành động)

Ở đâu:

Đầu vào là yêu cầu của người dùng hoặc một sự kiện (email mới, phiếu hỗ trợ, tín hiệu từ cảm biến).
Think là một mô hình ngôn ngữ suy luận về bước tiếp theo.
Act đang gọi một công cụ (tìm kiếm tài liệu nội bộ, chạy mã, tạo phiếu yêu cầu, soạn thảo phản hồi). Hướng dẫn gọi hàm OpenAI
Chức năng "Quan sát" đang đọc dữ liệu đầu ra của công cụ.
Sự lặp lại chính là yếu tố tạo nên cảm giác "có tính chủ động" thay vì "chỉ là lời nói suông". Tài liệu về "Agents" của LangChain.

Một số tác nhân về cơ bản là các macro thông minh. Những tác nhân khác hoạt động giống như một người vận hành cấp dưới, có khả năng xử lý nhiều nhiệm vụ và khắc phục lỗi. Cả hai đều được tính.

Ngoài ra, bạn không cần quyền tự chủ hoàn toàn. Trên thực tế… có lẽ bạn cũng không muốn điều đó 🙃

2) Khi nào bạn nên xây dựng một tác nhân (và khi nào không nên) 🚦

Xây dựng một tác nhân khi:

Công việc này gồm nhiều bước và thay đổi tùy thuộc vào những gì xảy ra trong quá trình thực hiện.
Công việc này đòi hỏi sử dụng các công cụ (cơ sở dữ liệu, CRM, thực thi mã, tạo tập tin, trình duyệt, API nội bộ). Tài liệu “Công cụ” của LangChain.
Bạn muốn có được kết quả lặp lại với các biện pháp kiểm soát, chứ không chỉ là những câu trả lời đơn lẻ.
Bạn có thể định nghĩa "hoàn thành" theo cách mà máy tính có thể kiểm tra được, dù chỉ là một cách tương đối.

Không nên tạo tác nhân khi:

Một câu hỏi và câu trả lời đơn giản sẽ giải quyết vấn đề (đừng làm quá phức tạp, bạn sẽ hối hận sau này).
Bạn cần tính tất định hoàn hảo (các tác nhân có thể nhất quán ở mức độ nào đó, nhưng không được giống robot).
Nếu bạn không có công cụ hay dữ liệu nào để kết nối, thì chủ yếu chỉ là cảm nhận bằng trực giác.

Thẳng thắn mà nói: một nửa số "dự án tác nhân AI" có thể chỉ là một quy trình làm việc với một vài quy tắc phân nhánh. Nhưng mà, đôi khi cảm giác cũng quan trọng đấy chứ 🤷♂️

3) Điều gì tạo nên một phiên bản tốt của tác nhân AI? ✅

Đây là phần "Điều gì tạo nên một phiên bản hay" mà bạn yêu cầu, nhưng tôi sẽ nói thẳng thắn một chút:

Một phiên bản tốt của trí tuệ nhân tạo không phải phiên bản suy nghĩ nhiều nhất. Mà là phiên bản:

Biết rõ những gì mình được phép làm (giới hạn phạm vi).
Sử dụng các công cụ một cách đáng tin cậy (các cuộc gọi có cấu trúc, thử lại, thời gian chờ) Hướng dẫn gọi hàm OpenAI AWS “Thời gian chờ, thử lại và lùi lại với độ trễ”
Giữ trạng thái sạch sẽ (bộ nhớ không bị hỏng) LangChain “Tổng quan về bộ nhớ”
Giải thích các hoạt động của nó (dấu vết kiểm toán, không phải là các thông tin lý giải bí mật) NIST AI RMF 1.0 (độ tin cậy và tính minh bạch)
Dừng lại một cách thích hợp (kiểm tra hoàn thành, số bước tối đa, leo thang) Tài liệu về “Agents” của LangChain
Thất bại một cách an toàn (yêu cầu trợ giúp, không ảo tưởng về quyền lực) NIST AI RMF 1.0
Có thể kiểm thử (bạn có thể chạy nó với các kịch bản có sẵn và chấm điểm kết quả)

Nếu không thể kiểm tra được người đại diện của bạn, về cơ bản đó chỉ là một máy đánh bạc rất tự tin. Vui vẻ ở các bữa tiệc, nhưng đáng sợ khi sử dụng trong thực tế 😬

4) Các khối cấu tạo cốt lõi của một tác nhân (còn gọi là “cấu trúc giải phẫu” 🧩)

Hầu hết các chuyên viên giỏi đều có những yếu tố này:

A) Vòng lặp điều khiển 🔁

Đây là người điều phối:

ghi bàn
hỏi mô hình về hành động tiếp theo
chạy công cụ
thêm quan sát
Lặp lại cho đến khi hoàn tất. Tài liệu về “Agents” của LangChain.

B) Công cụ (hay còn gọi là khả năng) 🧰

Công cụ là yếu tố giúp một tác nhân hoạt động hiệu quả: Tài liệu “Công cụ” của LangChain

truy vấn cơ sở dữ liệu
gửi email
đang tải các tệp
mã đang chạy
gọi các API nội bộ
ghi dữ liệu vào bảng tính hoặc hệ thống CRM

C) Bộ nhớ 🗃️

Có hai loại vấn đề:

Bộ nhớ ngắn hạn: bối cảnh hoạt động hiện tại, các bước gần đây, kế hoạch hiện tại
Bộ nhớ dài hạn: sở thích người dùng, bối cảnh dự án, kiến thức được truy xuất (thường thông qua các embedding + kho lưu trữ vector) Bài báo RAG

D) Chính sách lập kế hoạch và ra quyết định 🧭

Ngay cả khi bạn không gọi đó là "lập kế hoạch", bạn vẫn cần một phương pháp:

danh sách kiểm tra
Công cụ “suy nghĩ sau đó” theo phong cách ReAct (ReAct paper)
đồ thị nhiệm vụ
mô hình giám sát-nhân viên
Mô hình giám sát-nhân viên Microsoft AutoGen (khung đa tác nhân)

E) Lan can bảo vệ và đánh giá 🧯

quyền hạn
lược đồ công cụ an toàn Đầu ra có cấu trúc của OpenAI
xác thực đầu ra
giới hạn bước
ghi nhật ký
kiểm tra NIST AI RMF 1.0

Đúng vậy, nó thiên về kỹ thuật hơn là gợi ý. Và đó cũng chính là... mục đích.

5) Bảng so sánh: các cách phổ biến để xây dựng một tác nhân 🧾

Dưới đây là bảng so sánh thực tế - với một vài điểm khác biệt, vì các đội bóng thực sự đều có những điểm khác biệt riêng 😄

Công cụ / Khung	Khán giả	Giá	Lý do nó hiệu quả	Ghi chú (một mớ hỗn độn nhỏ)
LangChain	những người thích lắp ráp theo kiểu Lego	miễn phí + cơ sở hạ tầng	Hệ sinh thái lớn dành cho công cụ, bộ nhớ, chuỗi	Mọi thứ có thể trở nên rối tung như mì Ý nếu bạn không đặt tên mọi thứ rõ ràng
LlamaIndex	Các đội có nhiều RAG	miễn phí + cơ sở hạ tầng	các mẫu truy xuất mạnh mẽ, lập chỉ mục, các từ nối	Tuyệt vời khi người đại diện của bạn về cơ bản là "tìm kiếm + hành động"... điều này khá phổ biến
Cách tiếp cận theo phong cách Trợ lý OpenAI	các nhóm muốn thiết lập nhanh hơn	dựa trên mức sử dụng	các mẫu gọi công cụ tích hợp và trạng thái chạy	Ít linh hoạt hơn ở một số khía cạnh, nhưng gọn gàng đối với nhiều ứng dụng	OpenAI chạy API , gọi hàm của Trợ lý OpenAI.
Hạt nhân ngữ nghĩa	các nhà phát triển muốn có sự điều phối có cấu trúc	miễn phí	Sự trừu tượng hóa gọn gàng cho các kỹ năng/chức năng	Cảm giác "gọn gàng, ngăn nắp" - đôi khi đó là một lời khen 😉
Tự động tạo	các nhà thực nghiệm đa tác nhân	miễn phí	mô hình hợp tác giữa các tác nhân	có thể nói quá nhiều; đặt ra các quy tắc chấm dứt nghiêm ngặt
CrewAI	“các đội ngũ đặc vụ” người hâm mộ	miễn phí	Vai trò + nhiệm vụ + chuyển giao công việc rất dễ diễn đạt	Hiệu quả nhất khi nhiệm vụ được xác định rõ ràng, không mơ hồ
Đống cỏ khô	tìm kiếm + quy trình con người	miễn phí	đường ống rắn, thu hồi, linh kiện	Ít "kịch bản dàn dựng", mà thiên về "nhà máy thực tiễn" hơn
Tự cuốn (vòng tùy chỉnh)	những người thích kiểm soát (thân mật)	thời gian của bạn	Ít phép thuật, độ rõ nét tối đa	Thường thì đó là lựa chọn tốt nhất về lâu dài… cho đến khi bạn thay đổi hoàn toàn mọi thứ 😅

Không có người chiến thắng duy nhất. Sự lựa chọn tốt nhất phụ thuộc vào việc nhiệm vụ chính của tác nhân của bạn là truy xuất thông tin, thực thi công cụ, phối hợp nhiều tác nhânhay tự động hóa quy trình làm việc.

6) Hướng dẫn từng bước xây dựng một tác nhân AI (công thức thực tế) 🍳🤖

Đây là phần mà hầu hết mọi người thường bỏ qua, rồi sau đó lại thắc mắc tại sao nhân viên lại hành xử như một con gấu trúc trong kho thức ăn.

Bước 1: Mô tả công việc bằng một câu duy nhất 🎯

Ví dụ:

“Soạn thảo thư trả lời khách hàng dựa trên chính sách và ngữ cảnh của yêu cầu hỗ trợ, sau đó xin phê duyệt.”
“Hãy điều tra báo cáo lỗi, tái hiện lỗi và đề xuất giải pháp khắc phục.”
“Biến những ghi chú cuộc họp không hoàn hảo thành các nhiệm vụ, người chịu trách nhiệm và thời hạn hoàn thành.”

Nếu bạn không thể định nghĩa nó một cách đơn giản, thì người đại diện của bạn cũng không thể. Ý tôi là họ có thể, nhưng họ sẽ ứng biến, và sự ứng biến chính là nơi ngân sách bị lãng phí.

Bước 2: Quyết định mức độ tự chủ (thấp, trung bình, cao) 🌶️

Quyền tự chủ thấp: đề xuất các bước, người dùng nhấp vào "phê duyệt"
Mức độ trung bình: vận hành các công cụ, soạn thảo kết quả, báo cáo khi có vấn đề không chắc chắn.
Cao: thực thi từ đầu đến cuối, chỉ thông báo cho người dùng khi có ngoại lệ.

Hãy bắt đầu với mức thấp hơn mức bạn muốn. Bạn luôn có thể tăng mức cao hơn sau này.

Bước 3: Chọn chiến lược mô hình của bạn 🧠

Bạn thường chọn:

một mô hình mạnh mẽ cho mọi thứ (đơn giản)
một mô hình mạnh mẽ + một mô hình nhỏ hơn cho các bước chi phí thấp (phân loại, định tuyến)
các mô hình chuyên dụng (thị giác, mã hóa, giọng nói) nếu cần

Cũng hãy quyết định:

số mã thông báo tối đa
nhiệt độ
Liệu bạn có cho phép theo dõi chuỗi suy luận dài dòng bên trong hệ thống hay không (bạn có thể, nhưng đừng để lộ toàn bộ chuỗi suy nghĩ cho người dùng cuối)

Bước 4: Xác định các công cụ với lược đồ nghiêm ngặt 🔩

Các công cụ cần phải:

chật hẹp
đã gõ
được cho phép
Kết quả đầu ra có cấu trúc của OpenAI đã được xác thực

Thay vì một công cụ có tên là do_anything(input: string), hãy tạo:

search_kb(query: string) -> results[]
create_ticket(title: string, body: string, priority: enum) -> ticket_id
send_email(to: string, subject: string, body: string) -> status Hướng dẫn gọi hàm OpenAI

Nếu bạn đưa cho người môi giới một cái cưa máy, đừng ngạc nhiên khi nó cắt tỉa hàng rào đến mức làm hỏng cả hàng rào bên ngoài.

Bước 5: Xây dựng vòng lặp điều khiển 🔁

Vòng lặp tối thiểu:

Bắt đầu với mục tiêu + bối cảnh ban đầu
Hỏi người mẫu: “Bước tiếp theo là gì?”
Nếu gọi công cụ - hãy thực thi công cụ
Thêm quan sát
Kiểm tra điều kiện dừng
Lặp lại (với số bước tối đa) tài liệu “Agents” của LangChain

Thêm vào:

thời gian chờ
thử lại (cẩn thận - thử lại có thể lặp lại) AWS “Thời gian chờ, thử lại và lùi lại với độ trễ”
Định dạng lỗi công cụ (rõ ràng, có cấu trúc)

Bước 6: Thêm bộ nhớ cẩn thận 🗃️

Ngắn hạn: cập nhật nhanh chóng "bản tóm tắt trạng thái" ở mỗi bước. "Tổng quan bộ nhớ" của LangChain.
Dài hạn: lưu trữ các thông tin bền vững (tùy chọn người dùng, quy tắc tổ chức, tài liệu ổn định).

Nguyên tắc chung:

Nếu nó thay đổi thường xuyên - hãy giữ thời gian ngắn hạn
Nếu ổn định - có thể bảo quản lâu dài
Nếu đó là dữ liệu nhạy cảm, hãy lưu trữ ở mức tối thiểu (hoặc không lưu trữ)

Bước 7: Thêm bước xác thực và bước "phê bình" 🧪

Một mẫu thiết kế rẻ tiền và tiện dụng:

tác nhân tạo ra kết quả
Trình xác thực kiểm tra cấu trúc và các ràng buộc
Mô hình đánh giá tùy chọn dành cho nhà phê bình nhằm phát hiện các bước thiếu sót hoặc vi phạm chính sách NIST AI RMF 1.0

Không hoàn hảo, nhưng nó phát hiện ra một lượng lớn những điều vô lý.

Bước 8: Ghi lại tất cả những việc bạn sẽ hối tiếc nếu không ghi lại 📜

Nhật ký:

lệnh gọi công cụ + đầu vào + đầu ra
các quyết định được đưa ra
lỗi
kết quả cuối cùng
Mã thông báo và độ trễ: Giới thiệu về khả năng quan sát của OpenTelemetry

Bạn của tương lai sẽ cảm ơn bạn. Bạn của hiện tại sẽ quên. Cuộc sống là vậy đấy 😵💫

7) Công cụ gọi điện thoại không làm tổn thương tâm hồn bạn 🧰😵

Việc gọi công cụ chính là lúc "Cách xây dựng một tác nhân AI" trở thành kỹ thuật phần mềm thực thụ.

Hãy làm cho các công cụ trở nên đáng tin cậy (đáng tin cậy là tốt)

Các công cụ đáng tin cậy là:

xác định
phạm vi hẹp
dễ kiểm tra
Có thể chạy lại các "yêu cầu bất biến" của Stripe

Thêm các biện pháp bảo vệ ở cấp độ công cụ, chứ không chỉ là các lời nhắc

Các lời nhắc là những gợi ý lịch sự. Việc xác thực công cụ giống như một cánh cửa bị khóa. Đầu ra có cấu trúc của OpenAI.

LÀM:

danh sách cho phép (những công cụ nào được phép chạy)
xác thực đầu vào
truy cập OpenAI
kiểm tra quyền truy cập cho mỗi người dùng/tổ chức
“Chế độ diễn tập thử” cho các hành động rủi ro

Thiết kế cho trường hợp hỏng hóc một phần

Công cụ gặp sự cố. Mạng lưới chập chờn. Giấy phép xác thực hết hạn. Một tác nhân phải:

diễn giải lỗi
Thử lại với khoảng thời gian chờ khi thích hợp. Chiến lược thử lại của Google Cloud (khoảng thời gian chờ + độ trễ).
chọn các công cụ thay thế
leo thang khi bị mắc kẹt

Một thủ thuật hiệu quả mà ít người để ý: trả về các lỗi có cấu trúc như sau:

loại: lỗi xác thực
loại: không tìm thấy
type: rate_limited
Nhờ đó, mô hình có thể phản hồi một cách thông minh thay vì hoảng loạn.

8) Ký ức giúp ích thay vì ám ảnh bạn 👻🗂️

Bộ nhớ rất mạnh mẽ, nhưng nó cũng có thể trở thành một ngăn kéo chứa đồ linh tinh.

Trí nhớ ngắn hạn: hãy giữ cho nó gọn nhẹ

Sử dụng:

N bước cuối cùng
Bản tóm tắt liên tục (được cập nhật sau mỗi vòng lặp)
kế hoạch hiện tại
Các hạn chế hiện tại (ngân sách, thời gian, chính sách)

Nếu bạn đưa mọi thứ vào trong ngữ cảnh, bạn sẽ có:

chi phí cao hơn
độ trễ chậm hơn
Thêm sự nhầm lẫn (vâng, ngay cả khi đó)

Trí nhớ dài hạn: khả năng truy xuất thông tin quan trọng hơn là khả năng "nhồi nhét" thông tin

Phần lớn “trí nhớ dài hạn” giống với:

nhúng
kho lưu trữ vector
thế hệ tăng cường truy xuất (RAG) Bài báo RAG

Trình biên dịch không ghi nhớ. Nó truy xuất các đoạn mã phù hợp nhất trong quá trình thực thi. LlamaIndex “Giới thiệu về RAG”

Các quy tắc ghi nhớ thực tế

Lưu trữ "sở thích" dưới dạng các thông tin cụ thể: "Người dùng thích tóm tắt bằng gạch đầu dòng và ghét biểu tượng cảm xúc" (haha, nhưng không phải ở đây đâu 😄)
Lưu trữ các "quyết định" kèm theo dấu thời gian hoặc phiên bản (nếu không sẽ dẫn đến nhiều mâu thuẫn)
Đừng bao giờ cất giữ bí mật trừ khi thực sự cần thiết

Và đây là phép ẩn dụ không hoàn hảo của tôi: ký ức giống như một chiếc tủ lạnh. Nếu bạn không bao giờ lau chùi nó, cuối cùng bánh mì kẹp của bạn sẽ có vị như hành tây và sự hối tiếc.

9) Các kiểu lập kế hoạch (từ đơn giản đến cầu kỳ) 🧭✨

Lập kế hoạch chỉ là quá trình phân rã có kiểm soát. Đừng biến nó thành điều huyền bí.

Mẫu A: Công cụ lập kế hoạch dạng danh sách kiểm tra ✅

Mô hình đưa ra một danh sách các bước
Thực hiện từng bước
Cập nhật trạng thái danh sách kiểm tra

Tuyệt vời cho quá trình hội nhập nhân viên mới. Đơn giản, dễ kiểm thử.

Mẫu B: Vòng lặp ReAct (lý do + hành động) 🧠→🧰

Mô hình quyết định lệnh gọi công cụ tiếp theo
quan sát đầu ra
lặp lại bài báo ReAct

Đây chính là cảm giác đặc trưng của một điệp viên.

Mẫu C: Giám sát viên - nhân viên 👥

Người giám sát chia mục tiêu thành các nhiệm vụ
người lao động thực hiện các nhiệm vụ chuyên môn
người giám sát hợp nhất các kết quả Microsoft AutoGen (khung đa tác nhân)

Điều này rất hữu ích khi các tác vụ có thể được thực hiện song song, hoặc khi bạn muốn có các "vai trò" khác nhau, ví dụ như:

nhà nghiên cứu
lập trình viên
biên tập viên
Người kiểm tra chất lượng

Mô hình D: Lập kế hoạch rồi thực hiện, kèm theo điều chỉnh kế hoạch 🔄

lập kế hoạch
thực thi
Nếu kết quả của công cụ thay đổi thực tế, hãy lập kế hoạch lại

Điều này ngăn cản người thực hiện hành động ngoan cố bám theo một kế hoạch tồi. Con người cũng vậy, trừ khi họ mệt mỏi, trong trường hợp đó họ cũng sẽ theo đuổi những kế hoạch tồi.

10) An toàn, đáng tin cậy và không bị sa thải 🔐😅

Nếu tác nhân của bạn có khả năng thực hiện các hành động, bạn cần thiết kế an toàn. Không phải là "điều nên có", mà là điều cần thiết. NIST AI RMF 1.0

Giới hạn cứng

số bước tối đa mỗi lần chạy
số cuộc gọi công cụ tối đa mỗi phút
Mức chi tiêu tối đa mỗi phiên (ngân sách token)
các công cụ bị hạn chế đằng sau sự phê duyệt

Xử lý dữ liệu

Xóa bỏ thông tin nhạy cảm trước khi ghi nhật ký
các môi trường riêng biệt (phát triển so với sản xuất)
quyền công cụ tối thiểu

Hạn chế về hành vi

Buộc nhân viên phải trích dẫn các đoạn bằng chứng nội bộ (không phải liên kết bên ngoài, chỉ là các tham chiếu nội bộ)
Yêu cầu gắn cờ cảnh báo khi độ tin cậy thấp
Yêu cầu "đặt câu hỏi làm rõ" nếu thông tin đầu vào không rõ ràng

Một người môi giới đáng tin cậy không phải là người tự tin nhất. Đó là người biết khi nào mình đang đoán… và nói ra điều đó.

11) Thử nghiệm và đánh giá (phần mà mọi người thường né tránh) 🧪📏

Bạn không thể cải thiện những gì bạn không thể đo lường. Vâng, câu nói đó nghe có vẻ sáo rỗng, nhưng nó lại đúng một cách đáng buồn.

Xây dựng một bộ kịch bản

Tạo 30-100 trường hợp thử nghiệm:

những con đường hạnh phúc
các trường hợp ngoại lệ
các trường hợp “công cụ bị lỗi”
yêu cầu không rõ ràng
Các lời nhắc đối nghịch (các nỗ lực chèn lời nhắc) OWASP Top 10 cho các ứng dụng LLM OWASP LLM01 Chèn lời nhắc

Kết quả điểm số

Sử dụng các chỉ số như:

tỷ lệ thành công của nhiệm vụ
thời gian hoàn thành
tỷ lệ phục hồi lỗi công cụ
Tỷ lệ ảo giác (tuyên bố không có bằng chứng)
Tỷ lệ chấp thuận của con người (nếu ở chế độ giám sát)

Kiểm thử hồi quy cho các lời nhắc và công cụ

Bất cứ khi nào bạn thay đổi:

lược đồ công cụ
hướng dẫn hệ thống
logic truy xuất
dạng bộ nhớ
. Chạy lại bộ kiểm thử.

Các đại lý là những sinh vật nhạy cảm. Giống như cây cảnh trong nhà, nhưng đắt hơn.

12) Các mô hình triển khai không làm hao hụt ngân sách của bạn 💸🔥

Hãy bắt đầu với một dịch vụ duy nhất

API bộ điều khiển tác nhân
các dịch vụ công cụ đằng sau nó
ghi nhật ký và giám sát OpenTelemetry: quan sát.

Bổ sung các biện pháp kiểm soát chi phí sớm

kết quả truy xuất bộ nhớ đệm
nén trạng thái hội thoại bằng các bản tóm tắt
sử dụng các mô hình nhỏ hơn để định tuyến và trích xuất
Giới hạn "chế độ tư duy sâu sắc" chỉ ở những bước khó nhất

Lựa chọn kiến trúc phổ biến

Bộ điều khiển không lưu trạng thái + kho lưu trữ trạng thái bên ngoài (DB/Redis)
Các lệnh gọi công cụ có tính chất bất biến (idempotent) khi có thể. Stripe “Idempotent requests” (Yêu cầu bất biến).
xếp hàng chờ cho các tác vụ dài (để bạn không giữ yêu cầu web mở quá lâu)

Ngoài ra: hãy lắp thêm một "công tắc ngắt khẩn cấp". Bạn sẽ không cần đến nó cho đến khi thực sự, thực sự cần đến nó 😬

13) Lời kết - phiên bản ngắn gọn về Cách xây dựng một tác nhân AI 🎁🤖

Nếu bạn không nhớ gì khác, hãy nhớ điều này:

"Cách xây dựng một tác nhân AI" chủ yếu nói về việc xây dựng một vòng lặp an toàn xung quanh mô hình. Tài liệu "Agents" của LangChain.
Bắt đầu với mục tiêu rõ ràng, quyền tự chủ thấp và các công cụ nghiêm ngặt. (OpenAI Structured Outputs)
Tăng cường bộ nhớ thông qua việc truy xuất, chứ không phải nhồi nhét ngữ cảnh vô tận. Bài báo RAG
Việc lập kế hoạch có thể rất đơn giản - danh sách kiểm tra và việc điều chỉnh kế hoạch sẽ mang lại hiệu quả cao.
Việc ghi nhật ký và kiểm thử biến sự hỗn loạn của các tác nhân thành thứ có thể triển khai được. Hướng dẫn cơ bản về khả năng quan sát của OpenTelemetry.
Các rào chắn an toàn cần được đưa vào mã nguồn, chứ không chỉ vào lời nhắc. OWASP Top 10 cho các ứng dụng LLM

Một trợ lý ảo không phải là phép thuật. Nó là một hệ thống đưa ra những quyết định đúng đắn đủ thường xuyên để có giá trị… và thừa nhận thất bại trước khi gây ra thiệt hại. Theo một cách nào đó, điều này mang lại cảm giác an tâm thầm lặng 😌

Và đúng vậy, nếu bạn xây dựng nó đúng cách, cảm giác như đang thuê một thực tập sinh kỹ thuật số nhỏ bé, không bao giờ ngủ, thỉnh thoảng hoảng loạn và thích làm việc giấy tờ. Nói tóm lại, giống như một thực tập sinh vậy.

Ví dụ thực tế: Xây dựng một trợ lý AI phân loại yêu cầu hỗ trợ 🎫🤖

Kịch bản

Hãy tưởng tượng một nhóm SaaS nhỏ nhận được 120-180 yêu cầu hỗ trợ mỗi tuần. Hầu hết các yêu cầu không phức tạp, nhưng vẫn tốn thời gian: đặt lại mật khẩu, câu hỏi về thanh toán, báo cáo lỗi, yêu cầu tính năng và các tin nhắn kiểu "đây có phải là hành vi dự kiến không?".

Một chatbot đơn giản có thể soạn thảo câu trả lời, nhưng nó không thể kiểm tra trạng thái tài khoản một cách đáng tin cậy, tìm kiếm trong cơ sở kiến thức, phân loại mức độ khẩn cấp hoặc quyết định khi nào cần sự can thiệp của con người. Đây là lúc mà một nhân viên hỗ trợ trở nên hữu ích.

Mục tiêu không phải là thay thế hoàn toàn bộ phận hỗ trợ. Mục tiêu là xây dựng một hệ thống tự động có quyền hạn thấp, đọc yêu cầu mới, thu thập ngữ cảnh, soạn thảo câu trả lời và chuyển yêu cầu đến đúng hàng đợi. Mọi thứ liên quan đến khách hàng vẫn cần sự phê duyệt của con người.

Những gì trợ lý cần

Để làm việc an toàn, người đại lý cần một bộ công cụ và đầu vào nhỏ gọn, được kiểm soát chặt chẽ:

Văn bản vé đến
Loại gói dịch vụ của khách hàng, tuổi tài khoản và trạng thái thanh toán gần đây
Nhật ký thay đổi sản phẩm gần đây hoặc các sự cố đã biết
Các bài viết trong trung tâm trợ giúp nội bộ
Công cụ cập nhật vé với số lượng trường hạn chế
Đây là công cụ soạn thảo thư trả lời, không phải công cụ gửi email
Một chính sách leo thang rõ ràng

Danh sách công cụ nên được giữ ở mức độ hạn chế một cách có chủ đích:

trung tâm trợ giúp tìm kiếm (truy vấn)
get_customer_status(customer_id)
kiểm tra các sự cố đã biết (khu vực sản phẩm)
update_ticket_category(ticket_id, category, priority)
draft_reply(ticket_id, reply_text)
escalate_to_human(ticket_id, reason)

Hãy lưu ý những gì còn thiếu: không có công cụ "hoàn tiền cho khách hàng", "đóng tài khoản" hoặc "gửi phản hồi cuối cùng". Những thao tác đó quá rủi ro đối với phiên bản đầu tiên.

Ví dụ hướng dẫn

Bạn là nhân viên xử lý yêu cầu hỗ trợ cho một sản phẩm SaaS.

Nhiệm vụ của bạn là phân loại các yêu cầu hỗ trợ đến, thu thập thông tin cần thiết, soạn thảo phản hồi đề xuất và quyết định xem yêu cầu đó có cần được chuyển lên cấp cao hơn hay không.

Quy tắc:

Không nên trả lời trực tiếp khách hàng.

Vui lòng sử dụng trung tâm trợ giúp trước khi trả lời các câu hỏi về sản phẩm.

Hãy kiểm tra tình trạng khách hàng trước khi trả lời các câu hỏi về hóa đơn, gói cước hoặc quyền truy cập.

Nếu khách hàng đề cập đến các mối đe dọa pháp lý, mất dữ liệu, vấn đề bảo mật, thanh toán thất bại, hủy tài khoản hoặc ngôn ngữ giận dữ, hãy chuyển vấn đề cho người thật.

Nếu câu trả lời không được hỗ trợ bởi nội dung trung tâm trợ giúp hoặc dữ liệu tài khoản đã truy xuất, hãy cho biết điều gì còn thiếu và yêu cầu hỗ trợ cấp trên.

Dừng lại sau tối đa 6 lần gọi công cụ.

Một yêu cầu chỉ được coi là "hoàn tất" khi nó có danh mục, mức độ ưu tiên, tóm tắt bằng chứng, bản nháp phản hồi và trạng thái "cần sự phê duyệt của người" hoặc "đã được chuyển lên cấp cao hơn".

Cách kiểm tra nó

Hãy bắt đầu với 30 yêu cầu thử nghiệm trước khi kết nối với người dùng thực:

10 yêu cầu hỗ trợ thông thường, chẳng hạn như đặt lại mật khẩu, giới hạn gói cước và các câu hỏi cơ bản "Tôi phải làm thế nào?"
5 vé thanh toán
5 báo cáo lỗi
5 vé không rõ ràng với thông tin bị thiếu
5 loại vé rủi ro, chẳng hạn như lo ngại về an ninh, yêu cầu hoàn tiền và khiếu nại gay gắt

Với mỗi vé, hãy tính điểm như sau:

Liệu nó đã chọn đúng danh mục chưa?
Liệu hệ thống đã sử dụng công cụ phù hợp trước khi trả lời chưa?
Liệu nó có tránh được những tuyên bố thiếu căn cứ không?
Liệu điều đó có làm gia tăng số lượng vé có rủi ro cao không?
Bản thảo có cần chỉnh sửa nhiều không?

Một bảng tính đánh giá đạt/không đạt đơn giản là đủ ở giai đoạn đầu. Đừng xây dựng hệ thống đánh giá quá phức tạp trước khi bạn biết liệu người đại lý có mang lại giá trị hay không.

Kết quả

Kết quả minh họa: Dựa trên việc đo thời gian xử lý 30 yêu cầu hỗ trợ mẫu trước và sau khi sử dụng quy trình này, người quản lý hỗ trợ có thể đo lường được những điều sau:

Thời gian phân loại ban đầu trung bình giảm từ 6 phút/vé xuống còn 90 giây
30 yêu cầu được xử lý trong 45 phút thay vì 3 giờ
27 trên 30 vé được xếp vào đúng hạng mục
5/5 yêu cầu hỗ trợ rủi ro đã được xử lý chính xác
Chưa có phản hồi nào từ khách hàng được gửi đi mà không có sự chấp thuận của con người

Những con số này chỉ là ước tính ví dụ, không phải là tiêu chuẩn đã được chứng minh. Việc đo lường rất dễ lặp lại: hãy đo thời gian xử lý thủ công cùng một nhóm phiếu yêu cầu thử nghiệm, sau đó chạy chúng qua hệ thống tự động và so sánh độ chính xác của danh mục, độ chính xác khi chuyển tiếp yêu cầu và thời gian chỉnh sửa.

Điều gì có thể xảy ra sai sót?

Tác nhân vẫn có thể gặp lỗi theo những cách rất bình thường.

Nó có thể phân loại một khách hàng đang bực bội nhưng đơn giản là "khẩn cấp" vì ngôn ngữ nghe có vẻ giận dữ. Nó có thể soạn thảo một câu trả lời tự tin dựa trên một bài viết trợ giúp lỗi thời. Nó có thể tiếp tục tìm kiếm trong khi bước đúng đắn là chuyển vấn đề lên cấp cao hơn. Nó có thể tiết lộ quá nhiều chi tiết tài khoản trong bản nháp trả lời.

Giải pháp không phải là "viết một câu hỏi hay hơn" rồi hy vọng. Hãy đặt ra các giới hạn nghiêm ngặt:

Hãy báo cáo khi thấy các điều khoản liên quan đến thanh toán, bảo mật, pháp lý hoặc hủy bỏ xuất hiện
Yêu cầu trích dẫn nguồn từ các bài viết hướng dẫn nội bộ trong phần tóm tắt bằng chứng
Hãy giữ chức năng "gửi phản hồi" sau khi được người dùng phê duyệt
Ghi lại mọi lệnh gọi công cụ và bản nháp cuối cùng
Chạy lại bộ kiểm thử 30 vé sau mỗi lần thay đổi lời nhắc, công cụ hoặc chính sách

Bài học thực tiễn

Một nhân viên hỗ trợ giỏi không cần quyền tự chủ quá lớn. Trong ví dụ này, giá trị đến từ một quy trình được kiểm soát: đọc yêu cầu, lấy ngữ cảnh phù hợp, phân loại, soạn thảo phản hồi và dừng lại để xem xét. Điều đó dễ tin tưởng, kiểm thử và cải thiện hơn nhiều so với một nhân viên cố gắng "xử lý hỗ trợ" bằng một lời nhắc khổng lồ duy nhất.

Câu hỏi thường gặp

Nói một cách đơn giản, trí tuệ nhân tạo (AI agent) là gì?

Về cơ bản, một tác nhân AI là một vòng lặp tự động: nhận đầu vào, quyết định bước tiếp theo, sử dụng công cụ, đọc kết quả và lặp lại cho đến khi hoàn thành. Tính chất "tác nhân" đến từ khả năng hành động và quan sát, chứ không chỉ đơn thuần là trò chuyện. Nhiều tác nhân chỉ là hệ thống tự động hóa thông minh có quyền truy cập công cụ, trong khi những tác nhân khác lại hoạt động giống như một người vận hành cấp dưới có khả năng tự khắc phục lỗi.

Khi nào thì nên xây dựng một tác nhân AI thay vì chỉ sử dụng lời nhắc?

Hãy xây dựng một tác nhân (agent) khi công việc có nhiều bước, thay đổi dựa trên kết quả trung gian và cần sử dụng công cụ đáng tin cậy (API, cơ sở dữ liệu, hệ thống quản lý vé, thực thi mã). Tác nhân cũng hữu ích khi bạn muốn có kết quả lặp lại với các rào cản và cách thức để kiểm tra trạng thái "hoàn thành". Nếu một phản hồi nhắc nhở đơn giản hoạt động tốt, thì tác nhân thường là sự phức tạp không cần thiết và tạo ra thêm các chế độ lỗi.

Làm thế nào để xây dựng một tác nhân AI không bị kẹt trong vòng lặp?

Sử dụng các điều kiện dừng cứng: số bước tối đa, số lần gọi công cụ tối đa và kiểm tra hoàn thành rõ ràng. Thêm các lược đồ công cụ có cấu trúc, thời gian chờ và các lần thử lại không lặp lại vô hạn. Ghi nhật ký các quyết định và đầu ra của công cụ để bạn có thể thấy lỗi xảy ra ở đâu. Một van an toàn phổ biến là leo thang: nếu tác nhân không chắc chắn hoặc lặp lại lỗi, nó nên yêu cầu trợ giúp thay vì tự ứng biến.

Kiến trúc tối thiểu cần thiết để xây dựng một tác nhân AI là gì?

Tối thiểu, bạn cần một vòng lặp điều khiển cung cấp cho mô hình mục tiêu và ngữ cảnh, yêu cầu hành động tiếp theo, thực thi công cụ nếu được yêu cầu, thêm quan sát và lặp lại. Bạn cũng cần các công cụ với hình dạng đầu vào/đầu ra nghiêm ngặt và kiểm tra "hoàn thành". Ngay cả một vòng lặp tự tạo cũng có thể hoạt động tốt nếu bạn giữ trạng thái sạch sẽ và thực thi giới hạn bước.

Tôi nên thiết kế việc gọi công cụ như thế nào để đảm bảo tính đáng tin cậy trong môi trường sản xuất?

Hãy giữ cho các công cụ có phạm vi hẹp, được phân loại rõ ràng, có quyền truy cập và được xác thực – tránh các công cụ đa năng “làm được mọi thứ”. Ưu tiên các lược đồ nghiêm ngặt (như đầu ra có cấu trúc/gọi hàm) để tác nhân không thể bỏ qua các đầu vào. Thêm danh sách cho phép, giới hạn tỷ lệ và kiểm tra quyền của người dùng/tổ chức ở lớp công cụ. Thiết kế các công cụ sao cho an toàn khi chạy lại nếu có thể, sử dụng các mẫu bất biến.

Cách tốt nhất để tăng bộ nhớ mà không làm giảm hiệu năng của tác nhân là gì?

Hãy xem bộ nhớ gồm hai phần: trạng thái hoạt động ngắn hạn (các bước gần đây, kế hoạch hiện tại, các ràng buộc) và khả năng truy xuất dài hạn (sở thích, quy tắc ổn định, tài liệu liên quan). Giữ cho bộ nhớ ngắn hạn gọn nhẹ với các bản tóm tắt liên tục, không phải bản ghi đầy đủ. Đối với bộ nhớ dài hạn, việc truy xuất (các embedding + kho lưu trữ vector/mẫu RAG) thường hiệu quả hơn việc "nhồi nhét" mọi thứ vào ngữ cảnh và làm rối mô hình.

Tôi nên sử dụng mô hình lập kế hoạch nào: danh sách kiểm tra, ReAct, hay mô hình giám sát-nhân viên?

Công cụ lập kế hoạch dạng danh sách kiểm tra rất tuyệt vời khi các nhiệm vụ có thể dự đoán được và bạn muốn một thứ gì đó dễ kiểm tra. Các vòng lặp kiểu ReAct phát huy hiệu quả khi kết quả của công cụ thay đổi những gì bạn sẽ làm tiếp theo. Mô hình giám sát-nhân viên (như phân chia vai trò kiểu AutoGen) hữu ích khi các nhiệm vụ có thể được thực hiện song song hoặc được hưởng lợi từ các vai trò riêng biệt (nhà nghiên cứu, lập trình viên, kiểm thử chất lượng). Lập kế hoạch rồi thực hiện với việc lập kế hoạch lại là một giải pháp trung dung thực tế để tránh những kế hoạch tồi tệ khó thay đổi.

Làm thế nào để đảm bảo an toàn cho một tác nhân nếu nó có khả năng thực hiện các hành động thực tế?

Sử dụng quyền hạn tối thiểu và hạn chế việc sử dụng các công cụ rủi ro bằng chế độ phê duyệt hoặc "chạy thử". Thêm ngân sách và giới hạn: số bước tối đa, chi phí tối đa và giới hạn số lần gọi công cụ mỗi phút. Xóa bỏ dữ liệu nhạy cảm trước khi ghi nhật ký và tách biệt môi trường phát triển khỏi môi trường sản xuất. Yêu cầu gắn cờ cảnh báo hoặc đặt câu hỏi làm rõ khi dữ liệu đầu vào không rõ ràng, thay vì để sự tự tin thay thế bằng chứng.

Tôi có thể kiểm tra và đánh giá một tác nhân AI như thế nào để nó có thể cải thiện theo thời gian?

Hãy xây dựng một bộ kịch bản bao gồm các trường hợp thành công, trường hợp ngoại lệ, lỗi công cụ, yêu cầu không rõ ràng và các nỗ lực chèn lời nhắc (theo kiểu OWASP). Chấm điểm các kết quả như thành công của nhiệm vụ, thời gian hoàn thành, khả năng phục hồi từ lỗi công cụ và các tuyên bố không có bằng chứng. Bất cứ khi nào bạn thay đổi lược đồ công cụ, lời nhắc, phương thức truy xuất hoặc định dạng bộ nhớ, hãy chạy lại bộ kịch bản. Nếu bạn không thể kiểm tra nó, bạn không thể phát hành nó một cách đáng tin cậy.

Làm thế nào để triển khai một agent mà không làm tăng độ trễ và chi phí?

Một mô hình phổ biến là bộ điều khiển không trạng thái với kho lưu trữ trạng thái bên ngoài (DB/Redis), các dịch vụ công cụ phía sau và khả năng ghi nhật ký/giám sát mạnh mẽ (thường là OpenTelemetry). Kiểm soát chi phí bằng cách sử dụng bộ nhớ đệm truy xuất, tóm tắt trạng thái nhỏ gọn, các mô hình nhỏ hơn cho định tuyến/trích xuất và giới hạn "suy nghĩ sâu" chỉ ở những bước khó nhất. Sử dụng hàng đợi cho các tác vụ dài để tránh giữ các yêu cầu web mở. Luôn luôn bao gồm một công tắc ngắt khẩn cấp.

Tài liệu tham khảo

Viện Tiêu chuẩn và Công nghệ Quốc gia (NIST) - NIST AI RMF 1.0 (độ tin cậy và tính minh bạch) - nvlpubs.nist.gov
OpenAI - Kết quả đầu ra có cấu trúc - platform.openai.com
OpenAI - Hướng dẫn gọi hàm - platform.openai.com
OpenAI - Hướng dẫn về giới hạn tỷ lệ truy cập - platform.openai.com
OpenAI - Chạy API - platform.openai.com
OpenAI - Chức năng gọi hàm của trợ lý ảo - platform.openai.com
LangChain - Tài liệu về Agent (JavaScript) - docs.langchain.com
LangChain - Tài liệu hướng dẫn sử dụng (Python) - docs.langchain.com
LangChain - Tổng quan về bộ nhớ - docs.langchain.com
arXiv - Bài báo ReAct (lý trí + hành động) - arxiv.org
arXiv - Bài báo RAG - arxiv.org
Thư viện dành cho nhà phát triển Amazon Web Services (AWS) - Thời gian chờ, thử lại và lùi thời gian với độ trễ - aws.amazon.com
OpenTelemetry - Giới thiệu về khả năng quan sát - opentelemetry.io
Stripe - Yêu cầu bất biến (Idempotent requests) - docs.stripe.com
Google Cloud - Chiến lược thử lại (lùi bước + độ trễ) - docs.cloud.google.com
OWASP - Top 10 ứng dụng mô hình ngôn ngữ quy mô lớn - owasp.org
OWASP - LLM01 Prompt Injection - genai.owasp.org
LlamaIndex - Giới thiệu về RAG - developers.llamaindex.ai
Microsoft - Nhân ngữ nghĩa - learn.microsoft.com
Microsoft AutoGen - Khung đa tác nhân (tài liệu) - microsoft.github.io
CrewAI - Khái niệm về tác nhân - docs.crewai.com
Haystack (deepset) - Tài liệu về các công cụ truy xuất dữ liệu - docs.haystack.deepset.ai

Tìm kiếm những công nghệ AI mới nhất tại Cửa hàng Trợ lý AI chính thức

Về chúng tôi

Quay lại blog