Câu trả lời ngắn gọn: Các công cụ phát hiện văn bản bằng AI không “chứng minh” ai là tác giả; chúng chỉ ước tính mức độ phù hợp của đoạn văn với các mẫu ngôn ngữ quen thuộc. Hầu hết dựa trên sự kết hợp của các bộ phân loại, tín hiệu dự đoán (độ phức tạp/độ bùng nổ), phân tích phong cách và, trong những trường hợp hiếm hoi hơn, kiểm tra dấu bản quyền. Khi đoạn văn ngắn, mang tính trang trọng cao, kỹ thuật hoặc được viết bởi một tác giả học tiếng Anh như ngôn ngữ thứ hai, hãy coi điểm số như một gợi ý để xem xét lại - chứ không phải là một phán quyết.
Những điểm chính cần ghi nhớ:
Xác suất, không phải bằng chứng: Hãy coi tỷ lệ phần trăm như tín hiệu rủi ro về "sự tương đồng với AI", chứ không phải sự chắc chắn.
Kết quả dương tính giả: Các bài viết trang trọng, kỹ thuật, theo mẫu hoặc không phải do người bản ngữ viết thường bị gắn cờ sai.
Phương pháp kết hợp: Các công cụ kết hợp phân loại, độ phức tạp/độ bùng nổ, phân tích phong cách và kiểm tra dấu bản quyền không phổ biến.
Tính minh bạch: Nên ưu tiên các thiết bị dò hiển thị phạm vi, đặc điểm và độ không chắc chắn - chứ không chỉ là một con số duy nhất.
Khả năng tranh chấp: Giữ lại các bản nháp/ghi chú và bằng chứng về quy trình để phục vụ cho các tranh chấp và kháng cáo.

Những bài viết bạn có thể muốn đọc sau bài này:
🔗 Đâu là công cụ phát hiện AI tốt nhất?
So sánh các công cụ phát hiện AI hàng đầu về độ chính xác, tính năng và trường hợp sử dụng.
🔗 Liệu các thiết bị dò tìm bằng trí tuệ nhân tạo có đáng tin cậy?
Giải thích về độ tin cậy, kết quả dương tính giả và lý do tại sao kết quả thường khác nhau.
🔗 Turnitin có thể phát hiện AI không?
Hướng dẫn đầy đủ về cách phát hiện, giới hạn và các phương pháp tốt nhất khi sử dụng Turnitin AI.
🔗 Máy dò AI QuillBot có chính xác không?
Đánh giá chi tiết về độ chính xác, điểm mạnh, điểm yếu và các bài kiểm tra thực tế.
1) Ý tưởng nhanh gọn - bộ dò AI thực sự đang làm gì ⚙️
Hầu hết các công cụ phát hiện AI không "bắt AI" như dùng lưới bắt cá. Chúng đang làm một việc thực tế hơn:
-
Họ ước tính xác suất một đoạn văn bản trông giống như được tạo ra từ mô hình ngôn ngữ (hoặc được hỗ trợ rất nhiều bởi mô hình ngôn ngữ). (Một khảo sát về phát hiện văn bản được tạo ra bởi mô hình ngôn ngữ; OpenAI)
-
Họ so sánh văn bản của bạn với các mẫu được thấy trong dữ liệu huấn luyện (chữ viết của con người so với chữ viết do mô hình tạo ra). (Một khảo sát về phát hiện văn bản do LLM tạo ra)
-
Chúng đưa ra một điểm số (thường là phần trăm) nghe có vẻ chính xác…nhưng thường thì không phải vậy. (Hướng dẫn sử dụng Turnitin)
Thành thật mà nói, giao diện người dùng sẽ hiển thị dòng chữ kiểu như “92% AI”, và bạn sẽ nghĩ ngay “ừm, chắc là đúng rồi”. Nhưng đó không phải là sự thật. Đó chỉ là phỏng đoán của mô hình về dấu vân tay của một mô hình khác. Điều này khá buồn cười, giống như chó đánh hơi chó vậy 🐕🐕
2) Cách thức hoạt động của các công cụ phát hiện AI: các “công cụ phát hiện” phổ biến nhất 🔍
Các bộ dò thường sử dụng một (hoặc kết hợp) các phương pháp sau: (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
A) Mô hình phân loại (phổ biến nhất)
Bộ phân loại được huấn luyện trên các ví dụ đã được gán nhãn:
-
Các mẫu do con người viết
-
Các mẫu do AI tạo ra
-
Đôi khi là các mẫu "lai" (văn bản do AI chỉnh sửa bởi con người)
Sau đó, nó học các mẫu để phân tách các nhóm. Đây là phương pháp học máy kinh điển và nó có thể khá tốt… cho đến khi nó không còn tốt nữa. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
B) Cách chấm điểm sự khó hiểu và "đột ngột" 📈
Một số công cụ phát hiện tính toán mức độ "dễ đoán" của văn bản.
-
Độ bối rối: nói một cách đại khái, đó là mức độ ngạc nhiên của một mô hình ngôn ngữ trước từ tiếp theo. (Đại học Boston - Bài viết về Độ bối rối)
-
Độ phức tạp thấp hơn có thể cho thấy văn bản có tính dự đoán cao (điều này có thể xảy ra với các kết quả đầu ra của AI). (DetectGPT)
-
“Độ bùng nổ” cố gắng đo lường mức độ biến đổi về độ phức tạp và nhịp điệu của câu. (GPTZero)
Cách tiếp cận này đơn giản và nhanh chóng. Tuy nhiên, nó cũng dễ gây nhầm lẫn, bởi vì con người cũng có thể viết theo cách dễ đoán (ví dụ như email công ty). (OpenAI)
C) Phân tích kiểu chữ (dấu vân tay chữ viết) ✍️
Phân tích phong cách học xem xét các mẫu như:
-
độ dài câu trung bình
-
kiểu dấu câu
-
Tần suất xuất hiện của từ chức năng (the, and, but…)
-
sự đa dạng về từ vựng
-
điểm khả năng đọc hiểu
Nó giống như "phân tích chữ viết tay", nhưng là dành cho văn bản. Đôi khi nó hữu ích. Đôi khi nó giống như việc chẩn đoán cảm lạnh bằng cách nhìn vào giày của ai đó. (Phân tích phong cách học và khoa học pháp y: Tổng quan tài liệu; Từ chức năng trong việc xác định tác giả)
D) Phát hiện hình mờ (nếu có) 🧩
Một số nhà cung cấp mô hình có thể nhúng các mẫu tinh tế ("dấu bản quyền") vào văn bản được tạo ra. Nếu bộ phát hiện biết được sơ đồ dấu bản quyền, nó có thể cố gắng xác minh. (Dấu bản quyền cho các mô hình ngôn ngữ lớn; Văn bản SynthID)
Nhưng… không phải tất cả các mô hình đều đóng dấu bản quyền, không phải tất cả các kết quả đầu ra đều giữ nguyên dấu bản quyền sau khi chỉnh sửa, và không phải tất cả các bộ phát hiện đều có quyền truy cập vào công thức bí mật. Vì vậy, đây không phải là một giải pháp phổ quát. (Về độ tin cậy của dấu bản quyền đối với các mô hình ngôn ngữ lớn; OpenAI)
3) Điều gì tạo nên một phiên bản tốt của công cụ phát hiện AI? ✅
Theo kinh nghiệm của tôi khi thử nghiệm nhiều phần mềm dò tìm lỗi khác nhau cho các quy trình biên tập, một phần mềm "tốt" không phải là phần mềm gây ra nhiều lỗi nhất. Mà là phần mềm hoạt động một cách có trách nhiệm.
Đây là những yếu tố làm nên sự đáng tin cậy của một thiết bị dò tìm AI:
-
Độ tin cậy được hiệu chỉnh: con số 70% phải thể hiện sự nhất quán, chứ không phải là sự nói suông. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
-
Tỷ lệ nhận diện sai thấp: hệ thống không nên gắn nhãn tiếng Anh không phải tiếng mẹ đẻ, văn bản pháp lý hoặc tài liệu kỹ thuật là "AI" chỉ vì chúng trông sạch sẽ. (Stanford HAI; Liang et al. (arXiv))
-
Giới hạn minh bạch: nó nên thừa nhận sự không chắc chắn và hiển thị các phạm vi, chứ không nên giả vờ là toàn tri. (OpenAI; Turnitin)
-
Nhận thức về lĩnh vực: các bộ phát hiện được huấn luyện trên các blog thông thường thường gặp khó khăn với văn bản học thuật và ngược lại. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
-
Xử lý văn bản ngắn: các công cụ tốt tránh đưa ra điểm số quá tự tin dựa trên các mẫu dữ liệu nhỏ (một đoạn văn không phải là toàn bộ vũ trụ). (OpenAI; Turnitin)
-
Độ nhạy sửa đổi: nó phải xử lý việc chỉnh sửa của con người mà không ngay lập tức tạo ra kết quả vô nghĩa. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
Những người giỏi nhất mà tôi từng gặp thường khá khiêm tốn. Còn những người tệ nhất thì lại tỏ vẻ như thể họ có thể đọc được suy nghĩ của người khác 😬
4) Bảng so sánh - các “loại” máy dò AI phổ biến và điểm mạnh của chúng 🧾
Dưới đây là một so sánh thực tế. Đây không phải là tên thương hiệu - mà là các danh mục chính bạn sẽ gặp phải. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
| Loại công cụ (gần đúng) | Khán giả tốt nhất | Giá cả | Vì sao nó hiệu quả (đôi khi) |
|---|---|---|---|
| Perplexity Checker Lite | Giáo viên, kiểm tra nhanh | Miễn phí gần như | Tín hiệu nhanh về khả năng dự đoán - nhưng có thể không ổn định… |
| Máy quét phân loại chuyên nghiệp | Biên tập viên, Nhân sự, Tuân thủ | Đăng ký | Học các mẫu từ dữ liệu được gắn nhãn - hoạt động khá tốt với văn bản có độ dài trung bình |
| Máy phân tích phong cách viết | Các nhà nghiên cứu, các chuyên gia pháp y | $$$ hoặc thị trường ngách | So sánh dấu vân tay chữ viết - hơi lạ nhưng hữu ích khi viết dài |
| Công cụ tìm hình mờ | Nền tảng, nhóm nội bộ | Thường được đóng gói kèm theo | Mạnh mẽ khi có hình mờ - nếu không có, thì coi như vô dụng |
| Bộ giải pháp doanh nghiệp lai | Các tổ chức lớn | Theo từng chỗ ngồi, hợp đồng | Kết hợp nhiều tín hiệu - phạm vi phủ sóng tốt hơn, nhiều nút điều chỉnh hơn (và nhiều cách cấu hình sai hơn, ôi chao!) |
Hãy chú ý đến cột "cảm nhận về giá cả". Ừ, nó không mang tính khoa học. Nhưng nó rất thẳng thắn 😄
5) Các tín hiệu cốt lõi mà máy dò tìm kiếm - những "dấu hiệu" 🧠
Đây là những gì mà nhiều thiết bị dò tìm cố gắng đo lường bên trong động cơ:
Khả năng dự đoán (xác suất token)
Các mô hình ngôn ngữ tạo ra văn bản bằng cách dự đoán các từ khóa tiếp theo có khả năng xuất hiện. Điều đó thường dẫn đến:
-
chuyển đổi mượt mà hơn
-
ít lựa chọn từ ngữ gây ngạc nhiên hơn
-
hạn chế những lời lạc đề không liên quan (trừ khi được yêu cầu)
-
Giọng văn nhất quán (Đại học Boston - Bài đăng về sự bối rối; DetectGPT)
Ngược lại, con người thường hay đi vòng vo hơn. Chúng ta tự mâu thuẫn, thêm thắt những lời bình luận ngẫu nhiên, sử dụng những phép ẩn dụ hơi lệch lạc - chẳng hạn như so sánh một máy dò AI với một cái máy nướng bánh mì biết đánh giá thơ. Phép ẩn dụ đó không hay lắm, nhưng bạn hiểu ý tôi chứ.
Sự lặp lại và các mẫu cấu trúc
Văn bản do AI viết có thể thể hiện sự lặp lại tinh tế:
-
Cấu trúc câu lặp lại (“Tóm lại…”, “Ngoài ra…”, “Hơn nữa…”)
-
độ dài đoạn văn tương tự
-
Nhịp độ ổn định (Khảo sát về phát hiện văn bản do LLM tạo ra)
Nhưng cũng cần lưu ý rằng, rất nhiều người viết theo cách đó, đặc biệt là trong môi trường học đường hoặc công ty. Vì vậy, sự lặp lại chỉ là một manh mối, chứ không phải bằng chứng.
Văn phong quá rõ ràng và "quá trau chuốt" ✨
Đây là một trường hợp kỳ lạ. Một số phần mềm dò tìm ngầm coi "chữ viết rất sạch" là đáng ngờ. (OpenAI)
Điều này thật khó xử vì:
-
Những nhà văn giỏi vẫn tồn tại
-
có trình biên tập viên
-
Chức năng kiểm tra chính tả tồn tại
Vậy nếu bạn đang thắc mắc " Máy dò AI hoạt động như thế nào?", một phần câu trả lời là: đôi khi chúng lại đánh giá cao sự thô ráp. Điều này... có vẻ hơi ngược đời.
Mật độ ngữ nghĩa và cách diễn đạt chung
Các công cụ dò tìm có thể gắn cờ những đoạn văn bản có nội dung:
-
quá chung chung
-
thiếu thông tin chi tiết cụ thể về cuộc sống thực tế
-
Tập trung nhiều vào các tuyên bố cân bằng, trung lập (Một khảo sát về phát hiện văn bản do LLM tạo ra)
Trí tuệ nhân tạo thường tạo ra nội dung nghe có vẻ hợp lý nhưng được chỉnh sửa sơ sài. Giống như một phòng khách sạn trông đẹp nhưng thiếu cá tính vậy 🛏️
6) Phương pháp phân loại - cách huấn luyện (và lý do tại sao nó bị lỗi) 🧪
Một bộ phân loại/phát hiện thường được huấn luyện như sau:
-
Thu thập một tập dữ liệu gồm các văn bản do con người viết (bài luận, bài báo, diễn đàn, v.v.)
-
Tạo văn bản bằng AI (nhiều gợi ý, kiểu chữ, độ dài)
-
Hãy dán nhãn các mẫu
-
Huấn luyện mô hình để phân tách chúng bằng cách sử dụng các đặc trưng hoặc nhúng
-
Xác thực nó trên dữ liệu được giữ lại
-
Gửi nó đi… rồi thực tế lại giáng một cú đấm vào mặt (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
Vì sao hiện thực lại phũ phàng:
-
Thay đổi lĩnh vực: dữ liệu huấn luyện không khớp với bài viết thực tế của người dùng.
-
Thay đổi mô hình: các mô hình thế hệ mới không hoạt động giống như các mô hình trong tập dữ liệu.
-
Hiệu ứng chỉnh sửa: việc chỉnh sửa của con người có thể loại bỏ các họa tiết rõ ràng nhưng vẫn giữ lại những họa tiết tinh tế.
-
Sự khác biệt về ngôn ngữ: phương ngữ, văn viết tiếng Anh như ngôn ngữ thứ hai và phong cách trang trọng bị hiểu sai (Một khảo sát về phát hiện văn bản do LLM tạo ra; Liang et al. (arXiv))
Tôi từng thấy những máy dò được đánh giá là "xuất sắc" trên bộ dữ liệu demo của chính chúng, nhưng lại hoạt động kém hiệu quả trong môi trường làm việc thực tế. Điều đó giống như việc huấn luyện một con chó đánh hơi chỉ với một nhãn hiệu bánh quy và mong nó tìm thấy mọi loại đồ ăn vặt trên thế giới vậy 🍪
7) Sự khó hiểu và bùng nổ - lối tắt toán học 📉
Nhóm các bộ dò này thường dựa vào việc chấm điểm dựa trên mô hình ngôn ngữ:
-
Họ chạy đoạn văn bản của bạn qua một mô hình ước tính xác suất xuất hiện của mỗi từ tiếp theo.
-
Họ tính toán mức độ "bất ngờ" tổng thể (sự khó hiểu). (Đại học Boston - Bài viết về sự khó hiểu)
-
Họ có thể thêm các chỉ số biến thiên (“độ bùng nổ”) để xem nhịp điệu có giống nhịp điệu của con người hay không. (GPTZero)
Lý do tại sao phương pháp này đôi khi hiệu quả:
-
Văn bản thô do AI tạo ra có thể cực kỳ mượt mà và có thể dự đoán được về mặt thống kê (DetectGPT).
Lý do thất bại:
-
Các mẫu ngắn thường bị nhiễu
-
Văn phong trang trọng có thể dự đoán được
-
Viết kỹ thuật có thể dự đoán được
-
Văn phong của người không phải người bản xứ có thể dễ đoán
-
Văn bản do AI chỉnh sửa nhiều có thể trông giống văn bản của con người (OpenAI; Turnitin).
Vậy nên, cách thức hoạt động của các thiết bị phát hiện bằng AI đôi khi giống như một máy đo tốc độ nhầm lẫn giữa xe đạp và xe máy. Cùng một con đường, nhưng động cơ khác nhau 🚲🏍️
8) Hình mờ - ý tưởng "dấu vân tay trong mực in" 🖋️
Việc đóng dấu bản quyền nghe có vẻ là giải pháp tối ưu: đánh dấu văn bản do AI tạo ra ngay từ khi phát hiện, sau đó mới phát hiện lại. (Một phương pháp đóng dấu bản quyền cho các mô hình ngôn ngữ quy mô lớn; Văn bản SynthID)
Trên thực tế, hình mờ có thể rất dễ bị hư hỏng:
-
Việc diễn đạt lại có thể làm suy yếu chúng
-
việc dịch có thể làm hỏng chúng
-
Việc trích dẫn một phần có thể loại bỏ chúng
-
Việc trộn lẫn nhiều nguồn có thể làm mờ đi mẫu hình (Về độ tin cậy của dấu bản quyền đối với các mô hình ngôn ngữ lớn)
Ngoài ra, tính năng nhận diện hình mờ chỉ hoạt động nếu:
-
một hình mờ được sử dụng
-
Máy dò biết cách kiểm tra điều đó
-
Văn bản này không được chỉnh sửa nhiều (OpenAI; SynthID Text)
Vì vậy, đúng là hình mờ có thể rất hiệu quả, nhưng chúng không phải là giấy tờ tùy thân của cảnh sát trên toàn thế giới.
9) Kết quả dương tính giả và lý do tại sao chúng xảy ra (phần khó chịu) 😬
Phần này xứng đáng có một mục riêng vì đây là nơi tập trung nhiều tranh cãi nhất.
Các nguyên nhân gây ra kết quả dương tính giả thường gặp:
-
Giọng văn rất trang trọng (kiểu văn bản học thuật, pháp lý, tuân thủ quy định)
-
Tiếng Anh của người không phải là tiếng mẹ đẻ (cấu trúc câu đơn giản hơn có thể trông "chuẩn mực")
-
Viết theo mẫu (thư xin việc, quy trình chuẩn, báo cáo thí nghiệm)
-
Đoạn văn bản ngắn (tín hiệu yếu)
-
Các ràng buộc về chủ đề (một số chủ đề buộc phải lặp lại cách diễn đạt) (Liang et al. (arXiv); Turnitin)
Nếu bạn từng thấy ai đó bị gắn cờ vì viết quá hay… thì đúng vậy. Chuyện đó có xảy ra. Và nó thật tàn nhẫn.
Điểm số của máy dò nên được xem như sau:
-
Đây là thiết bị báo khói, chứ không phải phán quyết của tòa án 🔥
Nó cho bạn biết "có thể nên kiểm tra", chứ không phải "vụ án đã khép lại". (OpenAI; Turnitin)
10) Cách hiểu điểm số máy dò như một người trưởng thành 🧠🙂
Dưới đây là một cách thực tế để đọc kết quả:
Nếu công cụ chỉ hiển thị một tỷ lệ phần trăm duy nhất
Hãy coi đó như một tín hiệu rủi ro sơ bộ:
-
0-30%: Có thể do con người hoặc đã được chỉnh sửa nhiều
-
30-70%Vùng không rõ ràng - đừng giả định bất cứ điều gì
-
70-100%: nhiều khả năng là các mẫu giống AI, nhưng vẫn chưa phải là bằng chứng chắc chắn (Hướng dẫn Turnitin)
Ngay cả điểm số cao cũng có thể sai, đặc biệt là đối với:
-
viết theo tiêu chuẩn
-
một số thể loại nhất định (tóm tắt, định nghĩa)
-
Viết tiếng Anh như ngôn ngữ thứ hai (Liang và cộng sự (arXiv))
Hãy tìm kiếm lời giải thích, chứ không chỉ là con số
Các thiết bị dò tốt hơn cung cấp:
-
các khoảng thời gian được đánh dấu
-
Ghi chú về tính năng (khả năng dự đoán, sự lặp lại, v.v.)
-
Khoảng tin cậy hoặc ngôn ngữ không chắc chắn (Một khảo sát về phát hiện văn bản do LLM tạo ra)
Nếu một công cụ từ chối giải thích bất cứ điều gì và chỉ dán một con số lên trán bạn… tôi không tin tưởng nó. Bạn cũng không nên tin tưởng nó.
11) Cách thức hoạt động của các thiết bị dò tìm bằng trí tuệ nhân tạo: một mô hình tư duy đơn giản 🧠🧩
Nếu bạn muốn có một món ăn mang về sạch sẽ, hãy sử dụng mô hình tư duy này:
-
Các thuật toán phát hiện AI tìm kiếm các mẫu thống kê và phong cách phổ biến trong văn bản do máy tạo ra. (Một khảo sát về phát hiện văn bản do LLM tạo ra)
-
Họ so sánh các mẫu đó với những gì họ đã học được từ các ví dụ huấn luyện. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
-
Chúng đưa ra một phỏng đoán mang tính xác suất, chứ không phải là một câu chuyện nguồn gốc có thật. (OpenAI)
-
Dự đoán này nhạy cảm với thể loại, chủ đề, độ dài, chỉnh sửa và dữ liệu huấn luyện của bộ phát hiện. (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
Nói cách khác, cách thức hoạt động của các công cụ nhận dạng AI là chúng "đánh giá sự giống nhau", chứ không phải tác giả. Giống như việc nói ai đó trông giống anh em họ của họ. Điều đó không giống với xét nghiệm ADN… và ngay cả xét nghiệm ADN cũng có những trường hợp ngoại lệ.
12) Mẹo thực tế để giảm thiểu việc báo cáo nhầm (không cần chơi trò chơi) ✍️✅
Không phải "làm thế nào để đánh lừa máy dò". Mà đúng hơn là làm thế nào để viết sao cho phản ánh được tác giả thực sự và tránh những hiểu lầm kỳ lạ.
-
Hãy bổ sung các chi tiết cụ thể: tên các khái niệm bạn thực sự đã sử dụng, các bước bạn đã thực hiện, những sự đánh đổi bạn đã cân nhắc
-
Hãy sử dụng sự đa dạng tự nhiên: kết hợp câu ngắn và câu dài (giống như cách con người suy nghĩ)
-
Hãy nêu rõ những hạn chế thực tế: thời gian, công cụ đã sử dụng, những sai sót đã xảy ra, và những điều bạn sẽ làm khác đi
-
Tránh dùng từ ngữ rập khuôn: hãy thay thế cụm từ “Hơn nữa” bằng một câu nói mà bạn thực sự muốn diễn đạt
-
Hãy giữ lại bản nháp và ghi chú: nếu có tranh chấp xảy ra, bằng chứng về quy trình sẽ quan trọng hơn cảm tính
Thực ra, cách phòng thủ tốt nhất chỉ đơn giản là… hãy chân thật. Chân thật một cách không hoàn hảo, chứ không phải kiểu chân thật "hoàn hảo như trong tờ rơi quảng cáo".
Lời kết 🧠✨
Các công cụ phát hiện AI có thể rất hữu ích, nhưng chúng không phải là cỗ máy tìm ra sự thật. Chúng là những công cụ so khớp mẫu được huấn luyện trên dữ liệu không hoàn hảo, hoạt động trong một thế giới mà các phong cách viết liên tục chồng chéo lên nhau. (OpenAI; Khảo sát về phát hiện văn bản được tạo ra bởi LLM)
Tóm lại:
-
Các thuật toán phát hiện dựa vào bộ phân loại, độ phức tạp/độ bùng nổ, phân tích phong cách và đôi khi cả hình mờ 🧩 (Một khảo sát về phát hiện văn bản được tạo ra bởi LLM)
-
Họ ước tính "mức độ giống AI", chứ không phải sự chắc chắn (OpenAI)
-
Lỗi dương tính giả xảy ra rất nhiều trong văn bản trang trọng, kỹ thuật hoặc của người không phải là người bản ngữ 😬 (Liang et al. (arXiv); Turnitin)
-
Sử dụng kết quả phát hiện như một gợi ý để xem xét lại, chứ không phải là một phán quyết (Turnitin)
Và đúng vậy… nếu ai đó hỏi lại, “ Máy dò AI hoạt động như thế nào?”, bạn có thể trả lời: “Chúng đoán dựa trên các mẫu – đôi khi thông minh, đôi khi ngớ ngẩn, nhưng luôn có giới hạn.”
Ví dụ thực tế: Xem xét lại bài luận của học sinh bị gắn cờ mà không vội vàng đưa ra phán xét 🧑🏫
Kịch bản
Hãy tưởng tượng một giảng viên viết luận đại học nhận được một bài luận lịch sử dài 1.200 từ mà phần mềm phát hiện AI đánh dấu là "có khả năng 86% là do AI viết". Bài luận được viết trang trọng, cấu trúc mạch lạc và sử dụng nhiều cụm từ lặp đi lặp lại như "điều này cho thấy rằng" và "có thể lập luận rằng". Thoạt nhìn, nó có vẻ đáng ngờ.
Nhưng sinh viên này là người học tiếng Anh như ngôn ngữ thứ hai, đã sử dụng một mẫu bài luận nghiêm ngặt từ lớp học và chỉnh sửa bản nháp bằng phần mềm kiểm tra ngữ pháp. Nói cách khác, đây chính là trường hợp mà điểm số từ phần mềm phát hiện lỗi nên dẫn đến việc xem xét lại bài viết, chứ không phải là hình phạt.
Mục đích không phải là "bắt lỗi" học sinh. Mục đích là để quyết định xem điểm số đó có được hỗ trợ bởi các bằng chứng khác hay không.
Những gì người đánh giá cần
Trước khi đưa ra bất kỳ đánh giá nào, gia sư sẽ thu thập:
-
Báo cáo của thiết bị dò, bao gồm cả các đoạn được đánh dấu nếu có
-
Đề bài luận và tiêu chí chấm điểm
-
Bản nháp lịch sử, ghi chú, dàn ý hoặc tài liệu tham khảo của sinh viên
-
Bất kỳ công cụ hỗ trợ viết bài nào được phép sử dụng được liệt kê trong chính sách khóa học
-
Một hoặc hai bài viết mẫu trước đó của cùng một sinh viên, nếu chính sách cho phép
-
Một lời giải thích ngắn gọn từ sinh viên về quy trình viết của họ
Điều này rất quan trọng vì công cụ phát hiện chỉ nhìn thấy văn bản cuối cùng. Nó không biết liệu sinh viên đã dành bốn ngày để soạn thảo, sử dụng mẫu, sao chép cách diễn đạt trên lớp, dịch ghi chú hay chỉnh sửa dựa trên phản hồi.
Ví dụ hướng dẫn
Giáo viên có thể sử dụng hướng dẫn đánh giá này khi xem xét trường hợp:
Hãy xem xét bài luận này như một bài kiểm tra quy trình viết, chứ không phải là bằng chứng về việc sử dụng AI. So sánh những điểm nổi bật do phần mềm phát hiện với ghi chú, lịch sử bản nháp, danh sách nguồn và bài viết mẫu trước đó của học sinh. Xác định những đoạn văn nào thực sự đáng ngờ và những đoạn nào có thể chỉ đơn giản là mang tính hình thức, rập khuôn hoặc chịu ảnh hưởng của người học tiếng Anh như ngôn ngữ thứ hai. Phân loại bằng chứng thành ba nhóm: tín hiệu từ phần mềm phát hiện, bằng chứng về quy trình viết và đánh giá của con người. Không nên đề xuất biện pháp kỷ luật trừ khi có bằng chứng hỗ trợ rõ ràng ngoài điểm số của phần mềm phát hiện.
Cách kiểm tra nó
Một quy trình đánh giá công bằng có thể sử dụng ba bước kiểm tra đơn giản:
-
Hãy yêu cầu học sinh giải thích bằng lời hai đoạn văn.
Nếu các em có thể giải thích được luận điểm, nguồn tham khảo và lý do tại sao lại diễn đạt như vậy, đó là bằng chứng quan trọng về quá trình làm việc. -
So sánh các phần được đánh dấu với mẫu bài luận.
Nếu công cụ phát hiện chủ yếu làm nổi bật các cụm từ theo kiểu mẫu, điểm số có thể đang phản ứng với cấu trúc hơn là tác giả. -
Chỉ nên chạy lại những đoạn văn dài, không phải những đoạn trích ngắn
. Một đoạn văn đơn lẻ có thể chứa nhiều thông tin nhiễu. Một đoạn mẫu dài 600-900 từ thường cho tín hiệu có ý nghĩa hơn là ba câu riêng lẻ.
Kết quả
Kết quả minh họa: Trong bài tập đánh giá năm bài luận, người hướng dẫn ghi lại thời gian thực hiện trước và sau khi sử dụng quy trình này.
Trước khi áp dụng quy trình này, mỗi bài luận được đánh dấu cần khoảng 35 phút để xem xét vì người hướng dẫn phải tự quyết định xem cần kiểm tra những gì từ đầu.
Sau khi sử dụng quy trình làm việc, mỗi lần đánh giá mất khoảng 18 phút:
-
5 phút để đọc các điểm nổi bật của máy dò
-
6 phút để kiểm tra bản nháp, ghi chú và nguồn tài liệu
-
4 phút để so sánh với bài viết trước hoặc ngôn ngữ mẫu
-
Chỉ mất 3 phút để viết một ghi chú đánh giá ngắn
Như vậy, ước tính sẽ tiết kiệm được 17 phút cho mỗi bài luận, hoặc 85 phút cho năm bài luận được đánh dấu. Số liệu này rất dễ kiểm chứng: tính thời gian cho mỗi lần xem xét, đếm số trường hợp cần được chuyển lên cấp cao hơn, và ghi lại xem quyết định cuối cùng chỉ dựa trên điểm số của công cụ phát hiện hay dựa trên bằng chứng hỗ trợ.
Tiêu chí đánh giá thành công tốt hơn không phải là "có bao nhiêu học sinh bị phát hiện". Mà là có bao nhiêu điểm số đáng ngờ được xem xét lại một cách nhất quán, với bằng chứng rõ ràng và ít giả định vội vàng.
Điều gì có thể xảy ra sai sót?
Sai lầm lớn nhất là coi tỷ lệ phần trăm phát hiện là yếu tố quyết định. "86% có khả năng là AI" nghe có vẻ chính thức, nhưng vẫn có thể sai.
Những lỗi thường gặp khác bao gồm:
-
Chỉ kiểm tra bài luận cuối cùng và bỏ qua các bản nháp
-
Đánh giá thấp những bài viết tiếng Anh dành cho người học tiếng Anh như ngôn ngữ thứ hai (ESL) được trau chuốt vì trông "quá mượt mà"
-
Sử dụng một máy dò như thể nó là một công cụ pháp y
-
Chạy các đoạn mã nhỏ và coi điểm số là đáng tin cậy
-
Không cho sinh viên biết họ có thể cung cấp những bằng chứng gì
-
Quên mất rằng các công cụ ngữ pháp, mẫu câu và phản hồi có thể thay đổi phong cách viết
Một quy trình đánh giá tốt cũng cần bảo vệ quyền riêng tư. Sinh viên không nên bị yêu cầu tải lên các ghi chú riêng tư, tin nhắn cá nhân hoặc các tài liệu không liên quan trừ khi chính sách cho phép rõ ràng.
Bài học thực tiễn
Hãy sử dụng các công cụ phát hiện AI như một công cụ sàng lọc ban đầu, chứ không phải là một cỗ máy tìm kiếm sự thật tuyệt đối. Một quy trình hiệu quả sẽ kết hợp điểm số với các bản nháp, kiểm tra nguồn, lịch sử viết, lời giải thích của học sinh và đánh giá của con người. Điều đó mang lại cho các trường học, biên tập viên và người đánh giá một thứ có giá trị hơn nhiều so với một tỷ lệ phần trăm đáng sợ: một quyết định mà họ có thể bảo vệ một cách tự tin.
Câu hỏi thường gặp
Vậy các thiết bị dò tìm bằng trí tuệ nhân tạo hoạt động như thế nào trong thực tế?
Hầu hết các công cụ phát hiện văn bản giả mạo bằng AI không “chứng minh” quyền tác giả. Chúng ước tính mức độ tương đồng giữa văn bản của bạn với các mẫu thường được tạo ra bởi các mô hình ngôn ngữ, sau đó đưa ra một điểm số giống như xác suất. Về mặt kỹ thuật, chúng có thể sử dụng các mô hình phân loại, chấm điểm khả năng dự đoán kiểu perplexity, các đặc điểm phân tích phong cách viết hoặc kiểm tra dấu bản quyền. Kết quả tốt nhất nên được xem như một tín hiệu rủi ro, chứ không phải là một phán quyết cuối cùng.
Các thuật toán phát hiện AI tìm kiếm những tín hiệu gì trong văn bản?
Các dấu hiệu thường gặp bao gồm tính dễ đoán (mức độ “bất ngờ” của mô hình trước những từ ngữ tiếp theo của bạn), sự lặp lại trong cấu trúc câu, nhịp điệu đều đặn bất thường và cách diễn đạt chung chung thiếu chi tiết cụ thể. Một số công cụ cũng xem xét các dấu hiệu phong cách học như độ dài câu, thói quen dấu câu và tần suất sử dụng từ chức năng. Những tín hiệu này có thể trùng lặp với văn phong của con người, đặc biệt là trong các thể loại trang trọng, học thuật hoặc kỹ thuật.
Tại sao các phần mềm phát hiện AI lại nhận diện chữ viết của con người là chữ viết của AI?
Hiện tượng nhận diện sai xảy ra khi văn bản do con người viết trông "mượt mà" hoặc giống như mẫu có tính thống kê. Giọng văn trang trọng, cách diễn đạt theo kiểu tuân thủ quy định, giải thích kỹ thuật, các đoạn văn ngắn và tiếng Anh không phải tiếng mẹ đẻ đều có thể bị nhận diện nhầm là giống AI vì chúng làm giảm sự đa dạng. Đó là lý do tại sao một đoạn văn sạch sẽ, được biên tập tốt có thể dẫn đến điểm số cao. Bộ phát hiện đang so sánh sự tương đồng, chứ không phải xác nhận nguồn gốc.
Các bộ dò độ rối và "độ bùng nổ" có đáng tin cậy không?
Các phương pháp dựa trên độ phức tạp có thể hiệu quả khi văn bản là đầu ra thô, có tính dự đoán cao của AI. Nhưng chúng dễ bị lỗi: các đoạn văn ngắn thường nhiễu loạn, và nhiều thể loại văn bản do con người viết ra vốn dĩ có tính dự đoán cao (tóm tắt, định nghĩa, email doanh nghiệp, hướng dẫn sử dụng). Việc chỉnh sửa và hoàn thiện cũng có thể làm thay đổi điểm số một cách đáng kể. Những công cụ này phù hợp cho việc xử lý nhanh chóng, chứ không phải cho các quyết định quan trọng cần giải quyết độc lập.
Sự khác biệt giữa các công cụ phân loại và công cụ phân tích phong cách là gì?
Các bộ phân loại học từ các tập dữ liệu được gắn nhãn về văn bản do con người và AI (và đôi khi là sự kết hợp) viết, rồi dự đoán văn bản của bạn giống với loại nào nhất. Các công cụ phân tích phong cách viết tập trung vào “dấu vân tay” của văn bản, chẳng hạn như các mẫu lựa chọn từ ngữ, từ chức năng và các tín hiệu về khả năng đọc hiểu, những thông tin này có thể hữu ích hơn trong phân tích văn bản dài. Cả hai phương pháp đều gặp khó khăn khi thay đổi lĩnh vực nghiên cứu và có thể gặp trở ngại khi phong cách viết hoặc chủ đề khác với dữ liệu huấn luyện của chúng.
Liệu việc sử dụng hình mờ có giải quyết được vấn đề phát hiện AI một cách triệt để?
Dấu bản quyền có thể rất hiệu quả khi mô hình sử dụng chúng và bộ phát hiện biết được sơ đồ dấu bản quyền. Trên thực tế, không phải tất cả các nhà cung cấp đều sử dụng dấu bản quyền, và các biến đổi phổ biến - diễn giải lại, dịch thuật, trích dẫn một phần hoặc trộn lẫn các nguồn - có thể làm suy yếu hoặc phá vỡ mẫu. Phát hiện dấu bản quyền rất mạnh trong những trường hợp hẹp khi toàn bộ chuỗi khớp nhau, nhưng nó không bao phủ được mọi trường hợp.
Tôi nên hiểu điểm số “X% AI” như thế nào?
Hãy coi tỷ lệ phần trăm đơn lẻ như một chỉ số sơ bộ về "mức độ giống AI", chứ không phải là bằng chứng xác nhận AI là tác giả. Điểm số tầm trung đặc biệt mơ hồ, và ngay cả điểm số cao cũng có thể sai trong văn bản chuẩn hóa hoặc chính thức. Các công cụ tốt hơn cung cấp các giải thích như các đoạn văn được tô sáng, ghi chú tính năng và ngôn ngữ thể hiện sự không chắc chắn. Nếu một công cụ phát hiện không tự giải thích được, đừng coi con số đó là bằng chứng xác thực.
Những yếu tố nào tạo nên một công cụ phát hiện AI tốt cho trường học hoặc quy trình biên tập?
Một công cụ dò tìm đáng tin cậy cần được hiệu chuẩn, giảm thiểu sai sót và truyền đạt rõ ràng các giới hạn. Nó nên tránh đưa ra những tuyên bố quá tự tin dựa trên các mẫu dữ liệu ngắn, xử lý được nhiều lĩnh vực khác nhau (học thuật, blog và kỹ thuật) và duy trì tính ổn định khi con người chỉnh sửa văn bản. Những công cụ có trách nhiệm nhất hoạt động một cách khiêm tốn: chúng đưa ra bằng chứng và sự không chắc chắn thay vì hành động như những người đọc suy nghĩ.
Làm thế nào tôi có thể giảm thiểu việc vô tình gắn cờ AI mà không cần "lách luật" hệ thống?
Hãy tập trung vào những dấu hiệu chân thực của tác giả thay vì những thủ thuật. Thêm các chi tiết cụ thể (các bước bạn đã thực hiện, những hạn chế, sự đánh đổi), thay đổi nhịp điệu câu một cách tự nhiên và tránh những đoạn chuyển tiếp quá rập khuôn mà bạn thường không sử dụng. Giữ lại bản nháp, ghi chú và lịch sử chỉnh sửa - bằng chứng về quá trình thường quan trọng hơn điểm số của phần mềm phát hiện phần mềm trong các tranh chấp. Mục tiêu là sự rõ ràng đi kèm với cá tính, chứ không phải là văn phong hoàn hảo như trong cuốn cẩm nang quảng cáo.
Tài liệu tham khảo
-
Hiệp hội Ngôn ngữ học Máy tính (Tuyển tập ACL) - Khảo sát về phát hiện văn bản được tạo bởi LLM - aclanthology.org
-
OpenAI - Bộ phân loại AI mới để nhận diện văn bản do AI viết - openai.com
-
Hướng dẫn sử dụng Turnitin - Phát hiện lỗi chính tả bằng AI trong chế độ xem báo cáo cổ điển - guides.turnitin.com
-
Hướng dẫn sử dụng Turnitin - Mô hình phát hiện lỗi chính tả bằng AI - guides.turnitin.com
-
Turnitin - Tìm hiểu về các trường hợp nhận diện sai trong khả năng phát hiện lỗi chính tả bằng AI của chúng tôi - turnitin.com
-
arXiv - DetectGPT - arxiv.org
-
Đại học Boston - Perplexity Posts - cs.bu.edu
-
GPTZero - Sự khó hiểu và tính đột biến: đó là gì? - gptzero.me
-
PubMed Central (NCBI) - Phân tích văn phong và khoa học pháp y: Tổng quan tài liệu - ncbi.nlm.nih.gov
-
Hiệp hội Ngôn ngữ học Máy tính (Tuyển tập ACL) - Từ chức năng trong việc xác định tác giả - aclanthology.org
-
arXiv - Một dấu ấn cho các mô hình ngôn ngữ lớn - arxiv.org
-
Google AI dành cho nhà phát triển - SynthID Text - ai.google.dev
-
arXiv - Về độ tin cậy của dấu bản quyền đối với các mô hình ngôn ngữ lớn - arxiv.org
-
OpenAI - Hiểu rõ nguồn gốc những gì chúng ta thấy và nghe trên mạng - openai.com
-
Stanford HAI - Hệ thống phát hiện AI có thành kiến với người viết tiếng Anh không phải người bản xứ - hai.stanford.edu
-
arXiv - Liang và cộng sự - arxiv.org