Tôi có thể tin tưởng vào các công cụ nhận dạng bằng trí tuệ nhân tạo để chứng minh quyền tác giả không?

Các công cụ phát hiện bằng AI không đáng tin cậy để chứng minh quyền tác giả. Chúng có thể chỉ ra rằng một số nội dung cần được xem xét kỹ hơn, đặc biệt là với các đoạn văn dài, nhưng kết quả thường có thể gây hiểu nhầm. Tốt nhất nên coi những kết quả này như những gợi ý hơn là bằng chứng chắc chắn.

Tại sao các công cụ nhận dạng AI đôi khi lại đánh dấu nhầm chữ viết do con người tạo ra?

Các công cụ nhận diện AI có thể đưa ra kết quả dương tính giả, nghĩa là chúng có thể nhận định sai văn bản của con người là do AI tạo ra. Điều này thường xảy ra với các văn bản trang trọng, được trau chuốt kỹ lưỡng hoặc ngắn gọn, vì kiểu chữ viết có thể giống với kiểu chữ điển hình của sản phẩm AI.

Những yếu tố nào góp phần gây ra sự thiếu chính xác trong phát hiện của AI?

Các đoạn văn ngắn, văn bản được chỉnh sửa nhiều, văn bản kỹ thuật và định dạng cứng nhắc được biết là làm giảm độ chính xác của việc phát hiện bằng AI. Văn bản hàng ngày thường chứa các yếu tố hỗn hợp và các yếu tố gây nhiễu có thể đánh lừa các công cụ phát hiện.

Liệu việc diễn đạt lại bằng lời văn khác có thể giúp vượt qua các bộ lọc văn bản tự động bằng AI?

Đúng vậy, việc chỉnh sửa nhẹ hoặc diễn đạt lại có thể dẫn đến kết quả âm tính giả, nghĩa là văn bản do AI tạo ra không được phát hiện. Các công cụ phát hiện được thiết kế để tránh việc gắn cờ quá mức, điều này có thể khiến chúng bỏ sót nội dung do AI tạo ra khi nó được trộn lẫn với văn bản của con người.

Thay vì dựa vào điểm số của bộ dò AI, tôi nên dựa vào yếu tố nào khác?

Thay vì chỉ dựa vào điểm số của phần mềm nhận diện AI, nên tìm kiếm các bằng chứng về quy trình như lịch sử bản thảo, dàn ý và trích dẫn. Loại tài liệu này cung cấp bằng chứng xác thực mạnh mẽ hơn so với chỉ một điểm số nhận diện duy nhất.

Các cơ sở giáo dục có thể sử dụng các công cụ phát hiện AI một cách có trách nhiệm như thế nào?

Các cơ sở giáo dục nên sử dụng các công cụ phát hiện bằng AI như một công cụ sơ bộ chứ không phải là phương án phán quyết cuối cùng. Điều cần thiết là phải kết hợp việc xem xét của con người, cho phép sinh viên giải thích quy trình viết của họ và xem xét các bản nháp trước khi đưa ra bất kỳ hành động nào chỉ dựa trên điểm số của công cụ phát hiện.

Liệu việc sử dụng các công cụ phát hiện AI trong quy trình tuyển dụng có phải là một ý tưởng hay?

Việc sử dụng các công cụ phát hiện AI trong quy trình tuyển dụng có thể tiềm ẩn rủi ro vì văn bản nơi làm việc thường được cấu trúc và trau chuốt, giống với nội dung do AI tạo ra. Các phương pháp thay thế có thể bao gồm đánh giá các nhiệm vụ công việc thực tế hoặc thêm các cuộc thảo luận ngắn tiếp theo để đánh giá khả năng lập luận và sự mạch lạc của ứng viên.

So với việc xác định nguồn gốc xuất xứ hoặc đóng dấu bản quyền, phát hiện bằng AI có những hạn chế nào?

Phát hiện bằng AI dựa vào việc nhận dạng các mẫu để suy luận tác giả, điều này có thể gây nhầm lẫn giữa phong cách viết và nguồn gốc bài viết. Ngược lại, nguồn gốc xuất xứ và đóng dấu bản quyền nhằm mục đích xác minh nguồn gốc nội dung thông qua siêu dữ liệu được nhúng, mặc dù cả hai phương pháp đều không hoàn hảo do khả năng mất tín hiệu trong quá trình chỉnh sửa.

Liệu các thiết bị phát hiện AI có đáng tin cậy?

Liệu các thiết bị dò tìm bằng trí tuệ nhân tạo có đáng tin cậy?

Tóm lại: Các công cụ nhận dạng văn bản bằng AI có thể đóng vai trò như một tín hiệu "xem xét kỹ hơn" nhanh chóng, đặc biệt khi bạn có các mẫu văn bản dài hơn, nhưng chúng không phải là bằng chứng đáng tin cậy về tác giả. Với văn bản ngắn, được chỉnh sửa nhiều, mang tính trang trọng hoặc do người bản ngữ viết, việc nhận dạng sai và bỏ sót trở nên phổ biến, vì vậy quyết định không bao giờ nên chỉ dựa vào một điểm số duy nhất.

Chúng có thể hữu ích như một gợi ý - một lời nhắc nhở, một tín hiệu "có lẽ nên xem xét kỹ hơn". Nhưng chúng không đáng tin cậy như bằng chứng. Thậm chí còn không gần đúng. Và ngay cả các công ty xây dựng máy dò cũng có xu hướng nói điều này theo cách này hay cách khác (đôi khi nói to, đôi khi nói nhỏ). Ví dụ, OpenAI đã nói rằng không thể phát hiện một cách đáng tin cậy tất cả văn bản do AI viếtvà thậm chí đã công bố các số liệu đánh giá cho thấy tỷ lệ bỏ sót và dương tính giả đáng kể. [1]

Những điểm chính cần ghi nhớ:

Độ tin cậy: Hãy coi điểm số của máy dò kim loại như những gợi ý, chứ không phải bằng chứng, đặc biệt là trong các vụ án quan trọng.

Kết quả dương tính giả: Những bài viết trang trọng, theo mẫu, ngắn gọn hoặc được trau chuốt kỹ lưỡng thường bị dán nhãn sai.

Sai sót âm tính giả: Việc diễn đạt lại một cách sơ sài hoặc sự kết hợp giữa bản thảo của con người và AI có thể dễ dàng lọt qua khâu phát hiện.

Xác minh: Ưu tiên bằng chứng quy trình - lịch sử bản thảo, ghi chú, nguồn và nhật ký chỉnh sửa.

Quản trị: Cần có các giới hạn minh bạch, xem xét của con người và một lộ trình khiếu nại trước khi có hậu quả.

Những bài viết bạn có thể muốn đọc sau bài này:

🔗 Cách thức hoạt động của tính năng phát hiện bằng AI
Hãy xem các công cụ phát hiện văn bản do AI viết bằng cách sử dụng các mẫu và xác suất như thế nào.

🔗 Trí tuệ nhân tạo dự đoán xu hướng như thế nào?
Hiểu cách các thuật toán dự báo nhu cầu từ dữ liệu và tín hiệu.

🔗 Cách sử dụng trí tuệ nhân tạo trên điện thoại của bạn
Những cách thiết thực để sử dụng ứng dụng AI cho các công việc hàng ngày.

🔗 Liệu chuyển văn bản thành giọng nói có phải là trí tuệ nhân tạo (AI)?
Tìm hiểu cách các hệ thống TTS tạo ra giọng nói tự nhiên từ văn bản.

Sao mọi người cứ hỏi mãi về độ tin cậy của các thiết bị phát hiện AI vậy 😅

Bởi vì mức độ rủi ro tăng cao một cách bất thường, rất nhanh chóng.

Giáo viên muốn bảo vệ tính liêm chính trong học thuật 🎓
Các biên tập viên muốn ngăn chặn các bài viết spam thiếu đầu tư 📰
Các nhà tuyển dụng muốn có những bài viết mẫu chân thực 💼
Sinh viên muốn tránh bị vu oan 😬
Các thương hiệu muốn có giọng điệu nhất quán, chứ không phải là một xưởng sản xuất nội dung sao chép y nguyên 📣

Và, ở mức độ bản năng, có một khao khát sự an tâm từ một cỗ máy có thể khẳng định chắc chắn "đây là thật" hay "đây là giả". Giống như máy dò kim loại ở sân bay vậy.

Nhưng… ngôn ngữ không phải là kim loại. Ngôn ngữ giống như sương mù hơn. Bạn có thể chiếu đèn pin vào đó, nhưng mọi người vẫn tranh cãi về những gì họ nhìn thấy.

Độ tin cậy trong thực tế so với bản demo 🎭

Trong điều kiện được kiểm soát, các thiết bị dò tìm có thể trông rất ấn tượng. Nhưng trong sử dụng hàng ngày, chúng lại kém gọn gàng hơn - bởi vì các thiết bị dò tìm không "nhận biết tác giả", mà chỉ nhận biết các mẫu hình.

Ngay cả trang phân loại văn bản hiện đã ngừng hoạt động của OpenAI cũng thẳng thắn về vấn đề cốt lõi: việc phát hiện đáng tin cậy không được đảm bảo và hiệu suất thay đổi tùy thuộc vào các yếu tố như độ dài văn bản (văn bản ngắn khó hơn). Họ cũng chia sẻ một ví dụ cụ thể về sự đánh đổi: chỉ bắt được một phần văn bản của AI trong khi đôi khi vẫn dán nhãn sai văn bản của con người. [1]

Việc viết lách hàng ngày đầy rẫy những yếu tố gây nhiễu:

chỉnh sửa nặng
mẫu
giọng điệu kỹ thuật
cách diễn đạt không phải tiếng mẹ đẻ
câu trả lời ngắn
định dạng học thuật nghiêm ngặt
“Tôi viết bài này lúc 2 giờ sáng và đầu óc tôi đã mệt mỏi rã rời” – nguồn năng lượng

Vậy nên, máy dò có thể phản ứng với kiểu dángchứ không phải nguồn gốc. Giống như việc cố gắng xác định ai đã nướng bánh bằng cách nhìn vào vụn bánh vậy. Đôi khi bạn có thể đoán được. Đôi khi bạn chỉ đang đánh giá dựa trên cảm nhận từ vụn bánh.

Cách thức hoạt động của các thiết bị dò tìm AI (và lý do tại sao chúng bị lỗi) 🧠🔧

Hầu hết các "công cụ dò tìm AI" mà bạn gặp ngoài đời thực đều thuộc hai loại chính:

1) Phát hiện dựa trên phong cách (dự đoán từ các mẫu văn bản)

Điều này bao gồm các phương pháp "phân loại" cổ điển và các phương pháp dựa trên khả năng dự đoán/độ phức tạp. Công cụ này học các tín hiệu thống kê có xu hướng xuất hiện trong một số kết quả đầu ra của mô hình… và sau đó nó khái quát hóa.

Lý do nó bị hỏng:

Văn phong của con người cũng có thể trông "mang tính thống kê" (đặc biệt là văn phong trang trọng, tuân theo quy tắc hoặc mẫu có sẵn).
Viết văn hiện đại thường là sự kết hợp của nhiều yếu tố (con người + chỉnh sửa + gợi ý từ AI + công cụ ngữ pháp).
Các công cụ có thể trở nên quá tự tin khi ở ngoài vùng thoải mái thử nghiệm của chúng. [1]

2) Nguồn gốc/dấu bản quyền (xác minh, không phải phỏng đoán)

Thay vì cố gắng suy luận tác giả từ "dấu vết", các hệ thống xác thực nguồn gốc cố gắng đính kèm chứng minh nguồn gốc , hoặc nhúng các tín hiệu có thể được kiểm tra sau này.

Công việc của NIST về nội dung tổng hợp nhấn mạnh một thực tế quan trọng ở đây: ngay cả các bộ phát hiện hình mờ cũng có những kết quả dương tính giả và âm tính giả không bằng không - và độ tin cậy phụ thuộc vào việc hình mờ có tồn tại qua hành trình từ khi tạo ra → chỉnh sửa → đăng lại → chụp màn hình → xử lý trên nền tảng hay không. [2]

Vậy nên, về nguyên tắc, nguồn gốc xuất xứ rõ ràng hơn… nhưng chỉ khi hệ sinh thái hỗ trợ điều đó từ đầu đến cuối.

Các lỗi thường gặp: dương tính giả và âm tính giả 😬🫥

Đây chính là cốt lõi của vấn đề. Nếu bạn muốn biết liệu các thiết bị phát hiện bằng AI có đáng tin cậy hay không, bạn phải tự hỏi: đáng tin cậy với cái giá nào?

Kết quả dương tính giả (con người đánh dấu là AI) 😟

Đây là kịch bản ác mộng trong trường học và nơi làm việc: một người viết gì đó, bị gắn cờ là vi phạm, và đột nhiên họ phải tự bảo vệ mình trước một con số trên màn hình.

Đây là một mô típ phổ biến đến mức đáng buồn:

Một sinh viên nộp một bài phản ánh ngắn (khoảng vài trăm từ).
Một công cụ phát hiện đưa ra một điểm số có vẻ đáng tin cậy.
Mọi người hoảng sợ.
Sau đó, bạn biết rằng chính công cụ đó cảnh báo rằng những bài nộp ngắn có thể kém tin cậy hơn - và điểm số không nên được sử dụng làm cơ sở duy nhất cho hành động bất lợi. [3]

Hướng dẫn của Turnitin (trong ghi chú phát hành/tài liệu của họ) cảnh báo rõ ràng rằng các bài nộp dưới 300 từ có thể kém chính xác hơnvà nhắc nhở các tổ chức không sử dụng điểm AI làm cơ sở duy nhất cho các hành động bất lợi đối với sinh viên. [3]

Kết quả dương tính giả cũng thường xuất hiện khi văn bản được viết theo cách:

quá trang trọng
Tính lặp lại được thiết kế sẵn (bảng đánh giá, báo cáo, mẫu thương hiệu)
Ngắn (tín hiệu yếu hơn, nhiều phỏng đoán hơn)
Đã được hiệu đính và chỉnh sửa kỹ lưỡng

Về cơ bản, một công cụ nhận dạng có thể nói: “Đây trông giống như loại văn bản mà tôi đã thấy từ AI” ngay cả khi thực tế không phải vậy. Đó không phải là ác ý. Đó chỉ đơn giản là việc so khớp mẫu với một thanh trượt độ tin cậy.

Kết quả âm tính giả (AI không gắn cờ) 🫥

Nếu ai đó sử dụng AI và chỉnh sửa nhẹ - sắp xếp lại, diễn đạt lại, chèn thêm một số chi tiết do con người tạo ra - thì các công cụ phát hiện có thể bỏ sót. Ngoài ra, các công cụ được điều chỉnh để tránh cáo buộc sai thường sẽ bỏ sót nhiều văn bản do AI tạo ra hơn theo thiết kế (đó là sự đánh đổi ngưỡng). [1]

Vì vậy, bạn có thể gặp phải sự kết hợp tồi tệ nhất:

Những người viết chân thành đôi khi vẫn bị gắn cờ
Những kẻ gian lận quyết tâm thường không

Không phải lúc nào cũng vậy. Nhưng thường thì việc sử dụng máy dò làm "bằng chứng" là khá rủi ro.

Điều gì tạo nên một thiết lập dò tìm “tốt” (ngay cả khi các thiết bị dò tìm không hoàn hảo) ✅🧪

Nếu bạn vẫn định sử dụng hệ thống này (vì các tổ chức thường có những quy trình riêng), thì một hệ thống tốt sẽ giống với "phân loại bệnh nhân + thu thập bằng chứng" hơn là "thẩm phán + bồi thẩm đoàn"

Một thiết lập có trách nhiệm bao gồm:

Giới hạn minh bạch (cảnh báo văn bản ngắn, giới hạn miền, phạm vi tin cậy) [1][3]
Ngưỡng rõ ràng + sự không chắc chắn là một kết quả hợp lệ ("chúng ta không biết" không nên bị coi là điều cấm kỵ)
Đánh giá của con người và bằng chứng về quy trình (bản nháp, dàn ý, lịch sử sửa đổi, nguồn tham khảo)
Các chính sách ngăn cấm rõ ràng các quyết định mang tính trừng phạt, chỉ dựa trên điểm số [3]
Bảo vệ quyền riêng tư (đừng đưa những nội dung nhạy cảm vào các trang quản lý nội dung đáng ngờ)

Bảng so sánh: phương pháp phát hiện so với phương pháp xác minh 📊🧩

Chiếc bàn này có một vài điểm không hoàn hảo một cách có chủ ý, bởi vì đó là cách mà những chiếc bàn thường trông như thế khi được một người làm ra trong lúc nhâm nhi tách trà nguội ☕.

Công cụ / Phương pháp	Khán giả	Sử dụng thông thường	Vì sao nó hiệu quả (và vì sao nó không hiệu quả)
Các công cụ nhận diện dựa trên phong cách (các công cụ “chấm điểm AI” chung)	Mọi người	Sàng lọc nhanh	Nhanh chóng và dễ dàng, nhưng có thể nhầm lẫn giữa phong cách và nguồn gốc - và có xu hướng kém chính xác hơn đối với văn bản ngắn hoặc được chỉnh sửa nhiều. [1]
Máy dò cấp cơ sở (tích hợp với hệ thống quản lý học tập LMS)	Trường học, đại học	Gắn cờ quy trình làm việc	Thuận tiện cho việc sàng lọc nhưng có rủi ro khi được coi là bằng chứng; nhiều công cụ cảnh báo rõ ràng về kết quả chỉ dựa trên điểm số. [3]
Tiêu chuẩn xác định nguồn gốc (Chứng chỉ nội dung / kiểu C2PA)	Các nền tảng, phòng tin tức	Nguồn gốc truy tìm + chỉnh sửa	Mạnh mẽ hơn khi được áp dụng từ đầu đến cuối; dựa vào siêu dữ liệu tồn tại trong hệ sinh thái rộng lớn hơn. [4]
Hệ sinh thái đóng dấu bản quyền (ví dụ: dành riêng cho nhà cung cấp)	Các nhà cung cấp công cụ, nền tảng	Xác minh dựa trên tín hiệu	Hoạt động khi nội dung đến từ các công cụ đóng dấu bản quyền và có thể được phát hiện sau đó; không phổ biến và các công cụ phát hiện vẫn có tỷ lệ lỗi. [2][5]

Máy dò trong giáo dục 🎓📚

Giáo dục là môi trường khắc nghiệt nhất đối với những người phát hiện ra tội phạm vì những tác hại mà nó gây ra là trực tiếp và mang tính cá nhân.

Học sinh thường được dạy cách viết theo những khuôn mẫu "có vẻ cứng nhắc" vì điểm số của họ thực chất được chấm dựa trên cấu trúc bài viết:

luận điểm
mẫu đoạn văn
giọng điệu nhất quán
chuyển đổi chính thức

Vì vậy, máy dò có thể trừng phạt học sinh vì… tuân thủ nội quy.

Nếu trường học sử dụng máy dò kim loại, phương pháp khả thi nhất thường bao gồm:

máy dò chỉ dùng để phân loại ban đầu
Không có hình phạt nào được áp dụng nếu không có sự xem xét của con người
cơ hội để sinh viên giải thích quy trình của họ
Bản thảo lịch sử / dàn ý / nguồn tư liệu như một phần của quá trình đánh giá
theo dõi bằng miệng khi cần thiết

Và đúng vậy, việc theo dõi bằng miệng có thể giống như một cuộc thẩm vấn. Nhưng chúng có thể công bằng hơn là “robot nói bạn gian lận”, đặc biệt là khi chính thiết bị phát hiện cảnh báo chống lại các quyết định chỉ dựa trên điểm số. [3]

Các công cụ phát hiện dành cho tuyển dụng và viết văn bản nơi công sở 💼✍️

Việc viết lách trong môi trường công sở thường:

mẫu
được đánh bóng
lặp lại
(Được chỉnh sửa bởi nhiều người)

Nói cách khác: nó có thể trông giống như thuật toán ngay cả khi đó là con người.

Nếu bạn đang tuyển dụng, một cách tiếp cận tốt hơn là chỉ dựa vào điểm số của máy dò kim loại:

Hãy yêu cầu viết bài luận gắn liền với các nhiệm vụ công việc thực tế
Thêm một buổi trò chuyện trực tiếp ngắn (thậm chí chỉ 5 phút) để theo dõi
Đánh giá tính hợp lý và sự mạch lạc, chứ không chỉ "hình thức"
cho phép các ứng viên công khai trước các quy tắc hỗ trợ AI

Cố gắng “phát hiện AI” trong quy trình làm việc hiện đại giống như cố gắng phát hiện xem ai đó có sử dụng phần mềm kiểm tra chính tả hay không. Cuối cùng bạn nhận ra thế giới đã thay đổi trong khi bạn không để ý. [1]

Công cụ phát hiện dành cho nhà xuất bản, SEO và kiểm duyệt 📰📈

Các công cụ phát hiện có thể hữu ích cho việc phân loại hàng loạt: gắn cờ các nhóm nội dung đáng ngờ để con người xem xét.

Nhưng một biên tập viên cẩn thận thường phát hiện ra các vấn đề "mang hơi hướng AI" nhanh hơn so với phần mềm phát hiện, bởi vì biên tập viên để ý:

Những tuyên bố mơ hồ, không có thông tin cụ thể
Giọng điệu tự tin nhưng không có bằng chứng
kết cấu bê tông bị thiếu
Cách diễn đạt "cố ý" nghe không tự nhiên

Và đây là điều bất ngờ: đó không phải là một siêu năng lực thần kỳ. Đó chỉ là trực giác biên tập về các tín hiệu đáng tin cậy.

Những lựa chọn tốt hơn so với chỉ dựa vào phát hiện đơn thuần: nguồn gốc, quy trình và "trình bày rõ ràng quy trình" 🧾🔍

Nếu máy dò không đáng tin cậy để làm bằng chứng, thì các phương án tốt hơn thường trông giống như bằng chứng chồng chất hơn là một kết quả đơn lẻ.

1) Thu thập bằng chứng (người hùng thầm lặng) 😮💨✅

bản nháp
lịch sử sửa đổi
ghi chú và dàn ý
trích dẫn và dấu vết nguồn
Quản lý phiên bản cho văn bản chuyên nghiệp

2) Các bước kiểm tra tính xác thực không mang tính "bẫy" 🗣️

“Tại sao bạn lại chọn cấu trúc này?”
“Bạn đã từ chối phương án nào và tại sao?”
“Hãy giải thích đoạn văn này cho người trẻ tuổi hơn.”

3) Tiêu chuẩn về nguồn gốc xuất xứ + đóng dấu bản quyền (nếu có thể) 🧷💧

Chứng chỉ nội dung của C2PA được thiết kế để giúp khán giả theo dõi nguồn gốc và lịch sử chỉnh sửa của nội dung kỹ thuật số (hãy nghĩ đến khái niệm “nhãn dinh dưỡng” cho phương tiện truyền thông). [4]
Trong khi đó, hệ sinh thái SynthID của Google tập trung vào việc đóng dấu bản quyền và phát hiện sau này đối với nội dung được tạo bằng các công cụ được Google hỗ trợ (và một cổng phát hiện quét các nội dung tải lên và làm nổi bật các vùng có khả năng được đóng dấu bản quyền). [5]

Đây là mang tính xác minh - không hoàn hảo, không phổ quát, nhưng hướng đến một hướng rõ ràng hơn so với "đoán từ cảm nhận". [2]

4) Chính sách rõ ràng, phù hợp với thực tế 📜

"Cấm AI" là một quan điểm đơn giản… và thường không thực tế. Nhiều tổ chức đang hướng tới:

“Trí tuệ nhân tạo được dùng để động não ý tưởng, chứ không phải để soạn thảo bản cuối cùng”
“Được phép sử dụng AI nếu được tiết lộ”
“Trí tuệ nhân tạo cho phép kiểm tra ngữ pháp và sự mạch lạc, nhưng lập luận ban đầu phải là của bạn.”

Cách sử dụng công cụ phát hiện AI một cách có trách nhiệm (nếu bạn bắt buộc phải dùng) ⚖️🧠

Chỉ sử dụng máy dò như một dấu hiệu
chứ không phải là phán quyết. Không phải là tác nhân gây ra hình phạt. [3]
Kiểm tra loại văn bản
Câu trả lời ngắn? Danh sách gạch đầu dòng? Đã chỉnh sửa nhiều? Hãy mong đợi kết quả nhiễu hơn. [1][3]
Hãy tìm kiếm những bằng chứng xác thực:
bản thảo, tài liệu tham khảo, giọng văn nhất quán xuyên suốt thời gian và khả năng giải thích các lựa chọn của tác giả.
Giả sử việc có nhiều tác giả cùng viết bài là điều bình thường hiện nay:
Con người + biên tập viên + công cụ ngữ pháp + gợi ý từ AI + mẫu... thì đó chính là thứ Ba.
Không bao giờ dựa vào một con số.
Điểm số đơn lẻ khuyến khích những quyết định lười biếng - và những quyết định lười biếng là nguyên nhân dẫn đến những cáo buộc sai trái. [3]

Lời kết ✨

Tóm lại, bức tranh về độ tin cậy trông như thế này:

Đáng tin cậy như một gợi ý sơ bộ: đôi khi ✅
Độ tin cậy để chứng minh: không ❌
Chỉ dựa vào sự an toàn để trừng phạt hoặc khống chế đối phương: hoàn toàn không được 😬

Hãy coi máy dò như một thiết bị báo cháy:

Nó có thể gợi ý rằng bạn nên xem xét kỹ hơn
Nó không thể cho bạn biết chính xác chuyện gì đã xảy ra
Nó không thể thay thế cho việc điều tra, bối cảnh và bằng chứng về quy trình

Máy phát minh sự thật chỉ với một cú nhấp chuột chủ yếu chỉ có trong phim khoa học viễn tưởng. Hoặc các chương trình quảng cáo bán hàng trên truyền hình.

Ví dụ thực tế: Sử dụng công cụ phát hiện AI làm tín hiệu đánh giá trong trường học 🎓🔍

Kịch bản

Một giáo viên tiếng Anh lớp 12 có 28 bài luận cần chấm. Trường cho phép sử dụng công cụ ngữ pháp, nhưng không cho phép bài luận được viết hoàn toàn bằng trí tuệ nhân tạo. Thay vì coi điểm số từ công cụ phát hiện AI là bằng chứng xác thực, giáo viên sử dụng nó như một tín hiệu sàng lọc.

Mục đích không phải là "bắt lỗi" sinh viên chỉ bằng một điểm số duy nhất. Mục đích là để quyết định bài nộp nào cần được xem xét kỹ hơn, sau đó so sánh từng bài luận với các bằng chứng về quá trình thực hiện: ghi chú dàn ý, danh sách nguồn tham khảo, lịch sử bản thảo và lời giải thích ngắn gọn của sinh viên.

Những thứ giáo viên cần

Một cấu hình thực tế có thể bao gồm:

bài luận cuối cùng
dàn ý hoặc ghi chú kế hoạch của sinh viên
Lịch sử phiên bản từ Google Docs, Word hoặc hệ thống quản lý học tập của trường
Bản hướng dẫn bài tập và thang điểm đánh giá
bất kỳ chính sách sử dụng AI nào mà sinh viên được cung cấp
Một đoạn phản hồi ngắn từ sinh viên: “Cô/Thầy đã xây dựng luận điểm này như thế nào?”

Ví dụ hướng dẫn

Trước khi ôn tập, giáo viên có thể sử dụng danh sách kiểm tra như sau:

Chỉ sử dụng điểm số từ công cụ phát hiện như một dấu hiệu cảnh báo. Không coi đó là bằng chứng về hành vi sai trái. So sánh bài luận cuối cùng với ghi chú, bản nháp trước đó, trích dẫn và khả năng giải thích lựa chọn của sinh viên. Nếu văn bản dưới 300 từ, sử dụng quá nhiều mẫu có sẵn hoặc được viết theo phong cách rất trang trọng, hãy đánh dấu kết quả phát hiện là độ tin cậy thấp. Chỉ nên báo cáo khi có nhiều tín hiệu cùng chỉ ra một hướng.

Cách kiểm tra nó

Một trường học có thể tiến hành một cuộc thử nghiệm nội bộ nhỏ trước khi sử dụng bất kỳ thiết bị dò nào trong các trường hợp thực tế:

Thu thập 10 mẫu văn bản do con người viết, có ghi rõ lịch sử bản thảo.
Thu thập 5 mẫu do AI tạo ra để thử nghiệm.
Thu thập 5 mẫu hỗn hợp, trong đó văn bản được chỉnh sửa bởi AI do con người thực hiện.
Cho cả 20 mẫu chạy qua máy dò.
Ghi lại các trường hợp dương tính giả, âm tính giả và các trường hợp "không chắc chắn".
Hãy nhờ hai giáo viên cùng xem lại các bài mẫu giống nhau bằng cách sử dụng bản nháp, ghi chú và lời giải thích của học sinh.
So sánh phương pháp nào tạo ra ít báo cáo không công bằng hơn.

Kết quả

Kết quả minh họa: trong một bài kiểm tra 20 mẫu như trên, công cụ phát hiện có thể gắn cờ 7 bài viết là "có khả năng do AI tạo ra". Sau khi kiểm tra lịch sử bản nháp và lời giải thích của học sinh, 3 trong số những cờ đó có thể là kết quả dương tính giả.

Điều đó có nghĩa là công cụ phát hiện thoạt nhìn có vẻ hữu ích, nhưng quy trình chỉ dựa vào điểm số sẽ đánh giá sai 15% tổng số bài mẫu. Quy trình an toàn hơn mất nhiều thời gian hơn - khoảng 8 phút cho mỗi bài luận bị gắn cờ thay vì 1-2 phút để kiểm tra điểm nhanh - nhưng nó cung cấp cho giáo viên một cách để phân biệt các tín hiệu yếu với bằng chứng mạnh hơn.

Chỉ số này rất dễ xác minh: đếm số lượng hồ sơ bị gắn cờ, đếm số lượng hồ sơ được chấp thuận sau khi xem xét quy trình và theo dõi thời gian xem xét cho từng trường hợp.

Điều gì có thể xảy ra sai sót?

Sai lầm lớn nhất là coi bảng điều khiển của thiết bị dò tìm như một bản án.

Những lỗi thường gặp khác bao gồm:

sử dụng máy dò trên các câu trả lời rất ngắn
bỏ qua các kiểu viết không phải tiếng mẹ đẻ
quên mất rằng văn phong trau chuốt của con người đôi khi lại trông "giống như văn phong của AI"
giả định rằng "không bị gắn cờ" có nghĩa là "chắc chắn là người"
Không cho sinh viên cơ hội giải thích công việc của họ
Sử dụng bài viết cá nhân của sinh viên trong các công cụ mà không kiểm tra chính sách dữ liệu

Bài học thực tiễn

Công cụ dò tìm có thể giúp quyết định nên tìm kiếm ở đâu trước, nhưng nó không bao giờ nên quyết định điều gì đã xảy ra. Câu hỏi công bằng hơn không phải là "Công cụ này cho điểm bao nhiêu?" mà là "Sinh viên có thể chứng minh được quá trình thực hiện bài làm này như thế nào không?"

Câu hỏi thường gặp

Liệu các công cụ phát hiện văn bản bằng AI có đáng tin cậy để chứng minh ai đó đã sử dụng AI hay không?

Các công cụ nhận dạng văn bản bằng AI không phải là bằng chứng đáng tin cậy về quyền tác giả. Chúng có thể đóng vai trò như một tín hiệu nhanh chóng cho thấy một nội dung nào đó có thể cần được xem xét lại, đặc biệt là với các mẫu dài hơn, nhưng cùng một điểm số có thể sai theo cả hai hướng. Trong những tình huống quan trọng, bài báo khuyến nghị nên coi kết quả của công cụ nhận dạng như một gợi ý, chứ không phải bằng chứng, và tránh mọi quyết định phụ thuộc vào một con số duy nhất.

Tại sao các phần mềm phát hiện AI lại nhận diện chữ viết của con người là chữ viết của AI?

Hiện tượng dương tính giả xảy ra khi các bộ phát hiện phản ứng với phong cách hơn là nguồn gốc. Văn bản trang trọng, theo khuôn mẫu, được trau chuốt kỹ lưỡng hoặc ngắn gọn có thể bị hiểu nhầm là "mang tính thống kê" và dẫn đến điểm số cao ngay cả khi nó hoàn toàn do con người viết. Bài báo lưu ý rằng điều này đặc biệt phổ biến trong môi trường như trường học hoặc nơi làm việc, nơi cấu trúc, tính nhất quán và sự rõ ràng được đánh giá cao, điều này có thể vô tình tạo ra những điểm tương đồng với các mẫu mà bộ phát hiện liên kết với đầu ra của AI.

Loại văn bản nào khiến khả năng nhận diện của AI trở nên kém chính xác hơn?

Các đoạn văn ngắn, văn bản được chỉnh sửa nhiều, định dạng học thuật kỹ thuật hoặc cứng nhắc, và cách diễn đạt không phải của người bản ngữ thường tạo ra kết quả nhiễu hơn. Bài báo nhấn mạnh rằng việc viết hàng ngày bao gồm rất nhiều yếu tố gây nhiễu - mẫu, việc hiệu đính và các công cụ soạn thảo khác nhau - làm rối loạn các hệ thống dựa trên mẫu. Trong những trường hợp này, "điểm số AI" gần giống với một phỏng đoán không chắc chắn hơn là một phép đo đáng tin cậy.

Liệu ai đó có thể vượt qua các bộ lọc văn bản tự động bằng cách diễn đạt lại câu chữ không?

Đúng vậy, lỗi âm tính giả thường xảy ra khi văn bản do AI tạo ra được chỉnh sửa nhẹ. Bài viết giải thích rằng việc sắp xếp lại câu, diễn đạt lại hoặc kết hợp giữa văn bản do con người và AI soạn thảo có thể làm giảm độ tin cậy của bộ phát hiện và khiến công việc do AI hỗ trợ bị bỏ sót. Các bộ phát hiện được tinh chỉnh để tránh cáo buộc sai thường bỏ sót nhiều nội dung do AI tạo ra hơn, vì vậy "không bị gắn cờ" không có nghĩa là "chắc chắn là do con người"

Có giải pháp nào an toàn hơn thay vì chỉ dựa vào điểm số của máy dò AI?

Bài viết khuyến nghị sử dụng bằng chứng quy trình thay vì phỏng đoán dựa trên mẫu. Lịch sử bản thảo, dàn ý, ghi chú, nguồn trích dẫn và nhật ký chỉnh sửa cung cấp bằng chứng cụ thể hơn về quyền tác giả so với điểm số của phần mềm nhận dạng. Trong nhiều quy trình làm việc, việc "trình bày quá trình làm việc" vừa công bằng hơn vừa khó bị gian lận hơn. Bằng chứng nhiều lớp cũng làm giảm nguy cơ trừng phạt một tác giả chân chính vì kết quả phân loại tự động gây hiểu nhầm.

Các trường học nên sử dụng máy dò AI như thế nào để không gây hại cho học sinh?

Giáo dục là môi trường có rủi ro cao vì hậu quả mang tính cá nhân và tức thời. Bài báo lập luận rằng các công cụ phát hiện gian lận chỉ nên được sử dụng để sàng lọc ban đầu, chứ không bao giờ được dùng làm cơ sở để xử phạt mà không có sự xem xét của con người. Một cách tiếp cận hợp lý bao gồm việc cho phép sinh viên giải thích quy trình của họ, xem xét các bản nháp và dàn ý, và sử dụng các bước theo dõi khi cần thiết - thay vì coi điểm số như một phán quyết, đặc biệt là đối với các bài nộp ngắn.

Liệu các công cụ phát hiện bằng AI có phù hợp cho việc tuyển dụng và đánh giá bài viết mẫu trong môi trường làm việc?

Chúng tiềm ẩn rủi ro khi được sử dụng như một công cụ sàng lọc vì văn bản nơi công sở thường được trau chuốt, soạn thảo theo mẫu và chỉnh sửa bởi nhiều người, điều này có thể trông "máy móc" ngay cả khi đó là do con người thực hiện. Bài báo đề xuất các giải pháp thay thế tốt hơn: các nhiệm vụ viết liên quan đến công việc, các buổi trao đổi ngắn trực tiếp và đánh giá lý lẽ và sự rõ ràng. Bài báo cũng lưu ý rằng việc nhiều tác giả cùng viết bài ngày càng trở nên phổ biến trong quy trình làm việc hiện đại.

Sự khác biệt giữa nhận diện bằng AI và xác thực nguồn gốc hoặc đóng dấu bản quyền là gì?

Việc phát hiện tác giả cố gắng suy luận từ các mẫu văn bản, điều này có thể gây nhầm lẫn giữa phong cách và nguồn gốc. Xác minh nguồn gốc và đóng dấu bản quyền nhằm mục đích xác thực nguồn gốc nội dung bằng cách sử dụng siêu dữ liệu hoặc các tín hiệu được nhúng có thể được kiểm tra sau này. Bài viết nhấn mạnh rằng ngay cả những phương pháp xác minh này cũng không hoàn hảo - các tín hiệu có thể bị mất do chỉnh sửa hoặc đăng lại - nhưng chúng rõ ràng hơn về mặt khái niệm khi được hỗ trợ từ đầu đến cuối.

Một hệ thống phát hiện AI "có trách nhiệm" trông như thế nào?

Bài viết này định nghĩa việc sử dụng có trách nhiệm là “phân loại + bằng chứng”, chứ không phải “thẩm phán + bồi thẩm đoàn”. Điều đó có nghĩa là các giới hạn phải được minh bạch, chấp nhận sự không chắc chắn, xem xét của con người và có con đường kháng cáo trước khi chịu hậu quả. Bài viết cũng kêu gọi kiểm tra loại văn bản (ngắn hay dài, đã chỉnh sửa hay chưa chỉnh sửa), ưu tiên các bằng chứng có căn cứ như bản nháp và nguồn tham khảo, và tránh các kết quả mang tính trừng phạt, chỉ dựa trên điểm số có thể dẫn đến những cáo buộc sai trái.

Tài liệu tham khảo

[1] OpenAI - Bộ phân loại AI mới để chỉ ra văn bản do AI viết (bao gồm các hạn chế + thảo luận đánh giá) - đọc thêm
[2] NIST - Giảm thiểu rủi ro do nội dung tổng hợp gây ra (NIST AI 100-4) - đọc thêm
[3] Turnitin - Mô hình phát hiện văn bản do AI viết (bao gồm cảnh báo về văn bản ngắn + không sử dụng điểm số làm cơ sở duy nhất cho hành động bất lợi) - đọc thêm
[4] C2PA - Tổng quan về C2PA / Chứng chỉ nội dung - đọc thêm
[5] Google - SynthID Detector - một cổng thông tin giúp xác định nội dung do AI tạo ra - đọc thêm

Tìm kiếm những công nghệ AI mới nhất tại Cửa hàng Trợ lý AI chính thức

Về chúng tôi

Quay lại blog