Đã bao giờ bạn ngồi đó gãi đầu tự hỏi… những thứ này thực sự đến từ đâu vậy ? Ý tôi là, AI không lục lọi những chồng sách cũ kỹ trong thư viện hay lén lút xem các video ngắn trên YouTube. Vậy mà bằng cách nào đó, nó lại đưa ra câu trả lời cho mọi thứ – từ những mẹo làm lasagna đến vật lý hố đen – như thể nó có một tủ hồ sơ không đáy vậy. Thực tế còn kỳ lạ hơn, và có lẽ hấp dẫn hơn bạn tưởng. Hãy cùng tìm hiểu kỹ hơn (và tất nhiên, có thể sẽ bác bỏ một vài lầm tưởng trong quá trình này).
Có phải là phép thuật không? 🌐
Nó không phải là phép thuật, mặc dù đôi khi cảm giác như vậy. Về cơ bản, những gì đang diễn ra bên trong là dự đoán mẫu . Các mô hình ngôn ngữ lớn (LLM) không lưu trữ các sự kiện theo cách bộ não của bạn lưu giữ công thức làm bánh quy của bà bạn; thay vào đó, chúng được huấn luyện để đoán từ (token) tiếp theo dựa trên những gì đã xảy ra trước đó [2]. Trên thực tế, điều đó có nghĩa là chúng bám vào các mối quan hệ: những từ nào đi cùng nhau, câu thường hình thành như thế nào, toàn bộ ý tưởng được xây dựng như giàn giáo như thế nào. Đó là lý do tại sao đầu ra nghe có vẻ đúng, mặc dù - thành thật mà nói - đó là sự bắt chước thống kê, chứ không phải sự hiểu biết [4].
Vậy điều gì thực sự làm cho thông tin do AI tạo ra trở nên hữu ích ? Một vài điều:
-
Đa dạng dữ liệu - thu thập dữ liệu từ vô số nguồn khác nhau, chứ không chỉ một nguồn hẹp.
-
Cập nhật - nếu không có chu kỳ làm mới, nó sẽ nhanh chóng trở nên lỗi thời.
-
Lọc - lý tưởng nhất là giữ lại rác trước khi chúng ngấm vào (mặc dù, thành thật mà nói, lưới lọc đó vẫn có lỗ).
-
Kiểm tra chéo - dựa vào các nguồn có thẩm quyền (ví dụ như NASA, WHO, các trường đại học lớn), đây là điều bắt buộc trong hầu hết các cẩm nang quản trị AI [3].
Tuy nhiên, đôi khi nó bịa đặt một cách tự tin. Những cái gọi là ảo giác đó ? Về cơ bản là những điều vô nghĩa được trau chuốt kỹ lưỡng được truyền đạt với vẻ mặt nghiêm túc [2][3].
Những bài viết bạn có thể muốn đọc sau bài này:
🔗 Liệu trí tuệ nhân tạo có thể dự đoán số trúng xổ số?
Khám phá những lầm tưởng và sự thật về dự đoán xổ số bằng trí tuệ nhân tạo.
🔗 Áp dụng cách tiếp cận toàn diện đối với trí tuệ nhân tạo có nghĩa là gì?
Hiểu về Trí tuệ Nhân tạo với góc nhìn cân bằng về đạo đức và tác động.
🔗 Kinh Thánh nói gì về trí tuệ nhân tạo?
Nghiên cứu các quan điểm Kinh Thánh về công nghệ và sự tạo dựng con người.
So sánh nhanh: AI lấy dữ liệu từ đâu 📊
Không phải mọi nguồn thông tin đều có giá trị như nhau, nhưng mỗi nguồn đều đóng vai trò riêng. Dưới đây là một cái nhìn tổng quan.
| Loại nguồn | Ai sử dụng nó (Trí tuệ nhân tạo) | Chi phí/Giá trị | Vì sao nó hiệu quả (hoặc không hiệu quả...) |
|---|---|---|---|
| Sách & Bài báo | Mô hình ngôn ngữ lớn | Vô giá (gần như vậy) | Kiến thức cô đọng, có cấu trúc chặt chẽ - sẽ nhanh chóng trở nên lỗi thời. |
| Trang web & Blog | Hầu hết tất cả các AI | Miễn phí (có tiếng ồn) | Đa dạng đến khó tin; sự pha trộn giữa những tác phẩm xuất sắc và những thứ hoàn toàn vô giá trị. |
| Bài báo học thuật | Trí tuệ nhân tạo chuyên sâu về nghiên cứu | Đôi khi có tính phí | Tính chặt chẽ và độ tin cậy cao, nhưng lại được diễn đạt bằng ngôn ngữ chuyên ngành khó hiểu. |
| Dữ liệu người dùng | Trí tuệ nhân tạo cá nhân hóa | Rất nhạy cảm ⚠️ | Thiết kế rất tinh tế, nhưng lại tiềm ẩn nhiều vấn đề về quyền riêng tư. |
| Web thời gian thực | Trí tuệ nhân tạo liên kết tìm kiếm | Miễn phí (nếu trực tuyến) | Giúp thông tin luôn được cập nhật; nhược điểm là nguy cơ tin đồn bị khuếch đại. |
Vũ trụ dữ liệu huấn luyện 🌌
Đây là giai đoạn “học tập thời thơ ấu”. Hãy tưởng tượng đưa cho một đứa trẻ hàng triệu cuốn truyện, bài báo và những bài viết dài dòng trên Wikipedia cùng một lúc. Đó là hình thức đào tạo trước. Trong thế giới thực, các nhà cung cấp kết hợp dữ liệu có sẵn công khai, nguồn được cấp phép và văn bản do người đào tạo tạo ra [2].
Lớp trên cùng: các ví dụ của con người được chọn lọc - câu trả lời tốt, câu trả lời xấu, những lời nhắc nhở đúng hướng - trước khi quá trình củng cố bắt đầu [1].
Lưu ý về tính minh bạch: các công ty không tiết lộ mọi chi tiết. Một số rào cản là bí mật (sở hữu trí tuệ, vấn đề an toàn), vì vậy bạn chỉ có được một cái nhìn một phần về sự kết hợp thực tế [2].
Tìm kiếm thời gian thực: Thêm một lớp phủ đặc biệt 🍒
Một số mô hình hiện có thể nhìn ra ngoài phạm vi huấn luyện của chúng. Đó là tạo ra được tăng cường bằng truy xuất (RAG) - về cơ bản là lấy các đoạn từ chỉ mục trực tiếp hoặc kho lưu trữ tài liệu, sau đó kết hợp chúng vào câu trả lời [5]. Hoàn hảo cho những thứ thay đổi nhanh chóng như tiêu đề tin tức hoặc giá cổ phiếu.
Vấn đề nan giải là gì? Internet vừa là thiên tài vừa là bãi rác. Nếu các bộ lọc hoặc kiểm tra nguồn gốc yếu, bạn có nguy cơ dữ liệu rác lọt vào - chính xác là điều mà các khuôn khổ rủi ro cảnh báo [3].
Một giải pháp thay thế phổ biến: các công ty kết nối các mô hình với của riêng họ , vì vậy câu trả lời sẽ trích dẫn chính sách nhân sự hiện hành hoặc tài liệu sản phẩm được cập nhật thay vì đưa ra câu trả lời tùy tiện. Hãy nghĩ đến: ít tình huống "ôi không", nhiều câu trả lời đáng tin cậy hơn.
Tinh chỉnh: Bước hoàn thiện của AI 🧪
Các mô hình được huấn luyện trước ở dạng thô thường khá cồng kềnh. Vì vậy, chúng cần được tinh chỉnh :
-
Dạy chúng trở nên hữu ích, vô hại, trung thực (thông qua học tập củng cố từ phản hồi của con người, RLHF) [1].
-
Chà nhám các cạnh không an toàn hoặc độc hại (căn chỉnh) [1].
-
Điều chỉnh giọng điệu cho phù hợp - dù đó là thân thiện, trang trọng hay mỉa mai vui vẻ.
Đây không hẳn là việc mài giũa một viên kim cương, mà giống như việc điều khiển một lượng dữ liệu khổng lồ để nó trở nên giống một người bạn trò chuyện hơn.
Những khó khăn và thất bại 🚧
Chúng ta đừng giả vờ rằng nó hoàn hảo:
-
Ảo giác - những câu trả lời rõ ràng nhưng hoàn toàn sai [2][3].
-
Thiên kiến - nó phản ánh các mẫu cố hữu trong dữ liệu; thậm chí có thể khuếch đại chúng nếu không được kiểm tra [3][4].
-
Không có kinh nghiệm trực tiếp - nó có thể nói về công thức nấu súp nhưng chưa bao giờ nếm thử [4].
-
Tự tin thái quá - văn phong trôi chảy như thể nó biết, ngay cả khi nó không biết. Khung rủi ro nhấn mạnh các giả định cảnh báo [3].
Vì sao lại có cảm giác như đã biết? 🧠
Nó không có niềm tin, không có trí nhớ theo nghĩa của con người và chắc chắn không có bản ngã. Tuy nhiên, vì nó kết nối các câu lại với nhau một cách trơn tru, bộ não của bạn đọc nó như thể nó hiểu . Điều đang xảy ra chỉ là dự đoán mã thông báo tiếp theo quy mô lớn : xử lý hàng nghìn tỷ xác suất trong tích tắc [2].
Cảm giác “trí thông minh” là hành vi mới nổi mà các nhà nghiên cứu gọi một cách hơi mỉa mai là “con vẹt ngẫu nhiên” [4].
Ví dụ so sánh dễ hiểu cho trẻ em 🎨
Hãy tưởng tượng một con vẹt đã đọc hết mọi cuốn sách trong thư viện. Nó không hiểu cốt truyện nhưng có thể phối lại các từ ngữ thành thứ gì đó nghe có vẻ uyên bác. Đôi khi nó rất chính xác; đôi khi lại vô nghĩa - nhưng với đủ sự tinh tế, bạn không phải lúc nào cũng phân biệt được.
Tóm lại: Thông tin của AI đến từ đâu? 📌
Nói một cách đơn giản:
-
Dữ liệu đào tạo khổng lồ (công khai + được cấp phép + do người đào tạo tạo ra) [2].
-
Điều chỉnh tinh tế với phản hồi của con người để định hình giọng điệu/hành vi [1].
-
Hệ thống truy xuất khi được kết nối với các luồng dữ liệu trực tiếp [5].
AI không “biết” mọi thứ - nó dự đoán văn bản . Đó vừa là siêu năng lực vừa là điểm yếu chí mạng của nó. Tóm lại? Luôn luôn kiểm tra chéo những thông tin quan trọng với nguồn đáng tin cậy [3].
Tài liệu tham khảo
-
Ouyang, L. và cộng sự (2022). Huấn luyện mô hình ngôn ngữ để tuân theo hướng dẫn với phản hồi của con người (InstructGPT) . arXiv .
-
OpenAI (2023). Báo cáo kỹ thuật GPT-4 - sự kết hợp giữa dữ liệu được cấp phép, công khai và do con người tạo ra; mục tiêu và hạn chế của dự đoán token tiếp theo. arXiv .
-
NIST (2023). Khung quản lý rủi ro trí tuệ nhân tạo (AI RMF 1.0) - nguồn gốc, độ tin cậy và các biện pháp kiểm soát rủi ro. PDF .
-
Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Về những nguy hiểm của "con vẹt ngẫu nhiên": Liệu các mô hình ngôn ngữ có thể quá lớn? PDF .
-
Lewis, P. và cộng sự (2020). Tạo dữ liệu tăng cường bằng truy xuất cho xử lý ngôn ngữ tự nhiên chuyên sâu về kiến thức . arXiv .