Trí tuệ nhân tạo có thể giống như một trò ảo thuật mà ai cũng gật gù đồng tình trong khi thầm nghĩ... khoan đã, nó thực sự hoạt động như thế nào? Tin tốt đây. Chúng tôi sẽ giải thích nó một cách dễ hiểu, thực tế và đưa ra một vài phép so sánh chưa hoàn hảo nhưng vẫn thuyết phục. Nếu bạn chỉ muốn biết ý chính, hãy xem câu trả lời dài một phút bên dưới; nhưng thành thật mà nói, chi tiết mới là thứ giúp bạn hiểu rõ hơn 💡.
Những bài viết bạn có thể muốn đọc sau bài này:
🔗 GPT là viết tắt của từ gì?
Giải thích nhanh về từ viết tắt GPT và ý nghĩa của nó.
🔗 AI lấy thông tin từ đâu?
Các nguồn AI sử dụng để học, đào tạo và trả lời câu hỏi.
🔗 Làm thế nào để tích hợp trí tuệ nhân tạo vào doanh nghiệp của bạn?
Các bước thực tế, công cụ và quy trình làm việc để tích hợp AI hiệu quả.
🔗 Làm thế nào để bắt đầu một công ty trí tuệ nhân tạo?
Từ ý tưởng đến ra mắt: xác thực, tài trợ, nhóm và thực hiện.
AI hoạt động như thế nào? Câu trả lời trong một phút ⏱️
AI học các mẫu từ dữ liệu để đưa ra dự đoán hoặc tạo nội dung - không cần quy tắc viết tay. Một hệ thống tiếp nhận các ví dụ, đo lường mức độ sai lệch thông qua hàm mất mát, và điều chỉnh các nút bấm bên trong - các tham số - để mỗi lần sai lệch ít hơn một chút. Rửa sạch, lặp lại, cải thiện. Với đủ chu kỳ, nó sẽ trở nên hữu ích. Câu chuyện tương tự cho dù bạn đang phân loại email, phát hiện khối u, chơi trò chơi trên bàn cờ hay viết thơ Haiku. Để có nền tảng ngôn ngữ dễ hiểu về "học máy", tổng quan của IBM rất vững chắc [1].
AI hiện đại nhất là học máy. Phiên bản đơn giản nhất: nhập dữ liệu, học cách ánh xạ từ đầu vào đến đầu ra, sau đó khái quát hóa thành những thứ mới. Không phải phép thuật toán học, tính toán, và, thành thật mà nói, một chút nghệ thuật.
“AI hoạt động như thế nào?” ✅
Khi mọi người tìm kiếm trên Google "AI hoạt động như thế nào?" , họ thường muốn:
-
một mô hình tinh thần có thể tái sử dụng mà họ có thể tin tưởng
-
một bản đồ các loại hình học tập chính để thuật ngữ chuyên ngành không còn đáng sợ nữa
-
một cái nhìn thoáng qua bên trong mạng lưới thần kinh mà không bị lạc
-
tại sao máy biến áp dường như đang thống trị thế giới hiện nay
-
đường ống thực tế từ dữ liệu đến triển khai
-
một bảng so sánh nhanh mà bạn có thể chụp ảnh màn hình và lưu giữ
-
những rào cản về đạo đức, thành kiến và độ tin cậy không hề dễ dàng
Đó là những gì bạn sẽ nhận được ở đây. Nếu tôi đi lang thang, thì đó là cố ý - giống như đi theo con đường ngắm cảnh và bằng cách nào đó nhớ đường phố tốt hơn vào lần tới. 🗺️
Các thành phần cốt lõi của hầu hết các hệ thống AI 🧪
Hãy tưởng tượng hệ thống AI giống như một căn bếp. Bốn nguyên liệu xuất hiện lặp đi lặp lại:
-
Dữ liệu — ví dụ có hoặc không có nhãn.
-
Mô hình — một hàm toán học có các tham số có thể điều chỉnh.
-
Mục tiêu — hàm mất mát đo lường mức độ tệ của các dự đoán.
-
Tối ưu hóa — một thuật toán thúc đẩy các tham số để giảm thiểu tổn thất.
Trong học sâu, cú huých đó thường là giảm dần theo độ dốc với sự lan truyền ngược - một cách hiệu quả để tìm ra núm nào trên bảng âm thanh khổng lồ phát ra tiếng kêu cót két, sau đó giảm nó xuống một chút [2].
Ví dụ nhỏ: Chúng tôi đã thay thế bộ lọc thư rác dựa trên quy tắc dễ hỏng bằng một mô hình giám sát nhỏ. Sau một tuần lặp lại các vòng lặp nhãn → đo lường → cập nhật, số lượng cảnh báo sai và số phiếu hỗ trợ đã giảm. Không có gì đặc biệt - chỉ là các mục tiêu rõ ràng hơn (độ chính xác cao hơn đối với các email "ham") và tối ưu hóa tốt hơn.
Tổng quan về các mô hình học tập 🎓
-
Học có giám sát
Bạn cung cấp các cặp đầu vào-đầu ra (ảnh có nhãn, email được đánh dấu là thư rác/không phải thư rác). Mô hình học đầu vào → đầu ra. Xương sống của nhiều hệ thống thực tế [1]. -
Học không giám sát
Không có nhãn. Tìm cấu trúc cụm, nén, yếu tố tiềm ẩn. Tuyệt vời cho việc khám phá hoặc huấn luyện trước. -
Học tự giám sát:
Mô hình tự tạo nhãn (dự đoán từ tiếp theo, hình ảnh bị thiếu). Biến dữ liệu thô thành tín hiệu huấn luyện ở quy mô lớn; hỗ trợ các mô hình ngôn ngữ và thị giác hiện đại. -
Học tăng cường:
Một tác nhân hành động, thu thập phần thưởng và học một chính sách tối đa hóa phần thưởng tích lũy. Nếu “hàm giá trị”, “chính sách” và “học chênh lệch thời gian” nghe quen quen, thì đây chính là ngôi nhà của chúng [5].
Đúng vậy, các phạm trù này rất mơ hồ trong thực tế. Các phương pháp lai ghép là bình thường. Cuộc sống thực tế rất hỗn loạn; kỹ thuật tốt đáp ứng được điều đó.
Bên trong mạng lưới nơ-ron mà không đau đầu 🧠
Mạng nơ-ron xếp chồng các lớp đơn vị toán học nhỏ (nơ-ron). Mỗi lớp biến đổi dữ liệu đầu vào với trọng số, độ lệch và một dạng phi tuyến tính mềm dẻo như ReLU hoặc GELU. Các lớp đầu tiên học các đặc điểm đơn giản; các lớp sâu hơn mã hóa các khái niệm trừu tượng. "Phép thuật" - nếu chúng ta có thể gọi như vậy - là sự kết hợp : xâu chuỗi các hàm nhỏ và bạn có thể mô hình hóa các hiện tượng cực kỳ phức tạp.
Vòng lặp đào tạo, chỉ rung:
-
đoán → đo lỗi → quy kết lỗi thông qua backprop → đẩy trọng số → lặp lại.
Thực hiện điều này trên nhiều đợt và, giống như một vũ công vụng về cải thiện từng bài hát, mô hình sẽ không còn làm bạn mất tập trung nữa. Để biết thêm về chương về backprop thân thiện và nghiêm ngặt, hãy xem [2].
Tại sao máy biến áp lại được ưa chuộng - và "sự chú ý" thực sự có nghĩa là gì 🧲
Máy biến áp sử dụng khả năng tự chú ý để cân nhắc xem phần nào của dữ liệu đầu vào quan trọng với nhau, tất cả cùng một lúc. Thay vì đọc một câu theo thứ tự từ trái sang phải như các mẫu máy cũ, máy biến áp có thể nhìn khắp nơi và đánh giá các mối quan hệ một cách linh hoạt - giống như việc quét một căn phòng đông đúc để xem ai đang nói chuyện với ai.
Thiết kế này loại bỏ tính lặp lại và tích chập để mô hình hóa chuỗi, cho phép song song hóa hàng loạt và khả năng mở rộng tuyệt vời. Bài báo khởi xướng thiết kế này - Attention Is All You Need - trình bày kiến trúc và kết quả [3].
Tự chú ý trong một dòng: tạo truy vấn , khóa và giá trị cho mỗi mã thông báo; tính toán điểm tương đồng để có trọng số chú ý; kết hợp các giá trị cho phù hợp. Tỉ mỉ trong chi tiết, tinh tế trong tinh thần.
Lưu ý: Máy biến áp chiếm ưu thế, chứ không phải độc quyền. CNN, RNN và các tập hợp cây vẫn chiếm ưu thế về một số kiểu dữ liệu và hạn chế về độ trễ/chi phí. Hãy chọn kiến trúc phù hợp với công việc, đừng chạy theo quảng cáo thổi phồng.
AI hoạt động như thế nào? Quy trình thực tế mà bạn sẽ thực sự sử dụng 🛠️
-
Xác định vấn đề
Bạn đang dự đoán hoặc tạo ra điều gì và thành công sẽ được đo lường như thế nào? -
dữ liệu
, dán nhãn nếu cần, làm sạch và phân tách. Dự kiến các giá trị bị thiếu và các trường hợp ngoại lệ. -
Mô hình hóa
bắt đầu đơn giản. Các đường cơ sở (hồi quy logistic, tăng cường độ dốc hoặc một bộ biến đổi nhỏ) thường tốt hơn độ phức tạp cao. -
Đào tạo
Chọn một mục tiêu, chọn một trình tối ưu hóa, đặt siêu tham số. Lặp lại. -
Đánh giá
Sử dụng các phép kiểm tra, xác thực chéo và các số liệu liên quan đến mục tiêu thực sự của bạn (độ chính xác, F1, AUROC, BLEU, độ phức tạp, độ trễ). -
Triển khai:
Phục vụ đằng sau API hoặc nhúng vào ứng dụng. Theo dõi độ trễ, chi phí, thông lượng. -
Giám sát & quản trị
Theo dõi sự trôi dạt, tính công bằng, tính mạnh mẽ và tính bảo mật. Khung Quản lý Rủi ro AI của NIST (QUẢN TRỊ, LẬP BẢN ĐỒ, ĐO LƯỜNG, QUẢN LÝ) là một danh sách kiểm tra thực tế cho các hệ thống đáng tin cậy từ đầu đến cuối [4].
Trường hợp nhỏ: Một mô hình thị giác đã vượt qua bài kiểm tra trong phòng thí nghiệm, sau đó lại gặp sự cố ngoài thực địa khi ánh sáng thay đổi. Giám sát độ trôi được đánh dấu trong biểu đồ đầu vào; một lần tăng cường nhanh chóng + tinh chỉnh đã khôi phục hiệu suất. Nhàm chán? Có. Hiệu quả? Cũng có.
Bảng so sánh - các phương pháp tiếp cận, đối tượng sử dụng, chi phí ước tính, lý do tại sao chúng hiệu quả 📊
Không hoàn hảo một cách cố ý: cách diễn đạt hơi không đồng đều giúp câu văn có vẻ gần gũi với con người hơn.
| Tiếp cận | Đối tượng lý tưởng | Giá cả tương đối | Tại sao nó hoạt động / ghi chú |
|---|---|---|---|
| Học có giám sát | Các nhà phân tích, nhóm sản phẩm | thấp-trung bình | Đầu vào ánh xạ trực tiếp → nhãn. Tuyệt vời khi có nhãn; tạo thành xương sống của nhiều hệ thống được triển khai [1]. |
| Không giám sát | Người khám phá dữ liệu, R&D | thấp | Tìm cụm/nén/yếu tố tiềm ẩn - tốt cho việc khám phá và đào tạo trước. |
| Tự giám sát | Nhóm nền tảng | trung bình | Tạo nhãn riêng từ dữ liệu thô - thang đo bằng tính toán và dữ liệu. |
| Học tăng cường | Nghiên cứu robot, vận hành | trung bình-cao | Học các chính sách từ các tín hiệu phần thưởng; đọc Sutton & Barto để biết thêm thông tin [5]. |
| Máy biến hình | NLP, tầm nhìn, đa phương thức | trung bình-cao | Sự chú ý của bản thân nắm bắt được các độ lệch tầm xa và song song hóa tốt; xem bài báo gốc [3]. |
| ML cổ điển (cây) | Ứng dụng kinh doanh dạng bảng | thấp | Giá rẻ, nhanh chóng, và thường có cơ sở dữ liệu có cấu trúc mạnh mẽ đến kinh ngạc. |
| Dựa trên quy tắc/tượng trưng | Sự tuân thủ, xác định | rất thấp | Logic minh bạch; hữu ích trong các hệ thống lai khi bạn cần khả năng kiểm toán. |
| Đánh giá và rủi ro | Mọi người | thay đổi | Sử dụng GOVERN-MAP-MEASURE-MANAGE của NIST để giữ cho nó an toàn và hữu ích [4]. |
Giá cả = ghi nhãn dữ liệu + tính toán + con người + phục vụ.
Tìm hiểu sâu 1 - hàm mất mát, độ dốc và những bước nhỏ thay đổi mọi thứ 📉
Hãy tưởng tượng việc lắp một đường thẳng để dự đoán giá nhà theo kích thước. Bạn chọn các tham số (w) và (b), dự đoán (\hat{y} = wx + b) và đo lường sai số bằng phương pháp trung bình bình phương tổn thất. Độ dốc cho bạn biết nên di chuyển (w) và (b) theo hướng nào để giảm tổn thất nhanh nhất - giống như đi bộ xuống dốc trong sương mù bằng cách cảm nhận độ dốc của mặt đất. Cập nhật sau mỗi đợt và đường thẳng của bạn sẽ gần với thực tế hơn.
Trong mạng sâu, đó là cùng một bài hát với một ban nhạc lớn hơn. Backprop tính toán cách các tham số của từng lớp ảnh hưởng đến lỗi cuối cùng một cách hiệu quả, nhờ đó bạn có thể điều chỉnh hàng triệu (hoặc hàng tỷ) nút theo đúng hướng [2].
Những trực giác chính:
-
Sự mất mát định hình nên cảnh quan.
-
Độ dốc chính là la bàn của bạn.
-
Tốc độ học tập phụ thuộc vào kích thước bước chân - quá lớn thì bạn sẽ loạng choạng, quá nhỏ thì bạn sẽ ngủ gật.
-
Việc chuẩn hóa giúp bạn không thể ghi nhớ bộ dữ liệu đào tạo như một con vẹt có khả năng nhớ lại hoàn hảo nhưng lại không hiểu gì.
Đi sâu 2 - nhúng, nhắc nhở và truy xuất 🧭
Nhúng ánh xạ các từ, hình ảnh hoặc mục vào không gian vectơ, nơi các đối tượng tương tự nằm gần nhau. Điều này cho phép bạn:
-
tìm những đoạn văn có ngữ nghĩa tương tự
-
tìm kiếm sức mạnh hiểu được ý nghĩa
-
cắm vào thế hệ tăng cường truy xuất (RAG) để mô hình ngôn ngữ có thể tra cứu các sự kiện trước khi viết
Gợi ý là cách bạn điều khiển các mô hình tạo sinh - mô tả nhiệm vụ, đưa ra ví dụ, đặt ra các ràng buộc. Hãy tưởng tượng việc này giống như việc viết một thông số kỹ thuật rất chi tiết cho một thực tập sinh rất nhanh: háo hức, đôi khi quá tự tin.
Mẹo thực tế: nếu mô hình của bạn gây ảo giác, hãy thêm chức năng truy xuất, thắt chặt lời nhắc hoặc đánh giá bằng số liệu thực tế thay vì "cảm giác".
Đánh giá sâu 3 - không ảo tưởng 🧪
Đánh giá tốt có vẻ nhàm chán - đó chính là mục đích của nó.
-
Sử dụng bộ kiểm tra đã khóa.
-
Chọn một số liệu phản ánh nỗi đau của người dùng.
-
Tiến hành cắt bỏ để bạn biết điều gì thực sự có ích.
-
Ghi lại các lỗi bằng ví dụ thực tế và phức tạp.
Trong sản xuất, giám sát là đánh giá không bao giờ dừng lại. Sự trôi dạt xảy ra. Thuật ngữ mới xuất hiện, cảm biến được hiệu chuẩn lại, và mô hình ngày hôm qua bị trượt một chút. Khung NIST là tài liệu tham khảo thực tế cho quản lý rủi ro và quản trị liên tục - không phải là tài liệu chính sách để xếp xó [4].
Lưu ý về đạo đức, thành kiến và độ tin cậy ⚖️
Hệ thống AI phản ánh dữ liệu và bối cảnh triển khai của chúng. Điều này mang lại rủi ro: sai lệch, lỗi không đồng đều giữa các nhóm, sự mong manh khi thay đổi phân phối. Việc sử dụng có đạo đức không phải là tùy chọn - mà là điều kiện tiên quyết. NIST chỉ ra các thực hành cụ thể: ghi lại rủi ro và tác động, đo lường sai lệch có hại, xây dựng các giải pháp dự phòng và duy trì sự tham gia của con người khi rủi ro cao [4].
Những động thái cụ thể giúp ích:
-
thu thập dữ liệu đa dạng, mang tính đại diện
-
đo lường hiệu suất trên các phân nhóm dân số
-
thẻ mô hình tài liệu và bảng dữ liệu
-
thêm sự giám sát của con người khi rủi ro cao
-
thiết kế các biện pháp an toàn khi hệ thống không chắc chắn
AI hoạt động như thế nào? Là một mô hình tinh thần, bạn có thể tái sử dụng 🧩
Danh sách kiểm tra nhỏ gọn mà bạn có thể áp dụng cho hầu hết mọi hệ thống AI:
-
Mục tiêu là gì? Dự đoán, xếp hạng, tạo ra hay kiểm soát?
-
Tín hiệu học tập đến từ đâu? Nhãn, nhiệm vụ tự giám sát, phần thưởng?
-
Kiến trúc nào được sử dụng? Mô hình tuyến tính, tập hợp cây, CNN, RNN, máy biến áp [3]?
-
Nó được tối ưu hóa như thế nào? Biến thể dốc xuống/chống đỡ [2]?
-
Chế độ dữ liệu nào? Tập hợp có nhãn nhỏ, đại dương văn bản không có nhãn, môi trường mô phỏng?
-
Các chế độ lỗi và biện pháp bảo vệ là gì? Độ lệch, độ trôi, ảo giác, độ trễ, chi phí được ánh xạ theo GOVERN-MAP-MEASURE-MANAGE của NIST [4].
Nếu bạn có thể trả lời những câu hỏi đó, về cơ bản bạn đã hiểu hệ thống - phần còn lại là chi tiết triển khai và kiến thức chuyên môn.
Các nguồn nhanh đáng để đánh dấu 🔖
-
Giới thiệu bằng ngôn ngữ đơn giản về các khái niệm học máy (IBM) [1]
-
Truyền ngược với sơ đồ và toán học nhẹ nhàng [2]
-
Bài báo biến đổi mô hình trình tự đã thay đổi [3]
-
Khung quản lý rủi ro AI của NIST (quản trị thực tế) [4]
-
Sách giáo khoa học tăng cường chuẩn mực (miễn phí) [5]
Hỏi đáp nhanh ⚡
AI chỉ là thống kê thôi sao?
Nó là thống kê cộng với tối ưu hóa, tính toán, kỹ thuật dữ liệu và thiết kế sản phẩm. Thống kê là bộ khung; phần còn lại là cơ bắp.
Liệu các mô hình lớn hơn có luôn thắng thế?
Khả năng mở rộng quy mô có ích, nhưng chất lượng dữ liệu, đánh giá và các ràng buộc triển khai thường quan trọng hơn. Mô hình nhỏ nhất đạt được mục tiêu của bạn thường là tốt nhất cho người dùng và ví.
AI có thể hiểu được không?
Định nghĩa là hiểu . Các mô hình nắm bắt cấu trúc trong dữ liệu và khái quát hóa một cách ấn tượng; nhưng chúng có những điểm mù và có thể sai một cách chắc chắn. Hãy coi chúng như những công cụ mạnh mẽ - chứ không phải như những nhà thông thái.
Kỷ nguyên máy biến áp có phải là mãi mãi không?
Có lẽ không phải mãi mãi. Nó đang chiếm ưu thế hiện nay vì sự chú ý được song song hóa và mở rộng tốt, như bài báo gốc đã chỉ ra [3]. Nhưng nghiên cứu vẫn tiếp tục phát triển.
AI hoạt động như thế nào? Quá dài, tôi chưa đọc 🧵
-
AI học các mẫu từ dữ liệu, giảm thiểu tổn thất và tổng quát hóa thành các đầu vào mới [1,2].
-
Học có giám sát, không giám sát, tự giám sát và học tăng cường là các thiết lập đào tạo chính; RL học từ phần thưởng [5].
-
Mạng nơ-ron sử dụng phương pháp truyền ngược và giảm dần độ dốc để điều chỉnh hàng triệu tham số một cách hiệu quả [2].
-
Các máy biến áp chiếm ưu thế trong nhiều tác vụ tuần tự vì sự chú ý của bản thân nắm bắt các mối quan hệ song song ở quy mô lớn [3].
-
AI trong thế giới thực là một đường ống - từ việc định hình vấn đề thông qua triển khai và quản trị - và khuôn khổ của NIST giúp bạn trung thực về rủi ro [4].
Nếu ai đó hỏi lại AI hoạt động như thế nào?, bạn có thể mỉm cười, nhấp một ngụm cà phê và nói: nó học hỏi từ dữ liệu, tối ưu hóa tổn thất và sử dụng các kiến trúc như bộ biến đổi hoặc nhóm cây tùy thuộc vào bài toán. Sau đó nháy mắt, vì điều đó vừa đơn giản vừa hoàn thiện một cách khéo léo. 😉
Tài liệu tham khảo
[1] IBM - Học máy là gì?
đọc thêm
[2] Michael Nielsen - Thuật toán lan truyền ngược hoạt động như thế nào
đọc thêm
[3] Vaswani et al. - Chú ý là tất cả những gì bạn cần (arXiv)
đọc thêm
[4] NIST - Khung quản lý rủi ro trí tuệ nhân tạo (AI RMF 1.0)
đọc thêm
[5] Sutton & Barto - Học tăng cường: Giới thiệu (ấn bản thứ 2)
đọc thêm