AI hoạt động như thế nào?

Trí tuệ nhân tạo đôi khi giống như một trò ảo thuật mà mọi người đều gật đầu đồng tình trong khi thầm nghĩ… khoan đã, nó thực sự hoạt động như thế nào? Tin tốt đây. Chúng ta sẽ làm sáng tỏ điều đó mà không dài dòng, tập trung vào tính thực tiễn, và đưa ra một vài ví dụ không hoàn hảo nhưng vẫn giúp bạn hiểu rõ. Nếu bạn chỉ muốn nắm được ý chính, hãy xem câu trả lời trong một phút bên dưới; nhưng thành thật mà nói, chính những chi tiết cụ thể mới là điều khiến bạn "sáng mắt" lên 💡.

Những bài viết bạn có thể muốn đọc sau bài này:

🔗 GPT là viết tắt của từ gì?
Giải thích nhanh về từ viết tắt GPT và ý nghĩa của nó.

🔗 AI lấy thông tin từ đâu?
Các nguồn AI sử dụng để học, đào tạo và trả lời câu hỏi.

🔗 Làm thế nào để tích hợp trí tuệ nhân tạo vào doanh nghiệp của bạn?
Các bước thực tế, công cụ và quy trình làm việc để tích hợp AI hiệu quả.

🔗 Làm thế nào để bắt đầu một công ty trí tuệ nhân tạo?
Từ ý tưởng đến ra mắt: xác thực, tài trợ, nhóm và thực hiện.

AI hoạt động như thế nào? Câu trả lời trong một phút ⏱️

AI học các mẫu từ dữ liệu để đưa ra dự đoán hoặc tạo nội dung - không cần quy tắc viết tay. Một hệ thống tiếp nhận các ví dụ, đo lường mức độ sai sót của nó thông qua một hàm mất mát và điều chỉnh các thamsốđể giảm bớt sai sót mỗi lần. Lặp đi lặp lại, cải thiện. Với đủ chu kỳ, nó sẽ trở nên hữu ích. Câu chuyện tương tự cho dù bạn đang phân loại email, phát hiện khối u, chơi trò chơi trên bàn cờ hay viết thơ haiku. Để có được nền tảng ngôn ngữ đơn giản về “học máy”, tổng quan của IBM là vững chắc [1].

AI hiện đại nhất là học máy. Phiên bản đơn giản nhất: nhập dữ liệu, học cách ánh xạ từ đầu vào đến đầu ra, sau đó khái quát hóa thành những thứ mới. Không phải phép thuật toán học, tính toán, và, thành thật mà nói, một chút nghệ thuật.

“AI hoạt động như thế nào?” ✅

Khi mọi người tìm kiếm trên Google "AI hoạt động như thế nào?", họ thường muốn:

một mô hình tinh thần có thể tái sử dụng mà họ có thể tin tưởng
một bản đồ các loại hình học tập chính để thuật ngữ chuyên ngành không còn đáng sợ nữa
một cái nhìn thoáng qua bên trong mạng lưới thần kinh mà không bị lạc
tại sao máy biến áp dường như đang thống trị thế giới hiện nay
đường ống thực tế từ dữ liệu đến triển khai
một bảng so sánh nhanh mà bạn có thể chụp ảnh màn hình và lưu giữ
những rào cản về đạo đức, thành kiến và độ tin cậy không hề dễ dàng

Đó là những gì bạn sẽ nhận được ở đây. Nếu tôi đi lang thang, thì đó là cố ý - giống như đi theo con đường ngắm cảnh và bằng cách nào đó nhớ đường phố tốt hơn vào lần tới. 🗺️

Các thành phần cốt lõi của hầu hết các hệ thống AI 🧪

Hãy tưởng tượng hệ thống AI giống như một căn bếp. Bốn nguyên liệu xuất hiện lặp đi lặp lại:

Dữ liệu — ví dụ có hoặc không có nhãn.
Mô hình — một hàm toán học với các tham số có thể điều chỉnh.
Mục tiêu — một hàm mất mát đo lường mức độ sai lệch của các dự đoán.
Tối ưu hóa — một thuật toán điều chỉnh các tham số để giảm thiểu tổn thất.

Trong học sâu, cú huých đó thường là giảm dần theo độ dốc với sự lan truyền ngược- một cách hiệu quả để tìm ra núm nào trên bảng âm thanh khổng lồ phát ra tiếng kêu cót két, sau đó giảm nó xuống một chút [2].

Ví dụ nhỏ: Chúng tôi đã thay thế bộ lọc thư rác dựa trên quy tắc dễ bị lỗi bằng một mô hình học có giám sát nhỏ. Sau một tuần thực hiện vòng lặp gắn nhãn → đo lường → cập nhật, tỷ lệ báo cáo sai giảm và số lượng yêu cầu hỗ trợ cũng giảm. Không có gì phức tạp - chỉ đơn giản là mục tiêu rõ ràng hơn (độ chính xác đối với email "không phải thư rác") và tối ưu hóa tốt hơn.

Tổng quan về các mô hình học tập 🎓

Học có giám sát
Bạn cung cấp các cặp đầu vào-đầu ra (ảnh có nhãn, email được đánh dấu là thư rác/không phải thư rác). Mô hình học đầu vào → đầu ra. Xương sống của nhiều hệ thống thực tế [1].
Học không giám sát
Không có nhãn. Tìm cấu trúc cụm, nén, yếu tố tiềm ẩn. Tuyệt vời cho việc khám phá hoặc huấn luyện trước.
Học tự giám sát:
Mô hình tự tạo nhãn (dự đoán từ tiếp theo, hình ảnh bị thiếu). Biến dữ liệu thô thành tín hiệu huấn luyện ở quy mô lớn; hỗ trợ các mô hình ngôn ngữ và thị giác hiện đại.
Học tăng cường
Một tác nhân hành động, thu thập phần thưởngvà học một chính sách nhằm tối đa hóa phần thưởng tích lũy. Nếu “hàm giá trị”, “chính sách” và “học chênh lệch thời gian” nghe quen thuộc thì đây chính là lĩnh vực của chúng [5].

Đúng vậy, các phạm trù này rất mơ hồ trong thực tế. Các phương pháp lai ghép là bình thường. Cuộc sống thực tế rất hỗn loạn; kỹ thuật tốt đáp ứng được điều đó.

Bên trong mạng lưới nơ-ron mà không đau đầu 🧠

Mạng nơ-ron được cấu tạo từ nhiều lớp đơn vị toán học nhỏ (nơ-ron). Mỗi lớp biến đổi đầu vào bằng trọng số, độ lệch và một hàm phi tuyến tính mềm dẻo như ReLU hoặc GELU. Các lớp đầu tiên học các đặc điểm đơn giản; các lớp sâu hơn mã hóa các khái niệm trừu tượng. "Điều kỳ diệu" - nếu có thể gọi như vậy - chính là sự kết hợp: xâu chuỗi các hàm nhỏ và bạn có thể mô hình hóa các hiện tượng cực kỳ phức tạp.

Vòng lặp đào tạo, chỉ rung:

đoán → đo lỗi → quy kết lỗi thông qua backprop → đẩy trọng số → lặp lại.

Thực hiện điều này trên nhiều đợt và, giống như một vũ công vụng về cải thiện từng bài hát, mô hình sẽ không còn làm bạn mất tập trung nữa. Để biết thêm về chương về backprop thân thiện và nghiêm ngặt, hãy xem [2].

Tại sao máy biến áp lại được ưa chuộng - và "sự chú ý" thực sự có nghĩa là gì 🧲

Máy Transformer sử dụng khả năng tự chú ý để cân nhắc xem phần nào của dữ liệu đầu vào quan trọng với nhau, cùng một lúc. Thay vì đọc một câu theo thứ tự từ trái sang phải như các mô hình cũ, máy Transformer có thể quan sát toàn bộ khu vực và đánh giá các mối quan hệ một cách năng động - giống như việc quét một căn phòng đông người để xem ai đang nói chuyện với ai.

Thiết kế này loại bỏ tính lặp lại và tích chập để mô hình hóa chuỗi, cho phép song song hóa hàng loạt và khả năng mở rộng tuyệt vời. Bài báo khởi xướng thiết kế này -Attention Is All You Need- trình bày kiến trúc và kết quả [3].

Tự chú ý trong một dòng: tạo truy vấn, khóavà giá trị cho mỗi mã thông báo; tính toán điểm tương đồng để có trọng số chú ý; kết hợp các giá trị cho phù hợp. Tỉ mỉ trong chi tiết, tinh tế trong tinh thần.

Lưu ý: Máy biến áp chiếm ưu thế, chứ không phải độc quyền. CNN, RNN và các tập hợp cây vẫn chiếm ưu thế về một số kiểu dữ liệu và hạn chế về độ trễ/chi phí. Hãy chọn kiến trúc phù hợp với công việc, đừng chạy theo quảng cáo thổi phồng.

AI hoạt động như thế nào? Quy trình thực tế mà bạn sẽ thực sự sử dụng 🛠️

Xác định vấn đề
Bạn đang dự đoán hoặc tạo ra điều gì và thành công sẽ được đo lường như thế nào?
dữ liệu
, dán nhãn nếu cần, làm sạch và phân tách. Dự kiến các giá trị bị thiếu và các trường hợp ngoại lệ.
Mô hình hóa
bắt đầu đơn giản. Các đường cơ sở (hồi quy logistic, tăng cường độ dốc hoặc một bộ biến đổi nhỏ) thường tốt hơn độ phức tạp cao.
Đào tạo
Chọn một mục tiêu, chọn một trình tối ưu hóa, đặt siêu tham số. Lặp lại.
Đánh giá
Sử dụng các phép kiểm tra, xác thực chéo và các số liệu liên quan đến mục tiêu thực sự của bạn (độ chính xác, F1, AUROC, BLEU, độ phức tạp, độ trễ).
Triển khai:
Phục vụ đằng sau API hoặc nhúng vào ứng dụng. Theo dõi độ trễ, chi phí, thông lượng.
Giám sát & quản trị
Theo dõi sự trôi dạt, tính công bằng, tính mạnh mẽ và tính bảo mật. Khung quản lý rủi ro AI của NIST (QUẢN TRỊ, LẬP BẢN ĐỒ, ĐO LƯỜNG, QUẢN LÝ) là một danh sách kiểm tra thực tế cho các hệ thống đáng tin cậy từ đầu đến cuối [4].

Trường hợp nhỏ: Một mô hình thị giác đã vượt qua bài kiểm tra trong phòng thí nghiệm, sau đó lại gặp sự cố ngoài thực địa khi ánh sáng thay đổi. Giám sát độ trôi được đánh dấu trong biểu đồ đầu vào; một lần tăng cường nhanh chóng + tinh chỉnh đã khôi phục hiệu suất. Nhàm chán? Có. Hiệu quả? Cũng có.

Bảng so sánh - các phương pháp tiếp cận, đối tượng sử dụng, chi phí ước tính, lý do tại sao chúng hiệu quả 📊

Không hoàn hảo một cách cố ý: cách diễn đạt hơi không đồng đều giúp câu văn có vẻ gần gũi với con người hơn.

Tiếp cận	Đối tượng lý tưởng	Giá cả tương đối	Tại sao nó hoạt động / ghi chú
Học có giám sát	Các nhà phân tích, nhóm sản phẩm	thấp-trung bình	Đầu vào ánh xạ trực tiếp → nhãn. Tuyệt vời khi có nhãn; tạo thành xương sống của nhiều hệ thống được triển khai [1].
Không giám sát	Người khám phá dữ liệu, R&D	thấp	Tìm cụm/nén/yếu tố tiềm ẩn - tốt cho việc khám phá và đào tạo trước.
Tự giám sát	Nhóm nền tảng	trung bình	Tạo nhãn riêng từ dữ liệu thô - thang đo bằng tính toán và dữ liệu.
Học tăng cường	Nghiên cứu robot, vận hành	trung bình-cao	Học các chính sách từ các tín hiệu phần thưởng; đọc Sutton & Barto để biết thêm thông tin [5].
Máy biến hình	NLP, tầm nhìn, đa phương thức	trung bình-cao	Sự chú ý của bản thân nắm bắt được các độ lệch tầm xa và song song hóa tốt; xem bài báo gốc [3].
ML cổ điển (cây)	Ứng dụng kinh doanh dạng bảng	thấp	Giá rẻ, nhanh chóng, và thường có cơ sở dữ liệu có cấu trúc mạnh mẽ đến kinh ngạc.
Dựa trên quy tắc/tượng trưng	Sự tuân thủ, xác định	rất thấp	Logic minh bạch; hữu ích trong các hệ thống lai khi bạn cần khả năng kiểm toán.
Đánh giá và rủi ro	Mọi người	thay đổi	Sử dụng GOVERN-MAP-MEASURE-MANAGE của NIST để giữ cho nó an toàn và hữu ích [4].

Giá cả = ghi nhãn dữ liệu + tính toán + con người + phục vụ.

Tìm hiểu sâu 1 - hàm mất mát, độ dốc và những bước nhỏ thay đổi mọi thứ 📉

Hãy tưởng tượng việc lắp một đường thẳng để dự đoán giá nhà theo kích thước. Bạn chọn các tham số (w) và (b), dự đoán (\hat{y} = wx + b) và đo lường sai số bằng phương pháp trung bình bình phương tổn thất. Độ dốc cho bạn biết nên di chuyển (w) và (b) theo hướng nào để giảm tổn thất nhanh nhất - giống như đi bộ xuống dốc trong sương mù bằng cách cảm nhận độ dốc của mặt đất. Cập nhật sau mỗi đợt và đường thẳng của bạn sẽ gần với thực tế hơn.

Trong mạng nơ-ron sâu, đó cũng là bài hát tương tự nhưng với quy mô lớn hơn. Backprop tính toán cách các tham số của từng lớp ảnh hưởng đến lỗi cuối cùng một cách hiệu quả, vì vậy bạn có thể điều chỉnh hàng triệu (hoặc hàng tỷ) núm xoay theo đúng hướng [2].

Những trực giác chính:

Sự mất mát định hình nên cảnh quan.
Độ dốc chính là la bàn của bạn.
Tốc độ học tập phụ thuộc vào kích thước bước chân - quá lớn thì bạn sẽ loạng choạng, quá nhỏ thì bạn sẽ ngủ gật.
Việc chuẩn hóa giúp bạn không thể ghi nhớ bộ dữ liệu đào tạo như một con vẹt có khả năng nhớ lại hoàn hảo nhưng lại không hiểu gì.

Đi sâu 2 - nhúng, nhắc nhở và truy xuất 🧭

Nhúng ánh xạ các từ, hình ảnh hoặc mục vào không gian vectơ, nơi các đối tượng tương tự nằm gần nhau. Điều này cho phép bạn:

tìm những đoạn văn có ngữ nghĩa tương tự
tìm kiếm sức mạnh hiểu được ý nghĩa
cắm vào thế hệ tăng cường truy xuất (RAG) để mô hình ngôn ngữ có thể tra cứu các sự kiện trước khi viết

Gợi ý là cách bạn điều khiển các mô hình tạo sinh - mô tả nhiệm vụ, đưa ra ví dụ, đặt ra các ràng buộc. Hãy tưởng tượng việc này giống như việc viết một thông số kỹ thuật rất chi tiết cho một thực tập sinh rất nhanh: háo hức, đôi khi quá tự tin.

Mẹo thực tế: nếu mô hình của bạn bị ảo giác, hãy thêm phần truy xuất thông tin, thắt chặt câu hỏi hoặc đánh giá bằng các chỉ số thực tế thay vì chỉ dựa vào "cảm nhận".

Đánh giá sâu 3 - không ảo tưởng 🧪

Đánh giá tốt có vẻ nhàm chán - đó chính là mục đích của nó.

Sử dụng bộ kiểm tra đã khóa.
Chọn một số liệu phản ánh nỗi đau của người dùng.
Tiến hành cắt bỏ để bạn biết điều gì thực sự có ích.
Ghi lại các lỗi bằng ví dụ thực tế và phức tạp.

Trong sản xuất, giám sát là đánh giá không bao giờ dừng lại. Sự trôi dạt xảy ra. Thuật ngữ mới xuất hiện, cảm biến được hiệu chuẩn lại, và mô hình ngày hôm qua bị trượt một chút. Khung NIST là tài liệu tham khảo thực tế cho quản lý rủi ro và quản trị liên tục - không phải là tài liệu chính sách để xếp xó [4].

Lưu ý về đạo đức, thành kiến và độ tin cậy ⚖️

Hệ thống AI phản ánh dữ liệu và bối cảnh triển khai của chúng. Điều này mang lại rủi ro: sai lệch, lỗi không đồng đều giữa các nhóm, sự mong manh khi thay đổi phân phối. Việc sử dụng có đạo đức không phải là tùy chọn - mà là điều kiện tiên quyết. NIST chỉ ra các thực hành cụ thể: ghi lại rủi ro và tác động, đo lường sai lệch có hại, xây dựng các giải pháp dự phòng và duy trì sự tham gia của con người khi rủi ro cao [4].

Những động thái cụ thể giúp ích:

thu thập dữ liệu đa dạng, mang tính đại diện
đo lường hiệu suất trên các phân nhóm dân số
thẻ mô hình tài liệu và bảng dữ liệu
thêm sự giám sát của con người khi rủi ro cao
thiết kế các biện pháp an toàn khi hệ thống không chắc chắn

AI hoạt động như thế nào? Là một mô hình tinh thần, bạn có thể tái sử dụng 🧩

Danh sách kiểm tra nhỏ gọn mà bạn có thể áp dụng cho hầu hết mọi hệ thống AI:

Mục tiêu là gì? Dự đoán, xếp hạng, tạo ra hay kiểm soát?
Tín hiệu học tập đến từ đâu? Nhãn, nhiệm vụ tự giám sát, phần thưởng?
Kiến trúc nào được sử dụng? Mô hình tuyến tính, tập hợp cây, CNN, RNN, máy biến áp [3]?
Nó được tối ưu hóa như thế nào? Biến thể dốc xuống/chống đỡ [2]?
Chế độ dữ liệu nào? Tập hợp có nhãn nhỏ, đại dương văn bản không có nhãn, môi trường mô phỏng?
Các chế độ lỗi và biện pháp bảo vệ là gì? Sai lệch, trôi dạt, ảo giác, độ trễ, chi phí được ánh xạ tới GOVERN-MAP-MEASURE-MANAGE của NIST [4].

Nếu bạn có thể trả lời những câu hỏi đó, về cơ bản bạn đã hiểu hệ thống - phần còn lại là chi tiết triển khai và kiến thức chuyên môn.

Các nguồn nhanh đáng để đánh dấu 🔖

Giới thiệu bằng ngôn ngữ đơn giản về các khái niệm học máy (IBM) [1]
Truyền ngược với sơ đồ và toán học nhẹ nhàng [2]
Bài báo biến đổi mô hình trình tự đã thay đổi [3]
Khung quản lý rủi ro AI của NIST (quản trị thực tế) [4]
Sách giáo khoa học tăng cường chuẩn mực (miễn phí) [5]

Hỏi đáp nhanh ⚡

Liệu trí tuệ nhân tạo chỉ đơn thuần là thống kê?
Nó là sự kết hợp giữa thống kê, tối ưu hóa, tính toán, kỹ thuật dữ liệu và thiết kế sản phẩm. Thống kê là bộ khung; phần còn lại là cơ bắp.

Liệu các mô hình lớn hơn có luôn thắng thế?
Khả năng mở rộng quy mô có ích, nhưng chất lượng dữ liệu, đánh giá và các ràng buộc triển khai thường quan trọng hơn. Mô hình nhỏ nhất đạt được mục tiêu của bạn thường là tốt nhất cho người dùng và ví.

AI có thể hiểu được không?
Định nghĩa là hiểu. Các mô hình nắm bắt cấu trúc trong dữ liệu và khái quát hóa một cách ấn tượng; nhưng chúng có những điểm mù và có thể sai một cách chắc chắn. Hãy coi chúng như những công cụ mạnh mẽ - chứ không phải như những nhà thông thái.

Kỷ nguyên máy biến áp có tồn tại mãi mãi không?
Có lẽ không phải mãi mãi. Nó đang thống trị hiện nay vì sự chú ý được song song hóa và mở rộng tốt, như bài báo gốc đã chỉ ra [3]. Nhưng nghiên cứu vẫn tiếp tục tiến triển.

AI hoạt động như thế nào? Quá dài, tôi chưa đọc 🧵

AI học các mẫu từ dữ liệu, giảm thiểu tổn thất và tổng quát hóa thành các đầu vào mới [1,2].
Học có giám sát, không giám sát, tự giám sát và học tăng cường là các thiết lập đào tạo chính; RL học từ phần thưởng [5].
Mạng nơ-ron sử dụng phương pháp truyền ngược và giảm dần độ dốc để điều chỉnh hàng triệu tham số một cách hiệu quả [2].
Các máy biến áp chiếm ưu thế trong nhiều tác vụ tuần tự vì sự chú ý của bản thân nắm bắt các mối quan hệ song song ở quy mô lớn [3].
AI trong thế giới thực là một đường ống - từ việc định hình vấn đề thông qua triển khai và quản trị - và khuôn khổ của NIST giúp bạn trung thực về rủi ro [4].

Nếu ai đó hỏi lại "Trí tuệ nhân tạo hoạt động như thế nào?", bạn có thể mỉm cười, nhấp một ngụm cà phê và nói: "Nó học từ dữ liệu, tối ưu hóa hàm mất mát và sử dụng các kiến trúc như transformer hoặc tree ensemble tùy thuộc vào vấn đề." Sau đó, thêm một cái nháy mắt, vì câu trả lời vừa đơn giản lại vừa đầy đủ một cách khéo léo. 😉

Tài liệu tham khảo

[1] IBM - Học máy là gì?
đọc thêm

[2] Michael Nielsen - Thuật toán lan truyền ngược hoạt động như thế nào
đọc thêm

[3] Vaswani et al. - Chú ý là tất cả những gì bạn cần (arXiv)
đọc thêm

[4] NIST - Khung quản lý rủi ro trí tuệ nhân tạo (AI RMF 1.0)
đọc thêm

[5] Sutton & Barto - Học tăng cường: Giới thiệu (ấn bản thứ 2)
đọc thêm

Tìm kiếm những công nghệ AI mới nhất tại Cửa hàng Trợ lý AI chính thức

Về chúng tôi

Quay lại blog