Trí tuệ nhân tạo học hỏi như thế nào?

"Trí tuệ nhân tạo học hỏi như thế nào?" , cuốn sách hướng dẫn này sẽ giải thích những ý tưởng lớn bằng ngôn ngữ dễ hiểu - kèm theo ví dụ, những đoạn giải thích ngắn và một vài phép ẩn dụ không hoàn hảo nhưng vẫn phần nào giúp ích. Cùng bắt đầu nào! 🙂

Những bài viết bạn có thể muốn đọc sau bài này:

🔗 Trí tuệ nhân tạo dự đoán là gì?
Mô hình dự đoán hoạt động như thế nào để dự báo kết quả bằng cách sử dụng dữ liệu lịch sử và dữ liệu thời gian thực.

🔗 Trí tuệ nhân tạo (AI) sẽ làm thay đổi những ngành công nghiệp nào?
Các lĩnh vực có khả năng bị biến đổi mạnh mẽ nhất nhờ tự động hóa, phân tích dữ liệu và các tác nhân.

🔗 GPT là viết tắt của từ gì?
Giải thích rõ ràng về từ viết tắt GPT và nguồn gốc của nó.

🔗 Kỹ năng trí tuệ nhân tạo là gì?
Các năng lực cốt lõi để xây dựng, triển khai và quản lý hệ thống trí tuệ nhân tạo.

Vậy nó làm điều đó như thế nào? ✅

Khi mọi người hỏi "Trí tuệ nhân tạo học hỏi như thế nào?" , họ thường muốn hỏi: làm thế nào các mô hình trở nên hữu ích thay vì chỉ là những món đồ chơi toán học thú vị. Câu trả lời nằm trong một công thức:

Mục tiêu rõ ràng - một hàm mất mát xác định ý nghĩa của từ “tốt”. [1]
Dữ liệu chất lượng - đa dạng, sạch sẽ và phù hợp. Số lượng có ích; sự đa dạng có ích hơn. [1]
Tối ưu hóa ổn định - giảm độ dốc với các thủ thuật để tránh bị chao đảo rơi xuống vực. [1], [2]
Khái quát hóa - thành công trên dữ liệu mới, không chỉ trên tập huấn luyện. [1]
Vòng lặp phản hồi - đánh giá, phân tích lỗi và lặp lại. [2], [3]
An toàn và độ tin cậy - các rào chắn, thử nghiệm và tài liệu để tránh tình trạng hỗn loạn. [4]

Để có được nền tảng dễ tiếp cận, văn bản học sâu kinh điển, ghi chú khóa học trực quan và khóa học cấp tốc thực hành bao gồm những điều cần thiết mà không làm bạn choáng ngợp bởi các ký hiệu. [1]–[3]

Trí tuệ nhân tạo học hỏi như thế nào? Câu trả lời ngắn gọn bằng ngôn ngữ dễ hiểu ✍️

Một mô hình AI bắt đầu với các giá trị tham số ngẫu nhiên. Nó đưa ra một dự đoán. Bạn chấm điểm dự đoán đó bằng một hàm mất mát . Sau đó, bạn điều chỉnh các tham số đó để giảm hàm mất mát bằng cách sử dụng gradient . Lặp lại vòng lặp này trên nhiều ví dụ cho đến khi mô hình ngừng cải thiện (hoặc bạn hết đồ ăn nhẹ). Đó là vòng lặp huấn luyện trong một hơi thở. [1], [2]

Nếu bạn muốn có độ chính xác cao hơn một chút, hãy xem các phần về giảm độ dốc và lan truyền ngược bên dưới. Để có kiến thức nền nhanh chóng và dễ hiểu, các bài giảng ngắn và bài thực hành có sẵn rộng rãi. [2], [3]

Những điều cơ bản: dữ liệu, mục tiêu, tối ưu hóa 🧩

Dữ liệu : Đầu vào (x) và mục tiêu (y). Dữ liệu càng rộng và sạch thì cơ hội khái quát hóa càng tốt. Quản lý dữ liệu không hào nhoáng nhưng nó là người hùng thầm lặng. [1]
Mô hình : Một hàm (f_\theta(x)) với các tham số (\theta). Mạng nơ-ron là chồng các đơn vị đơn giản kết hợp theo những cách phức tạp—giống như những viên gạch Lego, nhưng mềm hơn. [1]
Mục tiêu : Một tổn thất (L(f_\theta(x), y)) đo lường lỗi. Ví dụ: lỗi bình phương trung bình (hồi quy) và entropy chéo (phân loại). [1]
Tối ưu hóa : Sử dụng phương pháp giảm độ dốc (ngẫu nhiên) để cập nhật các tham số: (\theta \leftarrow \theta - \eta \nabla_\theta L). Tốc độ học (\eta): quá lớn thì bạn sẽ bị xáo trộn; quá nhỏ thì bạn sẽ ngủ mãi mãi. [2]

Để có những giới thiệu rõ ràng về hàm mất mát và tối ưu hóa, những ghi chú kinh điển về các thủ thuật và cạm bẫy trong huấn luyện là một tài liệu tham khảo tuyệt vời. [2]

Học có giám sát: học từ các ví dụ được gắn nhãn 🎯

Ý tưởng : Hiển thị cho mô hình các cặp đầu vào và câu trả lời đúng. Mô hình học được một ánh xạ (x → y).

Các tác vụ thường gặp : phân loại hình ảnh, phân tích cảm xúc, dự đoán dữ liệu dạng bảng, nhận dạng giọng nói.
Các tổn thất điển hình : entropy chéo cho phân loại, sai số bình phương trung bình cho hồi quy. [1]
Những rủi ro thường gặp : nhiễu nhãn, mất cân bằng lớp, rò rỉ dữ liệu.
Các biện pháp khắc phục : lấy mẫu phân tầng, tổn thất mạnh mẽ, điều chỉnh và thu thập dữ liệu đa dạng hơn. [1], [2]

Dựa trên hàng thập kỷ tiêu chuẩn và thực tiễn sản xuất, học có giám sát vẫn là công cụ hữu hiệu vì kết quả có thể dự đoán được và các chỉ số rất đơn giản. [1], [3]

Học không giám sát và tự giám sát: học cấu trúc dữ liệu 🔍

không giám sát học các mẫu mà không cần nhãn.

Phân cụm : nhóm các điểm tương tự nhau — thuật toán k-means rất đơn giản và hữu ích một cách đáng ngạc nhiên.
Giảm chiều dữ liệu : nén dữ liệu thành các hướng cần thiết — PCA là công cụ then chốt.
Mô hình mật độ/tạo sinh : học phân phối dữ liệu. [1]

Tự giám sát là động cơ hiện đại: các mô hình tự tạo ra sự giám sát của riêng chúng (dự đoán che khuất, học tập tương phản), cho phép bạn huấn luyện trước trên lượng lớn dữ liệu không được gắn nhãn và tinh chỉnh sau này. [1]

Học tăng cường: học bằng cách thực hành và nhận phản hồi 🕹️

Một tác nhân tương tác với môi trường , nhận được phần thưởng và học được một chính sách nhằm tối đa hóa phần thưởng dài hạn.

Các yếu tố cốt lõi : trạng thái, hành động, phần thưởng, chính sách, hàm giá trị.
Các thuật toán : Học Q, thuật toán gradient chính sách, thuật toán diễn viên-phê bình.
Khám phá so với khai thác : thử những điều mới hoặc tái sử dụng những gì đã hiệu quả.
Phân bổ trách nhiệm : Hành động nào dẫn đến kết quả nào?

Phản hồi của con người có thể hướng dẫn quá trình huấn luyện khi phần thưởng không rõ ràng—xếp hạng hoặc sở thích giúp định hình hành vi mà không cần phải tự tay mã hóa phần thưởng hoàn hảo. [5]

Học sâu, lan truyền ngược và thuật toán giảm độ dốc - trái tim của thuật toán 🫀

Mạng nơ-ron là sự kết hợp của các hàm đơn giản. Để học, chúng dựa vào thuật toán lan truyền ngược :

Quá trình truyền tiến : tính toán dự đoán từ các đầu vào.
Hàm mất mát : thước đo sai số giữa dự đoán và mục tiêu.
Lượt truyền ngược : áp dụng quy tắc chuỗi để tính toán đạo hàm của hàm mất mát đối với từng tham số.
Cập nhật : Điều chỉnh các tham số ngược lại với độ dốc bằng cách sử dụng trình tối ưu hóa.

Các biến thể như momentum, RMSProp và Adam làm cho quá trình huấn luyện ít khó tính hơn. Các phương pháp điều chỉnh như dropout , weight decay và early stopping giúp các mô hình khái quát hóa thay vì ghi nhớ. [1], [2]

Người máy biến hình và sự chú ý: tại sao các mẫu máy hiện đại lại khiến người ta cảm thấy thông minh 🧠✨

Transformer đã thay thế nhiều thiết lập lặp lại trong ngôn ngữ và thị giác. Thủ thuật chính là tự chú ý , cho phép mô hình cân nhắc các phần khác nhau của đầu vào tùy thuộc vào ngữ cảnh. Mã hóa vị trí xử lý thứ tự và chú ý đa đầu cho phép mô hình tập trung vào các mối quan hệ khác nhau cùng một lúc. Mở rộng quy mô - dữ liệu đa dạng hơn, nhiều tham số hơn, thời gian huấn luyện dài hơn - thường hữu ích, nhưng lợi ích giảm dần và chi phí tăng lên. [1], [2]

Khái quát hóa, hiện tượng quá khớp và sự cân bằng giữa độ lệch và phương sai 🩰

Một mô hình có thể hoạt động xuất sắc trên tập dữ liệu huấn luyện nhưng vẫn thất bại trong thế giới thực.

Hiện tượng quá khớp (overfitting) : ghi nhớ nhiễu. Lỗi trong quá trình huấn luyện giảm, lỗi trong quá trình kiểm tra tăng.
Thiếu khớp dữ liệu : quá đơn giản; bỏ sót tín hiệu.
Sự đánh đổi giữa độ lệch và phương sai : độ phức tạp làm giảm độ lệch nhưng có thể làm tăng phương sai.

Làm thế nào để khái quát hóa tốt hơn:

Dữ liệu đa dạng hơn - từ nhiều nguồn, lĩnh vực và trường hợp ngoại lệ khác nhau.
Chuẩn hóa dữ liệu - dropout, giảm trọng số, tăng cường dữ liệu.
Kiểm định đúng cách - sử dụng bộ dữ liệu kiểm thử sạch, kiểm định chéo cho dữ liệu nhỏ.
Theo dõi sự thay đổi theo thời gian - phân bố dữ liệu của bạn sẽ thay đổi theo thời gian.

Thực hành nhận thức rủi ro coi đây là các hoạt động vòng đời - quản trị, lập bản đồ, đo lường và quản lý - chứ không phải là danh sách kiểm tra một lần. [4]

Các chỉ số quan trọng: làm sao để biết quá trình học tập đã diễn ra 📈

Phân loại : độ chính xác, độ chính xác, độ thu hồi, F1, ROC AUC. Dữ liệu không cân bằng yêu cầu đường cong độ chính xác-độ thu hồi. [3]
Hồi quy : MSE, MAE, (R^2). [1]
Xếp hạng/truy xuất : MAP, NDCG, recall@K. [1]
Các mô hình tạo sinh : độ phức tạp (ngôn ngữ), BLEU/ROUGE/CIDEr (văn bản), điểm số dựa trên CLIP (đa phương thức) và - quan trọng nhất - đánh giá của con người. [1], [3]

Chọn các chỉ số phù hợp với tác động của người dùng. Một sự cải thiện nhỏ về độ chính xác có thể không đáng kể nếu chi phí thực sự là các kết quả dương tính giả. [3]

Quy trình đào tạo trong thực tế: một bản kế hoạch đơn giản 🛠️

Xác định rõ vấn đề - định nghĩa các yếu tố đầu vào, đầu ra, ràng buộc và tiêu chí thành công.
Quy trình xử lý dữ liệu - thu thập, gắn nhãn, làm sạch, chia tách, bổ sung.
Đường cơ sở - bắt đầu đơn giản; các đường cơ sở tuyến tính hoặc dạng cây có khả năng cạnh tranh đáng kinh ngạc.
Xây dựng mô hình - hãy thử một vài nhóm mô hình: cây quyết định tăng cường độ dốc (dữ liệu dạng bảng), mạng nơ-ron tích chập (hình ảnh), bộ chuyển đổi (văn bản).
Huấn luyện - lịch trình, chiến lược tốc độ học tập, các mốc kiểm tra, độ chính xác hỗn hợp nếu cần.
Đánh giá - phân tích lỗi và các sai sót. Hãy xem xét các lỗi, chứ không chỉ giá trị trung bình.
Triển khai - quy trình suy luận, giám sát, ghi nhật ký, kế hoạch hoàn tác.
Lặp lại - thu thập dữ liệu tốt hơn, tinh chỉnh hoặc điều chỉnh kiến trúc.

Ví dụ nhỏ : một dự án phân loại email bắt đầu với mô hình tuyến tính đơn giản, sau đó tinh chỉnh một mô hình Transformer đã được huấn luyện trước. Thành công lớn nhất không phải là mô hình mà là việc siết chặt tiêu chí gán nhãn và bổ sung các danh mục "ngoại vi" ít được sử dụng. Khi đã bao quát được các danh mục đó, chỉ số F1 trên tập dữ liệu kiểm chứng cuối cùng đã phản ánh được hiệu suất thực tế. (Bạn của tương lai: rất biết ơn.)

Chất lượng dữ liệu, việc gắn nhãn và nghệ thuật tinh tế của việc không tự dối lòng mình 🧼

Đầu vào kém, đầu ra hối tiếc. Hướng dẫn ghi nhãn cần phải nhất quán, có thể đo lường và được xem xét lại. Sự đồng thuận giữa những người ghi nhãn rất quan trọng.

Hãy soạn thảo bảng tiêu chí đánh giá kèm theo ví dụ, trường hợp ngoại lệ và các tiêu chí phụ để phân định thắng thua.
Kiểm tra bộ dữ liệu để tìm các bản ghi trùng lặp và gần trùng lặp.
Theo dõi nguồn gốc xuất xứ - mỗi ví dụ đến từ đâu và tại sao nó được đưa vào.
Đo lường mức độ bao phủ dữ liệu dựa trên các tình huống sử dụng thực tế, chứ không chỉ là một tiêu chuẩn so sánh đơn thuần.

Những điều này phù hợp một cách gọn gàng với các khuôn khổ đảm bảo và quản trị rộng hơn mà bạn thực sự có thể vận hành. [4]

Học chuyển giao, tinh chỉnh và bộ điều hợp - tái sử dụng những công việc nặng nhọc ♻️

Các mô hình được huấn luyện trước sẽ học các biểu diễn tổng quát; việc tinh chỉnh sẽ điều chỉnh chúng cho phù hợp với nhiệm vụ của bạn với lượng dữ liệu ít hơn.

Trích xuất đặc trưng : đóng băng phần xương sống, huấn luyện một phần đầu nhỏ.
Tinh chỉnh toàn diện : cập nhật tất cả các thông số để đạt công suất tối đa.
Các phương pháp tiết kiệm tham số : bộ điều hợp, cập nhật hạng thấp kiểu LoRA - tốt khi tài nguyên tính toán hạn chế.
Thích ứng miền : điều chỉnh các nhúng trên các miền; những thay đổi nhỏ, lợi ích lớn. [1], [2]

Mô hình tái sử dụng này là lý do tại sao các dự án hiện đại có thể tiến triển nhanh chóng mà không cần ngân sách khổng lồ.

An toàn, độ tin cậy và sự đồng bộ - những yếu tố không thể thiếu 🧯

Việc học không chỉ đơn thuần là về độ chính xác. Bạn cũng cần những mô hình mạnh mẽ, công bằng và phù hợp với mục đích sử dụng.

Khả năng chống lại các tác động đối nghịch : những nhiễu loạn nhỏ có thể đánh lừa các mô hình.
Thiên kiến và sự công bằng : đo lường hiệu suất của các nhóm nhỏ, chứ không chỉ dựa trên mức trung bình chung.
Khả năng giải thích : việc xác định đặc điểm và phân tích sâu giúp bạn hiểu rõ lý do .
Con người tham gia vào quy trình : các con đường leo thang cho các quyết định mơ hồ hoặc có tác động lớn. [4], [5]

Học tập dựa trên sở thích là một cách thực tế để đưa phán đoán của con người vào khi mục tiêu không rõ ràng. [5]

Câu hỏi thường gặp trong một phút - hỏi đáp nhanh ⚡

Vậy, thực sự, AI học như thế nào? Thông qua tối ưu hóa lặp đi lặp lại dựa trên tổn thất, với độ dốc hướng dẫn các tham số hướng tới dự đoán tốt hơn. [1], [2]
Nhiều dữ liệu hơn có luôn hữu ích không? Thông thường là có, cho đến khi lợi ích giảm dần. Sự đa dạng thường vượt trội hơn khối lượng lớn. [1]
Điều gì sẽ xảy ra nếu nhãn bị rối? Hãy sử dụng các phương pháp chống nhiễu, các tiêu chí đánh giá tốt hơn và xem xét việc huấn luyện trước tự giám sát. [1]
Tại sao bộ chuyển đổi lại chiếm ưu thế? Sự chú ý có khả năng mở rộng tốt và nắm bắt được các mối quan hệ phụ thuộc tầm xa; công cụ đã hoàn thiện. [1], [2]
Làm sao tôi biết quá trình huấn luyện đã hoàn tất? Mất mát xác thực đạt mức ổn định, các chỉ số ổn định và dữ liệu mới hoạt động như mong đợi - sau đó theo dõi sự thay đổi. [3], [4]

Bảng so sánh - những công cụ bạn có thể sử dụng ngay hôm nay 🧰

Thiết kế có phần khác biệt một chút là có chủ ý. Giá cả áp dụng cho các thư viện cốt lõi - việc đào tạo trên quy mô lớn rõ ràng sẽ phát sinh chi phí cơ sở hạ tầng.

Dụng cụ	Tốt nhất cho	Giá	Lý do nó hiệu quả
PyTorch	Các nhà nghiên cứu, các nhà xây dựng	Miễn phí - mã nguồn mở	Đồ thị động, hệ sinh thái mạnh mẽ, hướng dẫn tuyệt vời.
TensorFlow	Đội ngũ sản xuất	Miễn phí - mã nguồn mở	Dịch vụ đã hoàn thiện, TF Lite dành cho thiết bị di động; cộng đồng lớn.
scikit-learn	Dữ liệu dạng bảng, đường cơ sở	Miễn phí	API gọn gàng, tốc độ lặp lại nhanh, tài liệu tuyệt vời.
Keras	Nguyên mẫu nhanh	Miễn phí	API cấp cao trên nền tảng TF, các lớp dễ đọc.
JAX	Người dùng chuyên nghiệp, nghiên cứu	Miễn phí	Tự động chuyển đổi sang vector, tốc độ XLA, phong cách toán học thanh lịch.
Transformers ôm mặt	Xử lý ngôn ngữ tự nhiên (NLP), thị giác, âm thanh	Miễn phí	Các mô hình được huấn luyện sẵn, tinh chỉnh đơn giản, các trung tâm dữ liệu tuyệt vời.
Sét	Quy trình đào tạo	Lõi miễn phí	Bao gồm cấu trúc, ghi nhật ký, pin đa GPU.
XGBoost	Bảng cạnh tranh	Miễn phí	Những tiêu chuẩn cơ bản vững chắc thường mang lại chiến thắng trong các cuộc tranh luận về dữ liệu có cấu trúc.
Trọng số và độ lệch	Theo dõi thí nghiệm	Gói miễn phí	Khả năng tái tạo, so sánh các lần chạy, vòng lặp học tập nhanh hơn.

Các tài liệu tham khảo đáng tin cậy để bắt đầu: PyTorch, TensorFlow và hướng dẫn sử dụng scikit-learn ngắn gọn. (Hãy chọn một trong số đó, xây dựng một ví dụ nhỏ, rồi phát triển dần.)

Khám phá chi tiết: những mẹo thực tế giúp bạn tiết kiệm thời gian thực sự 🧭

Các lịch trình tốc độ học tập : suy giảm theo hàm cosin hoặc một chu kỳ có thể ổn định quá trình huấn luyện.
Kích thước lô : lớn hơn không phải lúc nào cũng tốt hơn - hãy theo dõi các chỉ số xác thực, chứ không chỉ thông lượng.
Khởi tạo trọng số : các thiết lập mặc định hiện đại là ổn; nếu quá trình huấn luyện bị đình trệ, hãy xem xét lại quá trình khởi tạo hoặc chuẩn hóa các lớp đầu tiên.
Chuẩn hóa : Chuẩn hóa theo lô (batch norm) hoặc chuẩn hóa theo lớp (layer norm) có thể làm cho quá trình tối ưu hóa diễn ra suôn sẻ hơn đáng kể.
Tăng cường dữ liệu : lật/cắt/biến đổi màu sắc cho hình ảnh; che phủ/xáo trộn mã thông báo cho văn bản.
Phân tích lỗi : nhóm các lỗi theo từng lát cắt - một trường hợp ngoại lệ có thể làm chậm toàn bộ hệ thống.
Cách tái tạo : đặt hạt giống, ghi nhật ký siêu tham số, lưu điểm kiểm tra. Bạn trong tương lai sẽ biết ơn, tôi hứa. [2], [3]

Khi nghi ngờ, hãy quay lại những điều cơ bản. Những nguyên tắc cơ bản vẫn là kim chỉ nam. [1], [2]

Một phép ẩn dụ nhỏ nhưng gần như hoàn hảo 🪴

Việc huấn luyện một mô hình giống như tưới cây bằng một vòi phun kỳ lạ. Quá nhiều nước - tạo thành vũng nước quá tải. Quá ít nước - tạo thành hạn hán thiếu hụt. Với nhịp độ phù hợp, ánh sáng mặt trời từ dữ liệu tốt và chất dinh dưỡng từ các mục tiêu rõ ràng, bạn sẽ có được sự phát triển. Vâng, nghe có vẻ hơi sáo rỗng, nhưng nó rất hiệu quả.

Trí tuệ nhân tạo học hỏi như thế nào? Tổng hợp tất cả lại 🧾

Một mô hình bắt đầu ngẫu nhiên. Thông qua các cập nhật dựa trên độ dốc, được hướng dẫn bởi một hàm mất mát, nó điều chỉnh các tham số của mình với các mẫu trong dữ liệu. Các biểu diễn xuất hiện giúp việc dự đoán trở nên dễ dàng. Đánh giá cho bạn biết liệu việc học có thực sự hiệu quả hay không, chứ không phải là ngẫu nhiên. Và quá trình lặp lại - với các biện pháp bảo vệ an toàn - biến bản demo thành một hệ thống đáng tin cậy. Đó là toàn bộ câu chuyện, với ít cảm giác bí ẩn hơn so với vẻ ban đầu. [1]–[4]

Lời kết - Quá dài, không đọc hết 🎁

AI học như thế nào? Bằng cách giảm thiểu tổn thất bằng độ dốc trên nhiều ví dụ. [1], [2]
Dữ liệu tốt, mục tiêu rõ ràng và tối ưu hóa ổn định giúp việc học trở nên bền vững. [1]–[3]
Khái quát hóa luôn tốt hơn việc ghi nhớ. [1]
An toàn, đánh giá và lặp lại biến những ý tưởng thông minh thành sản phẩm đáng tin cậy. [3], [4]
Hãy bắt đầu đơn giản, đo lường kỹ lưỡng và cải thiện bằng cách sửa dữ liệu trước khi theo đuổi các kiến trúc lạ. [2], [3]

Tài liệu tham khảo

Goodfellow, Bengio, Courville - Học sâu (sách giáo khoa trực tuyến miễn phí). Liên kết
Stanford CS231n - Mạng nơ-ron tích chập cho nhận dạng hình ảnh (ghi chú và bài tập). Link
Google - Khóa học cấp tốc về Học máy: Các chỉ số phân loại (Độ chính xác, Độ lặp lại, Độ nhạy, ROC/AUC) . Liên kết
NIST - Khung quản lý rủi ro trí tuệ nhân tạo (AI RMF 1.0) . Liên kết
OpenAI - Học hỏi từ sở thích của con người (tổng quan về huấn luyện dựa trên sở thích). Liên kết

Tìm kiếm những công nghệ AI mới nhất tại Cửa hàng Trợ lý AI chính thức

Về chúng tôi

Quay lại blog

Quốc gia/vùng