AI) hiện diện ở khắp mọi nơi - âm thầm phân loại, chấm điểm và đưa ra gợi ý. Điều đó rất tiện lợi… cho đến khi nó ưu tiên một số nhóm và bỏ lại những nhóm khác. Nếu bạn đang thắc mắc về thiên kiến của AI , tại sao nó xuất hiện ngay cả trong các mô hình hoàn hảo và làm thế nào để giảm thiểu nó mà không làm giảm hiệu suất, thì hướng dẫn này dành cho bạn.
Những bài viết bạn có thể muốn đọc sau bài này:
🔗 GPT là viết tắt của từ gì?
Giải thích đơn giản về tên gọi và nguồn gốc của GPT.
🔗 Trí tuệ nhân tạo dự đoán là gì?
Mô hình dự đoán dự báo kết quả dựa trên dữ liệu lịch sử và dữ liệu hiện tại như thế nào?.
🔗 Trí tuệ nhân tạo mã nguồn mở là gì?
Định nghĩa, lợi ích chính, thách thức, giấy phép và ví dụ dự án.
🔗 Làm thế nào để tích hợp trí tuệ nhân tạo vào doanh nghiệp của bạn?
Lộ trình từng bước, công cụ, quy trình làm việc và những yếu tố thiết yếu trong quản lý thay đổi.
Định nghĩa ngắn gọn: Thiên kiến trong AI là gì?
Thiên kiến AI là khi đầu ra của hệ thống AI có xu hướng ưu tiên hoặc gây bất lợi một cách có hệ thống cho một số người hoặc nhóm nhất định. Nó thường bắt nguồn từ dữ liệu không cân bằng, lựa chọn đo lường hẹp hoặc bối cảnh rộng hơn mà hệ thống được xây dựng và sử dụng. Thiên kiến không phải lúc nào cũng có hại, nhưng nó có thể gây ra tác hại nhanh chóng nếu không được kiểm soát. [1]
Một sự phân biệt hữu ích: thiên kiến là sự lệch lạc trong việc ra quyết định, trong khi phân biệt đối xử là tác động có hại mà sự lệch lạc đó có thể tạo ra trên thế giới. Bạn không thể luôn loại bỏ tất cả thiên kiến, nhưng bạn phải quản lý nó để nó không tạo ra kết quả không công bằng. [2]
Vì sao việc hiểu về định kiến thực sự giúp bạn trở nên tốt hơn 💡
Nghe có vẻ lạ, phải không? Nhưng việc hiểu được thiên kiến của AI sẽ giúp bạn:
-
Giỏi hơn về thiết kế - bạn sẽ sớm phát hiện ra những giả định dễ sai sót.
-
Quản trị tốt hơn - bạn sẽ ghi lại những sự đánh đổi thay vì chỉ nói qua loa.
-
Giỏi giao tiếp hơn - với các nhà lãnh đạo, cơ quan quản lý và những người bị ảnh hưởng.
Ngoài ra, việc học ngôn ngữ của các số liệu và chính sách công bằng sẽ tiết kiệm thời gian sau này. Thành thật mà nói, nó giống như mua một tấm bản đồ trước một chuyến đi đường dài - không hoàn hảo, nhưng tốt hơn nhiều so với cảm tính. [2]
Các kiểu thiên kiến của AI mà bạn thực sự sẽ thấy trong thực tế 🧭
Thiên kiến xuất hiện trong suốt vòng đời của AI. Các mô hình phổ biến mà các nhóm thường gặp phải:
-
Sai lệch trong việc lấy mẫu dữ liệu - một số nhóm bị thiếu đại diện hoặc bị bỏ sót.
-
Thiên kiến về nhãn mác - các nhãn mác trong quá khứ chứa đựng định kiến hoặc những phán đoán phiến diện của con người.
-
Sai lệch trong đo lường - các chỉ số gián tiếp không phản ánh đúng những gì bạn thực sự coi trọng.
-
Thiên lệch trong đánh giá - bộ dữ liệu thử nghiệm bỏ sót một số nhóm dân cư hoặc bối cảnh nhất định.
-
Sai lệch do triển khai - một mô hình thí nghiệm tốt được sử dụng trong môi trường không phù hợp.
-
Thiên kiến hệ thống và thiên kiến cá nhân - các mô hình xã hội rộng hơn và các lựa chọn nhóm ảnh hưởng đến lĩnh vực công nghệ.
Một mô hình tư duy hữu ích từ các cơ quan tiêu chuẩn phân loại thiên kiến thành con người, kỹ thuật và hệ thống , đồng thời đề xuất kỹ thuật xã hội , chứ không chỉ là điều chỉnh mô hình. [1]
Nơi mà sự thiên vị len lỏi vào quy trình 🔍
-
Xác định vấn đề - nếu xác định mục tiêu quá hẹp, bạn sẽ loại trừ những người mà sản phẩm nên phục vụ.
-
Thu thập dữ liệu - dữ liệu lịch sử thường phản ánh những bất công trong quá khứ.
-
Các tùy chọn tính năng - các biến thay thế cho các thuộc tính nhạy cảm có thể tái tạo các thuộc tính nhạy cảm.
-
đào tạo tối ưu hóa độ chính xác trung bình, chứ không phải sự công bằng.
-
Kiểm thử - nếu tập dữ liệu kiểm chứng bị sai lệch, thì các chỉ số của bạn cũng sẽ bị sai lệch.
-
Giám sát - những thay đổi về người dùng hoặc bối cảnh có thể gây ra lại các vấn đề.
Các cơ quan quản lý nhấn mạnh việc ghi lại các rủi ro về tính công bằng trong suốt vòng đời này, không chỉ tại thời điểm phù hợp với mô hình. Đó là một hoạt động cần sự tham gia của tất cả mọi người. [2]
Làm thế nào để đo lường sự công bằng mà không cần phải đi vòng vo? 📏
Không có một tiêu chí nào có thể áp dụng cho tất cả. Hãy lựa chọn dựa trên trường hợp sử dụng và những rủi ro bạn muốn tránh.
-
Sự cân bằng về nhân khẩu học - tỷ lệ lựa chọn phải tương tự nhau giữa các nhóm. Tốt cho các câu hỏi phân bổ, nhưng có thể xung đột với mục tiêu chính xác. [3]
-
Tỷ lệ cược cân bằng - tỷ lệ lỗi như dương tính giả và dương tính thật phải tương tự nhau. Hữu ích khi chi phí của lỗi khác nhau theo nhóm. [3]
-
Hiệu chỉnh - với cùng một điểm số, kết quả phải có khả năng xảy ra như nhau giữa các nhóm. Hữu ích khi điểm số chi phối các quyết định của con người. [3]
Bộ công cụ giúp việc này trở nên thiết thực bằng cách tính toán khoảng cách, biểu đồ và bảng điều khiển để bạn có thể ngừng đoán. [3]
Những cách thiết thực để giảm thiểu định kiến và thực sự hiệu quả 🛠️
Hãy nghĩ đến các biện pháp giảm thiểu rủi ro đa tầng thay vì chỉ một giải pháp thần kỳ duy nhất:
-
Kiểm tra và làm giàu dữ liệu - xác định các khoảng trống trong phạm vi bao phủ, thu thập dữ liệu an toàn hơn khi hợp pháp, ghi lại quá trình lấy mẫu.
-
Điều chỉnh trọng số và lấy mẫu lại - điều chỉnh phân bố dữ liệu huấn luyện để giảm độ lệch.
-
Các ràng buộc trong quá trình xử lý - thêm các mục tiêu công bằng vào mục tiêu để mô hình học trực tiếp các sự đánh đổi.
-
Khử thiên vị đối kháng - huấn luyện mô hình sao cho các thuộc tính nhạy cảm không thể dự đoán được từ các biểu diễn nội bộ.
-
Xử lý hậu kỳ - hiệu chỉnh ngưỡng quyết định cho từng nhóm khi thích hợp và hợp pháp.
-
Kiểm tra có sự tham gia của con người - kết hợp các mô hình với các bản tóm tắt có thể giải thích và các lộ trình leo thang.
Các thư viện mã nguồn mở như AIF360 và Fairlearn cung cấp cả số liệu và thuật toán giảm thiểu. Chúng không phải là phép thuật, nhưng chúng sẽ cung cấp cho bạn một điểm khởi đầu có hệ thống. [5][3]
Bằng chứng thực tế cho thấy sự thiên vị có ảnh hưởng 📸💳🏥
-
Phân tích khuôn mặt - nghiên cứu được trích dẫn rộng rãi đã ghi nhận sự chênh lệch lớn về độ chính xác giữa các nhóm giới tính và loại da trong các hệ thống thương mại, thúc đẩy lĩnh vực này hướng tới các phương pháp đánh giá tốt hơn. [4]
-
Các quyết định quan trọng (tín dụng, tuyển dụng, nhà ở) - ngay cả khi không có ý định, kết quả thiên vị có thể xung đột với nghĩa vụ công bằng và chống phân biệt đối xử. Nói cách khác: bạn phải chịu trách nhiệm về hậu quả, chứ không chỉ về mã. [2]
Một câu chuyện ngắn từ thực tiễn: trong một cuộc kiểm tra sàng lọc ứng viên ẩn danh, một nhóm đã phát hiện ra sự thiếu hụt về khả năng nhớ lại thông tin của phụ nữ trong các vai trò kỹ thuật. Các bước đơn giản - phân chia nhóm tốt hơn, xem xét đặc điểm và ngưỡng cho từng nhóm - đã thu hẹp hầu hết khoảng cách với sự đánh đổi nhỏ về độ chính xác. Mấu chốt không phải là một thủ thuật duy nhất; mà là một vòng lặp đo lường - giảm thiểu - giám sát có thể lặp lại.
Chính sách, luật pháp và quản trị: thế nào là "điều tốt đẹp" 🧾
Bạn không cần phải là luật sư, nhưng bạn cần phải thiết kế sao cho công bằng và dễ giải thích:
-
Nguyên tắc công bằng - các giá trị lấy con người làm trung tâm, tính minh bạch và không phân biệt đối xử trong suốt vòng đời. [1]
-
Bảo vệ dữ liệu và bình đẳng - khi dữ liệu cá nhân được đề cập, hãy lưu ý các nghĩa vụ liên quan đến sự công bằng, giới hạn mục đích và quyền cá nhân; các quy tắc ngành cũng có thể được áp dụng. Xác định nghĩa vụ của bạn sớm. [2]
-
Quản lý rủi ro - sử dụng các khuôn khổ có cấu trúc để xác định, đo lường và giám sát sự thiên vị như một phần của các chương trình rủi ro AI rộng hơn. Hãy ghi lại. Xem xét lại. Lặp lại. [1]
Một lưu ý nhỏ: thủ tục giấy tờ không chỉ là vấn đề quan liêu; đó còn là cách bạn chứng minh mình thực sự đã hoàn thành công việc nếu ai đó yêu cầu.
Bảng so sánh: các công cụ và khung phần mềm để kiểm soát sự thiên vị của AI 🧰📊
| Công cụ hoặc khung | Tốt nhất cho | Giá | Lý do nó hiệu quả... đại khái là vậy |
|---|---|---|---|
| AIF360 | Các nhà khoa học dữ liệu muốn có số liệu + biện pháp giảm thiểu rủi ro | Miễn phí | Nhiều thuật toán ở cùng một chỗ; tạo nguyên mẫu nhanh chóng; giúp thiết lập cơ sở và so sánh các bản sửa lỗi. [5] |
| Công bằng học tập | Các đội cân bằng giữa tính chính xác và các ràng buộc về tính công bằng | Miễn phí | API rõ ràng để đánh giá/giảm thiểu; hình ảnh trực quan hữu ích; thân thiện với scikit-learn. [3] |
| NIST AI (SP 1270) | Rủi ro, tuân thủ và lãnh đạo | Miễn phí | Ngôn ngữ chung cho thiên kiến của con người/kỹ thuật/hệ thống và quản lý vòng đời. [1] |
| Hướng dẫn của ICO | Các nhóm tại Vương quốc Anh xử lý dữ liệu cá nhân | Miễn phí | Danh sách kiểm tra thực tế về rủi ro công bằng/phân biệt đối xử trong suốt vòng đời AI. [2] |
Mỗi yếu tố này giúp bạn trả lời câu hỏi "Thiên kiến AI là gì trong bối cảnh của bạn?" bằng cách cung cấp cấu trúc, số liệu và thuật ngữ chung.
Một quy trình làm việc ngắn gọn, hơi mang tính chủ quan 🧪
-
Hãy nêu rõ những tác hại mà bạn muốn tránh - tác hại do phân bổ nguồn lực không hợp lý, sự chênh lệch về tỷ lệ sai sót, tác hại đến phẩm giá, v.v.
-
Chọn một thước đo phù hợp với tác hại đó - ví dụ, tỷ lệ cược cân bằng nếu sự cân bằng lỗi là quan trọng. [3]
-
Chạy các phép tính cơ sở với dữ liệu và mô hình hiện tại. Lưu báo cáo về tính công bằng.
-
Hãy thử các giải pháp đơn giản trước tiên - phân chia dữ liệu tốt hơn, thiết lập ngưỡng hoặc điều chỉnh trọng số.
-
Nếu cần, hãy chuyển vấn đề
-
Tiến hành đánh giá lại trên các tập dữ liệu kiểm chứng đại diện cho người dùng thực.
-
Theo dõi trong quá trình sản xuất - sự thay đổi trong phân phối là điều tất yếu; bảng điều khiển cũng cần được cập nhật theo.
-
Ghi lại sự đánh đổi - tính công bằng phụ thuộc vào ngữ cảnh, vì vậy hãy giải thích lý do tại sao bạn chọn sự bình đẳng X thay vì sự bình đẳng Y. [1][2]
Các cơ quan quản lý và tiêu chuẩn tiếp tục nhấn mạnh tư duy vòng đời vì một lý do. Nó hiệu quả. [1]
Mẹo giao tiếp dành cho các bên liên quan 🗣️
-
Tránh chỉ giải thích bằng toán học - hãy trình bày các biểu đồ đơn giản và ví dụ cụ thể trước.
-
Hãy sử dụng ngôn ngữ đơn giản - nêu rõ mô hình có thể gây ra những hành vi không công bằng nào và ai có thể bị ảnh hưởng.
-
Sự đánh đổi bề ngoài - các ràng buộc về tính công bằng có thể làm thay đổi độ chính xác; đó không phải là lỗi nếu nó làm giảm thiệt hại.
-
Lập kế hoạch dự phòng - cách tạm dừng hoặc khôi phục lại nếu phát sinh sự cố.
-
Mời gọi sự xem xét kỹ lưỡng - đánh giá bên ngoài hoặc nhóm phản biện sẽ phát hiện ra những điểm mù. Không ai thích điều đó, nhưng nó có ích. [1][2]
Câu hỏi thường gặp: Thiên kiến trong AI thực sự là gì? ❓
Chẳng phải thiên kiến chỉ là dữ liệu xấu sao?
Không chỉ vậy. Dữ liệu rất quan trọng, nhưng các lựa chọn mô hình, thiết kế đánh giá, bối cảnh triển khai và động lực của nhóm đều ảnh hưởng đến kết quả. [1]
Tôi có thể loại bỏ hoàn toàn sự thiên vị không?
Thông thường là không. Mục tiêu của bạn là quản lý sự thiên vị để nó không gây ra những ảnh hưởng không công bằng - hãy nghĩ đến việc giảm thiểu và quản trị, chứ không phải sự hoàn hảo. [2]
Tôi nên sử dụng thước đo công bằng nào?
Hãy chọn dựa trên loại thiệt hại và quy tắc miền. Ví dụ, nếu kết quả dương tính giả gây hại cho một nhóm nhiều hơn, hãy tập trung vào sự bình đẳng về tỷ lệ lỗi (tỷ lệ cược được cân bằng). [3]
Tôi có cần xem xét pháp lý không?
Nếu hệ thống của bạn ảnh hưởng đến cơ hội hoặc quyền của mọi người, thì có. Các quy tắc hướng đến người tiêu dùng và bình đẳng có thể áp dụng cho các quyết định thuật toán và bạn cần phải chứng minh công việc của mình. [2]
Lời kết: Quá dài, không đọc hết 🧾✨
Nếu ai đó hỏi bạn thiên kiến AI là gì , đây là câu trả lời ngắn gọn: đó là sự sai lệch có hệ thống trong kết quả đầu ra của AI, có thể tạo ra những ảnh hưởng không công bằng trong thế giới thực. Bạn cần chẩn đoán nó bằng các chỉ số phù hợp với ngữ cảnh, giảm thiểu nó bằng các kỹ thuật đa lớp và quản lý nó trong toàn bộ vòng đời. Đây không phải là một lỗi đơn lẻ cần khắc phục - đó là vấn đề về sản phẩm, chính sách và con người, đòi hỏi sự đo lường, ghi chép và sự khiêm tốn liên tục. Tôi đoán không có giải pháp thần kỳ nào cả... nhưng có những danh sách kiểm tra hữu ích, những sự đánh đổi trung thực và những thói quen tốt hơn. Và vâng, một vài biểu tượng cảm xúc cũng không hại gì. 🙂
Tài liệu tham khảo
-
Ấn phẩm đặc biệt 1270 của NIST - Hướng tới một tiêu chuẩn để xác định và quản lý sự thiên vị trong trí tuệ nhân tạo . Liên kết
-
Văn phòng Ủy viên Thông tin Vương quốc Anh - Còn về sự công bằng, thiên vị và phân biệt đối xử thì sao? (Liên kết)
-
Tài liệu Fairlearn - Các chỉ số công bằng phổ biến (bình đẳng nhân khẩu học, tỷ lệ cược cân bằng, hiệu chỉnh). Liên kết
-
Buolamwini, J., & Gebru, T. (2018). Sắc thái giới tính: Sự chênh lệch về độ chính xác giao thoa trong phân loại giới tính thương mại . FAT* / PMLR. Link
-
IBM Research - Giới thiệu AI Fairness 360 (AIF360) . Liên kết