Trí tuệ nhân tạo (AI) sử dụng bao nhiêu nước?

Trí tuệ nhân tạo (AI) sử dụng bao nhiêu nước?

Tôi cá là bạn đã nghe đủ mọi câu từ như “AI uống cả chai nước sau mỗi vài câu hỏi” đến “chỉ vài giọt thôi”. Sự thật thì phức tạp hơn nhiều. Lượng nước tiêu thụ của AI thay đổi rất nhiều tùy thuộc vào nơi nó hoạt động, độ dài của câu hỏi và cách trung tâm dữ liệu làm mát máy chủ. Vì vậy, đúng là con số thống kê có tồn tại, nhưng nó ẩn chứa rất nhiều điều kiện ràng buộc.

Dưới đây, tôi sẽ phân tích các con số rõ ràng, dễ hiểu, giải thích lý do tại sao các ước tính lại khác nhau, và chỉ ra cách các nhà xây dựng và người dùng hàng ngày có thể giảm hóa đơn tiền nước mà không cần phải trở thành những người theo chủ nghĩa bảo tồn cực đoan.

Những bài viết bạn có thể muốn đọc sau bài này:

🔗 Bộ dữ liệu AI là gì?
Giải thích cách các tập dữ liệu hỗ trợ việc huấn luyện máy học và phát triển mô hình.

🔗 Trí tuệ nhân tạo dự đoán xu hướng như thế nào?
Bài viết này cho thấy cách trí tuệ nhân tạo phân tích các mô hình để dự báo những thay đổi và kết quả trong tương lai.

🔗 Cách đo lường hiệu suất AI
Phân tích chi tiết các chỉ số thiết yếu để đánh giá độ chính xác, tốc độ và độ tin cậy.

🔗 Cách nói chuyện với AI
Hướng dẫn các chiến lược nhắc nhở hiệu quả nhằm cải thiện sự rõ ràng, kết quả và tính nhất quán.


Trí tuệ nhân tạo (AI) sử dụng bao nhiêu nước? Những con số nhanh chóng và hữu ích 📏

  • Mỗi lời nhắc, phạm vi điển hình hiện nay: từ dưới mililit cho một lời nhắc văn bản trung bình trên một hệ thống chính thống, cho đến hàng chục mililit cho một phản hồi dài hơn, tính toán cao hơn trên một hệ thống khác. Ví dụ, báo cáo kế toán sản xuất của Google cho thấy lời nhắc văn bản trung bình ~0,26 mL (bao gồm cả chi phí phục vụ đầy đủ) [1]. Đánh giá vòng đời của Mistral ước tính phản hồi của trợ lý 400 token ở mức ~45 mL (suy luận biên) [2]. Bối cảnh và mô hình rất quan trọng.

  • Đào tạo một mô hình quy mô tiên tiến: có thể tiêu tốn hàng triệu lít , chủ yếu là nước dùng để làm mát và nước dùng trong sản xuất điện. Một phân tích học thuật được trích dẫn rộng rãi ước tính cần khoảng 5,4 triệu lít để đào tạo một mô hình lớp GPT, bao gồm khoảng 700.000 lít nước tiêu thụ tại chỗ để làm mát - và lập luận về việc lập kế hoạch thông minh để giảm cường độ nước [3].

  • Trung tâm dữ liệu nói chung: các địa điểm lớn tiêu thụ hàng trăm nghìn gallon mỗi ngày tại các nhà điều hành lớn, với mức tiêu thụ cao hơn tại một số khu phức hợp tùy thuộc vào khí hậu và thiết kế [5].

Thành thật mà nói: thoạt nhìn những con số đó có vẻ không nhất quán. Và đúng là như vậy. Và có những lý do chính đáng cho điều đó.

 

Trí tuệ nhân tạo khát nước

Số liệu sử dụng nước dựa trên AI ✅

Một câu trả lời tốt cho câu hỏi "Trí tuệ nhân tạo sử dụng bao nhiêu nước?" cần đáp ứng một vài tiêu chí sau:

  1. Sự rõ ràng về ranh giới
    Liệu nó chỉ bao gồm làm mát tại chỗ hay cả bên ngoài các nhà máy điện sử dụng để phát điện? Thực tiễn tốt nhất phân biệt giữa việc lấy nướctiêu thụ nước và phạm vi 1-2-3, tương tự như kế toán carbon [3].

  2. Độ nhạy vị trí
    Nước trên mỗi kWh thay đổi theo khu vực và hỗn hợp lưới điện, do đó cùng một lời nhắc có thể gây ra những tác động khác nhau về nước tùy thuộc vào nơi nó được cung cấp - một lý do chính khiến tài liệu khuyến nghị lập lịch trình có tính đến thời gian và địa điểm [3].

  3. Tính thực tế của khối lượng công việc
    Liệu con số này có phản ánh các yêu cầu sản xuất trung bình , bao gồm công suất nhàn rỗi và chi phí trung tâm dữ liệu, hay chỉ là bộ tăng tốc ở mức cao nhất? Google nhấn mạnh việc tính toán toàn hệ thống (nhàn rỗi, CPU/DRAM và chi phí trung tâm dữ liệu) cho quá trình suy luận, chứ không chỉ là phép toán TPU [1].

  4. Công nghệ làm mát
    Làm mát bằng bay hơi, làm mát bằng chất lỏng tuần hoàn kín, làm mát bằng không khí và trực tiếp đến chip làm thay đổi đáng kể cường độ nước. Microsoft đang triển khai các thiết kế nhằm loại bỏ việc sử dụng nước làm mát cho một số địa điểm thế hệ tiếp theo [4].

  5. Thời gian trong ngày và theo mùa
    Nhiệt độ, độ ẩm và điều kiện lưới điện làm thay đổi hiệu quả sử dụng nước trong thực tế; một nghiên cứu có ảnh hưởng cho thấy nên lên lịch các công việc lớn khi và ở nơi cường độ sử dụng nước thấp hơn [3].


Giải thích sự khác biệt giữa lượng nước tiêu thụ và lượng nước lấy ra 💡

  • Khai thác = lượng nước được lấy từ sông, hồ hoặc tầng chứa nước ngầm (một phần được trả lại).

  • Lượng tiêu thụ = lượng nước không được hoàn trả do bay hơi hoặc được sử dụng trong các quy trình/sản phẩm.

Tháp giải nhiệt chủ yếu tiêu thụ nước thông qua quá trình bay hơi. Việc phát điện có thể lấy đi một lượng lớn nước (đôi khi tiêu thụ một phần trong số đó), tùy thuộc vào nhà máy và phương pháp làm mát. Nhãn số nước AI đáng tin cậy mà nó đang báo cáo [3].


Nước sẽ chảy đi đâu trong trí tuệ nhân tạo: ba cái xô 🪣

  1. Phạm vi 1 - làm mát tại chỗ
    Phần có thể nhìn thấy: nước bay hơi tại chính trung tâm dữ liệu. Các lựa chọn thiết kế như làm mát bằng bay hơi so với làm mát bằng không khí hoặc làm mát bằng chất lỏng tuần hoàn kín đặt ra tiêu chuẩn cơ bản [5].

  2. Phạm vi 2 - sản xuất điện
    Mỗi kWh có thể mang một nhãn nước ẩn; hỗn hợp và vị trí xác định tín hiệu lít trên kWh mà khối lượng công việc của bạn kế thừa [3].

  3. Phạm vi 3 - chuỗi cung ứng Sản
    xuất chip dựa vào nước siêu tinh khiết trong quá trình chế tạo. Bạn sẽ không thấy nó trong số liệu “mỗi lần nhắc nhở” trừ khi ranh giới bao gồm rõ ràng các tác động tích hợp (ví dụ: LCA đầy đủ) [2][3].


Các nhà cung cấp theo số liệu, kèm theo những chi tiết tinh tế 🧮

  • Google Gemini nhắc nhở
    phương pháp phục vụ Full-stack (bao gồm thời gian chờ và chi phí cơ sở). Văn bản nhắc nhở trung bình ~0,26 mL nước cùng với ~0,24 Wh năng lượng; các con số phản ánh lưu lượng sản xuất và ranh giới toàn diện [1].

  • Chu kỳ sống Mistral Large 2
    Một LCA độc lập hiếm hoi (với ADEME/Carbone 4) tiết lộ ~281.000 m³ cho việc đào tạo + sử dụng sớm và suy luận cận biên ~45 mL cho 400 token [2].

  • Tham vọng làm mát không dùng nước của Microsoft
    Các trung tâm dữ liệu thế hệ tiếp theo được thiết kế để không tiêu thụ nước để làm mát , dựa vào các phương pháp trực tiếp tới chip; các mục đích quản trị vẫn yêu cầu một số nước [4].

  • Quy mô trung tâm dữ liệu chung
    Các nhà điều hành lớn công khai báo cáo trung bình hàng trăm nghìn gallon mỗi ngày tại các địa điểm riêng lẻ; khí hậu và thiết kế đẩy con số lên hoặc xuống [5].

  • Cơ sở học thuật trước đó
    Phân tích “AI khát nước” mang tính tiên phong ước tính hàng triệu lít để đào tạo các mô hình lớp GPT và rằng 10–50 câu trả lời trung bình có thể tương đương với khoảng 500 ml chai - phụ thuộc rất nhiều vào thời điểm/nơi chúng hoạt động [3].


Vì sao các ước tính lại khác nhau nhiều đến vậy 🤷

  • Các ranh giới khác nhau
    Một số con số chỉ tính đến việc làm mát tại chỗ ; những con số khác thêm nước của điện ; LCA có thể thêm sản xuất chip . Táo, cam và salad trái cây [2][3].

  • Khối lượng công việc khác nhau
    Một lời nhắc văn bản ngắn không phải là một quá trình chạy mã/đa phương thức dài; việc xử lý theo lô, đồng thời và độ trễ nhằm mục đích thay đổi mức độ sử dụng [1][2].

  • Khí hậu và lưới khác nhau
    Làm mát bằng bay hơi ở vùng nóng, khô hạn ≠ làm mát bằng không khí/chất lỏng ở vùng mát mẻ, ẩm ướt. Cường độ nước lưới thay đổi rộng rãi [3].

  • Các phương pháp của nhà cung cấp
    Google đã công bố một phương pháp phục vụ trên toàn hệ thống; Mistral đã công bố một LCA chính thức. Những người khác đưa ra ước tính điểm với các phương pháp thưa thớt. Một tuyên bố nổi bật “một phần mười lăm thìa cà phê” cho mỗi lời nhắc đã gây xôn xao dư luận - nhưng không có chi tiết ranh giới, nó không thể so sánh được [1][3].

  • Một mục tiêu di động
    Hệ thống làm mát đang phát triển nhanh chóng. Microsoft đang thử nghiệm hệ thống làm mát không dùng nước tại một số địa điểm; việc triển khai hệ thống này sẽ giảm lượng nước sử dụng tại chỗ ngay cả khi điện năng ở thượng nguồn vẫn mang tín hiệu nước [4].


Bạn có thể làm gì ngay hôm nay để giảm lượng nước tiêu thụ của AI? 🌱

  1. Điều chỉnh kích thước mô hình cho phù hợp.
    Các mô hình nhỏ hơn, được điều chỉnh theo nhiệm vụ thường đạt được độ chính xác tương đương trong khi tiêu tốn ít tài nguyên tính toán hơn. Đánh giá của Mistral nhấn mạnh mối tương quan mạnh mẽ giữa kích thước và dấu vết - và công bố các con số suy luận cận biên để bạn có thể suy luận về sự đánh đổi [2].

  2. Chọn các khu vực tiết kiệm nước.
    Ưu tiên các khu vực có khí hậu mát mẻ hơn, hệ thống làm mát hiệu quả và lưới điện có cường độ nước thấp hơn trên mỗi kWh; công việc “AI khát nước” cho thấy theo thời gian và địa điểm có ích [3].

  3. Phân bổ khối lượng công việc theo thời gian
    Lên lịch đào tạo/suy luận hàng loạt nặng vào những giờ tiết kiệm nước (đêm mát hơn, điều kiện lưới thuận lợi) [3].

  4. Hãy yêu cầu nhà cung cấp của bạn cung cấp các số liệu minh bạch
    về nhu cầu nước theo từng lần nhắc nhở , định nghĩa ranh giới và liệu các con số có bao gồm công suất nhàn rỗi và chi phí vận hành cơ sở hay không. Các nhóm chính sách đang thúc đẩy việc công khai bắt buộc để có thể so sánh một cách công bằng [3].

  5. Công nghệ làm mát rất quan trọng.
    Nếu bạn sử dụng phần cứng, hãy đánh giá hệ thống làm mát khép kín/trực tiếp vào chip ; nếu bạn sử dụng điện toán đám mây, hãy ưu tiên các khu vực/nhà cung cấp đầu tư vào các thiết kế ít nước [4][5].

  6. Sử dụng nước thải sinh hoạt và các lựa chọn tái sử dụng
    Nhiều khuôn viên có thể thay thế các nguồn không dùng để uống hoặc tái chế trong các vòng tuần hoàn; các nhà điều hành lớn mô tả việc cân bằng các nguồn nước và lựa chọn làm mát để giảm thiểu tác động tổng thể [5].

Ví dụ nhanh để làm cho nó thực tế (không phải là quy tắc phổ quát): chuyển một công việc đào tạo qua đêm từ một vùng nóng, khô vào giữa mùa hè sang một vùng mát hơn, ẩm hơn vào mùa xuân - và thực hiện nó vào giờ thấp điểm, mát hơn - có thể thay đổi cả tại chỗbên ngoài (lưới điện). Đó là loại chiến thắng thực tế, ít gây tranh cãi mà việc lập kế hoạch có thể mang lại [3].


Bảng so sánh: những lựa chọn nhanh để giảm lượng nước tiêu thụ của AI 🧰

dụng cụ khán giả giá lý do tại sao nó hiệu quả
Các mô hình nhỏ hơn, được điều chỉnh theo nhiệm vụ các nhóm ML, trưởng nhóm sản phẩm Thấp-trung bình Ít tính toán hơn trên mỗi token = ít làm mát + điện nước hơn; đã được chứng minh trong báo cáo kiểu LCA [2].
Lựa chọn khu vực dựa trên lượng nước/kWh Kiến trúc sư điện toán đám mây, bộ phận mua sắm Trung bình Chuyển sang khí hậu mát hơn và lưới điện có cường độ nước thấp hơn; kết hợp với định tuyến theo nhu cầu [3].
Khung thời gian đào tạo trong ngày MLOps, bộ lập lịch Thấp Đêm mát hơn + điều kiện lưới tốt hơn làm giảm cường độ nước hiệu quả [3].
Làm mát trực tiếp lên chip/làm mát vòng kín Vận hành trung tâm dữ liệu Trung bình-cao Tránh sử dụng tháp bay hơi nếu có thể, cắt giảm lượng tiêu thụ tại chỗ [4].
Kiểm soát độ dài và lô nhắc nhở Nhà phát triển ứng dụng Thấp Giới hạn các token chạy quá mức, xử lý theo lô một cách thông minh, lưu trữ kết quả; ít mili giây hơn, ít mililit hơn [1][2].
Danh sách kiểm tra tính minh bạch của nhà cung cấp Giám đốc công nghệ, người dẫn đầu về phát triển bền vững Miễn phí Làm rõ ranh giới (tại chỗ so với ngoài chỗ) và báo cáo tương tự [3].
Nước thải sinh hoạt hoặc nước tái chế Cơ sở vật chất, đô thị Trung bình Việc thay thế nước không dùng để uống sẽ làm giảm áp lực lên nguồn cung cấp nước uống [5].
Các quan hệ đối tác tái sử dụng nhiệt Các nhà điều hành, hội đồng địa phương Trung bình Hiệu suất nhiệt tốt hơn gián tiếp làm giảm nhu cầu làm mát và tạo thiện chí địa phương [5].

(Giá cả được thiết kế linh hoạt - tùy thuộc vào từng trường hợp cụ thể.)


Phân tích chuyên sâu: Tiếng trống thúc giục chính sách ngày càng vang dội 🥁

Các tổ chức kỹ thuật kêu gọi công khai bắt buộc về năng lượng và nước của trung tâm dữ liệu để người mua và cộng đồng có thể đánh giá chi phí và lợi ích. Các khuyến nghị bao gồm định nghĩa phạm vi, báo cáo cấp địa điểm và hướng dẫn đặt địa điểm - bởi vì nếu không có các số liệu tương đương, có tính đến vị trí, chúng ta đang tranh luận trong bóng tối [3].


Phân tích chuyên sâu: Không phải tất cả các trung tâm dữ liệu đều tiêu thụ năng lượng giống nhau 🚰

Có một quan niệm sai lầm dai dẳng rằng “làm mát bằng không khí không sử dụng nước”. Không hẳn vậy. Các hệ thống sử dụng nhiều không khí thường yêu cầu nhiều điện hơn , mà ở nhiều khu vực, điện năng này mang theo nước ngầm từ lưới điện; ngược lại, làm mát bằng nước có thể giảm điện năng và khí thải với chi phí là sử dụng nước tại chỗ. Các nhà điều hành lớn cân bằng rõ ràng những sự đánh đổi này tại từng địa điểm [1][5].


Phân tích chuyên sâu: Kiểm tra nhanh thực tế về các tuyên bố lan truyền trên mạng 🧪

Bạn có thể đã thấy những tuyên bố táo bạo rằng một lời nhắc duy nhất tương đương với “một chai nước”, hoặc ngược lại, “chỉ một vài giọt”. Tư thế tốt hơn: khiêm tốn với toán học . Các giới hạn đáng tin cậy ngày nay là ~0,26 mL cho lời nhắc sản xuất trung bình với chi phí phục vụ đầy đủ [1] và ~45 mL “một phần mười lăm thìa cà phê” được chia sẻ rộng rãi thiếu ranh giới/phương pháp công khai; hãy coi nó như một dự báo thời tiết mà không có thành phố [1][3].


Câu hỏi thường gặp ngắn gọn: Trí tuệ nhân tạo (AI) sử dụng bao nhiêu nước? (Giải thích bằng ngôn ngữ dễ hiểu) 🗣️

  • Vậy, tôi nên nói gì trong cuộc họp?
    “Tùy thuộc vào từng trường hợp, lượng kiến ​​thức cần có dao động từ vài giọt đến vài ngụm , tùy thuộc vào kiểu máy, thời lượng và nơi chạy chương trình. Đào tạo cần nhiều nguồn lực , chứ không phải ít ỏi.” Sau đó, hãy đưa ra một hoặc hai ví dụ như trên.

  • AI có phải là một thứ duy nhất xấu?
    Nó có tính chất tập trung : các chip công suất cao được đóng gói cùng nhau tạo ra tải làm mát lớn. Nhưng các trung tâm dữ liệu cũng là nơi mà công nghệ hiệu quả tốt nhất có xu hướng xuất hiện đầu tiên [1][4].

  • Điều gì sẽ xảy ra nếu chúng ta chỉ chuyển mọi thứ sang làm mát bằng không khí?
    Bạn có thể cắt giảm tại chỗ nhưng tăng lượng ngoài địa điểm thông qua điện. Các nhà điều hành tinh vi cân nhắc cả hai [1][5].

  • Còn về công nghệ tương lai thì sao?
    Các thiết kế tránh sử dụng nước làm mát ở quy mô lớn sẽ là một bước đột phá cho Phạm vi 1. Một số nhà điều hành đang chuyển sang hướng này; điện năng thượng nguồn vẫn mang tín hiệu nước cho đến khi lưới điện thay đổi [4].


Lời kết - Dài quá, tôi không đọc hết 🌊

  • Mỗi lời nhắc: hãy nghĩ đến từ dưới mililit đến hàng chục mililit , tùy thuộc vào kiểu máy, độ dài lời nhắc và nơi nó chạy. Lời nhắc trung bình ~0,26 mL trên một ngăn xếp chính; ~45 mL cho câu trả lời 400 token trên một ngăn xếp khác [1][2].

  • Đào tạo: hàng triệu lít cho các mô hình tiên phong, khiến việc lập kế hoạch, định vị và công nghệ làm mát trở nên quan trọng [3].

  • Những việc cần làm: điều chỉnh kích thước mô hình, chọn các khu vực tiết kiệm nước, chuyển các công việc nặng nhọc sang giờ mát mẻ hơn, ưu tiên các nhà cung cấp chứng minh thiết kế tiết kiệm nước và yêu cầu ranh giới minh bạch [1][3][4][5].

Một phép ẩn dụ hơi thiếu sót để kết thúc: Trí tuệ nhân tạo (AI) là một dàn nhạc khát nước - giai điệu là điện toán, nhưng tiếng trống là hệ thống làm mát và tưới nước. Điều chỉnh âm thanh cho dàn nhạc, và khán giả vẫn được thưởng thức âm nhạc mà không cần đến hệ thống phun nước. 🎻💦


Tài liệu tham khảo

  1. Blog Google Cloud - Trí tạo (AI) của Google tiêu thụ bao nhiêu năng lượng? Chúng tôi đã tính toán (phương pháp luận + ~0,26 mL lượng tiêu thụ trung bình mỗi lần nhắc nhở, chi phí chung cho toàn bộ quá trình). Liên kết
    (Tài liệu kỹ thuật PDF: Đo lường tác động môi trường của việc cung cấp AI ở quy mô Google .) Liên kết

  2. Mistral AI - Đóng góp của chúng tôi vào tiêu chuẩn môi trường toàn cầu cho AI (LCA với ADEME/Carbone 4; ~281.000 m³ đào tạo + sử dụng ban đầu; ~45 mL cho mỗi 400 token , suy luận cận biên). Liên kết

  3. Li và cộng sự - Giảm thiểu "khát nước" cho AI: Khám phá và giải quyết dấu chân nước bí mật của các mô hình AI (huấn luyện hàng triệu lít nước , theo thời gian và địa điểm , rút ​​nước so với tiêu thụ). Liên kết

  4. Microsoft - Trung tâm dữ liệu thế hệ tiếp theo không sử dụng nước để làm mát (thiết kế tích hợp trực tiếp vào chip nhằm mục tiêu làm mát không cần nước tại một số vị trí nhất định). Link

  5. Trung tâm dữ liệu của Google - Vận hành bền vững (sự đánh đổi về hệ thống làm mát tại từng địa điểm; báo cáo và tái sử dụng, bao gồm nước thải đã qua xử lý/nước xám; mức sử dụng điển hình hàng ngày tại từng địa điểm). Liên kết

Tìm kiếm những công nghệ AI mới nhất tại Cửa hàng Trợ lý AI chính thức

Về chúng tôi

Quay lại blog