Điện toán vũ trụ: Lời hứa hào nhoáng và cái giá vật lý đắt đỏ

Minh Nguyệt
Minh Nguyệt
Phản hồi: 0

Minh Nguyệt

Intern Writer
Không gian lạnh lẽo, vô tận và dường như tách biệt hoàn toàn với những xáo trộn trên Trái Đất như động đất, lũ lụt hay các cuộc biểu tình, liệu có phải là thiên đường lý tưởng cho các trung tâm dữ liệu? Nhiều người vẫn tin rằng không gian mang lại nguồn năng lượng mặt trời dồi dào và khả năng làm mát miễn phí. Tuy nhiên, khi nhìn nhận một cách thực tế hơn về vật lý học, bức tranh về điện toán ngoài không gian lại phức tạp và nhiều thách thức hơn chúng ta tưởng.

Một trong những hiểu lầm lớn nhất chính là khái niệm "làm mát miễn phí". Đúng là không gian rất lạnh, nhưng nó lại không có bầu khí quyển. Điều này đồng nghĩa với việc các cơ chế tản nhiệt hiệu quả nhất như dẫn nhiệt và đối lưu đều không thể áp dụng. Lựa chọn duy nhất còn lại là bức xạ nhiệt. Để ngăn một con chip quá nhiệt trong không gian, chúng ta cần một bề mặt tản nhiệt lớn và đắt đỏ để hấp thụ và sau đó bức xạ năng lượng ra ngoài.

Năng lượng mặt trời ngoài không gian quả thực rất phong phú, với cường độ khoảng 1.361 watt trên mỗi mét vuông. Thế nhưng, việc thu thập năng lượng này bằng các tấm pin mặt trời hoạt động hiệu quả và luôn giữ được sự căn chỉnh hoàn hảo hướng về phía Mặt Trời lại là một nhiệm vụ phức tạp, đòi hỏi các hệ thống kiểm soát tư thế (attitude control systems) tinh vi. Chưa kể, bức xạ ion hóa từ tia vũ trụ và các nguồn khác trong không gian là một thách thức độc đáo, làm suy giảm hiệu suất của các tấm pin mặt trời, bộ làm mát bức xạ và cả chính các con chip. Vì việc bảo trì định kỳ trong không gian rất khó khăn, nên các hệ thống dự phòng phải được tích hợp ngay từ khi phóng, và chi phí ước tính phải tính đến sự suy giảm hiệu suất theo thời gian.
1781791042031.png

Tại ABI Research, nơi mình làm việc với vai trò nhà phân tích hàng không vũ trụ, chúng mình đã thực hiện một so sánh sơ bộ về tổng chi phí sở hữu giữa một trung tâm dữ liệu trên Trái Đất và một trung tâm dữ liệu trong không gian. Kết quả cho thấy chi phí để phóng và vận hành một GPU trong không gian trong một năm cao hơn ít nhất một bậc độ lớn so với việc tương tự ở một trung tâm dữ liệu trên mặt đất. Mô hình của chúng mình khá đơn giản, giả định một giá đỡ máy chủ Nvidia H100 được phóng cùng với tấm pin mặt trời và bộ tản nhiệt có kích thước phù hợp trên một tàu vũ trụ tương tự như chuyến bay thử nghiệm của Starcloud. Chúng mình cũng giả định rằng tên lửa Starship của SpaceX được sử dụng với chi phí phóng mỗi kilogram rất lạc quan là 44 USD (khoảng 1,1 triệu VNĐ) và chi phí năng lượng trên mặt đất là 0,20 USD (khoảng 5.000 VNĐ) mỗi kilowatt giờ. Đây chỉ là một phép tính nhanh, nhưng nó đã chỉ ra một thực tế đáng suy ngẫm.

Từ góc độ của chúng mình, chi phí vận chuyển và chi phí "làm cứng" tải trọng để chịu được môi trường không gian khiến các trung tâm dữ liệu đa năng ngoài không gian khó có thể biện minh về mặt kinh tế ở thời điểm hiện tại. Điều này diễn ra ngay cả khi các nhà xây dựng trung tâm dữ liệu ở nhiều khu vực đang phải vật lộn để tìm kiếm nguồn điện. Tuy nhiên, vẫn có những ứng dụng chuyên biệt mà chi phí điện toán cao hơn nhiều trong không gian có thể được chấp nhận. Ví dụ bao gồm tiền xử lý dữ liệu từ các vệ tinh quan sát Trái Đất, phát hiện và theo dõi tên lửa siêu thanh theo thời gian thực, và tránh va chạm chủ động trong quỹ đạo Trái Đất tầm thấp (LEO) ngày càng đông đúc. Ngay cả đối với những ứng dụng này, việc đối phó với các định luật vật lý cơ bản vẫn sẽ là một thách thức lớn, nhưng cũng là một thách thức đầy hấp dẫn về mặt công nghệ.

Thách thức lớn nhất về mặt vật lý chính là làm mát. Phương trình chi phối việc làm mát bằng bức xạ, loại hình làm mát duy nhất có sẵn trong không gian, được gọi là Định luật Stefan-Boltzmann. Định luật này nói rằng lượng năng lượng bạn có thể bức xạ tỷ lệ thuận với diện tích của bộ tản nhiệt nhân với nhiệt độ của nó lũy thừa bậc bốn. Đối với một kiến trúc sư hệ thống không gian, ý nghĩa của định luật này rất khắc nghiệt. Trong quỹ đạo, biến số duy nhất chúng ta có thể kiểm soát là diện tích. Hạn chế này tạo ra một "thuế vật lý" cho việc làm mát trong không gian: bạn cần loại bỏ càng nhiều năng lượng, bạn càng cần một bộ tản nhiệt có diện tích lớn hơn để mang từ Trái Đất lên.

Để hình dung rõ hơn, một con chip Nvidia H100 GPU phổ biến, tiêu thụ 700 watt điện, cần một diện tích tản nhiệt khoảng 1,4 mét vuông để duy trì nhiệt độ hoạt động ổn định ở 60 °C. Con số này được tính toán khi giả định bộ tản nhiệt hướng hoàn toàn về không gian sâu, nơi có nhiệt độ nền lạnh giá chỉ 3 Kelvin. Tuy nhiên, đây mới chỉ là trường hợp lý tưởng. Một giá đỡ AI thông thường có thể chứa khoảng 32 GPU, cùng với CPU, bộ nhớ và thiết bị mạng, sẽ tiêu thụ khoảng 40 kilowatt điện. Để làm mát tải nhiệt này trong môi trường chân không, giá đỡ đó sẽ cần một bộ tản nhiệt có diện tích lên tới 80 mét vuông, tương đương kích thước của một sân bóng pickleball. Đối với một trung tâm dữ liệu tổng hợp 100 megawatt, chúng ta sẽ cần ít nhất 2.500 bộ tản nhiệt như vậy.

Và đó vẫn là kịch bản tốt nhất. Môi trường quỹ đạo Trái Đất tầm thấp còn ẩn chứa nhiều vấn đề khác. Không gian khiến các bộ tản nhiệt và lớp phủ của chúng tiếp xúc với một hỗn hợp hóa học khắc nghiệt của tia cực tím và oxy nguyên tử, hoàn toàn trái ngược với môi trường phòng sạch. Trong suốt vòng đời 5 năm điển hình của một vệ tinh LEO, các yếu tố này làm suy giảm tính chất bề mặt của bộ tản nhiệt và giảm khả năng tản nhiệt của nó. Khi tính đến sự suy giảm này, để duy trì nhiệt độ hoạt động 60 °C cho các chip GPU, diện tích bề mặt cần thiết sẽ tăng từ khoảng 1,4 mét vuông mỗi chip lên gần 2,0 mét vuông. Nói cách khác, "thuế vật lý" tăng thêm 40%. Điều này có nghĩa là chúng ta phải phóng thêm ít nhất 40% khối lượng bộ tản nhiệt, chịu lực cản khí quyển cao hơn và hy sinh không gian phóng quý giá chỉ để chống lại sự suy giảm của lớp phủ nhiệt. Sự gia tăng này làm tăng đáng kể chi phí phóng và tiếp tục làm xói mòn tính kinh tế của một trung tâm dữ liệu ngoài không gian.

Giải quyết vấn đề nhiệt chỉ là một phần của cuộc chiến. Thách thức đáng kể khác trong quỹ đạo Trái Đất tầm thấp là bức xạ ion hóa, ảnh hưởng trực tiếp đến phần cứng điện toán. Các vệ tinh ngày nay thường sử dụng bộ xử lý "chống bức xạ" (radiation-hardened), rất đáng tin cậy nhưng cũng đắt hơn nhiều và hiệu suất kém hơn đáng kể so với các bộ xử lý thương mại thông thường. Một chip chống bức xạ tiêu chuẩn không có đủ sức mạnh xử lý để chạy một mô hình ngôn ngữ lớn (LLM) hiện đại. Do đó, các nhà khai thác vệ tinh muốn phóng một trung tâm dữ liệu không có lựa chọn nào khác ngoài việc chấp nhận rủi ro: sử dụng phần cứng dành cho mục đích sử dụng trên mặt đất. Để đạt được mật độ tính toán cần thiết, các trung tâm dữ liệu quỹ đạo phải sử dụng cùng loại Nvidia H100 hoặc Google TPU được tìm thấy trong các trang trại máy chủ trên mặt đất. Vấn đề là những con chip này là "mục tiêu mềm" trong không gian. Các hạt năng lượng cao có thể làm lật bit trong bộ nhớ hoặc gây ra hiện tượng "latch-up" trong logic, làm hỏng mạch điện.

Một lựa chọn khả thi là che chắn máy tính khỏi bức xạ bằng các tấm chắn dày, hấp thụ. Tuy nhiên, việc che chắn sẽ làm tăng đáng kể trọng lượng của vệ tinh vốn đã nặng. Lựa chọn khác là bù đắp thiệt hại do bức xạ bằng cách sử dụng dự phòng. Thực tế, các kiến trúc sư điện toán biên (edge computing) đang chuyển sang khả năng phục hồi được định nghĩa bằng phần mềm, nơi thay vì một máy tính được làm cứng hoàn hảo, các nhà khai thác sẽ sử dụng một cụm máy tính thương mại không hoàn hảo, với tổng chi phí có thể chỉ bằng một phần mười đến một phần trăm so với mô hình chống bức xạ. Cách tiếp cận dự phòng này được sử dụng trong nhiều tàu vũ trụ, bao gồm Artemis II, các máy tính bay của SpaceX và máy chủ biên của Hewlett Packard Enterprise cho Trạm Vũ trụ Quốc tế. Bằng cách chạy ba (hoặc nhiều hơn) phiên bản của cùng một phép tính trên ba nút khác nhau và so sánh kết quả, hệ thống có thể phát hiện bộ xử lý bị hỏng. Nếu một nút bị lỗi, "bộ điều phối" sẽ khởi động lại nó trong khi các nút khác tiếp tục nhiệm vụ. Mặc dù điều này đảm bảo khả năng phục hồi, nhưng nó cũng có nghĩa là một phần dung lượng tính toán được dành cho dự phòng, làm tăng thêm chi phí.

Một lợi thế thường được ca ngợi của các trung tâm dữ liệu ngoài không gian là nguồn cung cấp năng lượng sạch, miễn phí và dường như không giới hạn từ Mặt Trời. Năng lượng mặt trời trong quỹ đạo thực sự dồi dào, đạt 1.361 watt trên mỗi mét vuông. Tuy nhiên, việc thu thập nguồn năng lượng miễn phí đó chỉ có thể thực hiện được bằng cách phóng các tấm pin mặt trời lớn lên quỹ đạo với chi phí rất cao. Và những tấm pin mặt trời đó cũng bị suy giảm theo thời gian do tiếp xúc với bức xạ, thường mất 1 đến 3 phần trăm hiệu suất mỗi năm.

Giả sử một mảng pin mặt trời thu thập 1 megawatt điện để vận hành một cụm AI. Các định luật vật lý đòi hỏi vệ tinh cuối cùng phải bức xạ 1 megawatt nhiệt thải. Vì diện tích cần thiết để tạo ra năng lượng mặt trời (khoảng 400 W/m²) và để loại bỏ nhiệt (khoảng 450 W/m²) gần như tương đương, nên mỗi mét vuông tạo ra điện năng giờ đây đòi hỏi xấp xỉ một mét vuông làm mát khác. Bộ tản nhiệt cần phải có cấu trúc tương đương, chứ không chỉ là một lớp phủ thụ động trên một bề mặt được sử dụng cho mục đích khác. Như Elon Musk gần đây đã lưu ý tại Davos, bộ tản nhiệt hiệu quả nhất là bộ tản nhiệt không bao giờ nhìn thấy Mặt Trời. Bằng cách định hướng tàu vũ trụ sao cho các tấm pin mặt trời hướng về Mặt Trời và các bộ tản nhiệt hướng về chân không sâu của không gian, hiệu suất tăng vọt cho cả hai. Nhưng có một vấn đề: duy trì sự căn chỉnh ba chiều hoàn hảo này – tấm pin hướng về Mặt Trời, bộ tản nhiệt hướng về khoảng không, ăng-ten hướng về Trái Đất – đòi hỏi các hệ thống kiểm soát tư thế phức tạp, mô-men xoắn cao. Vì vậy, cấu hình này có nghĩa là nhiều tải trọng hơn và nhiều sức mạnh tính toán hơn. Hơn nữa, các hệ thống điều khiển này là các thành phần phức tạp với nhiều chế độ lỗi, điều này không tối ưu trong một tình huống mà việc bảo trì rất khó khăn.

Với tất cả những thách thức trong việc triển khai các bộ tản nhiệt khổng lồ cho vệ tinh trong môi trường không gian khắc nghiệt, tại sao chúng ta vẫn cần xây dựng các trung tâm dữ liệu trong không gian? Mặc dù việc đào tạo hoặc suy luận các mô hình ngôn ngữ lớn (LLM) trong không gian có vẻ không kinh tế ở thời điểm hiện tại, nhưng vẫn có những ứng dụng rất hấp dẫn khác cho điện toán trong không gian. Hai ví dụ điển hình là giải quyết nút thắt cổ chai về đường truyền dữ liệu từ các vệ tinh quan sát Trái Đất và cho phép các thao tác tránh va chạm trong quỹ đạo Trái Đất tầm thấp ngày càng đông đúc.

Các vệ tinh quan sát Trái Đất mới nhất, được trang bị cảm biến siêu phổ và radar khẩu độ tổng hợp, được sử dụng cho một loạt các nhiệm vụ trinh sát quan trọng, như tình báo chiến trường, theo dõi hạm đội tàu "bóng tối" toàn cầu vận chuyển hàng lậu, và đánh giá động đất hoặc các sự cố cơ sở hạ tầng với độ chính xác đến từng milimet. Các hệ thống này có thể tạo ra hàng trăm terabyte dữ liệu thô mỗi ngày cần được truyền về Trái Đất. Tuy nhiên, các "đường ống" tần số vô tuyến được sử dụng để truyền dữ liệu đang bị tắc nghẽn, và cơ sở hạ tầng mặt đất không thể hấp thụ lượng dữ liệu thô khổng lồ này.

Một ứng dụng quan trọng khác, mang tính nhiệm vụ cấp bách cho điện toán trong không gian là bảo vệ môi trường quỹ đạo. Với hơn 17.000 vệ tinh đang hoạt động, phần lớn trong số đó nằm ở quỹ đạo Trái Đất tầm thấp, việc tránh va chạm giữa các vệ tinh này là vô cùng quan trọng. Như nhà vật lý thiên văn NASA Donald Kessler đã chỉ ra từ năm 1978, một vụ va chạm duy nhất trong không gian có thể gây ra hiệu ứng dây chuyền, khiến toàn bộ LEO trở nên không thể sử dụng được. Theo báo cáo thường niên gần đây của SpaceX, chòm sao Starlink thực hiện một thao tác tránh va chạm trung bình cứ mỗi 2 phút. Mỗi thao tác này đã dựa vào các hệ thống AI trên tàu, nhưng phần lớn quá trình xử lý vẫn diễn ra trên mặt đất. Khi quỹ đạo Trái Đất tầm thấp ngày càng đông đúc, việc tránh va chạm sẽ phải phá vỡ mô hình vòng lặp mặt đất truyền thống. Trong kỷ nguyên của các chòm sao vệ tinh khổng lồ, vòng lặp OODA (quan sát, định hướng, quyết định, hành động) phải diễn ra trên tàu, từ đó giảm thời gian phân tích từ vài phút xuống còn vài mili giây. Vấn đề là các máy tính bay tiêu chuẩn trên vệ tinh không được xây dựng cho mức độ xử lý này. Các mô hình xác suất phức tạp cần thiết cho việc điều động hiện không thể được triển khai bởi các máy tính trên tàu cùng với hệ thống định vị của chúng. Rõ ràng, cần có những máy tính mạnh mẽ hơn. Đây chính là lý do kinh tế thực sự để chuyển điện toán lên không gian: để tạo ra thông tin chi tiết ngay tại đó. Bằng cách đặt điện toán hiệu suất cao gần các cảm biến, chúng ta có thể xử lý hàng terabyte dữ liệu trong quỹ đạo và chỉ truyền xuống Trái Đất những dữ liệu liên quan theo thời gian thực, đồng thời thực hiện các phép tính cần thiết để tránh va chạm vệ tinh theo thời gian thực.

Vậy, giả sử rằng một hình thức điện toán nào đó là không thể tránh khỏi trong quỹ đạo Trái Đất tầm thấp trong tương lai gần, vấn đề nhiệt sẽ được xử lý như thế nào? Ngành công nghiệp hiện đang thử nghiệm hai loại giải pháp chính để đối phó với định luật Stefan-Boltzmann. Một lựa chọn sáng tạo là sử dụng bộ tản nhiệt lấy cảm hứng từ nghệ thuật gấp giấy origami, loại được dùng cho kính viễn vọng James Webb. Các công ty đang phát triển bộ tản nhiệt composite linh hoạt, có độ dẫn nhiệt cao, có thể gấp gọn thành một khối lập phương nhỏ khi phóng và mở ra thành những cánh tản nhiệt khổng lồ nhưng nhẹ trong quỹ đạo. Một khả năng khác là sử dụng bộ tản nhiệt giọt chất lỏng. Khái niệm này đề xuất loại bỏ hoàn toàn cấu trúc tản nhiệt cứng nhắc và thay vào đó phun một dòng dầu làm mát trực tiếp vào chân không của không gian. Chất lỏng di chuyển qua một vòng lặp mở, tiếp xúc với nhiệt độ gần bằng không tuyệt đối của khoảng không, tối đa hóa diện tích bề mặt bức xạ trước khi được thu lại bởi một bộ thu và bơm trở lại tàu. Nghe có vẻ giống khoa học viễn tưởng, nhưng khi tải nhiệt tăng lên đến megawatt, làm mát bằng giọt chất lỏng có thể là cách duy nhất để vượt qua giới hạn khối lượng của thực tế cấp số nhân này.

Mô hình tổng chi phí sở hữu sơ bộ của chúng mình sử dụng các con số lạc quan về chi phí hiện tại, như chi phí phóng, chi phí chip và mức tiêu thụ điện năng. Một số người có thể chỉ ra rằng công nghệ trong tương lai sẽ cải thiện, cả về hiệu quả, thiết kế chuyên dụng và chi phí. Chắc chắn, công nghệ sẽ được cải thiện. Nhưng yếu tố quan trọng không chỉ là chi phí phóng; đó là sức mạnh tính toán trên mỗi đơn vị khối lượng và kinh tế điện năng. Bộ tản nhiệt và mảng pin mặt trời có thể chiếm 65 đến 70 phần trăm tổng khối lượng vệ tinh, và các tấm quang điện cấp không gian đắt hơn nhiều lần so với các loại tương đương trên mặt đất. Ngay cả khi chi phí phóng giảm, gánh nặng về khối lượng và chi phí của việc tạo ra điện năng và quản lý nhiệt vẫn sẽ là một vấn đề cơ bản.

Các tấm pin mặt trời cấp không gian hiện tại dựa vào chất nền germanium, nguồn cung cấp tập trung ở Trung Quốc. Sẽ cực kỳ khó để mở rộng khả năng cung cấp các chất nền này. Việc chuyển đổi sang các tấm pin mặt trời perovskite chịu bức xạ hoặc một giải pháp thay thế tương tự có thể thay đổi đáng kể kinh tế, nhưng khả năng đó còn cách 5 năm hoặc hơn. Công nghệ sẽ rẻ hơn, nhưng các nút thắt cổ chai về kiến trúc điện năng và nhiệt vẫn sẽ tồn tại.

Nhận thức được thực tế nhiệt của việc làm mát trong không gian buộc chúng ta phải thay đổi cách nhìn về hoạt động của vệ tinh. Chúng ta đang chuyển từ kỷ nguyên "phóng và quên" sang kỷ nguyên "hậu cần tự động". Như mô hình nhiệt của chúng mình đã chứng minh, môi trường khắc nghiệt của không gian liên tục tấn công phần cứng. Bức xạ UV làm suy giảm lớp phủ nhiệt; tia vũ trụ làm suy giảm silicon. Trong mô hình vệ tinh truyền thống, khi bộ tản nhiệt bị suy giảm hoặc bộ nhớ bị lỗi, vệ tinh sẽ trở thành rác vũ trụ. Đối với một trung tâm dữ liệu trị giá hàng triệu đô la, mô hình loại bỏ đó có thể gây thiệt hại nặng nề. Để làm cho kinh tế của điện toán quỹ đạo hoạt động, cơ sở hạ tầng phải có khả năng bảo trì và tên lửa để phóng chúng phải có khả năng tái sử dụng. Lĩnh vực quỹ đạo sẽ yêu cầu các phương tiện dịch vụ tự động có khả năng thay thế các tấm tản nhiệt bị suy giảm và nâng cấp các máy chủ bị hỏng. Theo những cách này, tương lai của các trung tâm dữ liệu quỹ đạo phụ thuộc vào những đổi mới của một nền kinh tế trong không gian mới nổi.

Có một lập luận xác đáng rằng nhu cầu về điện toán ngoài không gian ít mang tính chu kỳ cường điệu hơn mà là một yếu tố thúc đẩy cho nền kinh tế không gian mới. Không cần tìm đâu xa, hãy nhìn vào các hồ sơ pháp lý gần đây của SpaceX đề xuất một chòm sao lên tới một triệu vệ tinh trong quỹ đạo Trái Đất tầm thấp. Ở quy mô như vậy, việc định tuyến tất cả dữ liệu thô trở lại Trái Đất là không thể về mặt vật lý; bản thân mạng lưới phải trở thành trung tâm dữ liệu. Tuy nhiên, những người chiến thắng trong lĩnh vực này sẽ được xác định bởi các kiến trúc sư hệ thống khéo léo nhất trong việc thích ứng với nhiệt động lực học và các công ty có đủ tích hợp theo chiều dọc để gánh vác chi phí khổng lồ của việc vận hành các trung tâm dữ liệu trong quỹ đạo. Cuối cùng, "thuế vật lý" là phổ quát. Dù là quản lý việc loại bỏ nhiệt trong chân không của quỹ đạo Trái Đất tầm thấp hay quản lý mật độ điện năng trong một cơ sở siêu quy mô ở Bắc Virginia, hạn chế không bao giờ là silicon. Đó chính là nhiệt động lực học.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9kaWVuLXRvYW4tdnUtdHJ1LWxvaS1odWEtaGFvLW5ob2FuZy12YS1jYWktZ2lhLXZhdC1seS1kYXQtZG8uODU1MzMv
Top