Trung tâm Plasma Thụy Sĩ và DeepMind Sử dụng AI để điều khiển Plasmas cho nhiệt hạch hạt nhân

Các nhà khoa học tại Trung tâm Plasma Thụy Sĩ của EPFL và DeepMind đã cùng nhau phát triển một phương pháp mới để kiểm soát cấu hình plasma để sử dụng trong nghiên cứu phản ứng tổng hợp hạt nhân.
Trung tâm Plasma Thụy Sĩ (SPC) của EPFL có nhiều thập kỷ kinh nghiệm trong lĩnh vực vật lý plasma và các phương pháp điều khiển plasma. DeepMind là một công ty khám phá khoa học được Google mua lại vào năm 2014 với cam kết ‘giải quyết trí thông minh để thúc đẩy khoa học và nhân loại. Cùng nhau, họ đã phát triển một phương pháp điều khiển từ trường mới cho plasmas dựa trên việc học tăng cường sâu và lần đầu tiên áp dụng nó vào plasma thế giới thực tại cơ sở nghiên cứu tokamak của SPC, TCV. Nghiên cứu của họ vừa được công bố trên tạp chí Nature.
Tokama là thiết bị hình bánh rán để tiến hành nghiên cứu về phản ứng tổng hợp hạt nhân và SPC là một trong số ít các trung tâm nghiên cứu trên thế giới có một trung tâm này đang hoạt động. Những thiết bị này sử dụng một từ trường mạnh để giam giữ plasma ở nhiệt độ cực cao – hàng trăm triệu độ C , thậm chí còn nóng hơn lõi của mặt trời – để có thể xảy ra phản ứng tổng hợp hạt nhân giữa các nguyên tử hydro. Năng lượng giải phóng từ nhiệt hạch đang được nghiên cứu để sử dụng trong việc tạo ra điện. Điều làm cho tokamak của SPC trở nên độc đáo là nó cho phép tạo ra nhiều cấu hình plasma khác nhau, do đó có tên: tokamak cấu hình thay đổi (TCV). Điều đó có nghĩa là các nhà khoa học có thể sử dụng nó để nghiên cứu các cách tiếp cận mới để giam giữ và kiểm soát các plasmas. Cấu hình của plasma liên quan đến hình dạng và vị trí của nó trong thiết bị.

Kiểm soát một chất nóng như Mặt trời
Tokama hình thành và duy trì các plasmas thông qua một loạt các cuộn dây từ tính mà các cài đặt, đặc biệt là điện áp, phải được kiểm soát cẩn thận. Nếu không, plasma có thể va chạm với thành mạch và xấu đi. Để ngăn điều này xảy ra, các nhà nghiên cứu tại SPC trước tiên kiểm tra cấu hình hệ thống điều khiển của họ trên một trình mô phỏng trước khi sử dụng chúng trong TCV tokamak. “Trình mô phỏng của chúng tôi dựa trên hơn 20 năm nghiên cứu và được cập nhật liên tục,” Federico Felici, một nhà khoa học SPC và đồng tác giả của nghiên cứu cho biết. “Nhưng ngay cả như vậy, vẫn cần phải tính toán dài dòng để xác định đúng giá trị cho mỗi biến trong hệ thống điều khiển. Đó là nơi bắt đầu dự án nghiên cứu chung của chúng tôi với DeepMind. ”

Các chuyên gia của DeepMind đã phát triển một thuật toán AI có thể tạo và duy trì các cấu hình plasma cụ thể và đào tạo nó trên trình mô phỏng của SPC. Điều này trước tiên liên quan đến việc thuật toán thử nhiều chiến lược điều khiển khác nhau trong mô phỏng và thu thập kinh nghiệm. Dựa trên kinh nghiệm thu thập được, thuật toán đã tạo ra một chiến lược điều khiển để tạo ra cấu hình plasma được yêu cầu. Điều này trước tiên liên quan đến việc thuật toán chạy qua một số cài đặt khác nhau và phân tích các cấu hình plasma tạo ra từ mỗi cài đặt đó. Sau đó, thuật toán được yêu cầu hoạt động theo cách khác – tạo ra một cấu hình plasma cụ thể bằng cách xác định các cài đặt phù hợp. Sau khi được đào tạo, hệ thống dựa trên AI đã có thể tạo và duy trì một loạt các hình dạng plasma và cấu hình tiên tiến, bao gồm cả một hệ thống nơi hai plasmas riêng biệt được duy trì đồng thời trong tàu. Cuối cùng, nhóm nghiên cứu đã thử nghiệm hệ thống mới của họ trực tiếp trên tokamak để xem nó sẽ hoạt động như thế nào trong các điều kiện thực tế.

Sự hợp tác của SPC với DeepMind bắt đầu từ năm 2018 khi Felici gặp gỡ các nhà khoa học DeepMind lần đầu tiên tại một cuộc thi hackathon tại trụ sở chính ở London của công ty. Tại đây, ông giải thích vấn đề điều khiển từ trường tokamak của nhóm nghiên cứu của mình. Felici nói: “DeepMind ngay lập tức quan tâm đến triển vọng thử nghiệm công nghệ AI của họ trong một lĩnh vực như phản ứng tổng hợp hạt nhân và đặc biệt là trên một hệ thống trong thế giới thực như tokamak. Martin Riedmiller, trưởng nhóm điều khiển tại DeepMind và đồng tác giả của nghiên cứu, cho biết thêm rằng “nhiệm vụ của nhóm chúng tôi là nghiên cứu một thế hệ hệ thống AI mới – bộ điều khiển vòng kín – có thể học trong môi trường động phức tạp hoàn toàn từ đầu. Điều khiển plasma nhiệt hạch trong thế giới thực mang lại những cơ hội tuyệt vời, mặc dù cực kỳ thách thức và phức tạp. ”
Sự hợp tác đôi bên cùng có lợi
Sau khi nói chuyện với Felici, DeepMind đã đề nghị làm việc với SPC để phát triển một hệ thống điều khiển dựa trên AI cho tokamak của mình. Ambrogio Fasoli, giám đốc SPC và đồng tác giả của nghiên cứu cho biết: “Chúng tôi đã đồng ý với ý tưởng này ngay lập tức vì chúng tôi thấy tiềm năng đổi mới rất lớn. “Tất cả các nhà khoa học DeepMind mà chúng tôi đã làm việc cùng rất nhiệt tình và biết nhiều về việc triển khai AI trong các hệ thống điều khiển.” Về phần mình, Felici rất ấn tượng với những điều tuyệt vời mà DeepMind có thể làm trong một thời gian ngắn khi tập trung nỗ lực vào một dự án nhất định.
Sự hợp tác với SPC thúc đẩy chúng tôi cải thiện các thuật toán học tập củng cố của mình.
– Brendan Tracey, kỹ sư nghiên cứu cấp cao, DeepMind
DeepMind cũng thu được rất nhiều điều từ dự án nghiên cứu chung, minh họa lợi ích cho cả hai bên khi áp dụng phương pháp tiếp cận đa ngành. Brendan Tracey, kỹ sư nghiên cứu cấp cao tại DeepMind và đồng tác giả của nghiên cứu, cho biết: “Sự hợp tác với SPC thúc đẩy chúng tôi cải thiện các thuật toán học tăng cường của mình và kết quả là có thể đẩy nhanh nghiên cứu về việc hợp nhất các plasmas.”
Dự án này sẽ mở đường cho EPFL tìm kiếm các cơ hội R&D chung khác với các tổ chức bên ngoài. Fasoli nói: “Chúng tôi luôn cởi mở với những hợp tác đôi bên cùng có lợi, nơi chúng tôi có thể chia sẻ ý tưởng và khám phá những quan điểm mới, từ đó đẩy nhanh tốc độ phát triển công nghệ,” Fasoli nói.
Tham khảo: “Điều khiển từ tính các plasmas tokamak thông qua học tập tăng cường sâu” của Jonas Degrave, Federico Felici, Jonas Buchli, Michael Neunert, Brendan Tracey, Francesco Carpanese, Timo Ewalds, Roland Hafner, Abbas Abdolmaleki, Diego de las Casas, Craig Donner, Leslie Fritz, Cristian Galperti, Andrea Huber, James Keeling, Maria Tsimpoukelli, Jackie Kay, Antoine Merle, Jean-Marc Moret, Seb Noury, Federico Pesamosca, David Pfau, Olivier Sauter, Cristian Sommariva, Stefano Coda, Basil Duval, Ambrogio Fasoli, Pushmeet Kohli, Koray Kavukcuoglu, Demis Hassabis và Martin Riedmiller, ngày 16 tháng 2 năm 2022, Nature .
DOI: 10.1038 / s41586-021-04301-9
Theo Scitechdaily
What's your reaction?



