Kỹ thuật học máy mới lạ để xác định sự tương đồng về cấu trúc và xu hướng trong vật liệu

Một mạng lưới thần kinh mới để hiểu tính đối xứng, nghiên cứu tốc độ vật liệu.
Sử dụng một tập dữ liệu lớn, phi cấu trúc thu thập được từ 25.000 hình ảnh, các nhà khoa học lần đầu tiên chứng minh một kỹ thuật học máy mới để xác định các điểm tương đồng về cấu trúc và xu hướng trong vật liệu.
Theo Joshua Agar, giảng viên Khoa Kỹ thuật và Khoa học Vật liệu của Đại học Lehigh, tìm hiểu mối quan hệ cấu trúc-thuộc tính là mục tiêu chính của nghiên cứu vật liệu. Và hiện tại vẫn chưa có thước đo nào để hiểu cấu trúc của vật liệu vì tính chất phức tạp và đa chiều của cấu trúc.
Agar cho biết, mạng nơ-ron nhân tạo, một loại máy học, có thể được đào tạo để xác định các điểm tương đồng ― và thậm chí tương quan với các thông số như cấu trúc và đặc tính ― nhưng có hai thách thức lớn. Một là phần lớn lượng dữ liệu khổng lồ được tạo ra từ các thí nghiệm vật liệu không bao giờ được phân tích. Điều này phần lớn là do những hình ảnh như vậy, được tạo ra bởi các nhà khoa học trong các phòng thí nghiệm trên toàn thế giới, hiếm khi được lưu trữ theo cách có thể sử dụng được và thường không được chia sẻ với các nhóm nghiên cứu khác. Thách thức thứ hai là mạng nơ-ron không hiệu quả lắm trong việc học tính đối xứng và tính tuần hoàn (cấu trúc tuần hoàn của vật liệu như thế nào), hai đặc điểm cực kỳ quan trọng đối với các nhà nghiên cứu vật liệu.

Giờ đây, một nhóm do Đại học Lehigh dẫn đầu đã phát triển một phương pháp học máy mới có thể tạo ra các phép chiếu tương tự thông qua máy học, cho phép các nhà nghiên cứu lần đầu tiên tìm kiếm cơ sở dữ liệu hình ảnh phi cấu trúc và xác định xu hướng. Agar và các cộng sự của ông đã phát triển và đào tạo một mô hình mạng nơ-ron bao gồm các đặc điểm nhận biết đối xứng và sau đó áp dụng phương pháp của họ cho một bộ 25.133 hình ảnh hiển vi lực piezoresponse được thu thập trên các hệ thống vật liệu đa dạng trong vòng 5 năm tại Đại học California, Berkeley . Kết quả: họ có thể nhóm các lớp vật liệu tương tự lại với nhau và quan sát các xu hướng, tạo thành cơ sở để bắt đầu hiểu các mối quan hệ cấu trúc-thuộc tính.
“Một trong những điểm mới trong công việc của chúng tôi là chúng tôi đã xây dựng một mạng lưới thần kinh đặc biệt để hiểu tính đối xứng và chúng tôi sử dụng nó như một công cụ trích xuất tính năng để giúp hiểu hình ảnh tốt hơn nhiều,” Agar, tác giả chính của bài báo cho biết. đã mô tả: “Khám phá sự giống nhau của hình ảnh đệ quy đối xứng-nhận thức cho kính hiển vi vật liệu”, được xuất bản ngày hôm nay trên tạp chí Nature Computational Materials Science . Ngoài Agar, các tác giả bao gồm, từ Đại học Lehigh: Tri NM Nguyen, Yichen Guo, Shuyu Qin và Kylie S. Frew và, từ Đại học Stanford: Ruijuan Xu. Nguyễn, tác giả chính, đã từng tốt nghiệp Đại học Lehigh và hiện đang theo học Tiến sĩ. tại Stanford.
Nhóm đã có thể đưa ra các dự báo bằng cách sử dụng Phép chiếu và Phép chiếu xấp xỉ đa dạng thống nhất (UMAP), một kỹ thuật giảm kích thước phi tuyến tính. Agar nói, cách tiếp cận này cho phép các nhà nghiên cứu tìm hiểu “… một cách mờ nhạt, cấu trúc liên kết và cấu trúc cấp cao hơn của dữ liệu và nén nó xuống thành 2D”.
“Nếu bạn đào tạo một mạng nơ-ron, kết quả là một vectơ hoặc một tập hợp số là một mô tả nhỏ gọn của các tính năng. Những tính năng đó giúp phân loại mọi thứ để học được một số điểm tương đồng, ”Agar nói. “Tuy nhiên, những gì được tạo ra vẫn còn khá lớn trong không gian, vì bạn có thể có 512 hoặc nhiều tính năng khác nhau. Vì vậy, sau đó bạn muốn nén nó vào một không gian mà con người có thể hiểu được, chẳng hạn như 2D, hoặc 3D ― hoặc, có thể là 4D. “
Bằng cách này, Agar và nhóm của ông đã có thể lấy hơn 25.000 hình ảnh và nhóm các loại vật liệu rất giống nhau lại với nhau.
Agar nói: “Các loại cấu trúc tương tự trong vật liệu gần nhau về mặt ngữ nghĩa và cũng có thể quan sát thấy một số xu hướng nhất định đặc biệt nếu bạn áp dụng một số bộ lọc siêu dữ liệu,” Agar nói. “Nếu bạn bắt đầu lọc xem ai đã lắng đọng, ai tạo ra vật liệu, họ đang cố gắng làm gì, hệ thống vật liệu là gì… bạn thực sự có thể bắt đầu tinh chỉnh và ngày càng có nhiều điểm tương đồng hơn. Sự tương đồng đó sau đó có thể được liên kết với các tham số khác như thuộc tính ”.
Công trình này chứng minh cách thức cải tiến việc lưu trữ và quản lý dữ liệu có thể thúc đẩy nhanh chóng các khám phá vật liệu. Theo Agar, giá trị cụ thể là hình ảnh và dữ liệu được tạo ra bởi các thí nghiệm thất bại.
Agar nói: “Không ai công bố kết quả thất bại và đó là một mất mát lớn vì sau đó vài năm có người lặp lại cùng một dòng thí nghiệm,” Agar nói. “Vì vậy, bạn lãng phí nguồn lực thực sự tốt cho một thử nghiệm có khả năng không hoạt động.”
Agar cho biết, thay vì mất tất cả thông tin đó, dữ liệu đã được thu thập có thể được sử dụng để tạo ra các xu hướng mới chưa từng thấy trước đây và tăng tốc độ khám phá theo cấp số nhân.
Nghiên cứu này là “ca sử dụng” đầu tiên của một doanh nghiệp lưu trữ dữ liệu mới sáng tạo được đặt tại Phòng thí nghiệm Quốc gia Oak Ridge có tên là DataFed . DataFed, theo trang web của mình là “… một hệ thống lưu trữ, cộng tác và lưu trữ dữ liệu lớn được liên kết và toàn bộ vòng đời cho khoa học tính toán và / hoặc phân tích dữ liệu trong điện toán hiệu suất cao phân tán (HPC) và / hoặc điện toán đám mây môi trường. ”
Agar nói: “Nhóm của tôi tại Lehigh đã tham gia thiết kế và phát triển DataFed để làm cho nó phù hợp với các trường hợp sử dụng khoa học. “Lehigh là triển khai trực tiếp đầu tiên của hệ thống có thể mở rộng hoàn toàn này. Đó là một cơ sở dữ liệu liên hợp để bất kỳ ai cũng có thể bật máy chủ của riêng mình và được gắn với cơ sở trung tâm ”.
Agar là chuyên gia học máy trong nhóm Sáng kiến Giao diện Nano-Con người của Đại học Lehigh. Sáng kiến liên ngành, tích hợp khoa học xã hội và kỹ thuật, tìm cách biến đổi cách con người tương tác với các công cụ khám phá khoa học để tăng tốc các đổi mới.
Agar nói: “Một trong những mục tiêu chính của Sáng kiến giao diện người / Nano của Lehigh là đưa thông tin liên quan vào tầm tay của các nhà thực nghiệm để cung cấp thông tin hữu ích cho phép ra quyết định sáng suốt hơn và tăng tốc khám phá khoa học”. “Con người có khả năng ghi nhớ và hồi ức rất hạn chế. DataFed là một Memex hiện đại; nó cung cấp một bộ nhớ thông tin khoa học có thể dễ dàng tìm thấy và nhớ lại. ”
DataFed cung cấp một công cụ đặc biệt mạnh mẽ và vô giá cho các nhà nghiên cứu tham gia vào khoa học nhóm liên ngành, cho phép các nhà nghiên cứu đang cộng tác trong các dự án nhóm ở các vị trí khác nhau / từ xa truy cập dữ liệu thô của nhau. Đây là một trong những thành phần quan trọng của Sáng kiến Nano / Giao diện Con người (NHI) của Tổng thống Lehigh của chúng tôi nhằm tăng tốc khám phá khoa học, ”Martin P. Harmer, Giáo sư Quỹ Alcoa tại Khoa Kỹ thuật và Khoa học Vật liệu của Lehigh và Giám đốc Giao diện Nano / Con người cho biết Sáng kiến.
Tham khảo: “Khám phá độ tương tự hình ảnh đệ quy nhận biết đối xứng cho kính hiển vi vật liệu” 8 tháng 10 năm 2021, npj Computational Materials .
DOI: 10.1038 / s41524-021-00637-y
Công trình được mô tả đã được hỗ trợ bởi Sáng kiến Tổng thống về Nano / Giao diện Con người của Đại học Lehigh và một khoản tài trợ của Quỹ Khoa học Quốc gia trong khuôn khổ TRIPODS + X.
Theo Scitechdaily
What's your reaction?



