Mit Mini Cheetah 777x437 1
Thông tin công nghệ

Cách Robot Cheetah Mini MIT học cách chạy hoàn toàn bằng thử nghiệm và lỗi

Báo đốm nhỏ của MIT, sử dụng hệ thống học tập củng cố không có mô hình, đã phá kỷ lục chạy nhanh nhất được ghi nhận. Nguồn: Ảnh do MIT CSAIL cung cấp.

Các nhà khoa học của CSAIL đã đưa ra một lộ trình học tập cho robot bốn chân học cách chạy hoàn toàn bằng cách thử và sai trong mô phỏng.

Đã gần 23 năm kể từ khi một trong những động vật robot đầu tiên chạy lon ton đến hiện trường, bất chấp những quan niệm cổ điển về những người bạn bốn chân đáng yêu của chúng ta. Kể từ đó, một loạt các máy đi bộ, khiêu vũ và mở cửa đã chỉ huy sự hiện diện của chúng, một hỗn hợp kiểu dáng đẹp của pin, cảm biến, kim loại và động cơ. Thiếu vắng trong danh sách các hoạt động tim mạch là một trong những hoạt động được cả con người yêu thích và ghê tởm (tùy thuộc vào người bạn yêu cầu), và điều này tỏ ra khó khăn hơn một chút đối với các bot: học cách chạy.

Các nhà nghiên cứu từ Phòng thí nghiệm AI cải tiến của MIT , một phần của Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) và được chỉ đạo bởi Trợ lý Giáo sư Pulkit Agrawal của MIT, cũng như Viện Tương tác Cơ bản và AI (IAIFI) đã nghiên cứu về tốc độ nhanh những bước tiến của một chú báo gêpa nhỏ bằng robot – và hệ thống học tập củng cố không có mô hình của chúng đã phá kỷ lục về lần chạy nhanh nhất được ghi nhận. Tại đây, nghiên cứu sinh Tiến sĩ Gabriel Margolis của MIT và người đăng bài IAIFI Ge Yang thảo luận về tốc độ chạy của loài báo gêpa.

Hỏi: Chúng tôi đã từng xem video về rô bốt chạy trước đây. Tại sao chạy khó hơn đi bộ?

Đáp: Để đạt được tốc độ chạy nhanh đòi hỏi phải đẩy phần cứng đến giới hạn của nó, chẳng hạn như bằng cách vận hành gần công suất mô-men xoắn cực đại của động cơ. Trong điều kiện như vậy, động lực học của robot khó có thể mô hình hóa một cách phân tích. Robot cần phản ứng nhanh với những thay đổi của môi trường, chẳng hạn như khoảnh khắc nó gặp băng khi đang chạy trên cỏ. Nếu rô bốt đang đi, nó đang di chuyển chậm và việc có tuyết thường không phải là vấn đề. Hãy tưởng tượng nếu bạn đang đi chậm, nhưng cẩn thận: bạn có thể băng qua hầu hết mọi địa hình. Robot ngày nay phải đối mặt với một vấn đề tương tự. Vấn đề là di chuyển trên mọi địa hình như thể bạn đang đi trên băng rất kém hiệu quả, nhưng lại phổ biến ở các robot hiện nay. Con người chạy nhanh trên cỏ và chạy chậm trên băng – chúng ta thích nghi. Việc cung cấp cho rô bốt khả năng thích ứng tương tự đòi hỏi phải xác định nhanh các thay đổi địa hình và nhanh chóng thích ứng để ngăn rô bốt bị ngã. Tóm lại, vì việc xây dựng trước các mô hình phân tích (do con người thiết kế) về tất cả các địa hình có thể xảy ra là không thực tế và động lực học của robot trở nên phức tạp hơn ở vận tốc cao, nên việc chạy tốc độ cao sẽ khó khăn hơn so với đi bộ.

Báo đốm nhỏ MIT học cách chạy nhanh hơn bao giờ hết, sử dụng một đường dẫn học tập hoàn toàn là thử nghiệm và sai sót trong mô phỏng.

H: Các bộ điều khiển chạy nhanh trước đây cho MIT Cheetah 3 và báo gêpa mini, cũng như cho các rô bốt của Boston Dynamics, được “thiết kế phân tích”, dựa vào các kỹ sư của con người để phân tích vật lý của chuyển động, xây dựng các bản tóm tắt hiệu quả và thực hiện một hệ thống phân cấp chuyên biệt của bộ điều khiển để làm cho robot cân bằng và chạy. Bạn sử dụng “mô hình học theo kinh nghiệm” để chạy thay vì lập trình nó. Tại sao?

A: Việc lập trình cách thức hoạt động của robot trong mọi tình huống có thể xảy ra đơn giản là rất khó. Quá trình này rất tẻ nhạt, bởi vì nếu một robot bị lỗi trên một địa hình cụ thể, một kỹ sư con người sẽ cần xác định nguyên nhân của sự cố và điều chỉnh bộ điều khiển robot theo cách thủ công, và quá trình này có thể đòi hỏi thời gian đáng kể của con người. Học bằng cách thử và sai loại bỏ nhu cầu con người phải chỉ định chính xác cách thức hoạt động của robot trong mọi tình huống. Điều này sẽ hoạt động nếu: (1) rô bốt có thể trải nghiệm một loạt các địa hình; và (2) rô bốt có thể tự động cải thiện hành vi của mình bằng kinh nghiệm.

Nhờ các công cụ mô phỏng hiện đại, robot của chúng tôi có thể tích lũy kinh nghiệm trị giá 100 ngày trên các địa hình khác nhau chỉ trong ba giờ thời gian thực tế. Chúng tôi đã phát triển một cách tiếp cận theo đó hành vi của rô-bốt được cải thiện từ trải nghiệm mô phỏng và cách tiếp cận của chúng tôi cũng cho phép triển khai thành công các hành vi đã học đó trong thế giới thực. Trực giác đằng sau lý do tại sao các kỹ năng chạy của robot hoạt động tốt trong thế giới thực là: Trong tất cả các môi trường mà nó nhìn thấy trong mô phỏng này, một số sẽ dạy các kỹ năng robot hữu ích trong thế giới thực. Khi hoạt động trong thế giới thực, bộ điều khiển của chúng tôi xác định và thực hiện các kỹ năng liên quan trong thời gian thực.

Q: Phương pháp này có thể được mở rộng ra ngoài loài báo gêpa nhỏ không? Điều gì làm bạn phấn khích về các ứng dụng trong tương lai của nó?

A: Trọng tâm của nghiên cứu trí tuệ nhân tạo là sự đánh đổi giữa những gì con người cần để xây dựng trong (tự nhiên) và những gì máy móc có thể tự học (nuôi dưỡng). Mô hình truyền thống trong chế tạo rô bốt là con người nói với rô bốt cả nhiệm vụ phải làm và cách thực hiện. Vấn đề là một khuôn khổ như vậy không thể mở rộng, bởi vì nó sẽ tốn rất nhiều công sức kỹ thuật của con người để lập trình thủ công một robot với các kỹ năng hoạt động trong nhiều môi trường khác nhau. Một cách thiết thực hơn để chế tạo một robot với nhiều kỹ năng đa dạng là nói với robot phải làm gì và để nó tìm ra cách thực hiện. Hệ thống của chúng tôi là một ví dụ về điều này. Trong phòng thí nghiệm của mình, chúng tôi đã bắt đầu áp dụng mô hình này cho các hệ thống robot khác, bao gồm cả bàn tay có thể cầm và thao tác nhiều vật thể khác nhau.

Công việc này được hỗ trợ bởi Chương trình Nhận thức chung của Máy DARPA , Phòng thí nghiệm Robot phỏng sinh học MIT, NAVER LABS và một phần của Viện Khoa học Quốc gia về Tương tác Cơ bản về Trí tuệ Nhân tạo, Máy gia tốc AI của Không quân Hoa Kỳ-MIT và MIT-IBM Phòng thí nghiệm AI của Watson. Nghiên cứu được tiến hành bởi Phòng thí nghiệm AI khả thi.

Theo Scitechdaily

What's your reaction?

Excited
0
Happy
0
In Love
0
Not Sure
0

You may also like

Leave a reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.