Ai System Takes Inspiration From Humans 777x389 1 2
Thông tin công nghệ

Các nhà nghiên cứu cho phép AI sử dụng "trí tưởng tượng" của nó – Gần gũi hơn với hiểu biết của loài người về thế giới

Hệ thống AI mới lấy cảm hứng từ con người: khi con người nhìn thấy màu sắc từ một vật thể, chúng ta có thể dễ dàng áp dụng nó cho bất kỳ vật thể nào khác bằng cách thay thế màu gốc bằng màu mới. Tín dụng: Chris Kim

Một nhóm các nhà nghiên cứu tại USC đang giúp AI tưởng tượng ra điều chưa từng thấy, một kỹ thuật cũng có thể dẫn đến AI công bằng hơn, các loại thuốc mới và tăng cường độ an toàn cho xe tự hành.

Hãy tưởng tượng một con mèo màu cam. Bây giờ, hãy tưởng tượng cùng một con mèo, nhưng có bộ lông màu đen như than. Bây giờ, hãy tưởng tượng con mèo đang sải bước dọc theo Vạn Lý Trường Thành của Trung Quốc. Khi làm điều này, một loạt các kích hoạt tế bào thần kinh nhanh chóng trong não của bạn sẽ tạo ra các biến thể của bức tranh được trình bày, dựa trên kiến thức trước đây của bạn về thế giới.

Nói cách khác, là con người, thật dễ dàng để hình dung một đối tượng có các thuộc tính khác nhau. Tuy nhiên, bất chấp những tiến bộ trong mạng thần kinh sâu phù hợp hoặc vượt qua hiệu suất của con người trong một số tác vụ nhất định, máy tính vẫn phải vật lộn với kỹ năng “tưởng tượng” của con người.

Giờ đây, một nhóm nghiên cứu của USC bao gồm Giáo sư khoa học máy tính Laurent Itti và các sinh viên Tiến sĩ Yunhao Ge, Sami Abu-El-Haija và Gan Xin, đã phát triển một AI sử dụng các khả năng giống con người để tưởng tượng một vật thể chưa từng thấy với các thuộc tính. Bài báo, có tiêu đề Tổng hợp Zero-Shot với phương pháp học tập có giám sát của nhóm , đã được xuất bản trong Hội nghị quốc tế về đại diện học tập năm 2021 vào ngày 7 tháng 5.

Ge, tác giả chính của nghiên cứu cho biết: “Chúng tôi được truyền cảm hứng từ khả năng khái quát thị giác của con người để cố gắng mô phỏng trí tưởng tượng của con người trong máy móc.

“Con người có thể phân tách kiến thức đã học của mình theo các thuộc tính — ví dụ, hình dạng, tư thế, vị trí, màu sắc — và sau đó kết hợp chúng lại để hình dung một vật thể mới. Bài báo của chúng tôi cố gắng mô phỏng quá trình này bằng cách sử dụng mạng nơ-ron ”.

Vấn đề tổng quát hóa của AI

Ví dụ: giả sử bạn muốn tạo một hệ thống AI để tạo ra hình ảnh của những chiếc xe hơi. Lý tưởng nhất là bạn sẽ cung cấp cho thuật toán một vài hình ảnh về một chiếc ô tô và nó có thể tạo ra nhiều loại ô tô — từ Porsche đến Pontiacs cho đến xe bán tải — với bất kỳ màu nào, từ nhiều góc độ.

Đây là một trong những mục tiêu được tìm kiếm từ lâu của AI: tạo ra các mô hình có thể ngoại suy. Điều này có nghĩa là, với một vài ví dụ, mô hình sẽ có thể trích xuất các quy tắc cơ bản và áp dụng chúng cho một loạt các ví dụ mới mà nó chưa từng thấy trước đây. Nhưng máy móc thường được đào tạo về các tính năng mẫu, ví dụ như pixel, mà không tính đến các thuộc tính của đối tượng.

Khoa học về trí tưởng tượng

Trong nghiên cứu mới này, các nhà nghiên cứu đã cố gắng khắc phục hạn chế này bằng cách sử dụng một khái niệm được gọi là sự xáo trộn. Ví dụ: Disentanglement có thể được sử dụng để tạo ra deepfakes bằng cách tách các chuyển động và nhận dạng khuôn mặt con người. Ge cho biết bằng cách làm này, “mọi người có thể tổng hợp các hình ảnh và video mới thay thế danh tính của người ban đầu bằng một người khác, nhưng vẫn giữ nguyên chuyển động ban đầu”.

Tương tự, cách tiếp cận mới sử dụng một nhóm các hình ảnh mẫu — thay vì một hình ảnh mẫu tại một thời điểm như các thuật toán truyền thống đã thực hiện — và khai thác sự giống nhau giữa chúng để đạt được thứ gọi là “học biểu diễn không phân biệt có thể kiểm soát”.

Sau đó, nó tổng hợp lại kiến thức này để đạt được “sự tổng hợp hình ảnh mới lạ có thể kiểm soát được” hay bạn có thể gọi là trí tưởng tượng. “Ví dụ, hãy lấy bộ phim Transformer làm ví dụ” Ge nói, “Nó có thể có hình dạng của chiếc xe Megatron, màu sắc và tư thế của chiếc xe Bumblebee màu vàng, và nền của Quảng trường Thời đại của New York. Kết quả sẽ là một chiếc xe Megatron màu Bumblebee đang lái ở Quảng trường Thời đại, ngay cả khi mẫu này không được chứng kiến trong buổi đào tạo ”.

Điều này tương tự như cách chúng ta ngoại suy: khi con người nhìn thấy một màu từ một đối tượng, chúng ta có thể dễ dàng áp dụng nó cho bất kỳ đối tượng nào khác bằng cách thay thế màu gốc bằng màu mới. Sử dụng kỹ thuật của họ, nhóm đã tạo ra một tập dữ liệu mới chứa 1,56 triệu hình ảnh có thể giúp ích cho các nghiên cứu trong tương lai về lĩnh vực này.

Tìm hiểu thế giới

Mặc dù tách rời không phải là một ý tưởng mới, nhưng các nhà nghiên cứu cho biết khung của họ có thể tương thích với hầu hết mọi loại dữ liệu hoặc kiến thức. Điều này mở rộng cơ hội cho các ứng dụng. Ví dụ: tách biệt chủng tộc và kiến thức liên quan đến giới tính để làm cho AI công bằng hơn bằng cách loại bỏ hoàn toàn các thuộc tính nhạy cảm khỏi phương trình.

Trong lĩnh vực y học, nó có thể giúp các bác sĩ và nhà sinh học khám phá ra nhiều loại thuốc hữu ích hơn bằng cách tách rời chức năng của thuốc khỏi các đặc tính khác, sau đó kết hợp chúng lại để tổng hợp thuốc mới. Ví dụ, các cỗ máy gắn kết với trí tưởng tượng cũng có thể giúp tạo ra AI an toàn hơn bằng cách cho phép các phương tiện tự hành tưởng tượng và tránh các tình huống nguy hiểm chưa từng thấy trong quá trình huấn luyện.

Itti cho biết: “Học sâu đã chứng minh hiệu suất vượt trội và hứa hẹn trong nhiều lĩnh vực, nhưng điều này quá thường xuyên xảy ra thông qua sự bắt chước nông cạn và không hiểu sâu hơn về các thuộc tính riêng biệt tạo nên mỗi đối tượng. “Cách tiếp cận tách rời mới này, lần đầu tiên, thực sự giải phóng trí tưởng tượng mới trong các hệ thống AI, đưa chúng đến gần hơn với sự hiểu biết của con người về thế giới.”

Tham khảo: “Tổng hợp Zero-shot với Học tập có Giám sát của Nhóm” của Yunhao Ge, Sami Abu-El-Haija, Gan Xin và Laurent Itti, Hội nghị Quốc tế về Đại diện Học tập ngày 7 tháng 5 năm 2021.
Liên kết

Theo Scitechdaily

What's your reaction?

Excited
0
Happy
0
In Love
0
Not Sure
0

You may also like

Leave a reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.