Con người và AI có nghĩ xa nhau không?

Một kỹ thuật mới so sánh lý luận của mô hình học máy với lý luận của con người, vì vậy người dùng có thể thấy các mẫu trong hành vi của mô hình.
Trong học máy, hiểu lý do tại sao một mô hình đưa ra các quyết định nhất định thường cũng quan trọng như việc liệu những quyết định đó có đúng hay không. Ví dụ, một mô hình học máy có thể dự đoán chính xác rằng một tổn thương da là ung thư, nhưng nó có thể làm như vậy bằng cách sử dụng một đốm sáng không liên quan trên ảnh lâm sàng.
Mặc dù tồn tại các công cụ để giúp các chuyên gia hiểu được lý luận của mô hình, nhưng thường thì các phương pháp này chỉ cung cấp thông tin chi tiết về một quyết định tại một thời điểm và mỗi quyết định phải được đánh giá theo cách thủ công. Các mô hình thường được đào tạo bằng cách sử dụng hàng triệu dữ liệu đầu vào, khiến con người hầu như không thể đánh giá đủ các quyết định để xác định các mô hình.
Giờ đây, các nhà nghiên cứu tại MIT và IBM Research đã tạo ra một phương pháp cho phép người dùng tổng hợp, sắp xếp và xếp hạng các giải thích riêng lẻ này để phân tích nhanh hành vi của mô hình học máy. Kỹ thuật của họ, được gọi là Sở thích chung, kết hợp các số liệu có thể định lượng để so sánh mức độ lý luận của mô hình phù hợp với lý luận của con người.
Sở thích chia sẻ có thể giúp người dùng dễ dàng khám phá các xu hướng liên quan đến việc ra quyết định của người mẫu – ví dụ: có lẽ người mẫu thường trở nên bối rối bởi các tính năng gây mất tập trung, không liên quan, như đối tượng nền trong ảnh. Việc tổng hợp những thông tin chi tiết này có thể giúp người dùng xác định một cách nhanh chóng và định lượng liệu một mô hình có đáng tin cậy và sẵn sàng triển khai trong tình huống thực tế hay không.
Tác giả chính Angie Boggust, một nghiên cứu sinh trong Nhóm Visualization của Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL).
Boggust đã viết bài báo với cố vấn của cô, Arvind Satyanarayan, một trợ lý giáo sư về khoa học máy tính, người lãnh đạo Nhóm Visualization, cũng như Benjamin Hoover và tác giả cấp cao Hendrik Strobelt, cả hai đều thuộc IBM Research. Bài báo sẽ được trình bày tại Hội nghị về các yếu tố con người trong hệ thống máy tính.
Boggust bắt đầu thực hiện dự án này trong kỳ thực tập mùa hè tại IBM, dưới sự cố vấn của Strobelt. Sau khi trở lại MIT, Boggust và Satyanarayan đã mở rộng dự án và tiếp tục hợp tác với Strobelt và Hoover, những người đã giúp triển khai các nghiên cứu điển hình cho thấy kỹ thuật này có thể được sử dụng như thế nào trong thực tế.
Sự liên kết giữa con người và trí tuệ nhân tạo
Sở thích chia sẻ tận dụng các kỹ thuật phổ biến cho thấy cách mô hình học máy đưa ra một quyết định cụ thể, được gọi là phương pháp cấp tốc. Nếu mô hình đang phân loại hình ảnh, các phương pháp saliency làm nổi bật các vùng của hình ảnh quan trọng đối với mô hình khi nó đưa ra quyết định. Những khu vực này được hình dung dưới dạng một loại bản đồ nhiệt, được gọi là bản đồ độ mặn, thường được phủ lên trên hình ảnh gốc. Nếu mô hình phân loại hình ảnh là một con chó và đầu của con chó được đánh dấu, điều đó có nghĩa là những pixel đó quan trọng đối với mô hình khi nó quyết định hình ảnh có chứa một con chó.
Sở thích chia sẻ hoạt động bằng cách so sánh phương pháp độ mặn với dữ liệu trung thực. Trong tập dữ liệu hình ảnh, dữ liệu chân thực thường là các chú thích do con người tạo ra bao quanh các phần có liên quan của mỗi hình ảnh. Trong ví dụ trước, hộp sẽ bao quanh toàn bộ con chó trong ảnh. Khi đánh giá một mô hình phân loại hình ảnh, Shared Interest sẽ so sánh dữ liệu độ mặn do mô hình tạo ra và dữ liệu sự thật trên mặt đất do con người tạo ra cho cùng một hình ảnh để xem chúng căn chỉnh như thế nào.
Kỹ thuật này sử dụng một số thước đo để định lượng sự liên kết đó (hoặc sự lệch lạc) và sau đó sắp xếp một quyết định cụ thể thành một trong tám loại. Các danh mục chạy gam màu từ hoàn toàn phù hợp với con người (mô hình đưa ra dự đoán chính xác và khu vực được đánh dấu trong bản đồ độ mặn giống hệt với hộp do con người tạo ra) đến hoàn toàn bị phân tâm (mô hình đưa ra dự đoán không chính xác và không sử dụng bất kỳ hình ảnh nào các tính năng được tìm thấy trong hộp do con người tạo).
“Ở một đầu của quang phổ, mô hình của bạn đưa ra quyết định giống hệt lý do mà con người đã làm, và ở đầu kia của quang phổ, mô hình của bạn và con người đang đưa ra quyết định này vì những lý do hoàn toàn khác nhau. Bằng cách định lượng điều đó cho tất cả các hình ảnh trong tập dữ liệu của bạn, bạn có thể sử dụng định lượng đó để sắp xếp thông qua chúng, ”Boggust giải thích.
Kỹ thuật này hoạt động tương tự với dữ liệu dựa trên văn bản, trong đó các từ khóa được đánh dấu thay vì các vùng hình ảnh.

Phân tích nhanh
Các nhà nghiên cứu đã sử dụng ba nghiên cứu điển hình để chỉ ra rằng Sở thích được chia sẻ có thể hữu ích như thế nào đối với cả những người không chuyên và các nhà nghiên cứu học máy.
Trong nghiên cứu trường hợp đầu tiên, họ sử dụng Shared Interest để giúp bác sĩ da liễu xác định xem liệu anh ta có nên tin tưởng vào mô hình máy học được thiết kế để giúp chẩn đoán ung thư từ ảnh chụp các tổn thương trên da hay không. Shared Interest cho phép bác sĩ da liễu xem nhanh các ví dụ về các dự đoán đúng và sai của mô hình. Cuối cùng, bác sĩ da liễu quyết định rằng ông không thể tin tưởng vào mô hình vì nó đưa ra quá nhiều dự đoán dựa trên các hiện vật hình ảnh, thay vì các tổn thương thực tế.
“Giá trị ở đây là bằng cách sử dụng Sở thích được chia sẻ, chúng tôi có thể thấy những mô hình này xuất hiện trong hành vi của mô hình của chúng tôi. Trong khoảng nửa giờ, bác sĩ da liễu đã có thể đưa ra quyết định tự tin về việc có nên tin tưởng vào mô hình hay không và có nên triển khai nó hay không, ”Boggust nói.
Trong nghiên cứu trường hợp thứ hai, họ đã làm việc với một nhà nghiên cứu học máy để chỉ ra cách Shared Interest có thể đánh giá một phương pháp độ mặn cụ thể bằng cách tiết lộ những cạm bẫy chưa biết trước đây trong mô hình. Kỹ thuật của họ cho phép nhà nghiên cứu phân tích hàng nghìn quyết định đúng và sai trong một phần nhỏ thời gian theo yêu cầu của các phương pháp thủ công điển hình.
Trong nghiên cứu điển hình thứ ba, họ đã sử dụng Sở thích chia sẻ để đi sâu hơn vào một ví dụ phân loại hình ảnh cụ thể. Bằng cách điều khiển khu vực chân thực của hình ảnh, họ có thể tiến hành phân tích điều gì sẽ xảy ra để xem đặc điểm hình ảnh nào là quan trọng nhất đối với các dự đoán cụ thể.
Các nhà nghiên cứu đã bị ấn tượng bởi Shared Interest hoạt động tốt như thế nào trong các nghiên cứu điển hình này, nhưng Boggust cảnh báo rằng kỹ thuật này chỉ tốt như các phương pháp sử dụng muối mà nó dựa trên. Nếu những kỹ thuật đó có sự sai lệch hoặc không chính xác, thì Sở thích chia sẻ sẽ kế thừa những hạn chế đó.
Trong tương lai, các nhà nghiên cứu muốn áp dụng Sở thích chung cho các loại dữ liệu khác nhau, đặc biệt là dữ liệu dạng bảng được sử dụng trong hồ sơ y tế. Họ cũng muốn sử dụng Shared Interest để giúp cải thiện các kỹ thuật làm mặn hiện tại. Boggust hy vọng nghiên cứu này sẽ truyền cảm hứng cho nhiều công việc tìm cách định lượng hành vi của mô hình học máy theo những cách có ý nghĩa đối với con người.
Tham khảo: “Mối quan tâm được chia sẻ: Đo lường sự liên kết giữa Con người-AI để xác định các mô hình lặp lại trong hành vi kiểu mẫu” của Angie Boggust, Benjamin Hoover, Arvind Satyanarayan và Hendrik Strobelt, ngày 24 tháng 3 năm 2022, arXiv.
DOI: https://doi.org/10.48550/arXiv.2107.09234
Công trình này được tài trợ một phần bởi Phòng thí nghiệm MIT-IBM Watson AI, Phòng thí nghiệm Nghiên cứu Không quân Hoa Kỳ và Máy gia tốc Trí tuệ Nhân tạo của Lực lượng Không quân Hoa Kỳ.
Theo Scitechdaily
What's your reaction?



