Artificial Intelligence Worker Trust 777x437 1
Thông tin công nghệ

Khi nào thì ai đó nên tin tưởng vào dự đoán của đồng đội AI?

Các nhà nghiên cứu đã tạo ra một phương pháp giúp người lao động hợp tác với hệ thống trí tuệ nhân tạo. Tín dụng: Christine Daniloff, MIT

Các nhà nghiên cứu đã tạo ra một phương pháp giúp người lao động hợp tác với hệ thống trí tuệ nhân tạo.

Trong một bệnh viện bận rộn, một bác sĩ X quang đang sử dụng một hệ thống trí tuệ nhân tạo để giúp cô chẩn đoán các tình trạng y tế dựa trên hình ảnh X-quang của bệnh nhân. Sử dụng hệ thống AI có thể giúp cô ấy chẩn đoán nhanh hơn, nhưng làm thế nào để cô ấy biết khi nào nên tin tưởng vào những dự đoán của AI?

Cô ấy không. Thay vào đó, cô ấy có thể dựa vào kiến thức chuyên môn của mình, mức độ tin cậy do chính hệ thống cung cấp hoặc lời giải thích về cách thuật toán đưa ra dự đoán – điều này có thể thuyết phục nhưng vẫn sai – để đưa ra ước tính.

Để giúp mọi người hiểu rõ hơn khi nào nên tin tưởng một “đồng đội” AI, các nhà nghiên cứu của MIT đã tạo ra một kỹ thuật tích hợp hướng dẫn con người phát triển sự hiểu biết chính xác hơn về những tình huống mà máy đưa ra dự đoán chính xác và những tình huống mà nó đưa ra dự đoán sai.

Bằng cách cho mọi người thấy cách AI bổ sung khả năng của họ, kỹ thuật đào tạo có thể giúp con người đưa ra quyết định tốt hơn hoặc đưa ra kết luận nhanh hơn khi làm việc với các tác nhân AI.

Hussein Mozannar, một nghiên cứu sinh tại Nhóm học máy lâm sàng của Khoa học máy tính và Trí tuệ nhân tạo, cho biết: “Chúng tôi đề xuất một giai đoạn giảng dạy trong đó chúng tôi dần dần giới thiệu con người với mô hình AI này để họ có thể tự nhận ra điểm yếu và điểm mạnh của nó. Phòng thí nghiệm (CSAIL) và Viện Khoa học và Kỹ thuật Y tế. “Chúng tôi làm điều này bằng cách bắt chước cách con người sẽ tương tác với AI trong thực tế, nhưng chúng tôi can thiệp để cung cấp cho họ phản hồi nhằm giúp họ hiểu từng tương tác mà họ đang thực hiện với AI.”

Mozannar đã viết bài báo với Arvind Satyanarayan, một trợ lý giáo sư khoa học máy tính, người đứng đầu Nhóm Trực quan hóa trong CSAIL; và tác giả cao cấp David Sontag, một phó giáo sư về kỹ thuật điện và khoa học máy tính tại MIT và lãnh đạo của Nhóm Học máy Lâm sàng. Nghiên cứu sẽ được trình bày tại Hiệp hội Vì sự Tiến bộ của Trí tuệ Nhân tạo vào tháng Hai.

Mô hình trí tuệ

Công việc này tập trung vào các mô hình tinh thần mà con người xây dựng về người khác. Nếu bác sĩ X quang không chắc chắn về một trường hợp nào đó, cô ấy có thể hỏi đồng nghiệp là chuyên gia trong một lĩnh vực nào đó. Từ kinh nghiệm trong quá khứ và hiểu biết của mình về người đồng nghiệp này, cô ấy có một mô hình tinh thần về điểm mạnh và điểm yếu của anh ấy mà cô ấy sử dụng để đánh giá lời khuyên của anh ấy.

Mozannar nói, con người xây dựng các loại mô hình tinh thần giống nhau khi họ tương tác với các tác nhân AI, vì vậy điều quan trọng là các mô hình đó phải chính xác. Khoa học nhận thức cho rằng con người đưa ra quyết định cho những nhiệm vụ phức tạp bằng cách ghi nhớ những tương tác và trải nghiệm trong quá khứ. Vì vậy, các nhà nghiên cứu đã thiết kế một quy trình tích hợp cung cấp các ví dụ đại diện về việc con người và AI làm việc cùng nhau, đóng vai trò là điểm tham chiếu mà con người có thể rút ra trong tương lai. Họ bắt đầu bằng cách tạo ra một thuật toán có thể xác định các ví dụ sẽ dạy con người tốt nhất về AI.

Mozannar nói: “Trước tiên, chúng tôi tìm hiểu thành kiến và sức mạnh của một chuyên gia về con người, sử dụng những quan sát về các quyết định trong quá khứ của họ mà không được hỗ trợ bởi AI”. “Chúng tôi kết hợp kiến thức của chúng tôi về con người với những gì chúng tôi biết về AI để xem nơi nào sẽ hữu ích cho con người dựa vào AI. Sau đó, chúng tôi thu được các trường hợp mà chúng tôi biết con người nên dựa vào AI và các trường hợp tương tự mà con người không nên dựa vào AI ”.

Các nhà nghiên cứu đã thử nghiệm kỹ thuật giới thiệu của họ trên một nhiệm vụ trả lời câu hỏi dựa trên đoạn văn: Người dùng nhận được một đoạn văn và một câu hỏi có câu trả lời trong đoạn văn. Sau đó, người dùng phải trả lời câu hỏi và có thể nhấp vào nút để “cho phép AI trả lời”. Tuy nhiên, người dùng không thể thấy trước câu trả lời của AI, yêu cầu họ phải dựa vào mô hình tinh thần của AI. Quá trình giới thiệu mà họ đã phát triển bắt đầu bằng cách hiển thị những ví dụ này cho người dùng, người cố gắng đưa ra dự đoán với sự trợ giúp của hệ thống AI. Con người có thể đúng hoặc sai và AI có thể đúng hoặc sai, nhưng trong cả hai trường hợp, sau khi giải quyết ví dụ, người dùng sẽ thấy câu trả lời đúng và lời giải thích tại sao AI chọn dự đoán của mình. Để giúp người dùng khái quát hóa từ ví dụ, hai ví dụ tương phản được hiển thị để giải thích tại sao AI hiểu đúng hay sai.

Ví dụ, có lẽ câu hỏi luyện tập hỏi cây nào có nguồn gốc ở nhiều lục địa hơn, dựa trên một đoạn phức tạp trong sách giáo khoa về thực vật học. Con người có thể tự trả lời hoặc để hệ thống AI trả lời. Sau đó, cô ấy thấy hai ví dụ tiếp theo giúp cô ấy hiểu rõ hơn về khả năng của AI. Có lẽ AI đã sai ở một câu hỏi tiếp theo về trái cây nhưng lại đúng với một câu hỏi về địa chất. Trong mỗi ví dụ, các từ mà hệ thống sử dụng để đưa ra dự đoán được đánh dấu. Mozannar giải thích rằng việc nhìn thấy những từ được đánh dấu sẽ giúp con người hiểu được giới hạn của tác nhân AI.

Để giúp người dùng ghi lại những gì họ đã học, người dùng sau đó viết ra quy tắc mà cô ấy suy ra từ ví dụ giảng dạy này, chẳng hạn như “AI này không giỏi trong việc dự đoán hoa”. Sau đó, cô ấy có thể tham khảo các quy tắc này sau khi làm việc với đại lý trong thực tế. Những quy tắc này cũng tạo thành một sự chính thức hóa mô hình tinh thần của người dùng về AI.

Tác động của việc giảng dạy

Các nhà nghiên cứu đã thử nghiệm kỹ thuật giảng dạy này với ba nhóm người tham gia. Một nhóm đã trải qua toàn bộ kỹ thuật tích hợp, một nhóm khác không nhận được các ví dụ so sánh tiếp theo và nhóm cơ sở không nhận được bất kỳ sự giảng dạy nào nhưng có thể xem trước câu trả lời của AI.

“Những người tham gia nhận được giảng dạy cũng như những người tham gia không nhận được giảng dạy nhưng có thể thấy câu trả lời của AI. Vì vậy, kết luận ở đó là họ có thể mô phỏng câu trả lời của AI cũng như nếu họ đã nhìn thấy nó, ”Mozannar nói.

Các nhà nghiên cứu đã đào sâu hơn vào dữ liệu để xem các quy tắc mà cá nhân người tham gia đã viết. Họ phát hiện ra rằng gần 50% những người được đào tạo đã viết các bài học chính xác về khả năng của AI. Những người có bài học chính xác đúng 63% trong số các ví dụ, trong khi những người không có bài học chính xác đúng trên 54%. Và những người không được giảng dạy nhưng có thể nhìn thấy câu trả lời của AI đã đúng trên 57% câu hỏi.

“Khi việc giảng dạy thành công, nó có tác động đáng kể. Đó là bài học ở đây. Khi chúng tôi có thể dạy những người tham gia một cách hiệu quả, họ có thể làm tốt hơn nếu bạn thực sự cho họ câu trả lời, ”ông nói.

Nhưng kết quả cũng cho thấy vẫn còn một khoảng cách. Chỉ 50% những người được đào tạo đã xây dựng các mô hình tinh thần chính xác của AI và thậm chí những người đã làm chỉ đúng 63% thời gian. Mozannar nói, mặc dù họ đã học được những bài học chính xác, nhưng không phải lúc nào họ cũng tuân theo các quy tắc của riêng mình.

Đó là một câu hỏi khiến các nhà nghiên cứu phải vò đầu bứt tai – ngay cả khi mọi người biết AI phải đúng, tại sao họ lại không lắng nghe mô hình tinh thần của chính mình? Họ muốn khám phá câu hỏi này trong tương lai, cũng như tinh chỉnh quy trình giới thiệu để giảm lượng thời gian. Họ cũng quan tâm đến việc thực hiện các nghiên cứu người dùng với các mô hình AI phức tạp hơn, đặc biệt là trong các cài đặt chăm sóc sức khỏe.

Tham khảo: “Dạy con người khi nào nên trì hoãn với máy phân loại thông qua các nhà phân loại” của Hussein Mozannar, Arvind Satyanarayan và David Sontag, ngày 13 tháng 12 năm 2021, Khoa học máy tính> Học máy .
arXiv: 2111.11297

Nghiên cứu này một phần được hỗ trợ bởi Quỹ Khoa học Quốc gia

Theo Scitechdaily

What's your reaction?

Excited
0
Happy
0
In Love
0
Not Sure
0

You may also like

Leave a reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.