Privid Privacy Preserving Video 777x437 1
Thông tin công nghệ

Công cụ bảo mật – Privid – Đảm bảo quyền riêng tư trong các cảnh giám sát

Hệ thống phân tích video bảo vệ quyền riêng tư của Privid hỗ trợ các truy vấn tổng hợp, xử lý lượng lớn dữ liệu video. Tín dụng: Jose-Luis Olivares

“Privid” có thể giúp các quan chức thu thập dữ liệu y tế công cộng an toàn hoặc cho phép các sở giao thông vận tải giám sát mật độ và lưu lượng người đi bộ mà không cần tìm hiểu thông tin cá nhân về mọi người.

Camera giám sát có vấn đề về nhận dạng, được thúc đẩy bởi sự căng thẳng cố hữu giữa tiện ích và quyền riêng tư. Khi các thiết bị nhỏ bé mạnh mẽ này mọc lên dường như ở khắp mọi nơi, việc sử dụng các công cụ học máy đã tự động phân tích nội dung video ở quy mô lớn – nhưng với việc giám sát hàng loạt ngày càng tăng, hiện không có quy tắc có hiệu lực pháp luật nào để hạn chế các hành vi xâm phạm quyền riêng tư.

Camera an ninh có thể làm được nhiều điều – chúng trở nên thông minh hơn và có năng lực vượt trội hơn so với bóng ma của những bức ảnh nhiễu hạt trong quá khứ, đôi khi là “công cụ anh hùng” trong truyền thông tội phạm. (“Nhìn thấy đốm màu xanh mờ nhỏ ở góc phải của góc đông dân cư – chúng tôi đã bắt được anh ta!”) Giờ đây, giám sát video có thể giúp các quan chức y tế đo lường tỷ lệ người đeo khẩu trang, cho phép các sở giao thông giám sát mật độ và lưu lượng xe cộ, xe đạp và người đi bộ, đồng thời giúp các doanh nghiệp hiểu rõ hơn về các hành vi mua sắm. Nhưng tại sao quyền riêng tư vẫn là một suy nghĩ yếu về sau?

Hiện trạng là trang bị thêm video có các khuôn mặt bị mờ hoặc hộp đen. Điều này không chỉ ngăn các nhà phân tích hỏi một số câu hỏi chính xác (ví dụ: Mọi người có đeo mặt nạ không?), Nó còn không phải lúc nào cũng hoạt động; hệ thống có thể bỏ sót một số khuôn mặt và không làm mờ chúng cho cả thế giới nhìn thấy. Không hài lòng với hiện trạng này, các nhà nghiên cứu từ Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) của MIT, phối hợp với các tổ chức khác, đã đưa ra một hệ thống để đảm bảo quyền riêng tư tốt hơn trong các cảnh quay video từ camera giám sát. Được gọi là “Privid”, hệ thống cho phép các nhà phân tích gửi truy vấn dữ liệu video và thêm một chút nhiễu (dữ liệu bổ sung) vào kết quả cuối cùng để đảm bảo rằng không thể xác định được một cá nhân. Hệ thống được xây dựng dựa trên một định nghĩa chính thức về quyền riêng tư – “quyền riêng tư khác biệt” – cho phép truy cập vào số liệu thống kê tổng hợp về dữ liệu riêng tư mà không tiết lộ thông tin nhận dạng cá nhân.

Thông thường, các nhà phân tích sẽ chỉ có quyền truy cập vào toàn bộ video để làm bất cứ điều gì họ muốn với nó, nhưng Privid đảm bảo rằng video không phải là một bữa tiệc tự chọn miễn phí. Các nhà phân tích trung thực có thể truy cập vào thông tin họ cần, nhưng quyền truy cập đó đủ hạn chế để các nhà phân tích độc hại không thể làm quá nhiều với nó. Để kích hoạt điều này, thay vì chạy mã trên toàn bộ video trong một lần quay, Privid chia video thành nhiều phần nhỏ và chạy mã xử lý qua từng đoạn. Thay vì nhận lại kết quả từ mỗi phần, các phân đoạn được tổng hợp lại và tiếng ồn bổ sung được thêm vào. (Ngoài ra còn có thông tin về lỗi ràng buộc mà bạn sẽ nhận được trên kết quả của mình – có thể sai số chênh lệch 2 phần trăm, do dữ liệu nhiễu thêm được thêm vào).

Ví dụ: mã có thể xuất ra số lượng người được quan sát trong mỗi đoạn video và tổng hợp có thể là “tổng”, để đếm tổng số người đeo khăn che mặt hoặc “trung bình” để ước tính mật độ đám đông.

Privid cho phép các nhà phân tích sử dụng các mạng thần kinh sâu của riêng họ, vốn phổ biến cho phân tích video ngày nay. Điều này mang lại cho các nhà phân tích sự linh hoạt để đưa ra những câu hỏi mà các nhà thiết kế của Privid không lường trước được. Trên nhiều video và truy vấn khác nhau, Privid chính xác trong vòng 79 đến 99% của một hệ thống không riêng tư.

“Hiện tại chúng ta đang ở giai đoạn mà máy ảnh thực tế có mặt khắp nơi. Nếu có camera ở mọi góc phố, mọi nơi bạn đến và nếu ai đó thực sự có thể xử lý tổng hợp tất cả các video đó, bạn có thể tưởng tượng thực thể đó đang xây dựng một dòng thời gian rất chính xác về thời gian và địa điểm mà một người đã đi “, MIT CSAIL nói Nghiên cứu sinh Frank Cangialosi, tác giả chính của bài báo về Privid. “Mọi người đã lo lắng về quyền riêng tư của vị trí với GPS – dữ liệu video tổng hợp không chỉ có thể ghi lại lịch sử vị trí của bạn mà còn cả tâm trạng, hành vi và hơn thế nữa ở mỗi vị trí.”

Privid đưa ra khái niệm mới về “quyền riêng tư dựa trên thời hạn”, tách rời định nghĩa về quyền riêng tư khỏi việc thực thi – với sự xáo trộn, nếu mục tiêu quyền riêng tư của bạn là bảo vệ tất cả mọi người, thì cơ chế thực thi cần thực hiện một số công việc để tìm ra những người cần bảo vệ , mà nó có thể làm hoàn hảo hoặc không. Với cơ chế này, bạn không cần phải chỉ định đầy đủ mọi thứ và không phải che giấu nhiều thông tin hơn mức cần thiết.

Giả sử chúng ta có một video nhìn ra đường phố. Hai nhà phân tích, Alice và Bob, đều cho rằng họ muốn đếm số lượng người qua lại mỗi giờ, vì vậy họ gửi mô-đun xử lý video và yêu cầu tổng hợp.

Nhà phân tích đầu tiên là sở quy hoạch thành phố, hy vọng sẽ sử dụng thông tin này để tìm hiểu mô hình lối đi và quy hoạch vỉa hè cho thành phố. Mô hình của họ đếm số người và xuất ra số lượng này cho mỗi đoạn video.

Các nhà phân tích khác là độc hại. Họ hy vọng sẽ xác định được mỗi khi “Charlie” đi ngang qua máy ảnh. Mô hình của họ chỉ tìm kiếm khuôn mặt của Charlie và xuất ra một số lớn nếu Charlie có mặt (tức là “tín hiệu” mà họ đang cố gắng trích xuất) hoặc bằng không. Hy vọng của họ là tổng sẽ bằng 0 nếu Charlie có mặt.

Từ quan điểm của Privid, hai truy vấn này trông giống hệt nhau. Thật khó để xác định một cách đáng tin cậy các mô hình của họ có thể đang làm gì trong nội bộ hoặc nhà phân tích hy vọng sẽ sử dụng dữ liệu để làm gì. Đây là nơi phát ra tiếng ồn. Privid thực hiện cả hai truy vấn và thêm lượng nhiễu như nhau cho mỗi truy vấn. Trong trường hợp đầu tiên, bởi vì Alice đang đếm tất cả mọi người, tiếng ồn này sẽ chỉ có tác động nhỏ đến kết quả, nhưng có thể sẽ không ảnh hưởng đến tính hữu ích.

Trong trường hợp thứ hai, vì Bob đang tìm kiếm một tín hiệu cụ thể (Charlie chỉ được nhìn thấy trong một vài đoạn ngắn), tiếng ồn đủ để ngăn họ biết liệu Charlie có ở đó hay không. Nếu họ thấy kết quả khác 0, có thể là do Charlie đã thực sự ở đó hoặc vì mô hình cho kết quả là “không”, nhưng tiếng ồn đã làm cho nó khác 0. Privid không cần biết bất cứ điều gì về thời gian hoặc vị trí Charlie xuất hiện, hệ thống chỉ cần biết giới hạn trên sơ bộ về thời gian Charlie có thể xuất hiện, điều này dễ xác định hơn là tìm ra vị trí chính xác, mà các phương pháp trước đây dựa vào .

Thách thức là xác định mức độ nhiễu cần thêm vào – Privid muốn thêm vừa đủ để ẩn tất cả mọi người, nhưng không quá nhiều đến mức vô ích đối với các nhà phân tích. Thêm nhiễu vào dữ liệu và nhấn mạnh vào các truy vấn theo thời gian có nghĩa là kết quả của bạn sẽ không chính xác như mong đợi, nhưng kết quả vẫn hữu ích đồng thời cung cấp quyền riêng tư tốt hơn.

Cangialosi đã viết bài báo với nghiên cứu sinh Neil Agarwal của Princeton, nghiên cứu sinh tiến sĩ MIT CSAIL Venkat Arun, trợ lý giáo sư tạiĐại học ChicagoJunchen Jiang, trợ lý giáo sư tại Đại học Rutgers và cựu postdoc MIT CSAIL Srinivas Narayana, phó giáo sư tại Đại học Rutgers Anand Sarwate, và trợ lý giáo sư tạiTrường Đại học Princetonvà Ravi Netravali SM ’15, Tiến sĩ ’18. Cangialosi sẽ trình bày bài báo tại Hội nghị Chuyên đề USENIX về Thiết kế và Triển khai Hệ thống Mạng vào tháng Tư ở Renton, Washington.

Tham khảo: “Privid: Các truy vấn phân tích video thực tế, bảo vệ quyền riêng tư” của Frank Cangialosi, Neil Agarwal, Venkat Arun, Junchen Jiang, Srinivas Narayana, Anand Sarwate và Ravi Netravali, 22 tháng 6 năm 2021, arXiv.
DOI: https://doi.org/10.48550/arXiv.2106.12083

Công việc này được hỗ trợ một phần bởi Học bổng Nghiên cứu Sloan và các khoản tài trợ của Quỹ Khoa học Quốc gia.

Theo Scitechdaily

What's your reaction?

Excited
0
Happy
0
In Love
0
Not Sure
0

You may also like

Leave a reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.