Khử danh nghĩa là gì
Khử ẩn danh là một kỹ thuật khai thác dữ liệu xác định lại thông tin được mã hóa hoặc tổng quát. Khử ẩn danh, còn được gọi là nhận dạng lại dữ liệu, tham chiếu chéo thông tin ẩn danh với dữ liệu có sẵn khác để xác định một người, nhóm hoặc giao dịch.
BREAKING DOWN De-Ẩn danh
Thời đại am hiểu công nghệ đang nhanh chóng phá vỡ cách làm truyền thống trên nhiều lĩnh vực khác nhau của nền kinh tế. Trong những năm gần đây, ngành tài chính đã chứng kiến rất nhiều sản phẩm kỹ thuật số được giới thiệu vào lĩnh vực của mình bởi các công ty fintech. Những sản phẩm sáng tạo này đã thúc đẩy bao gồm tài chính, theo đó nhiều người tiêu dùng có quyền truy cập vào các sản phẩm và dịch vụ tài chính với chi phí thấp hơn so với các tổ chức tài chính truyền thống cho phép. Sự gia tăng trong việc thực hiện công nghệ đã mang lại sự gia tăng trong việc thu thập, lưu trữ và sử dụng dữ liệu. Các công cụ công nghệ như nền tảng truyền thông xã hội, nền tảng thanh toán kỹ thuật số và công nghệ điện thoại thông minh đã tiết lộ một tấn dữ liệu được sử dụng bởi các công ty khác nhau để tăng cường tương tác với người tiêu dùng. Tấn dữ liệu này được gọi là dữ liệu lớn và là nguyên nhân gây lo ngại cho các cá nhân và cơ quan quản lý kêu gọi thêm luật bảo vệ danh tính và quyền riêng tư của người dùng.
Cách khử từ hoạt động
Trong thời đại dữ liệu lớn, nơi thông tin nhạy cảm về các hoạt động trực tuyến của người dùng được chia sẻ tức thời thông qua điện toán đám mây, các công cụ ẩn danh dữ liệu đã được sử dụng để bảo vệ danh tính của người dùng. Ẩn danh che dấu thông tin nhận dạng cá nhân (PII) của người dùng giao dịch trong các lĩnh vực khác nhau như dịch vụ y tế, nền tảng truyền thông xã hội, giao dịch thương mại điện tử, v.v. PII bao gồm thông tin như ngày sinh, Số an sinh xã hội (SSN), mã zip và IP Địa chỉ. Sự cần thiết phải che dấu những lối mòn kỹ thuật số bị bỏ lại bởi các hoạt động trực tuyến đã dẫn đến việc thực hiện các chiến lược ẩn danh như mã hóa, xóa, khái quát hóa và nhiễu loạn. Mặc dù các nhà khoa học dữ liệu sử dụng các chiến lược này để cắt thông tin nhạy cảm từ dữ liệu được chia sẻ, họ vẫn bảo tồn thông tin ban đầu, từ đó mở ra cơ hội nhận dạng lại.
Khử ẩn danh đảo ngược quá trình ẩn danh bằng cách khớp các tập dữ liệu được chia sẻ nhưng có giới hạn với các tập dữ liệu có thể truy cập trực tuyến dễ dàng. Công cụ khai thác dữ liệu sau đó có thể truy xuất một số thông tin từ mỗi bộ dữ liệu có sẵn để kết hợp nhận dạng hoặc giao dịch của một người. Ví dụ: công cụ khai thác dữ liệu có thể truy xuất tập dữ liệu được chia sẻ bởi một công ty viễn thông, trang web truyền thông xã hội, nền tảng thương mại điện tử và kết quả điều tra dân số có sẵn công khai để xác định tên và hoạt động thường xuyên của người dùng.
Cách khử từ được sử dụng
Nhận dạng lại có thể thành công khi thông tin mới được phát hành hoặc khi chiến lược ẩn danh được triển khai không được thực hiện đúng cách. Với nguồn cung cấp dữ liệu khổng lồ và lượng thời gian có hạn mỗi ngày, các nhà phân tích và khai thác dữ liệu đang triển khai các phím tắt được gọi là heuristic trong việc đưa ra quyết định. Mặc dù heuristic tiết kiệm thời gian và tài nguyên quý giá trong việc kết hợp thông qua một tập dữ liệu, nó cũng có thể tạo ra những khoảng trống có thể bị lợi dụng nếu công cụ heuristic sai được thực hiện. Những lỗ hổng này có thể được xác định bởi những người khai thác dữ liệu đang tìm cách ẩn danh một bộ dữ liệu cho mục đích hợp pháp hoặc bất hợp pháp.
Thông tin nhận dạng cá nhân nhận được bất hợp pháp từ các kỹ thuật khử ẩn danh có thể được bán tại các thị trường ngầm, cũng là một hình thức của nền tảng ẩn danh. Thông tin rơi vào tay kẻ xấu có thể được sử dụng để ép buộc, tống tiền và đe dọa dẫn đến những lo ngại về quyền riêng tư và chi phí khổng lồ cho các doanh nghiệp trở thành nạn nhân.
Khử ẩn danh cũng có thể được sử dụng hợp pháp. Ví dụ: trang web Silk Road, một thị trường ngầm cho các loại thuốc bất hợp pháp, được lưu trữ bởi một mạng ẩn danh có tên Tor, sử dụng chiến lược hành tây để làm xáo trộn địa chỉ IP của người dùng. Mạng Tor cũng lưu trữ một vài thị trường bất hợp pháp khác buôn bán súng, thẻ tín dụng bị đánh cắp và thông tin nhạy cảm của công ty. Với việc sử dụng các công cụ khử ẩn danh phức tạp, FBI đã bẻ khóa thành công và đóng cửa Silk Road và các trang web tham gia vào nội dung khiêu dâm trẻ em.
Thành công trên các quy trình xác định lại đã chứng minh rằng tính ẩn danh không được đảm bảo. Ngay cả khi các công cụ ẩn danh đột phá được triển khai ngày hôm nay để che giấu dữ liệu, dữ liệu có thể được xác định lại trong một vài năm khi công nghệ mới và bộ dữ liệu mới có sẵn.
