Ai Có Dữ Liệu Của Bạn Và Tại Sao Bạn Nên Quan Tâm
What’s inside?
Khi nói đến dữ liệu của bạn, bạn có thể là một người cực kỳ lo lắng, nhưng có lẽ bạn vẫn chưa lo lắng đủ.
Mỗi lần bạn gõ một cụm từ tìm kiếm vào Google, nhấp vào nút thích trên bài đăng của một người bạn trên Facebook hoặc cuộn qua Instagram, bạn tạo ra một dấu vết dữ liệu. Các công ty Công nghệ lớn thu hoạch các chuyến đi trực tuyến của bạn, phân tích chúng và bán thông tin cho các nhà quảng cáo.
Trong nghiên cứu đầy hấp dẫn này, cựu quan chức Cơ quan An ninh Quốc gia (NSA) April Falcon Doss dẫn độc giả qua các hệ quả thực tiễn và pháp lý của cuộc cách mạng dữ liệu.
Bà đi sâu vào Silicon Valley’s data machine (máy móc dữ liệu của Thung lũng Silicon) và mô tả cách các cơ quan chính phủ đang – và không – khai thác dữ liệu cho công tác thực thi pháp luật. Mặc dù Doss cẩn thận không trở thành một nhà báo cáo cảnh báo, báo cáo toàn diện của bà nên khiến bạn cảm thấy lo lắng – một cách sâu sắc.
Take-Aways
- Khai thác big data (dữ liệu lớn), các công ty lớn thu thập kiến thức chưa từng có về từng người dùng internet.
- Người tiêu dùng (Consumers) thường không hiểu được những sự đánh đổi (trade-offs) mà họ đang thực hiện với dữ liệu cá nhân của mình.
- The Big Four tech companies (Bốn công ty công nghệ lớn) liên tục thu thập kiến thức chi tiết về bạn.
- Predictive analysis (Phân tích dự đoán) vừa có vấn đề vừa đầy triển vọng.
- Mobile technology (Công nghệ di động) cho phép những kẻ lạm dụng theo dõi nạn nhân của họ.
- Chính phủ liên bang đã mở rộng các cuộc tìm kiếm và thu giữ không cần lệnh bắt của chính quyền Tổng thống Donald Trump.
- Các quan chức công cộng, người tiêu dùng và lãnh đạo công nghệ nên xem xét lại cách các công ty công nghệ kinh doanh.
Tóm lược
Sử dụng dữ liệu lớn, các công ty lớn thu thập kiến thức chưa từng có về từng người dùng internet.
Với tư cách là người tiêu dùng, nhà đầu tư, người truyền thông và cử tri, mọi người đang tạo ra dữ liệu cá nhân trực tuyến với tốc độ ngày càng nhanh chóng. Các công ty công nghệ tổng hợp thông tin này – những nơi bạn đã đến, những gì bạn đã mua, những cụm từ tìm kiếm bạn đã gõ – thành các bộ dữ liệu có thể bán được. Khi các công ty thu thập và sở hữu dữ liệu về cách sử dụng web của bạn tổng hợp và phân tích nhiều điểm dữ liệu, họ tích lũy thông tin chi tiết về các sở thích cá nhân của bạn – và của mọi người khác nữa.
Khi được kết nối với các công cụ phân tích tinh vi (sophisticated analytical tools), dữ liệu này mang lại những dự đoán (predictions) chi tiết đáng kinh ngạc về hành vi cá nhân.
Ngành công nghiệp siêu thị cung cấp một nghiên cứu trường hợp về việc ôm ấp dữ liệu lớn. Trong nhiều thập kỷ, những người săn tìm giá rẻ đã cắt phiếu giảm giá để được giảm giá, và khách hàng đã chuộc chúng một cách vô danh. (For decades, bargain hunters clipped coupons for discounts, and shoppers redeemed them anonymously. ) Các nhà tiếp thị cửa hàng biết nói chung nếu một chương trình khuyến mãi được ưa chuộng, nhưng họ không thể theo dõi chính xác ai đã trình bày phiếu giảm giá. (Store marketers knew generally if a promotion was popular, but they couldn’t track precisely who presented coupons.) Bây giờ, người tiêu dùng nhận được những ưu đãi tương tự thông qua các chương trình thành viên (loyalty programs) của cửa hàng và, vô tình, cung cấp cho cửa hàng thông tin chi tiết một cách miễn phí, có thể theo dõi về những gì họ mua và khi nào họ mua nó.
“Nhiều ứng dụng dữ liệu tiên tiến nhất hiện nay không phải là kết quả của những thay đổi trong bản thân dữ liệu; mà chúng trở nên khả thi nhờ vào những tiến bộ trong lưu trữ và xử lý máy tính.”
Những bước tiến khổng lồ trong sức mạnh máy tính đã làm cho việc tổng hợp dữ liệu lớn trở nên khả thi.
Ví dụ, các ghi chép của bác sĩ trước đây được lưu trữ trong hồ sơ giấy. Giờ đây, các nhà cung cấp dịch vụ chăm sóc sức khỏe số hóa và phân tích thông tin đó. Sức mạnh xử lý của máy tính tăng gấp đôi mỗi 18 tháng, tương đương với một bước nhảy vọt một nghìn tỷ lần về khả năng từ năm 1955 đến 2015. Sức mạnh này cho phép các công ty công nghệ lớn phân tích khối lượng thông tin khổng lồ. Tính đến năm 2018, bốn tỷ người dùng internet trên thế giới thực hiện năm tỷ lượt tìm kiếm mỗi ngày. Người dùng Facebook đăng 300 triệu hình ảnh mỗi ngày. Một báo cáo vào cuối năm 2018 ước tính rằng 90% tổng dữ liệu hiện có đã được tạo ra và thu thập trong hai năm qua.
Người tiêu dùng thường không hiểu được những sự đánh đổi mà họ đang thực hiện với dữ liệu cá nhân của mình.
Một nghiên cứu tiết lộ của các nhà nghiên cứu về quyền riêng tư đã cung cấp cho khách hàng một lựa chọn giữa hai thẻ quà tặng. Một thẻ trị giá 10 USD và không theo dõi việc mua sắm của người dùng. Một thẻ thứ hai trị giá 12 USD, nhưng nó theo dõi chi tiêu của người mua. Nghiên cứu đã cung cấp cho những người nhận thẻ 10 USD một cơ hội để chấp nhận một thẻ với 2 USD bổ sung và quyền riêng tư ít hơn; hầu hết từ chối (most declined.). Nhưng khi các nhà nghiên cứu cung cấp cho những người nhận thẻ 12 USD tùy chọn nhận 2 USD ít hơn và nhận được quyền riêng tư nhiều hơn, hầu hết nói không (most said no), ngược lại với nhóm đầu tiên. Có vẻ như những người mua này không nghĩ rằng việc chi 2 USD để có được quyền riêng tư là đáng giá. Yếu tố quyết định chính đối với cả hai nhóm là vị trí của họ về quyền riêng tư trước khi nghiên cứu.
Ngoài một nghiên cứu có kiểm soát, các lựa chọn trở nên phức tạp và đa mặt (multifaceted) hơn. Người tiêu dùng hiếm khi biết về các tùy chọn quyền riêng tư đi kèm với các hành động của họ trên các nền tảng truyền thông xã hội, công cụ tìm kiếm và video.
“Khi đo lường giá trị của các dịch vụ dựa trên dữ liệu, quyền riêng tư luôn là một phần của phương trình, ngay cả khi nó không được diễn đạt rõ ràng.“
Một chân lý về dữ liệu: “Nếu bạn không trả tiền cho sản phẩm, thì chính bạn là sản phẩm.”
Facebook, Google và các ứng dụng, dịch vụ khác không tính phí người tiêu dùng. Nhưng các dịch vụ miễn phí lại kiếm tiền bằng cách thu thập dữ liệu giá trị về người dùng để bán cho nhà quảng cáo. Các nhà tiếp thị trả tiền vì những thông tin chi tiết này rất có giá trị. Một nghiên cứu học thuật năm 2015 khẳng định rằng thuật toán của Facebook có thể biết về người dùng của mình một cách chi tiết đến mức khó tin. Nhấp vào nút “Thích” 10 lần trên Facebook, và nền tảng này sẽ hiểu bạn hơn cả đồng nghiệp của bạn. Nhấp 300 lần, và Facebook sẽ có thông tin về bạn tốt hơn cả vợ/chồng bạn.
Bốn công ty công nghệ lớn luôn thu thập một lượng lớn thông tin chi tiết về bạn.
Amazon, Apple, Facebook và Google đã thu thập được các hồ sơ chi tiết về lựa chọn tin tức và giải trí của người tiêu dùng, các giao dịch mua hàng, tìm kiếm trực tuyến, hồ sơ tôn giáo và chính trị, và nhiều thông tin khác. Sự gia tăng nhanh chóng này đã khiến các cơ quan quản lý của Hoa Kỳ bối rối. Một mặt, sự đổi mới và thịnh vượng là một phần của câu chuyện của nước Mỹ. Mặt khác, các công ty Công nghệ lớn có nhiều thông tin về cá nhân hơn bất kỳ tổ chức nào từng có trong lịch sử nhân loại.
“Facebook – cùng với Apple, Google và Amazon – biết về bạn hơn cả mẹ bạn.”
Tất cả những hoạt động khai thác dữ liệu này vẫn là một bí ẩn đối với hầu hết người tiêu dùng. Những điểm dữ liệu nào mà Bốn Ông Lớn (Big Four) thu thập? Họ sử dụng thông tin đó như thế nào để ảnh hưởng đến người dùng? Đôi khi việc theo dõi lộ ra, ví dụ khi bạn ghé thăm một trạm xăng lần đầu tiên, sau đó thấy một quảng cáo về doanh nghiệp đó trên bảng tin Facebook của mình chỉ sau một giờ. Để bắt đầu, hãy giả định rằng Công nghệ Lớn theo dõi mọi hoạt động của bạn trên mạng. Đăng nhập vào Facebook, nhập một cụm từ tìm kiếm trên Chrome hoặc gửi một email bằng Gmail, và nhà cung cấp dịch vụ đó sẽ ghi lại hoạt động của bạn.
“Phạm vi của khoản phạt của Ủy ban Thương mại Liên bang Hoa Kỳ (FTC) năm 2019 đối với Facebook minh họa những cách mà một số nền tảng công nghệ lớn đã trở nên quá lớn đến mức gần như không thể quản lý được.“‘
Chính phủ Hoa Kỳ đã áp dụng một cách tiếp cận khá tự do với vấn đề này, để các cơ quan lập pháp tiểu bang chịu trách nhiệm về các biện pháp bảo vệ quyền riêng tư. Ủy ban Thương mại Liên bang Hoa Kỳ (FTC) đã can thiệp vào năm 2019, áp đặt một khoản phạt 5 tỷ đô la đối với Facebook. Các nhà phê bình chỉ ra rằng mức phạt này không phải là một biện pháp răn đe; nó không có tác động đáng kể đối với một công ty có doanh thu quý là 15 tỷ đô la và dự trữ tiền mặt 40 tỷ đô la.
Trong khi các cơ quan chính phủ Mỹ chủ yếu dung thứ cho các công ty công nghệ thu thập dữ liệu, các cơ quan chính phủ châu Âu lại có một lập trường cứng rắn hơn. Vào năm 2017, các cơ quan chống độc quyền của Liên minh châu Âu đã xem xét các biện pháp pháp lý chống lại các tập đoàn công nghệ lớn. Vào năm 2019, Cơ quan Chống độc quyền Liên bang Đức đã ra phán quyết rằng Facebook đã vi phạm các tiêu chuẩn bảo vệ dữ liệu của châu Âu.
Phân tích dự đoán vừa có vấn đề vừa đầy hứa hẹn.
Trong câu chuyện khoa học viễn tưởng năm 1956 “The Minority Report ” (Báo cáo của Thiểu số), tác giả Philip K. Dick đã tưởng tượng ra một thế giới mà ở đó những người gần như toàn tri có thể dự đoán các tội phạm trước khi chúng xảy ra. Một phiên bản chuyển thể của câu chuyện này đã trở thành một bộ phim có sự tham gia của Tom Cruise. Nếu Dick viết câu chuyện của mình vào năm 2020, các thuật toán hành vi sẽ là lực lượng toàn tri chỉ ra những tội phạm tương lai.
“Các chương trình học máy thường được mô tả là ‘hộp đen’, bởi vì ngay cả những nhà thiết kế của hệ thống cũng không thể giải thích chính xác tại sao máy tính lại đi đến một kết luận cụ thể.”
Những công cụ tiên tiến này đã đang đưa ra các quyết định liên quan đến sinh mạng con người. Một đường dây nóng phòng chống tự tử sử dụng thuật toán để xác định những cuộc gọi nào cần được ưu tiên. Các hội đồng ân xá trong nhà tù áp dụng thuật toán để dự đoán tù nhân nào sẽ giữ được nếp sống lương thiện và ai có khả năng tái phạm. Rủi ro ở đây là thuật toán có thể thay thế ý chí tự do trong việc xử lý khủng hoảng sức khỏe tâm thần hoặc tái hòa nhập xã hội sau khi mãn hạn tù.
Các định kiến (Biases) thường ảnh hưởng đến các thuật toán. Ví dụ, một thuật toán tuyển dụng của Amazon đã khuyến nghị áp đảo các ứng viên da trắng và nam giới. Một công cụ dự đoán tái phạm của những người phạm tội cũ cũng được chứng minh là kém chính xác hơn so với sự phán đoán của các nhân viên quản lý tha tù.
Tuy nhiên, các thuật toán cũng có thể mang lại lợi ích. Ví dụ, Crisis Text Line là một nhánh của DoSomething.org. Đến năm 2015, dịch vụ này đã có mặt trên tất cả các mã vùng của Mỹ và nhận được 15.000 tin nhắn mỗi ngày.
“Một trong những lý do khiến phương thức trò chuyện qua tin nhắn văn bản đã thu hút được sự quan tâm rất lớn là do, theo các nghiên cứu, mọi người sẵn sàng chia sẻ những thông tin cá nhân nhạy cảm qua tin nhắn nhiều hơn so với việc trò chuyện trực tiếp hoặc qua điện thoại.”
Với khối lượng phản hồi cao như vậy, the Crisis Text Line(Đường dây Khủng hoảng Nhắn tin) đã thuê một nhà khoa học dữ liệu để phân tích các mẫu trong các tin nhắn của nó. Các phát hiện cho thấy, trong số những điều khác, các cơn lo âu đạt đỉnh điểm vào lúc 11 giờ tối, và tự gây thương tích có khả năng xảy ra nhất vào lúc 4 giờ sáng. Một số từ nhất định có khả năng cao hơn để chỉ ra một cuộc khủng hoảng thực sự – ví dụ, nhắc đến ibuprofen dẫn đến nhu cầu về dịch vụ khẩn cấp nhiều hơn 16 lần so với việc sử dụng từ “tự tử”. Đường dây Khủng hoảng Nhắn tin đã thu thập dữ liệu này mà không xâm phạm quyền riêng tư của bất kỳ cá nhân nào.
Mobile technology cho phép những kẻ lạm dụng theo dõi nạn nhân của họ.
Trong thế kỷ vừa qua, một cựu vợ/chồng ám ảnh hoặc một người bạn đời độc đoán có thể tham gia vào theo dõi, nhưng phạm tội đó đòi hỏi thời gian – để theo dõi nạn nhân thực tế – hoặc tiền – để thuê thám tử tư. Bây giờ, một kẻ theo dõi có thể sử dụng “phần mềm theo dõi vợ/chồng” để theo dõi mọi di chuyển của một người.
Cài đặt phần mềm như vậy trên điện thoại của người khác là bất hợp pháp, nhưng nhiều tội phạm vẫn làm như vậy. Women’s Aid, một tổ chức phòng chống bạo lực gia đình ở Vương quốc Anh, cho biết hơn một phần tư phụ nữ trong các mối quan hệ lạm dụng đã phát hiện ra phần mềm gián điệp trên điện thoại của họ. Thực hành này phổ biến đến mức nhiều nhà tạm trú cho nạn nhân bạo lực gia đình yêu cầu người cư trú không sử dụng Facebook do tính năng theo dõi vị trí.
“Công nghệ hiện đại mở ra một thế giới mới các cơ hội cho những người bạo hành – thường là phụ nữ – để theo dõi những người là đối tượng của sự ám ảnh của họ.”
Stalkerware hợp pháp trong một số trường hợp – một phụ huynh có thể hợp pháp đặt một ứng dụng theo dõi trên điện thoại của con mình, và một nhà tuyển dụng có thể hợp pháp cài đặt nó trên thiết bị mà họ cung cấp cho nhân viên của họ. Nói chung, việc cài đặt phần mềm như vậy trên điện thoại của vợ/chồng là không hợp pháp. Những ứng dụng này rất mạnh mẽ. Chúng cung cấp dữ liệu vị trí, bản ghi cuộc gọi điện thoại, bản sao tin nhắn văn bản và ảnh, và thậm chí là một bản ghi lịch sử tìm kiếm trên internet và các phím đánh. Bất chấp những nguy hiểm rõ ràng, các tòa án Mỹ hiếm khi xử lý các vụ theo dõi bất hợp pháp.
Chính phủ liên bang đã mở rộng các cuộc tìm kiếm và thu giữ không cần lệnh theo luật pháp trong thời kỳ chính quyền của Tổng thống Donald Trump.
Trung Quốc và Nga là những quốc gia theo chủ nghĩa giám sát toàn diện; Hoa Kỳ vẫn chưa đi đến bước đó. Tuy nhiên, chính phủ liên bang đã quyết liệt tuyên bố những quyền lực mới để xâm phạm quyền riêng tư – mà không cần lệnh pháp lý – trong thời kỳ chính quyền Trump.
Tu chính án Thứ tư (The Fourth Amendment) bảo vệ công dân Mỹ khỏi bị khám xét và tịch thu mà không có lý do chính đáng. Tuy nhiên, điện toán đám mây và dữ liệu lớn đã mở rộng đáng kể khả năng của cơ quan thực thi pháp luật trong việc kiểm tra thông tin riêng tư của cá nhân. Điện thoại cố định chỉ tạo ra hạn chế hồ sơ các cuộc gọi được thực hiện và nhận; điện thoại di động cung cấp một kho dữ liệu theo dõi vị trí và các dữ liệu cá nhân khác. Một chiếc điện thoại di động liên tục gửi tín hiệu đến các tháp thu phát gần đó, khiến các hệ thống này theo dõi vị trí của người dùng gần như liên tục.
“Chính quyền Trump đã mở rộng phạm vi quyền lực hành pháp theo những cách sâu sắc gây lo ngại cho những người bảo vệ quyền riêng tư và những người ủng hộ các quyền tự do dân sự trên khắp đất nước và trên toàn thế giới.”
Trong những năm của chính quyền Trump, với sự nhấn mạnh vào an ninh biên giới, Bộ An ninh Nội địa đã tăng cường việc kiểm tra điện thoại di động và máy tính của những người nhập cảnh và xuất cảnh Hoa Kỳ mà không cần lệnh. Cơ quan này báo cáo đã kiểm tra 30.000 thiết bị trong năm đầu tiên của nhiệm kỳ Trump, tăng 60% so với năm trước.
Tu chính án thứ Tư (The Fourth Amendment) cấm các cuộc “tìm kiếm không hợp lý”, nhưng những người đi du lịch hầu như không có lựa chọn nào khác ngoài việc phải tuân thủ. Các sĩ quan tuần tra biên giới đã yêu cầu những người đi du lịch cung cấp mật khẩu của họ cho các tài khoản mạng xã hội, để các đặc vụ có thể kiểm tra các hoạt động của họ. Trong chính quyền Trump, các cơ quan chức năng có thể thực hiện những cuộc xâm nhập không có lệnh này trong phạm vi 100 dặm từ biên giới quốc gia, và trong toàn bộ các bang Michigan và Florida, cùng với phần lớn các bang Pennsylvania và Ohio.
Các quan chức công cộng, người tiêu dùng và lãnh đạo công nghệ nên xem xét lại cách các công ty công nghệ kinh doanh.
Bảo vệ cá nhân của bạn khỏi việc sử dụng trái phép dữ liệu của bạn chủ yếu là vấn đề của các cơ quan quản lý, nhà hoạch định chính sách và nhà lập pháp chính phủ.
“Chúng ta không muốn các ứng dụng sử dụng chúng ta – chúng ta muốn là những người có ý thức và tự do quyết định khi nào sử dụng chúng.”
Các nhà lập pháp và cơ quan quản lý quy định nên thực hiện các khuyến nghị chính sách này:
- Làm rõ định nghĩa về xâm phạm quyền riêng tư bất hợp pháp
- Tòa án Mỹ chưa sẵn sàng coi vi phạm quyền riêng tư là tổn thương có thể bồi thường.
- Hệ thống pháp luật Mỹ cần đưa ra biện pháp khắc phục cho những cá nhân có thông tin cá nhân bị sử dụng theo cách họ không lường trước.
- Hạn chế giám sát của chính phủ hoặc xác định những gì được chấp nhận
- Hệ thống pháp luật Mỹ cần xác định cách chính phủ có thể sử dụng thông tin thu thập được thông qua giám sát điện tử.
- Học hỏi từ quy định về môi trường
- Cơ quan Bảo vệ Môi trường (EPA) thường xuyên kiểm tra không khí, nước và đất, đồng thời đặt ra giới hạn ô nhiễm chấp nhận được.
- Quy định về bảo mật dữ liệu có thể áp dụng khái niệm này.
- Quyền riêng tư hoàn toàn không tồn tại, nhưng chính phủ nên xác định một biên độ sai số hợp lý.
- Cân bằng Tu chính án thứ Nhất với Tu chính án thứ Tư
- Các nền tảng Internet đăng nội dung phỉ báng hoặc xâm phạm sử dụng Tu chính án thứ Nhất (đảm bảo tự do báo chí) như một sự bảo vệ toàn diện.
- Khi nội dung liên quan đến “porn trả thù” hoặc thông tin sai lệch chính trị, Tu chính án thứ Tư nên bảo vệ quyền riêng tư cho những cá nhân bị tổn hại.
- Cân bằng quyền riêng tư và lợi nhuận
- Mô hình kinh doanh của ngành công nghệ đang hy sinh quyền riêng tư cá nhân để đổi lấy lợi nhuận.
- Nhà quảng cáo trên Facebook và Google nhận được thông tin cho phép họ xác định từng người tiêu dùng.
- Các nền tảng công nghệ chỉ nên được phép tiết lộ dữ liệu nhân khẩu học, không phải thông tin xác định danh tính cá nhân.
- Đào tạo người tiêu dùng và cử tri nhận biết thao túng dựa trên dữ liệu
- Dạy học sinh cách nhận biết cách doanh nghiệp sử dụng dữ liệu của họ.
- Người trưởng thành cần học về các chiến dịch thuyết phục tại nơi làm việc.
- Người cao tuổi, do trình độ kỹ thuật số thấp hơn, phải học về thông tin sai lệch thông qua các chương trình tại trung tâm người cao tuổi và viện dưỡng lão.
Tác giả: April Falcon Doss
Link bài gốc: Cyber Privacy: Who Has Your Data and Why You Should Care | getabstract.com
Dịch giả: Dieter R – KenkAI Nhiều thứ hay
(*) Bạn có thể sao chép và chia sẻ thoải mái.
(**) Follow KenkAI Nhiều thứ hay để đọc các bài dịch khác và cập nhật thông tin bổ ích hằng ngày.
Để lại một bình luận