Vụ bê bối Cambridge Analytica: Dữ liệu của người dùng Facebook được khai thác ra sao

Bài đặc sắc, Thế giới

Phạm Vũ Lửa Hạ

Lâu nay đã râm ran nhiều đồn đoán các mạng xã hội bị thao túng để ảnh hưởng kết quả bầu cử ở Mỹ năm 2016. Hôm 17/3, báo The Observer, Anh, và báo The New York Times, Mỹ, đưa ra tiết lộ động trời về việc một hãng phân tích thông tin tiếp thị khai thác trái phép dữ liệu của hàng chục triệu người dùng Facebook.

Hôm 18/3, Facebook thông báo rằng tiến sĩ Aleksandr Kogan, giảng viên môn tâm lý ở Đại học Cambridge (Anh) và phó giáo sư Đại học St Petersburg (Nga), đã nói dối với Facebook và vi phạm chính sách sử dụng nền tảng Facebook khi chuyển dữ liệu từ một ứng dụng đăng nhập bằng Facebook cho SCL/Cambridge Analytica. Cambridge Analytica là hãng do Steve Bannon, cựu cố vấn của Donald Trump, đồng sáng lập, và chuyên phân tích dữ liệu cho nhiều khách hàng chính trị, nhà nước, và quân đội trên toàn cầu.

Mối liên hệ của những nhân vật chính trong vụ Cambridge Analytica (Minh họa của The Guardian. Phần tiếng Việt của PVLH & Canada Info.)

Dữ liệu lớn và tâm lý học

Facebook đã ngừng cho phép Cambridge Analytica dùng nền tảng của mình sau khi một cựu nhân viên Cambridge Analytica tố cáo rằng hãng này đã dùng sai mục đích dữ liệu Facebook để xây dựng các mô hình “đặc điểm tâm lý” và giúp Trump đắc cử tổng thống.

Trong nghiên cứu tâm lý, một trong những mô hình phổ biến để đánh giá hành vi con người là mô hình 5 yếu tố tính cách OCEAN: openness (tính cởi mở / sẵn sàng trải nghiệm), conscientiousness (tính chu đáo / tỉ mỉ), extraversion (tính hướng ngoại), agreeableness (tính dễ chịu / dễ hài lòng) và neuroticism (tính cả lo, dễ bất ổn tâm lý). Căn cứ vào đó, giới tiếp thị có thể chọn kiểu quảng cáo tới đối tượng cụ thể bằng thông điệp phù hợp tính cách của phân khúc thị trường đó.

Một ví dụ là nghiên cứu năm 2012 của Jacob Hirsh, một nhà tâm lý học chuyên về hành vi tổ chức ở Đại học Toronto, và các đồng nghiệp. Trong khảo sát đó, 324 người trả lời được cho xem các mẩu quảng cáo một điện thoại thông minh tưởng tượng. Ngôn từ dùng trong các quảng cáo đó được chọn dựa trên điểm đánh giá tính cách OCEAN của người trả lời. Ai có điểm cao về openness được xem quảng cáo ca ngợi điện thoại là công cụ có nhiều ứng dụng và trải nghiệm mới. Ai có điểm cao về neuroticism được xem quảng cáo nhấn mạnh tính năng bảo mật trên hết. Kết quả cho thấy việc chọn thông điệp khớp với tính cách có hiệu quả tăng tác động của quảng cáo.

Nghiên cứu này về sau được trích dẫn trong công trình của các nhà nghiên cứu ở Đại học Cambridge; họ dùng các bài đánh giá tính cách của hàng chục ngàn tình nguyện viên, được thực hiện qua Facebook, để chứng minh rằng các đặc điểm tính cách cũng tương ứng với những phản ứng “thích” (like) trên Facebook của người sử dụng. Nhóm nghiên cứu đó sau đó xây dựng một mô hình điện toán có thể đảo ngược quy trình đó: dùng các phản ứng “thích” để tiên đoán tính cách. Năm 2015, họ chứng minh rằng mô hình đó chính xác hơn con người trong việc đánh giá tính cách và tiên đoán quan điểm chính trị.

Số lượng người sử dụng Facebook khổng lồ cộng với kỹ thuật phân tích dữ liệu lớn (big data) ngày càng mạnh đã mang lại cơ hội chưa từng có để áp dụng mô hình này ở quy mô lớn.

Christopher Wylie, cựu nhân viên của SCL, công ty mẹ của Cambridge Analytica, tố cáo rằng Aleksandr Kogan đã cung cấp dữ liệu về hơn 50 triệu tài khoản Facebook cho Cambridge Analytica. Wylie là người viết nên thuật toán giúp những người ủng hộ Trump dùng Facebook để khai thác dữ liệu của hàng triệu người.

Tuyên truyền có mục tiêu

Hợp tác với hãng nghiên cứu Global Science Research (GSR) của Aleksandr Kogan, họ viết ứng dụng “thisisyourdigitallife” (đây là cuộc sống số của bạn). Tuy người dùng được thông báo đây là một khảo sát đánh giá tính cách để giúp nghiên cứu tâm lý học, ứng dụng này thực ra được dùng để phỏng đoán tính cách và thiên hướng chính trị nhằm tuyên truyền chính trị nhắm tới từng cá nhân.

“Báu vật” của ứng dụng này không phải là những câu trả lời của người tham gia, mà là quyền tự do tiếp cận tài khoản Facebook mà người tham gia cho phép Cambridge Analytica. Theo tố cáo của Wylie, hàng trăm ngàn người dùng Facebook đã làm đánh giá tính cách với ứng dụng này, và do vậy họ đã đồng ý để dữ liệu của họ được thu thập vì mục đích nghiên cứu. Nhưng mục đích thực tế thì hoàn toàn khác.

Cambridge Analytica đã lợi dụng một lỗ hổng cho phép truy cập phản ứng “thích” và các thông tin khác không chỉ của 270.000 người tham gia một khảo sát, mà cả của những người trong danh sách bạn bè Facebook của những người tham gia đó. (Sau giữa năm 2015, Facebook mới cấm chuyện đó.) Rốt cuộc, họ thu thập được dữ liệu liên quan tới tính cách từ khoảng 50 triệu người, nhiều hơn 1/3 số người bỏ phiếu trong cuộc bầu cử tổng thống Mỹ năm 2016. Mỗi người là một đối tượng khả dĩ để nhận được thông điệp liên quan tới bầu cử được “may đo” phù hợp với cá nhân người đó.

Alexander Nix, CEO (đã bị đình chỉ) của Cambridge Analytica, từng nói rằng khảo sát này thu thập được gần 5.000 điểm dữ liệu về một người để giúp tạo nên thông điệp phù hợp cho người đó. Ví dụ, một cử tri sùng đạo có thể được nhắm tới với 30% thông điệp có màu sắc tôn giáo, 20% thông điệp về quyền sở hữu súng, và 30% các quảng cáo về kinh tế, trong khi người hàng xóm là thành viên Hiệp hội Súng Quốc gia (NRA) chủ yếu nhận được các thông điệp về quyền sở hữu súng trên Facebook.

Mạng xã hội là một nhân tố tác động quan trọng trong cuộc bầu cử năm 2016 ở Mỹ. Theo trưởng ban phân tích dữ liệu David Wilkinson, Cambridge Analytica đã tư vấn cho chiến dịch tranh cử của Trump dành nhiều thời gian và nguồn lực cho các cử tri nông thôn, nhất là ở các bang Florida, Pennsylvania, và Michigan. Dù Cambridge Analytica khoe khoang là đã góp phần giúp Trump bước vào Nhà Trắng, giới chuyên gia vẫn chưa nhất trí về hiệu quả thực sự từ mô hình của hãng này.

Từ đầu năm 2015, Facebook đã biết một số dữ liệu người sử dụng đã bị sử dụng sai mục đích. Tháng 8/2016, Facebook yêu cầu Kogan và Cambridge Analytica xác nhận rằng họ đã xóa dữ liệu đó. Việc này diễn ra mấy ngày trước khi Trump thuê Steve Bannon, cựu phó tổng giám đốc Cambridge Analytica, điều hành chiến dịch tranh cử tổng thống của ông. Mãi tới nay, sau khi báo chí tiết lộ, Facebook mới công khai thừa nhận rằng dữ liệu người sử dụng đã bị khai thác.

Cambridge Analytica đã phủ nhận nhiều cáo buộc. Hãng này nay khẳng định rằng khi biết dữ liệu đã không được thu thập đúng với quy định của Facebook, hãng đã xóa toàn bộ dữ liệu nhận được. Ngoài ra, Cambridge Analytica nay khẳng định “không có dữ liệu nào từ GSR được Cambridge Analytica dùng trong những dịch vụ mà hãng cung cấp cho chiến dịch tranh cử tổng thống năm 2016 của Donald Trump.”

Tờ The New York Times gọi vụ này là “một trong những vụ rò rỉ dữ liệu lớn nhất trong lịch sử của mạng xã hội này.” Thêm vào đó, mối liên hệ giữa Aleksandr Kogan với chính phủ Nga, và với các nhân vật cánh hữu gạo cội như tỷ phú Robert Mercer và Steve Bannon (xem hình) càng khiến Facebook khó xử giữa lúc cuộc điều tra về chuyện Nga giật dây năm 2016 vẫn đang rối bời.

Vụ bê bối Cambridge Analytica đang và sẽ tiếp tục có hệ lụy nghiêm trọng tới Facebook. Chỉ trong hai ngày sau khi vụ này vỡ lở, giá trị thị trường của Facebook giảm 60 tỷ USD, nhiều hơn mức vốn hóa của hãng xe điện Tesla.

One thought on “Vụ bê bối Cambridge Analytica: Dữ liệu của người dùng Facebook được khai thác ra sao

Leave a Reply