0
Vòng lặp thao túng
Trích đoạn từ cuốn sách "Cỗ máy thao túng" của Sinan Aral
Bằng những ví dụ như trường hợp về cuộc bầu cử tổng thống Hoa Kỳ năm 2016 hay đại dịch COVID-19, Sinan Aral, giáo sư quản lý tại Viện Công nghệ Massachusetts (MIT), đã chỉ ra rằng các nền tảng truyền thông xã hội như Facebook, Twitter và Instagram đã trở thành một “cỗ máy thao túng” khuếch đại, truyền bá thông tin sai lệch, thuyết âm mưu và nội dung độc hại, được sử dụng để thao túng dư luận. Trong cuốn sách, Aral cũng thảo luận về tác động kinh tế của mạng xã hội, lập luận rằng nó đã dẫn đến sự gia tăng của “những người có ảnh hưởng kỹ thuật số” và một kỷ nguyên tiếp thị mới ưu tiên nội dung thu hút sự chú ý hơn chất lượng hoặc độ chính xác. Ông cũng khám phá những cách mà mạng xã hội đã ảnh hưởng đến sức khỏe thể chất và tinh thần của chúng ta, trích dẫn các nghiên cứu về mối liên hệ giữa việc sử dụng mạng xã hội với tỷ lệ trầm cảm, lo lắng và nghiện ngập gia tăng.
“Cỗ máy thao túng” là một cuốn sách kịp thời và quan trọng, cung cấp một phân tích sắc thái về những cách thức phức tạp mà mạng xã hội đang biến đổi xã hội của chúng ta. Những hiểu biết sâu sắc và đề xuất của Aral dựa trên nghiên cứu nghiêm ngặt và cung cấp một lộ trình có giá trị về cách chúng ta có thể thích ứng với những thách thức do mạng xã hội đặt ra đồng thời khai thác tiềm năng thay đổi tích cực của nó.
Một hệ tư tưởng văn hóa đang thịnh hành ngày nay đó là coi công nghệ như một thế lực ma quái được thiết kế, theo một cách nào đó, để phá vỡ và hủy diệt chúng ta. Elon Musk từng cảnh báo về sự nguy hiểm của trí tuệ nhân tạo khi cho rằng “AI là hiểm họa cốt lõi cho sự tồn tại của văn minh nhân loại”. Ý niệm rằng người máy được tạo ra để “cướp đi công ăn việc làm của chúng ta” hàm ý về mưu đồ của công nghệ hòng xâm lược và chiếm đoạt nền kinh tế của chúng ta. Quốc hội Hoa Kỳ đổ lỗi cho Facebook về sự xói mòn của nền dân chủ Mỹ. Giới chuyên gia đã chứng thực rằng các bot là nguồn cơn của sự nở rộ của tin giả. Nhưng cách nhìn nhận này trao quá nhiều quyền năng cho công nghệ mà dễ dàng rũ bỏ trách nhiệm của mỗi chúng ta, và làm giảm thiểu vai trò của tác nhân con người trong việc định hình mối liên kết của chúng ta với mạng xã hội. Khi làm như vậy, nó ngay lập tức thoái thác trách nhiệm của chúng ta trong nỗ lực tạo lập thực tại của chính mình, và tước khỏi chúng ta cơ hội được làm điều này.
Tôi có một quan điểm trái ngược về ảnh hưởng của Cỗ máy Thao túng lên thế giới; quan điểm của tôi được nảy sinh và hỗ trợ bởi các nghiên cứu tìm hiểu cách chúng ta tạo ra và khai thác giá trị của công nghệ như thế nào.
Vòng lặp Thao túng mô tả một mô thức theo chu kỳ các hành động và phản ứng, cùng các nguyên nhân, kết quả và sự biến chuyển định hình nên công nghệ và hành vi của con người (Hình 3.8). Các nhân tố này đan xen chặt chẽ với nhau trong một vòng lặp phản hồi không ngừng biến động để định hình những trải nghiệm của chúng ta. Đầu tiên, công nghệ, hay cụ thể hơn là trí tuệ máy, phân tích những gì xảy ra bên trong Cỗ máy Thao túng để tối ưu hóa các mục tiêu nhất định, chẳng hạn như tối đa hóa mức độ tương tác hoặc tăng lượng người xem nội dung. Đơn cử, các thuật toán gợi ý kết bạn phân tích xem chúng ta biết ai, chúng ta giao tiếp như nào và chúng ta thích gì, để có thể đề xuất những người bạn mới. Các thuật toán nguồn cấp tin tức đánh giá xem chúng ta và bạn bè chúng ta đọc gì, thích gì và chia sẻ gì, để đề xuất các bài báo mới. Các thuật toán nhắm mục tiêu quảng cáo đánh giá xem chúng ta là ai, chúng ta lướt tin tức như nào và hành vi mua hàng của chúng ta ra sao, để đề xuất các sản phẩm mới. Cứ như thế, những thuật toán này và các phát kiến công nghệ tinh vi khác cấu trúc lại thực tại của chúng ta bằng cách áp đặt giới hạn cho các lựa chọn của chúng ta.
Vì rằng, như nhận định đầy tinh tế của nhà kinh tế học đoạt giải Nobel Herbert Simon[1], đó là “sự sung túc của thông tin tạo ra sự nghèo nàn về khả năng chú ý[2]”, những lựa chọn theo gợi ý này có thể tác động đáng kể đến hành vi của mỗi chúng ta. Chúng ta có khuynh hướng đưa ra lựa chọn dựa trên những người bạn được đề xuất, những bài báo được gợi ý hay những sản phẩm được khuyến cáo sử dụng, do rằng chúng ta không có thời gian hay sự chú tâm để mở rộng phạm vi tìm kiếm. Trong một vài trường hợp, chúng ta thậm chí còn không được thấy các lựa chọn mà Cỗ máy Thao túng đã loại bỏ. Chẳng hạn, trong khi một số ứng dụng hẹn hò cho phép chúng ta tìm kiếm bất kỳ ai ở gần khu vực, thì những ứng dụng khác, như Tinder, Bumble hay Hinge, chỉ hiển thị những kết quả tương thích với các thuật toán đề xuất của các trang này. Bằng cách cung cấp cho chúng ta một tập hợp các tùy chọn được sắp xếp theo thuật toán, công nghệ vừa cho phép vừa kìm hãm chúng ta. Khi đó, Cỗ máy Thao túng tác động đến những gì chúng ta đọc, những ai chúng ta kết giao, những thứ chúng ta mua, và thậm chí cả những người chúng ta cảm mến.
Hình 3.8 Vòng lặp Thao túng trực quan hóa sự kết hợp giữa trí tuệ máy và hành vi con người. Phía bên phải của vòng lặp là Vòng lặp Cảm nhận và Vòng lặp Gợi ý, là quá trình trí tuệ máy cơ cấu lại các lựa chọn của con người. Phía bên trái là Vòng lặp Tiêu thụ và Vòng lặp Hành động, là quá trình con người khai thác các đề xuất của máy móc rồi hành động tương ứng.
Nhưng khía cạnh công nghệ chỉ là một nửa của vấn đề. Mặc dù Cỗ máy Thao túng góp phần tạo ra thực tại của chúng ta, nhưng sau cuối chúng ta mới là những đối tượng khai thác và đưa ra hành động dựa trên các phát kiến công nghệ này. Tác nhân con người sắp xếp dữ liệu đầu vào sau khi Cỗ máy đã thực hiện phân tích và đề xuất các giải pháp. Mọi hành động của chúng ta – đăng tải gì, đọc gì, kết bạn ra sao, hoặc giao tiếp và tương tác với nhau như thế nào – định hình cách Cỗ máy Thao túng diễn giải những gì chúng ta đòi hỏi từ công nghệ, cũng như cách chúng ta muốn trải nghiệm cuộc sống và được người khác tương tác ra sao.
Một nghiên cứu gần đây, được thực hiện bởi các đồng nghiệp cũ của tôi tại Viện MIT là Iyad Rahwan[3], Pinar Yanardag[4] và Manuel Cebrian[5], cung cấp một dẫn chứng hoàn hảo về vai trò của tác nhân con người. Iyad muốn biết trí tuệ máy được “nhúng” vào Cỗ máy Thao túng bị ảnh hưởng như nào bởi những dữ liệu được dùng để huấn luyện nó. Nói cách khác, anh ấy tự hỏi các thuật toán của mạng xã hội sẽ thay đổi cách chúng “suy nghĩ” như nào sau khi học hỏi từ các nguồn dữ liệu khác nhau về hành vi trực tuyến của chúng ta.
Nhóm của Viện MIT tập trung phân tích công nghệ gán nhãn hình ảnh tự động (automated image labeling), một công đoạn thiết yếu trong quá trình phát triển các hệ thống trí tuệ máy trên mạng xã hội và thế giới trực tuyến. Bạn đã bao giờ phải nhập các mã hình ảnh xác thực (captcha[6]) chưa? Là một phát kiến của đồng nghiệp của tôi là Luis Von Ahn[7] tại Đại học Carnegie Mellon[8], những thao tác gán nhãn hình ảnh phiền phức này không chỉ để xác nhận rằng bạn là một con người, mà chúng còn gán nhãn cho các hình ảnh được sử dụng sau đó để huấn luyện các thuật toán cách gán nhãn hình ảnh một cách tự động. Trong các buổi diễn thuyết của mình trước công chúng, Luis luôn tạ lỗi cử tọa vì đã “xả lồng” ra thế giới loại mã xác thực hình ảnh gây phiền toái này. Tuy nhiên, chúng phục vụ một mục đích quan trọng. Những nhãn dán này được sử dụng để sắp xếp, lưu trữ, tìm kiếm và mô tả hàng trăm tỷ hình ảnh được đăng tải lên mạng xã hội mỗi ngày.
Iyad và nhóm của anh muốn tìm hiểu xem các thuật toán gán nhãn hình ảnh này phản ứng khác nhau như nào với những hình ảnh dịu mắt, hài hòa và tươi vui, so với các bức ảnh gây kinh hãi nhất từng được đăng lên mạng. Vì vậy, họ tạo ra một thuật toán học sâu sử dụng ứng dụng tạo chú thích cho hình ảnh (image captioning) để mô tả các bức ảnh tìm thấy trên mạng xã hội. Họ đặt tên cho AI này là “Norman”, theo tên nhân vật do Anthony Perkins[9] thủ vai trong bộ phim Psycho[10] năm 1960 của Alfred Hitchcock[11], do rằng họ muốn xem liệu họ có thể làm cho thuật toán trở nên “loạn thần” không (có thể ví von như vậy) khi cung cấp cho nó một nguồn cấp đều đặn các hình ảnh gây loạn thần kinh. Họ muốn biết những gì chúng ta đăng tải lên mạng thay đổi cách suy nghĩ của Cỗ máy Thao túng, hoặc chí ít là một trong các thuật toán của nó, như thế nào. Đầu tiên, họ huấn luyện thuật toán của mình qua các video thư giãn thường có trên mạng xã hội về các bờ biển, các loài hoa, chim chóc hay các loại bánh. Tiếp theo, sử dụng các mã phần mềm giống nhau, họ huấn luyện cho cùng thuật toán đó những video khủng khiếp nhất họ có thể tìm thấy trên mạng xã hội: những thước phim về sự chết chóc và bạo lực. (Các video được chú thích có chứa hình ảnh bạo lực. Tuy nhiên, do yếu tố đạo đức, họ đã huấn luyện thuật toán dựa trên những lời mô tả về các video này thay vì dựa trên nội dung bạo lực của các video).
Sau khi huấn luyện cùng một thuật toán bằng hai loại video khác nhau, họ cho phần mềm tạo chú thích làm một bài trắc nghiệm Rorschach[12], là bài kiểm tra tâm lý trong đó đối tượng sau khi xem một số hình ảnh [vết mực] trừu tượng sẽ được yêu cầu mô tả những gì họ nhìn thấy trong đó. (Đây là bài kiểm tra về tiềm thức của bạn sau khi bạn được cho xem những hình ảnh có thể gợi liên tưởng đến nhiều thứ khác nhau). Khi Norman “hình ảnh thường” và Norman “hình ảnh gây kinh hãi” được cho xem cùng một hình ảnh vết mực (inkblots), chúng có những phản ứng cực kỳ khác nhau. Trong khi Norman “hình ảnh thường” nhìn thấy bánh cưới, chim chóc và những chiếc ô, thì Norman “hình ảnh gây kinh hãi” lại nhìn thấy hình ảnh các vụ giết người bằng súng hoặc cảnh tượng oto chạy quá tốc độ đâm chết người (Hình 3.9).
Nhưng cần nhớ rằng các thuật toán được mã hóa giống hệt nhau, và chúng đều xem xét các hình ảnh vết mực tương tự nhau. Sự khác biệt duy nhất đó là hai thuật toán được huấn luyện bằng hai loại video khác nhau – một loại mô tả một thế giới mà tại đó chúng ta chỉ đăng tải toàn hình ảnh bạo lực lên mạng xã hội, còn loại còn lại là khi chúng ta đăng lên những hình ảnh yên bình, thường nhật về thế giới quanh ta. Bài học rút ra ở đây rất rõ ràng: chúng ta lấy ra khỏi Cỗ máy Thao túng những gì chúng ta đã đưa vào nó. Nếu chúng ta nhồi cho nó hình ảnh về cái chết và bạo lực, mọi thứ mà các thuật toán nhìn thấy sẽ chỉ toàn chết chóc và sự tàn bạo, bởi vì đó là tất cả những gì nó biết. Mặt khác, nếu chúng ta đưa vào nó hình ảnh về hòa bình, niềm vui, sự hòa thuận và hợp tác, thì chúng ta sẽ nhận lại nhiều những điều tương tự.
Một ví dụ hoàn hảo là Tay, ứng dụng hộp trò chuyện (chatbot) được hỗ trợ bằng AI mà Microsoft từng ra mắt trên Twitter vào năm 2016. Tay được thiết kế để trở nên “thông minh hơn” khi có nhiều người dùng tương tác với nó – nó tham gia vào các cuộc trò chuyện trên Twitter và “học hỏi” về thế giới từ cộng đồng người dùng. Nhưng ngay sau khi ra mắt, ứng dụng này bắt đầu “phun” ra một loạt các dòng tweet phân biệt chủng tộc, phân biệt giới tính, bạo lực và xúc phạm; nó tuyên bố rằng chủ nghĩa nữ quyền là ung nhọt, thảm sát diệt chủng người Do Thái là “dàn dựng”, và rằng Hitler đã có thể làm tốt hơn George Bush. Nó học được tất cả những điều này từ những cuộc hội thoại với người dùng, do đó Microsoft cuối cùng đã phải khai tử dự án.
Hình 3.9 Kết quả của thí nghiệm “Norman” sử dụng trí tuệ nhân tạo của Viện MIT. Ba hình ảnh Rorschach đại diện từ thí nghiệm được đặt phía trên những chú thích được mô tả bởi Norman “hình ảnh thường” và Norman “hình ảnh gây kinh hãi”. Norman “hình ảnh thường” được huấn luyện bằng những hình ảnh thường nhật từ mạng xã hội. Norman “hình ảnh gây kinh hãi” được huấn luyện bằng những hình ảnh bạo lực và chết chóc. Các yếu tố khác trong cuộc thí nghiệm đều tương tự nhau.
Có một điều thú vị về Tay, đó là hai năm trước đó Microsoft đã tung ra một công nghệ tương tự ở Trung Quốc mà không gặp bất kỳ vấn đề nào như trên. Hệ thống kiểm duyệt của Trung Quốc đảm bảo rằng ứng dụng này học hỏi các nội dung về các bờ biển, các loài hoa hay bánh ngọt, thay vì loạt nội dung phân biệt chủng tộc, chết chóc hoặc bạo lực. Tôi không nói tôi ủng hộ việc kiểm duyệt; trên thực tế, tôi sẽ biện bác cho điều ngược lại trong Chương 12. Tuy nhiên, Tay là một lời nhắc nhở sống động về vai trò của chính chúng ta trong Vòng lặp Thao túng – rằng chúng ta lấy ra khỏi Cỗ máy Thao túng những gì chúng ta đã đưa vào nó.
Trí tuệ máy của Facebook thực hiện 200 nghìn tỷ dự đoán mỗi ngày. Vòng lặp Thao túng định hình cách trí tuệ máy tác động đến Cỗ máy Thao túng. Cỗ máy này thu nạp dữ liệu về việc chúng ta đăng tải gì, chúng ta đọc gì, chúng ta bấm theo dõi những ai, chúng ta phản ứng như nào với các nội dung được hiển thị đến chúng ta, và chúng ta đối xử với nhau ra sao. Sau đó, nó xử lý những dữ liệu này để hiển thị các nội dung mới, các đề xuất mới từ bạn bè hay các quảng cáo mới nhằm tối đa hóa các mục tiêu cụ thể.
Chú thích:
[1] Nhà khoa học chính trị người Mỹ có các công trình nghiên cứu ảnh hưởng đến nhiều lĩnh vực như khoa học máy tính, kinh tế và tâm lý học nhận thức.
[2] Nguyên văn: “A wealth of information creates a poverty of attention”.
[3] Nhà khoa học người Úc gốc Syria, ông từng là phó giáo sư tại Phòng thí nghiệm truyền thông Viện MIT.
[4] Cộng tác viên nghiên cứu sau tiến sĩ tại Phòng thí nghiệm truyền thông Viện MIT.
[5] Nhà khoa học nghiên cứu tại Phòng thí nghiệm truyền thông Viện MIT.
[6] Completely Automated Public Turing test to tell Computers and Humans Apart.
[7] Doanh nhân người Đức gốc Guatemala, và là giáo sư tại khoa khoa học máy tính tại Đại học Carnegie Mellon. Ông được coi là một trong những nhà tiên phong trong lĩnh vực gọi vốn cộng đồng.
[8] Được thành lập vào năm 1900, đây là một trường đại học nghiên cứu tư nhân ở Pittsburgh (Pennsylvania).
[9] Diễn viên, đạo diễn và ca sĩ người Mỹ.
[10] Bộ phim kinh dị tâm lý nổi tiếng của Mỹ.
[11] Nhà làm phim người Anh được đánh giá là một trong những nhân vật có ảnh hưởng nhất trong lịch sử điện ảnh. Trong sự nghiệp kéo dài sáu thập kỷ, ông là đạo diễn của hơn 50 bộ phim, nhiều trong số đó vẫn được xem và đánh giá cao đến tận ngày nay.
[12] Hermann Rorschach: Bác sĩ tâm thần và nhà phân tâm học người Thụy Sĩ.