「老大哥正看著你...的微信!」中國微信(Wechat)在中國的滲透率高達 93 %、月活躍用戶超過十億,但你知道微信不只有「文字獄」審查「敏感詞」,現在就連透過微信傳送的每張圖片,也逃不過「老大哥」的敏感資料庫監控審查!過去早已不時傳出新聞,有人被中國公安傳訊,結果對方直接秀出他的私人微信對話內容,讓民眾對微信的使用者隱私保護感到懷疑。
加拿大多倫多大學研究小組公民實驗室(Citizen Lab)日前發表研究報告,發現微信系統針對用戶所傳送的圖像建立龐大且不斷更新的資料庫,系統會自動監測、辨認出「敏感」圖片,將之加入黑名單並刪除。微信黑名單的涵蓋範圍相當廣,除了與攸關政治議題的圖片之外,美中貿易戰、華為財務長孟晚舟的相關圖片皆遭封鎖,還有許多圖片因被系統判定諷刺或貶低了中國人而無法傳送。還在用微信傳梗圖嗎?或許看著圖呵呵笑的人比你想像的還多呢!
什麼樣的圖片會被加入黑名單?
中國法律要求在中國營運的社交媒體公司必須「控制」其平台上的內容,否則將面臨處罰,因此這些網路公司必須「自律」運用技術來「對其服務內容負責」。公民實驗室翻閱過往研究資料,發現不同的中國社交媒體進行的審查幾乎沒有一致標準,此外中國政府也常對一些知名的社交平台直接下令,也因為中國嚴格審查網路文字,所以許多人試圖用傳送圖片來躲避「老大哥」監控,但這些人很快發現,圖片也無法避開審查。公民實驗室針對中國最大、每月活躍用戶超過 10 億的社交平台——騰訊微信的聊天功能進行測試,探究微信審查圖片的機制和標準。
公民實驗室在 7 月 15 日發布的報告指出,除了批評政府的諷刺漫畫、官員醜聞的相關照片之外,微信後台還會擋掉與以下 11 個新聞或歷史事件的相關照片:
ㄧ、文化大革命
二、1989 年六四天安門事件
三、范冰冰逃稅醜聞
四、2018 年重慶客車撞車事故
五、2018 年美國選舉
六、最高人民法院醜聞
七、華為財務長孟晚舟被捕事件
八、美中貿易戰
九、基因改造嬰兒
十、2019 年成都七中食堂醜聞
十一、2019 年成都森林大火
公民實驗室指出,微信定義黑名單的標準不明,除了具有政治意涵的圖片,例如 2010 年諾貝爾和平獎頒獎典禮上為劉曉波保留的空椅子、波蘭主持人在節目上表達支持臺灣等新聞照片之外,一篇作者自述其向母親出櫃經驗的文章中的配圖「鴕鳥的逃避」也被微信封鎖,公民實驗室認為原因可能是圖片有諷刺中國人逃避麻煩的「鴕鳥心態」之嫌。還有一些圖片沒有被列入黑名單的明確理由,卻也同樣遭到封鎖,其中一個案例是著名靈長類動物學家珍古德(Jane Goodall)與一隻嬰兒黑猩猩的照片,公民實驗室猜測封鎖原因可能是系統認為黑猩猩的照片是對中國人的種族歧視。
另外公民實驗室還發現遭到微信刪除的公開文章中所使用的配圖都會另外被系統加進黑名單,即使圖片本身並沒有「敏感」內容,其中甚至有許多是取自中國官方網站的官員照片和政策公告的截圖。公民實驗室認為,微信母公司騰訊可能過度審查其認為政治敏感或會引起公眾「不必要的關注」的事件相關圖片。
私聊、群聊和朋友圈各自有獨立資料庫
公民實驗室經測試發現,微信的三種主要社交功能:一對一的私聊、多人群組聊天、用戶發表即時動態的朋友圈,皆會被後台系統建立獨立的資料庫並以不同標準進行審查,大部分無法在朋友圈發布的圖片同樣也無法在聊天群組中傳送,但有一部分朋友圈的「禁圖」可以透過私聊傳送。每張出現在微信的圖片都會被記錄在微信後台龐大的 hash資料庫,但是否列入黑名單似乎在三項功能中標準不一,影響力較大、會接觸到人群、可能讓內容被廣傳的朋友圈受到的審查最嚴,其次是群組聊天,一對一私聊相對之下審查略微寬鬆。
另外,公民實驗室還發現微信審查的對象針對中國境內的用戶,在使用分別以中國手機號碼註冊和以加拿大手機號碼註冊的兩個微信帳號進行測試時,許多傳送的圖片中國帳號無法收到,但是加拿大號碼都能順利收到。另外,圖片被擋時微信系統也不會作出提醒,傳送人依然能看到圖片出現在對話框,但是接收人什麼也看不到,也不會知道對方嘗試傳送圖片。
公民實驗室還想確認同為騰訊公司旗下的另一個社交平台 QQ 空間是否與微信共享黑名單,經過測試發現在 QQ 空間被擋的 30 張圖片有 24 張同樣也被微信朋友圈封鎖,重複率高達 84%,之後用同一批圖片進行第二次測試時,則有 27 張圖片無法發布,重複率上升到 93%,公民實驗室推測這兩個社交平台可能共用同一份黑名單,只是新舊版本的不同。
中國微信如何進行審查?
公民實驗室測試後發現,微信透過建立每張圖片的 Hash 索引資料庫,檢查並記錄每張圖片檔案的 MD5編碼,並將其中具有「敏感」內容的圖片列入黑名單,讓用戶無法在微信上傳送這類圖片。公民實驗室設法在一張畫有中國民主人士劉曉波的漫畫(敏感內容)和另一張公民實驗室的標誌圖片(非敏感內容)的檔案中加入了相同的 MD5 編碼,測試發現兩張照片都無法用微信傳送。
微信利用 Hash 索引來過濾平台上的「敏感圖片」,雖然 Hash 索引並不是一種靈活的辨認程式,一旦圖片檔案的原始數據被稍微更改,其 Hash 數值就會被改變,但是公民實驗室發現如果微信用戶在傳送圖片時沒有特別選擇「發送原圖」,微信系統就會對圖片進行壓縮,並在過程中對圖片重新編碼。經過微信重新編碼的「敏感」圖片,即使經過修改,也無法再在微信上傳送,因為編碼已經被微信系統記錄。若用戶傳送一張 hash 資料庫中沒有的「新圖片」,系統會准許傳送,但這張圖片也將自動列入「待審查」隊伍,由系統檢測有無「敏感」內容,隨後就無法再正常傳送。
公民實驗室嘗試對「敏感圖片」檔案進行修改,包括調色、降低畫素、增加黑格等方式,為每張投入測試的「敏感圖片」做出 10 個有微小差異的版本,測試微信系統是否會將被改過的檔案過濾掉。結果發現,即使有部分動過手腳的「敏感」圖片在第一次測試時騙過微信系統順利傳送,但也在短時間之內被系統識別、加入黑名單。公民實驗室的測試為期一個月,總共製作了 30 張經過微調的圖片,在實驗結束的時候沒有任何一張可以在微信傳送。
最後由於公民實驗室使用的微信帳號大量傳送「敏感」圖片,被微信系統關閉,而申請新帳號非常困難,公民實驗室表示新帳號必須被另一個帳號批准,而另一個帳號必須存在六個月、「信譽良好」、一個月內未批准其他帳號成立,因此無法再在微信上進行更多測試。