【翻牆問答】粵語、繁體字避過中共網絡審查 封城期間接力傳遞

0:00 / 0:00

問:中國當局不近人情的動態清零措施,受到越來越多的批評,惟網監全力封殺相關言論,令民怨、真相難透過網絡曝光。但有網友成功透過粵語發文迴避當局的言論審查,是怎樣的一回事?

李建軍:在語言學上,由於粵語語法與中文書面語有相當大的差異,因此原本設計用於審查書面中文言論的人工智能系統,無法有效學習有關內容,所以粵語短片、帖文避過了機器審查的法眼。而在人工操作上,又由於很多審查員根本不懂粵語,因此未能察覺粵語撰寫的帖文內容敏感,無從下手進行審查,使粵語的內容再成功闖關。

另外在技術上還有一個突圍關鍵,就是由於歷史原因,令粵語和普通話採用了不同的電腦漢字字符集。

現時很多粵用字,其實都是香港政府在主權移交前,英國政府為推廣政府和法院使用電腦通訊和存檔而編入香港政府字集之中,由於香港傳統上用繁體字,當時在電腦編碼時就理所當然跟隨同樣使用繁體字的台灣,而非使用簡化漢字的大陸,因此,在Unicode未普及前,其實是台灣繁體電腦編碼Big-5的延伸部分。

很多中國政府程式都是主力處理中國大陸的字集編碼,一般用Unicode來處理文字,一般都不會特意處理Big-5碼內容,更何況是由Big-5伸延的香港政府字集。而且過去由於大陸流行的輸入法,一般都不處理繁體字和香港字,而編寫電腦程式的習慣,並非在一時三刻可以改變,因此,技術上, 大陸的一套系統,理論上不具備使用粵語發表文章的能力,故當局原本也無必要刻意開發針對粵語輸入的審查系統。

但現代作業系統技術上的進步,就明顯改變了情況。蘋果Mac OS、iOS等,除了有手寫輸入法,更可以語音輸入,而大陸流行的輸入法,亦改到可以輸入日文、韓文、繁體字等漢字,應付商務往來上的需要,於是乎就再不難直接用粵語發表內容,而由於中國當局審查系統未趕得及提升,當局是依賴人手去審查內容,因此當出現粵語發文批評政府的內容,其生存時間往往比較長,令到相關資訊能得以傳遞。

問:用粵語發表文章沒那麼容易受到審查的優勢能保持多久?

李建軍:畢竟中國當局一直都處心積慮過濾香港的互聯網內容,因此,肯定有暗中投放資源去設計可以處理香港字集內容的審查工具,以及利用人工智慧去了解粵語的語法內容並作出審查。因此,一旦中共能在香港實施大規模網絡審查,粵語突圍發敏感訊息的優勢就會隨之消失,因為屆時中國當局可以利用這套系統,同時應用於廣東以及澳門等粵語地區。

問:那麼使用其他地方語言,譬如閩南語、客家話,又能否同樣達到避過審查的功效?

李建軍:粵語是比較幸運,因為英國政府當年為了紀錄可能含有大量粗言穢語的刑事案件供詞,因此花費大量人力物力和時間,在古籍中歸納了不少粵語甚至只見於口語的寫法,但其他中國方言,一般都未有做這類的整理,或投放資源在類似的研究上。因此,除非有人為其他省份的語言研究出一套公認的寫法,並且像香港政府字集一樣被編入Unicode中,否則其他語言很難像粵語一樣意外獲得「翻牆」能力。要其它中文方言獲取「翻牆」能力,不但需要投放大量資源去研究,還要在中國、日本、韓國等主權國家在商討Unicode修訂時,願意將有關新字交予Unicode標準制訂者,並具能於手機和電腦上輸入。而以現時的政治局勢,恐怕不易有空間去向Unicode相關組織提交新的字。因此,暫時其他中國地區的語言要作為迴避封鎖的工具,難度遠比粵語為高。暫時有可能只有粵語具備這種能力,除非其他語言使用急起直追。