立即捐款

網絡

如何繞過中共國的防火牆

廣告

廣告

(轉載自:http://newnewhkcc1976.wordpress.com/2008/07/13/%E5%A6%82%E4%BD%95%E7%B9%9E%E9%81%8E%E4%B8%AD%E5%85%B1%E5%9C%8B%E7%9A%84%E9%98%B2%E7%81%AB%E7%89%86/)

思路是:
1. 中共國的防火牆小組不喜歡個別審查每一個案,因此寧願軟件封錯都不會每個封包去查,它們除了簡體中文之外,英文或其他語言都懶得去看;
2. 用審查軟件去審查網上內容當然是用機械式的關鍵字尋找方法,但軟件明白未能文章的真正意思及訊息,因此常常出現誤封無關政治的網站的情況;
3. 審查網上內容需要審查,但中共當然不想中國對外互聯的速度因此而變得太慢,慢就會傷害中共國的經濟;
4. 審查網上內容要成本的,中共當然不想因此而支出太多,影響其他IT項目;
5. 審查網上內容的軟件如果不夠精準的話,常常封閉無關的網站的話,中共國會因此要付出不輕的經濟代價;
6. 任何審查網上內容軟件的弱點:
A. 它不知網頁主人本來打算用什麼碼來顯示它的網頁,不可能頁頁、字字都瞎猜的!
B. 它是用中文字的組合及順序來分辨出關鍵字的,而不是用意思,亦不懂中文文法,因此可以針對這一點;
C. 它不懂分辨網頁各種內容(data type)是在表達意思中有什麼作用,它只是機械性的針對中文字,不會懂數字可以代替中文,中文亦可代替數字,圖案/符號/Flash 動畫亦可代替文字;
D. 它不懂閱讀圖案/影像/聲音/多媒體檔內的文字訊息,當然亦不知圖案/影像/聲音/多媒體檔是想表達什麼,但是這方法的檔案容量較大,加長上下載所需的時間,或者可以把檔案壓縮來費卻時間。把檔案壓縮還有一個好處,就是審查軟件不可能把所有被壓縮的檔案都先解壓再檢查。
E. Java/PHP亦可以動態生產含中文字內容,審查軟件無從由它的程式碼得知它的真正內容,中文字還有一個好處,可以把中文字碼拆散,或當成變數作各種數學運算。即使審查軟件有辦法知道每個變數,但一來它不知道這些變數的用途是什麼,二來要猜的話,所用的運算資源亦不成比例的高!

方法:
1. 由中文字可以用6-8種不同的中文編碼來入手,網頁不一定要標正確的中文編碼,它看不懂某字/詞就不可以審查內容,如果某網頁有3種不同的中文編碼,它要平常費多達512部的功夫,而且因為網頁刻意破壞了關鍵字的連結關係,而無從審查。理論上,一篇有300字的文章如果3種中文編碼是隨機排的.因為它無從知道什麼是正確的中文編碼,因此它要試6^300次所有組合! 問題是看網頁的人可能會很辛苦,要有專用的轉碼程式,依一定規則來轉碼,以及有其他人幫手就容易,就算審查軟件知道規則亦用盡審查方的運算資源!

2. 在關鍵字中加插空位、數字、符號、別國語文、英文,一般人用一用常理就分到,但對於審查軟件來說,分不清哪一些是無意義的符號,哪一些是有意義的。例如網頁本來是字與字中間隔空的,忽然中間有個字或符號,審查軟件是分不出字或符號是本來意思的一部份故意放上去擾亂審查軟件的。再進一步的方法,可以用不規則隔空/分段方式加字或符號來對付審查軟件。

3. 用圖來顯示網頁中的某些字詞,可以是被審查的關鍵詞,可以是無關的字,可以是關鍵詞的一部份,不一而足。其實不少網頁已經用圖來顯示中文字碼顯示不到的字,每篇加多幾個字改成圖畫是小小的功夫,例如10個字隨機抽一個化成圖晝,在一篇100字的文章,自動化審查的難度多了1024部以上,而且它只看到部份的字,文章的原意用再高階的系統都無從去猜!

4. 混合不同類別的資料種類,而不按常見的方法去用它,例如六4,6四,陸4,關鍵詞或非關鍵詞還可以用同音異字。讀者一看就明,而審查軟件卻要試所有可能的語音組合,費時失事。

5. 用英文/別國語文來表達關鍵字的意思,字典整個網隨處可見,用網上字典並不犯法,但軟件要先翻譯再檢查就麻煩得多,更有趣的用法是把被審查的關鍵字及非被審查的關鍵字的部份用英文/別國語文來表達。寫網頁只要簡單的字典,用自動化的軟件隨機的把不同字眼譯成英文/別國語文。問題是看的人會覺得麻煩,需要有軟件自動辨認語文及翻譯。

6. 審查軟件並不知道什麼為之網頁內容(包括文字、圖畫、影像等)的正確順序,因為它是不理解網頁內容的意思,亦不可能把網頁內容如一篇文章所有可能的排序全都試完,例如一段20字的訊息有24兆種組合,把全中國的電腦合起來都需要1小時才可以運算出來,不要想像是便一篇有100字的文章了!所以可以用中國最古老的方式去「加密訊息」,例如把想表達的訊息放在每篇文章隔第三個字,又或者是要第一篇的每三個字加第二篇的第二個字加第三篇的第一個字,當然可以篇篇不同/次次新款,只要提供一些審查軟件讀不到的貼士給瀏覽者來解密;其實就算審查軟件讀得到貼士,它亦分不開什麼是文章內容什麼是貼士,什麼的文章該怎樣去讀。如此作強迫審查過程不可以自動化,大幅增加它的成本和降低它的效率!
最好有一軟件結合以上辦法,自動辨別自己網頁的內容被中共國的防火牆阻截,立刻用以上任何一種方法隨機改寫網頁內容,只費幾分鐘,但審查軟件卻可能用幾小時去分辨。除非中共可以容忍在北京奧運時互聯網比日常慢萬倍,否則到時中共的思想統治基石:防火牆將形同虛設!
北京奧運是各位黑客表現身手的時侯,我等着看好戲。

廣告