“你可以想象一下,每一個軟體,其實就可以被看成是一整段語言,所有的語句,最後翻譯成01的時候,其實對電腦來說,就是一個特別長的單詞。”
喬伊雙手盡力拉伸:“在語言學上,語言的基本組成部分其實不是字,字是語言的硬體基礎,每一種語言的字,其實都是使用者為了方便而設定的。”
“英文的字母,其實就是簡單的約定符號,中國的漢字,最早是從模擬某種特定的事物而來,以象形為基礎。語言的基礎是詞——詞代表了一個確切的含義。”
“比如中文裡的春天,和英文的spring——在春天這個概念上,它們可以被認為是大概相等的,但兩者並不能完全取代。因為春天只是兩者在語言學上的交集,除了交集含義之外,兩個詞都還分別各自有其他的意思。
“在英文裡,spring還代表著泉水,以及彈簧,這兩個概念都是在中文裡沒有的。同樣,中文的春天,還可以指代某種好的情境,單獨來說,某人的春天到了,還有『性』暗示的味道——但這種用法在英文裡也是不存在的。”
“這種一個詞代表著多重含義的現象,我們這裡被稱之為語言學上的複雜程度。沒有具體的指標,是一個感『性』的標尺。”
“這樣說吧,還是spring,在英文裡,他的複雜程度就比中文稍微高一些,但大致都是差不多。”
“兩者都是常用詞彙,複雜程度本身,代表著語言使用過程中的演繹和文明本身的複雜程度——如果回到石器時代,也許古代的字母文字中,可能存在類似spring的詞,也許字的符號完全不一樣,但它表示的意思,肯定跟中文的春天,英文的spring是大概相等的。”
“但,即使存在這樣一個詞,我們也完全可以斷定這個詞的複雜程度不會高於現在的spring和春天,為什麼,因為詞的更多含義,並不是語言創立之初被賦予的,而是在漫長的使用過程中自己演化出來的。”
“一個連鐵器都不存在的文明,肯定不會有彈簧的概念——自然也就不需要相應的詞。同樣,在一個『性』道德還沒有出現的社會里,『性』暗示這種高階幽默也不可能有存在的基礎。”
這個叫喬伊的人說話,就跟他抽菸一樣,完全就是一口氣說下來,中間幾乎不存在多少停頓。雖然他的中文不算正宗,中間說著說著還會夾帶出幾個單詞,但大概的意思是明確的。看得出來他的心情有些激動——不知道是熬了一個通宵之後的慣『性』,還是被話題本身所激發出來的熱情。
這段話的資訊量很大,但對陳舍來說其實並不難接受。
因為專案對語言學的關注很早就開始了,其中的一些觀點,做功課的時候,陳舍已經有所涉獵。雖然沒有去做專門的深入瞭解,但是聽懂這些話本身確實問題不大。喬伊說的這些,只是在前面的基礎上更加深入——倒不是說他們公司在學術上搞出了什麼更深的成果,只是在應用上,用到了更為專業的語言學知識而已。
“更高複雜程度的語言通常也體現在文學上,從某種程度上來說,文學家對語言的開創『性』應用本身,就是賦予了同一個詞彙更多的含義,或者在詞彙之間產生更多的映『射』,甚至根據自己的表達需要,創造出全新的詞彙。”
“比如說超人的英文superman吧,這個概念最早是哲學家尼采提出來的,在德語中是指代未來的某種理想型卓越人士。在由蕭伯納翻譯成英文之後,創造出了一個新單詞superman。”
“superman一個簡單的詞,就可以用來指代尼采原著中,那種複雜的描述,這種創造『性』本身,可以看做是對資訊的提煉和加工。在漢語中,這樣的現象更加多見,漢語中的成語,可以說是創造『性』詞彙中,最有代表的一個系列,簡單的四個字,往往代表著很複雜的一大段概念的集合。
“但是機器語言……不,我應該換一種說法,程式語言。如果我用這種對語言的複雜度標準,應用在大多數程式語言上的話,那這些程式語言的得分,將會是一個無限接近於0的值。”
“之前我已經說過了,程式是一種最精確的語言——你可以想象一個,一個俄羅斯方塊的遊戲語言,整個程式就好像是一個單詞,這個單詞肯定是有意義的,假如我們把組合成這段程式的01展示給外星人看,把程式附帶的執行環境也給他們看,如果程式能被執行——那外星人肯定就能看到一個確切的含義。”
“在這個具體的含義中,是一個不斷出現不