下麵我們討論一下從滇緬走廊,也就是從今天的雲南省和緬甸交界地區進入中國的晚亞洲人。當然在他們不停遷徙的路上,也總會有些人不時地就地停下來,不再跟隨同伴繼續往前走。

沿滇緬走廊北進的人群中最早沉澱在西南中國的部分,後來演化為說孟-高棉語[5]的各個人群。曆史上所謂的“百濮”[6],其主體可能就由他們構成。顧名思義,我們不難想象,現代說孟-高棉語的民族,就應該包括高棉人,也就是柬埔寨人,以及伊洛瓦底江下遊的孟人。

古代孟人的分布空間後來受到從北方南下的緬人的嚴重擠壓。後者屬於藏人的親緣人群,在語言上同屬於藏-緬語族。越南語也屬於孟-高棉語族。如今在中國境內,隻有在雲南邊界還生活著三個人口極少的孟-高棉語民族,即佤族、布朗族和德昂族。但在古代,孟-高棉語人群在中國的分布,還可能從西南地區大規模地向外擴展。

就像我們後麵會提到的,當原先居住在華北的上古時期的漢語祖先人群,沿著漢水到達長江,並且入鄉問俗,向當地的土著詢問如何稱呼長江時,當地人回答他們說,它叫krong。這個詞在孟-高棉語裏的意思就是大河流,南下的漢語祖先人群把它誤解為長江的專名,用“江”這個漢字來記錄krong的發音。

上古漢語裏是存在著諸如kr-、pl-等雙聲母的,也就是字頭輔音包含兩個輔音的元素。“江”字就是以kr-為首輔音的雙聲母字,所以正好用它來記錄外來名詞krong的讀音。漢語裏的“江”就這樣變成長江的專名。隻是到後來,它變得可兼指流入長江的大支流,再轉義為可以泛指一般大河流的普通名詞;而它的讀音則從最先的krong演變為kjang,而後隨16或者17世紀的漢語新產生出j-、q-、x-三個輔音,最終演變為今天普通話裏的jiang。

“江”從土語中泛指大河流轉義為漢語中對一條大河流的專稱,與到達南美的歐洲人把印第安語裏泛指大河的普通名詞“密西西比”誤解為今天密西西比河的專名,道理完全相同。另外據文獻記載,中國南方當時有人稱死亡為“劄”,孟-高棉語就把“死”叫作chad。而“劄”在古漢語裏是一個帶尾輔音-t的收聲字,所以用來記錄chad的讀音也正好。可見孟-高棉語人群在上古中國的南部呈大麵積分布的狀態。

這一批晚亞洲人當然沒有全體止步在中國的西南一角。其中折向東偏北繼續前行者,在今天華中地區發展成說苗、瑤語的各支人群,是今天湖北、湖南地區苗族、瑤族等人群的祖先。而從繼續朝著大體上正北的方向前行的那部分群體裏,最終分化出占今天中國人口90%之多的最大民族,也就是漢族的祖先人群。

由南向北穿越四川盆地的晚亞洲人,看來在翻越秦嶺之後獲得了很大的拓展,一路分布到太行山的東麓。這部分人曾經說一種原始漢藏共同語。在公元前大約4000年左右,也就是距今6000年前,他們又分化為說原始漢語和原始藏緬共同語的兩群人。

這也就是說,幾乎囊括今河南、山西和陝西省範圍的仰韶文化(公元前5000—前3000年),其創造者很可能是原始漢藏共同語的人群。在仰韶文化形成發育約千年之後,共同創造了這一文化的人們開始分化成兩個分別說原始漢語與說原始藏緬共同語的人群。造成這一分化的主要原因,可能是身處仰韶文化西部邊緣的一部分人,因生態環境不宜於進一步的農業開發,而選擇把原來從事的農業和流動畜牧混合經濟逐步推向專門化流動畜牧業的發展方向,因此逐步從他們原先的居地遷往更西更南的宜牧地區。中國學者新近發表在《自然》雜誌上的文章,綜合分子生物學、考古和語言史領域的研究,把上述分化的年代定位於5900年前。由此可見,繼碳十四測定技術的發明之後,基因研究對於推動第二次“考古學革命”起到了何等重大的作用。

與上述過程同時,位於西進人群之東的仰韶人,不但與它更東麵的其他人群發生頻繁密切的交往,還在西麵逐步占據了由於原始藏緬共同語人群的向西退卻而留出來的舊地盤。而原始漢語就是在他們中間逐漸形成的。

研究漢語史的人早就認定,漢語和藏語起源於同一種遠古的共同語言。證據實在太多了,現在隻舉一個同源詞作為例證。古藏語“魚鱗”“盾甲”讀作khrab,上古漢語裏把“甲”讀作khrap,這兩者是千真萬確的同源詞。隻不過“甲”的讀音在漢語複聲母分化後變成kjap。入派三聲後變成kja,然後在漢語首輔音j-、q-、x-產生後,變成它今天的語音jia。經曆此種複雜音變後,一般人很難再從語音角度直接感知兩者之間的同源性。現在分子生物學以基因為根據,推斷漢藏兩族擁有一個共同的祖先人群。出於兩種完全不同的學科領域的結論,恰好可以在這裏互相印證。

除了上麵提到的漢藏共同語人群以外,活動在河西走廊到今新疆一帶的,主要是從更西麵的中亞地區遷移進來的若幹支印歐語係的人群。不過他們的曆史大概超不過4000年,遠遠不及活動在東亞的人群那樣久遠。從東亞也有人往西一直走到那裏的,但是他們基本上被吸納進文化上占支配地位的印歐語人群之中去了。

絕大多數研究者認為,印歐語人群的起源地在黑海和裏海以北的草原地區,原始印歐語人群的最初一波擴張,可以粗分為三支,分別到達西歐、今天土耳其所在的小亞,以及東部哈薩克斯坦草原和阿爾泰山—薩彥嶺山地。

上述第三支人群在4000年前移居塔裏木盆地東部的各個綠洲,他們所說的語言被後人稱為“吐火羅語”,是著名學者季羨林深感興趣的研究對象之一。他們一直在該地生活到公元9世紀,被在那裏建立統治的回鶻人,也就是維吾爾族人征服,並且最終淹沒在其語言歸屬於突厥語族的維吾爾族人裏麵。

天山以北和塔裏木盆地西部,也被從西方進入的東伊朗語人群所占據,分別是遊牧的月氏人和靠綠洲農業以及過境貿易為生的於闐塞人。於闐塞人大致與吐火羅人同時被它西麵的鄰國喀喇汗王朝征服,並且也很快融合進突厥語人群之中。

在今天中國境內,除了維吾爾族,還有哈薩克、克爾克孜、撒拉等六個講突厥語族諸語的民族。原始突厥語人群的起源地應該是在蒙古高原的西部。從遺傳結構上看,這個人群中除有O、C等源於東亞和東北亞的染色體基因成分外,還含有在印歐語人群中高頻分布的父係單倍型R1a1。因此,原始突厥語人群與原蒙古語和原始通古斯語人群,不像是從同一個祖先人群分化出來的。過去學術界曾經把這三個語族合稱為“阿爾泰語係”,但是從20世紀70年代以後,這個語係是否成立,遭到越來越多專家的懷疑。

本世紀初,一位博學的俄羅斯語言學家出版了三卷本的巨著《阿爾泰諸語辭源學詞典》。但是另一個以分析新波斯語中的突厥語與蒙古語成分而享譽全球的德國語言學家在對這本書的書評裏指出:讀完這本試圖肯定阿爾泰語係身份的書以後,他最深刻的印象就是阿爾泰語係不可能成立。語言學和分子生物學又一次以各自不同的切入路徑,達成了彼此非常接近的認識。

好,我們已經接觸到了中國境內講各個主要語係屬下各種語言的上古人群。但說到這裏為止,“中國”其實還沒有出現。然而由於上古人群付出了成千上萬年的、自南向北逐漸打開自己生存空間的努力,“中國”很快就要從一片混沌的東亞大陸上逐漸浮現它的身影了。