汉语、藏语、羌语、缅语等400多种东亚语言被认为拥有共同的祖先语言,合称为汉藏语系。这是世界第二大语系,母语使用人数仅次于印欧语系。一直以来,语言学家对汉藏语系内部各语支亲缘关系、分化时间以及起源地点长期存在争议。
复旦大学金力院士团队历时两年多,通过对109种汉藏语系语言的近千个词汇词根-语义组合进行谱系建模分析,重构了汉藏语系诸语言间的亲缘关系,通过语言学和遗传学等多学科交叉的分析方法,对这一问题做出了有力的回答,揭示汉藏语系在新石器时代晚期起源于中国北方。4月25日,该成果以《语言谱系证据支持汉藏语系在新石器时代晚期起源于中国北方》为题,以原创性研究论文形式在线发表于《自然》。这是中国语言学研究领域首次在《自然》杂志发表科研成果。
“这是第一次运用遗传学的数学分析方法,对东亚诸多语言的材料进行系统分析,得到的结果很有意思。”复旦大学遗传工程国家重点实验室、生命科学学院人类遗传学与人类学系教授、中国科学院院士金力告诉记者,关于汉藏语系的演化,有两种假说:“北方起源假说”认为它起源于大约4000~6000年前中国北方的黄河流域,而“西南起源假说”则认为它起源于至少9000年前的东亚西南部某地。此项研究证实了东亚地区汉藏语系诸多语言的同源关系,支持了关于汉藏语系源流与分化的“北方起源假说”,为探寻中华文明的起源和发展历程,了解中国及周边邻国的各汉藏语系语言之间的演化关系提供了重要依据,也为认识东亚人口迁移历史提供了重要启示。
语言是架起群体演化和文化演化研究的桥梁。此次研究构建出汉藏语系中109种语言的谱系树,以语言谱系证据科学揭示出东亚地区汉藏语系诸多语言的同源关系。同时证实了汉语从原始汉藏语分离成独立语族(支)的观点,并且汉藏语系中的其余语言构成一个单系语言群,即藏缅语族。
更重要的是,这项研究估计了汉语和藏缅语系的分化时间——即原始汉藏语分化成现代语言的最早年代在距今约5900年前,地点可能在中国北方,因此该语系的起源和分化可能与仰韶文化及马家窑文化的发展有着密切关系。这些发现也符合语言随农业扩散的观点,并且扩散的时间点与考古证据相符——此前的考古证据揭示出独特建筑形式和陶器类型向南扩散的特征。
语言学家、复旦大学人文社会科学数据研究所东亚语言数据中心负责人潘悟云参与了此项研究。他表示,该研究也是迄今为止国际上第一个如此大规模的汉藏语系语言演化研究。
值得一提的是,此项研究是2018年新成立的复旦大学现代语言学研究院发表的第一篇论文。金力为通讯作者,复旦大学现代语言学研究院青年研究员张梦翰为该篇论文的第一作者,复旦大学人类表型组研究院助理研究员严实为共同第一作者。融合创新,让现代语言学大学科平台成果初显。
“我们的研究还只是开始。研究语言演化,是近年来语言学研究中新兴的交叉学科方向。东亚地区语言复杂,语言种类多,随着研究深入,还有大量有趣的话题值得继续深挖。”论文第一作者张梦翰说,这一次,我们通过多学科的分析方法,揭示汉藏语系分化时间和起源地,可以说为今后的相关研究提供了一个框架,以此为发端,可以进一步推进考古学、民族学、社会学等研究。(颜维琦、曹继军)