去读读

免费在线阅读网

去读读 > 哲学心理 > 新中国民族语言学研究70年

第四节 民族语言实验研究热点

    《新中国民族语言学研究70年》章节:第四节 民族语言实验研究热点,去读读网友提供全文无弹窗免费在线阅读。!



基于语音声学参数库的语言本体描写研究和比较研究得到了学者们的关注。其中,语音演变声学线索和“语音声学模型”相似度为语言亲属关系判定提供科学依据,将会成为历史比较语音学的新的增长点。对语言语句焦点的韵律编码方式进行多层面、多维度深入研究,如何通过计算机自动准确提取韵律结构成为新的关注点。有关言语工程方面另有章节阐述,这里不赘述。



一  语句或篇章语音声学生理模式研究


要研究语音,先要了解语音的存在形式。众所周知,我们所发的某一个或多个单音(单发语音模式)不是语音在自然语言中的存在形式,单词语音模式只是一种接近自然的理想化模式,并非语音在实际语流中的存在形式。“语句语音模式”或“篇章语音模式”才是真正的“语流语音模式”(与此对应的语音发音声学空间也是如此)。这是语言实验研究的前沿动态和重要理论问题。[22]例如:



语音存在形式:单发语音模式→单词或词组语音模式→语句语音模式→篇章语音模式

语音发音空间:单发语音声学空间模式→单词或词组语音声学空间模式→语句语音声学空间模式→篇章语音声学空间模式



二  “语音声学空间分布模式”研究


这里所说的“语音声学空间分布模式”指不同语境中每一个音段在声学空间中的存在形式,也可以叫做“声学空间动态分布图”(自然分布图,动态)。从这类图中可以寻找和归纳每一个音段的演变轨迹,即演变规则、演变方向、演变原因以及音段原始模式和目标模式(预测)。也可以利用“语音声学空间分布模式”相似度(基于图形识别理论和方法),探讨语言之间亲属关系亲近度和类型问题。[23]我们相信这项研究将成为语言类型学研究,特别是语音类型学研究的新方向和增长点。“语音声学空间分布模式”(语音声学模式)研究能够把原来依靠“口耳之学”而看不到研究对象的无形或不可见的研究转换成依靠现代科技的看得到的有形的或可视的研究。



三  语音发声态研究


发声态指的是说话时声门(主要是声带)活动的各种状态[24]。近年来,发声态研究在民族语言语音学学界逐渐升温。学者们依靠声学实验辨认出六类十二种语言学语音学发声态,并详细讨论了它们的语音性质。



四  民族语言韵律特征研究


随着深度机器学习方法和大数据计算能力等方面技术的突破,语音技术成为国内外科学界和产业界的关注焦点,并在世界范围内取得了关键技术突破。经过数十年的努力,汉语普通话语音合成和语音识别研究已有了长足的发展,文语转换系统、语音转写系统、翻译系统、多媒体教学软件、听写器和语音翻译系统等各种应用成果大量地推向市场,在导航系统、呼叫应答、信息查询、新闻播报等社会生活领域得到了广泛应用,并且基本满足了人们的日常应用需求。与此相比,民族语言言语声学工程进程相对缓慢、滞后。瓶颈在于民族语言语音、语言资源建设贫瘠、更新缓慢。搭建“民族语言人工智能资源库平台”迫在眉睫。民族语言语句焦点的韵律编码方式研究取得积极进展,成为民族语言韵律实验研究新的增长点[25]。



五  实验语音学应用研究新拓展


随着人工智能研究的不断深入,民族语言语音识别研究开始引进深度神经网络技术。神经网络可以指向两种,一个是生物神经网络,一个是人工神经网络。生物神经网络一般指生物的大脑神经元、细胞、触点等组成的网络,用于产生生物的意识,帮助生物进行思考和行动。人工神经网络(Artificial  Neural  Networks,ANNs)也简称为神经网络(NNs)或称作连接模型(Connection  Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的[26]。



六  语音与韵律实验研究的标准化、规范化和自动化问题


语音科学要从“经验科学”转变为“实验科学”(精密科学),必须遵循“实验科学”的方法论,制定一系列的实验方法、实验步骤和实验规则,使实验研究具备“可重复性”和“可验证性”,即在实验材料、实验条件和实验方法相同的情况下,所得到的结果和结论拥有高度的一致性。只有确定统一的实验方法和标准,语音实验研究才能长足发展,逐渐变成真正的“实验科学”。语音学学科亟待解决语音声学、生理特征参数集及其采集方法的标准化、规范化和自动化问题。目前,初步解决了语音与韵律特征声学参数的采集方法的标准化、规范化和自动化问题[27]。



七  中国少数民族语音与韵律资源库建设


随着语音研究的深入,如何在单一系统中融合多语言和方言语音的声学特征参数问题是近几年语音研究的重要问题之一。搭建“语音声学参数统一平台”是我国民族语言语音研究急需开展的重要的基础研究工作之一,也是民族语言实验语音学学科建设的基石。因为:

(1)“语音声学参数统一平台”能够确保数据资源的共享性和科学研究的延续性,与同行共享数据资源,提高数据库、语料库、信息和技术平台的使用价值。如,以往的语音实验研究多以研究某种语言语音现象为目标,选取少量的语料,以提取相关语音参数为目的,很少以研究特定语言的语音系统为出发点。因而,对语音声学和生理特征的选择和把握缺乏全面性和系统性,所采集的语音声学和生理参数数据仅满足于写出论著,不注重数据的积累和整合,缺乏共享性和延续性。“统一平台”将摒弃这种传统小作坊式的方法,运用声学语音学的理论和方法,用统一框架、统一标准和统一方法,系统全面地分析和采集数据并介入统一平台。这一研究成果具有很高的参考价值,并提供后续研究的可能,统一平台对全面分析掌握某种语言音系系统具有现实意义。

(2)语音特征是个性和共性的统一体,不但同一个语系或语族语言的音位系统之间存在共性,而且不同语系或语族语言之间也存在一定的共性。利用“语音声学参数统一平台”,不仅可以对单语种的语音特征参数进行全面、系统的统计分析,探讨并总结出其语音特征和变化规律,而且还可以对跨语系、跨语族语言的语音特征进行比较研究。还可以用“语音声学空间分布类型”相似度探讨语言之间的亲属关系亲近度和类型问题,为语言亲属关系的断定提供科学依据,推进语言学重大基础理论研究,促进历史比较语言学的发展。

(3)“语音声学参数统一平台”不仅是语音本体基础研究领域的基石,而且将会成为国家信息资源的重要组成部分,弥补国家少数民族语言语音信息资源的空白。[28]



八  “中国少数民族语言方言语音实验研究丛书”


中国社会科学院民族学与人类学研究所实验语音学研究团队在国家社科基金重大招标项目“中国少数民族语言语音声学参数统一平台建设研究”(编号:12  &  ZD225)和中国社会科学院创新工程项目“中国少数民族语言语音资源库建设与应用”(项目编号:2019MZSCX006)等的资助下,正在修改和完善蒙古、达斡尔、土族、东部裕固、东乡、维吾尔、哈萨克、鄂温克、鄂伦春等语言的语音声学参数数据库,在搭建“中国少数民族语言语音声学参数统一平台”的同时,组织撰写出版基于“语音声学参数统一平台”的“中国少数民族语言方言实验研究丛书”(呼和主编)。到目前为止,已出版《蒙古语语音声学研究》(呼和,社会科学文献出版社2018年版)、《鄂温克语语音声学研究》(乌日格喜乐图、呼和,社会科学文献出版社2018年版)和《维吾尔语语音声学研究》(艾则孜、呼和,社会科学文献出版社2019年版)。

该丛书将在以往研究的基础上,针对民族语言语音研究的历史和现状,从解决所面临的实际问题出发,采用声学语言学的理论和方法,对我国民族语言方言土语的元音、辅音等音段特征和词重音等超音段特征进行较全面、系统的定量和定性分析。这是一项庞大的工程,需要民族语言实验研究学界的共同努力才能完成。该丛书的出版能够打造具有中国特色和普遍意义的民族语言实验语音学学科体系、学术体系和话语体系,完善学科建设机制,实现学科发展的历史性跨越。