中国语音学报(第11辑)
上QQ阅读APP看书,第一时间看更新

6.结果示例

下面给出几个音段自动切分与标注的实际样例,从中可以看出,自动对齐的音素或声韵母边界在时间精度上还有待于进一步提高。这主要与训练材料和发音词典等因素有关。通常而言,训练用的语音材料越多,各个音素的上下文语音环境越均衡、越丰富,其声学模型就会越有效。另外,发音词典的系统性和科学性也会影响到声学模型的精度。虽然我们不能奢望音段的自动标注能够代替人工的精细标注。但利用自动处理的技术,一方面能够大幅度提高效率,避免手工录入的费时费力,另一方面也能够避免手工录入错误,从而提高数据的一致性。这对于大规模语音数据库建设来说,是极其便利的。

图7 普通话语句的切分结果示例

图8 粤语材料切分结果示例

图9 蒙古语材料切分结果示例

图10 英语材料切分结果示例

从以上结果数据可以看出,标注内容包括三个层级:词语层、音节层(词典内容中含有音节分界符“|”时会输出音节层)和音素层,并支持声调或重音等标记符号的输出。