论文部分内容阅读
本文对中国盲文计算机系统语句级输入法进行了研究。主要内容如下:
(1)在音节串切分方面,结合拼音纠错技术,引入了拼音最大匹配算法MM+。该算法利用拼音纠错的处理结果对拼音码以有效音节为单位进行切分,大大降低数据库的扫描库次数,从而提高了拼音串的切分的速度,并且降低了切分的错误率。
(2)在音节串切分歧义处理方面,结合最大匹配算法提出了基于词频数学期望的交集型歧义音节串处理算法。该算法在音节串切分的歧义处理方面,利用同音词词频的数学期望来评价音节串的切分结果。该算法在交集型歧义音节串处理方面能够很好的解决最佳切分结果的选择问题。
(3)在最佳路径搜索方面,采用基于剪枝的策略,结合贪婪算法和Trigram同现概率模型设计了语句级最佳路径搜索算法。该算法使用逐级剪枝和构造局部最优解的方式,去掉不可能成为最优解的路径,大大减少了候选语句的向量空间,提高了候选语句的搜索速度。该算法在实际的应用中取得了良好的效果。
(4)在词频调整方面,基于条件词频算法设计了语句级条件词频实时调整算法。该算法在最佳路径搜索的过程中,动态修改条件词频,从而达到条件词频实时调整的目的。
(5)给出中国盲文计算机语句级输入法的整体设计结构、系统实现的数据结构、词库创建、开发环境等问题。