词位标注汉语分词中上下文有效范围定量分析

来源 :计算机应用 | 被引量 : 4次 | 上传用户:zap6872
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在利用条件随机场进行基于词位标注的汉语分词时,特征窗口的宽度是决定条件随机场学习效果的重要参数。针对特征窗口最佳宽度的选择问题,设计了一组特征模板,并选取Bakeoff2005中的测试语料,使用CRF++0.53工具包进行了对比实验,定量分析了影响分词效果的有效上下文范文。通过实验得出以下结论:下文对分词性能贡献要大于上文;影响分词性能的特征窗口的宽度不超过五,以四字或五字窗口为宜。
其他文献
针对视频传输中宏块受损引起的视频质量下降问题,兼顾隐藏效果和计算复杂度,采用交错的加权二次隐藏方案对边界匹配算法进行改进,有选择性地引入运动估计过程,并通过设定阈值,在预测块的边界匹配误差过大时采用8×8子块相关性隐藏模式。实验结果表明,采用改进算法,峰值信噪比平均提高1dB左右,解码的视频质量得到明显改善。
本文综述了临床应用葛根素注射液引起的过敏性休克、过敏性药疹、药物性皮炎、速发喉头水肿、面部血管水肿、肝肾损害、丙氨酸转氨酶增高、肾绞痛、血红蛋白尿、急性溶血、心