切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于前后文n-gram模型的古汉语句子切分
基于前后文n-gram模型的古汉语句子切分
来源 :计算机工程 | 被引量 : 0次 | 上传用户:woaibaobei123321
【摘 要】
:
提出了基于前后文n-gram模型的古汉语句子切分算法,该算法能够在数据稀疏的情况下,通过收集上下文信息,对切分位置进行比较准确的预测,从而较好地处理小规模训练语料的情况,降低数
【作 者】
:
陈天莹
陈蓉
潘璐璐
李红军
于中华
【机 构】
:
四川大学计算机学院,西南科技大学计算机学院
【出 处】
:
计算机工程
【发表日期】
:
2007年3期
【关键词】
:
N-GRAM模型
数据稀疏
平滑技术
基于前后文的n-gram模型
N-gram model Data sparse Smoothing technology
【基金项目】
:
国家自然科学基金资助项目(60073046),高等学校博士学科点专项科研基金“SRFDP”资助项目(20020610007)
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了基于前后文n-gram模型的古汉语句子切分算法,该算法能够在数据稀疏的情况下,通过收集上下文信息,对切分位置进行比较准确的预测,从而较好地处理小规模训练语料的情况,降低数据稀疏对切分准确率的影响。采用《论语》对所提出的算法进行了句子切分实验,达到了81%的召回率和52%的准确率。
其他文献
人格本位:高等职业教育模式的理念和策略
随着我国高等职业教育迅速发展,全面提高等职业教育的质量成为主要目标。国内学者和一线教师也开始提出一些适合本校实际和独具职业教育特色的教育模式。但长期以来,高职教育
学位
高等职业教育模式
人格本位
知识本位
能力本位
高职院校学生辩证思维能力的培养
随着时代的发展,社会对高素质人才的要求越来越高,一个未来人才不仅要具有完善的知识结构,更需要具备很强的创新能力和社会服务力。与国外高等教育在人才培养上的较大差距,使
学位
高职院校学生
辩证思维能力
培养对策
海拉尔盆地贝尔凹陷热演化史与油气关系研究
贝尔凹陷是是海拉尔盆地内勘探程度较高的一个南部凹陷,该凹陷沉积厚度大,地层发育全,生油条件十分优越,是海拉尔盆地主要产油气凹陷。主要烃源岩层是南屯组,其次是大磨拐河
期刊
海拉尔盆地
贝尔凹陷
地温梯度
磷灰石裂变径迹
热演化史
Hailaer basin Beier depression geothermal gradient
天安门与蒯祥
天安门与蒯祥雄伟壮丽的天安门,吸引着中外游客,成了北京的象征。那么,天安门的设计者是谁呢?天安门的设计者名叫观(kUdi)祥,生于明初洪武年间,江苏吴县一个木匠家庭里。他的父亲是当时有
期刊
蒯祥
洪武年间
雄伟壮丽
明初
江苏吴县
北京宫殿
南京博物馆
匠师
三大殿
工部侍郎
ED-225G龙门刨铣床工作台传动齿轮测绘及变位设计
1.状态描述2010年3月我公司装备车间ED-225G龙门刨铣床工作台不能正常往返运动,有严重异响。经维修人员拆卸工作台后,发现工作台床身减速箱Ⅳ轴上双联齿轮的齿形严重损坏;Ⅲ
期刊
铣床工作台
齿轮测绘
龙门刨
设计
变位
传动
双联齿轮
齿轮齿形
基于市场需求条件下高等职业院校弹性学制改革研究
随着我国市场经济的发展,市场对职业教育的影响越来越大,高等职业教育实施弹性学制面临着前所未有的考验。本文分析了高等职业教育和高等职业教育弹性学制改革国内外研究现状
学位
高等职业教育
弹性学制
就业竞争力
风助力摩托车工业设计
期刊
摩托车工业
教师工资不兑现 地方长官摘乌纱
教师工资不兑现地方长官摘乌纱最近,河北省决定,落实领导责任.实行首长负责制,对于拖欠教师工资不能解决,或再出现新的拖欠经过两个月的视为领导失职.超过半年的.主要领导引咎辞职。
期刊
地方长官
领导责任
江西教育
领导干部
我国职业教育基本矛盾研究
职业教育基本矛盾是职业教育基本理论体系的重要组成部分,职业教育实践中许多问题的发生都与职业教育基本矛盾有关。本研究以科学发展观、系统论和人的需要理论为指导,把职业
学位
职业教育
基本矛盾
社会职业
需求
基于P2P匿名系统下的信息隐藏技术研究
基于P2P的匿名通信技术能够隐藏通信双方的通信关系,但传送的信息仍暴露在信道上;信息隐藏技术则可以将传送信息隐藏在掩体信息中不易被察觉。该文在基于P2P的匿名通信技术和
期刊
匿名通信
P2P
信息隐藏
anonymous communication P2P Information hiding
与本文相关的学术论文
基
于
前
后
文
n
-
gram
模
型
的
古
汉语句子切分
基
于
N
—
gram
模
型
的
中
文
分词
前
k优算法
基
于
N
-
Gram
模
型
的
蒙
古
语
文
本语种识别算法
的
研究
基
于
n
-
gram
模
型
的
中
文
分词技术研究
基
于
N
-
Gram
模
型
的
藏
文
文
本分类技术研究
基
于
N
—
gram
模
型
的
中
文
分词算法
的
研究
基
于
Ontology改进
的
N
-
Gram
文
本分类
模
型
研究
N
-
gram
模
型
综述
基
于
N
-
gram
统计
模
型
的
搜索引擎中
文
纠错
中
文
N
-
gram
分词
模
型
改进
基
于
N
—
gram
语言
模
型
的
汉字识别
后
处理研究
基
于
N
-
gram
语言
模
型
的
哈萨克
文
机构名识别
基
于
N
-
gram
语言
模
型
的
哈萨克
文
机构名识别
基
于
N
-
gram
语言
模
型
的
哈萨克
文
机构名识别
基
于
n
-
gram
的
大规
模
中
文
文
档聚类研究
基
于
短语
的
汉语
N
-
gram
语言
模
型
研究
基
于
N
-
gram
模
型
的
查询纠错技术
的
研究
基
于
贝叶斯
的
N
-
Gram
统计信息检索
模
型
基
于
改进
的
N
-
gram
模
型
和知识库
的
文
本查错算法
基
于
N
—
gram
模
型
的
哈萨克词干提取方法