基于词汇链的中文短信主题语句抽取方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cxxcxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于词汇链的中文短信文本主题的抽取方法。该方法首先通过构造多条词汇链来表达短信文本的叙事线索,并从多条词汇链中抽取出富含主题信息的词汇链,将其作为构造短信文本主题语句的关键词序列。实验表明该方法抽取的短信文本主题能够更全面地覆盖短信文本的信息,并能消除多个关键词序列表达同一主题信息的冗余。其效果明显优于采用统计信息进行短信文本主题抽取的方法。
其他文献
在移动园区网环境中部署了P2P系统并提出了一种协同缓存策略。接入控制策略利用“阈值”和节点的位置关系选择缓存的数据。缓存替换策略利用价值函数“Cost”选择要替换掉的
金融危机后中国在区域发展战略思路上发生的重要布局和走向体现在五个方面:一是全球竞争视野下东部地区经济与产业率先转型;二是腾笼换鸟,以产业融合发展避免产业的空心化;三
为测量五轴台的轴线垂直度、相交度以及对准误差,首先介绍了用水平仪测量非整周回转竖直轴系铅垂度的测试原理,及利用经纬仪将回转轴线引出的原理.在测量了三轴转台偏航轴、
为了解决受限网络环境所带来的低的递交率的问题,DTN(Delay Tolemllt Networks)通常采用多拷贝路由(multiple-copyrouting)机制来实现报文的有效递交。但在实际情况下,网络中节点的
消费主义导致大学生消费价值观取向出现偏差,使得大学生出现精神危机,让高校学生心理产生不平衡感,不和谐因素开始在校园衍生,对高校师生的思想道德建设产生重要影响。高校的当务
行政调解在解决新时期农村纠纷中具有明显的优势,但目前行政调解的机构、人员、基本原则、程序、调解协议效力等方面均存在缺失。为此,从健全机构、提高人员业务素质、明确应遵
针对LEACH算法存在簇头节点个数和位置分布不稳定的现象,在簇头节点的选择过程中,充分考虑簇头节点的残余能量因素,通过设定簇头的能量阈值防止低能量的节点成为簇头。改进的算
农业"两个飞跃"的思想提出后,理论界围绕这一思想在全国上下展开了热烈的讨论,对中国农村改革和农业经济的发展起到了很好的指导作用.我国农村改革的实践,尤其是人民群众丰富
代理多重签名是指在一个代理签名方案中,一个代理签名人可以同时代表多个原始签名人的利益生成一个有效的签名。将代理多重签名和盲签名结合起来的代理多重盲签名,在电子选举