一种信息过滤系统中语义扩展模型的研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:xingyuan77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对用户信息需求自动处理方法的研究是信息系统研究领域的重点之一,其中信息过滤系统的目标就是能够快速准确的从海量文本信息中挖掘出符合用户定制或者查询需求的信息。针对目前文本信息特征向量维数太高并且语义重复性较大的缺点,给出一种对信息过滤系统实现的语义扩展模型,其主要方法是在系统中选取适当规模的概念集合,利用其代替关键词集合来计算得到系统中文本信息的特征向量,通过计算实现文本信息的聚类,然后基于系统的语义关联信息将各个聚类实现基于分层P2P架构的组织。试验证明,文中的语义扩展模型有效实现海量动态信息数据的高效组
其他文献
文本聚类中,文本特征向量的高维特性使得对样本统计特征的评估十分困难,所以有必要进行有效的维数简约.LLE算法利用线性重构的局部对称性找出高维数据空间中的非线性结构,并
针对基本蚁群算法的搜索时间长和局部收敛等现象,提出一种用于求解旅行商问题(TSP)的优化型蚁群算法,该算法有效地将最大最小蚁群算法(MMAS)和遗传算法(GA)相结合,一方面在很大程度
在西文经济学中,人才被当作一种资源或生产要素来看待。同样,在市场经济条件下发展的中国,也离不开人才的批量涌现。如果没有人才脱颖而出的土壤,也就没有经济的快速发展。
蒙学即启蒙之学。中国古人蒙学主要是指中国的传统语文教育。中国传统的语文教育,大体说来,由三个阶段构成。开头是启蒙阶段,以识字教育为中心;其次是进行初步的读写基础训练
由于校准形式的灵活性,校准活动已经越来越多应用于各种试验设备,校准证书一般不给出合格与否的结论,校准数据是否满足设备技术指标要求或满足实际工作使用要求,则需技术人员依据
南宋词人刘辰翁,对《项羽本纪》中的鸿门宴上的人物描写赞不绝口,称道这段描写“历历如目睹,无毫发渗漉,非十分笔力,模写不出”。节选《项羽本纪》的《鸿门宴》一文,虽篇幅不
70年代以前的很长一段时间内,园艺学家、育种家和广大的蔬菜工作者、生产者都把提高产量作为蔬菜生产和消费领域的中心课题,进行了大量的研究。随着科学技术的进步和经济的发
期刊
关联规则挖掘是数据挖掘研究的重要内容之一。通过对关联规则挖掘算法的详细分析,提出了一种基于有向关联图的频繁项集挖掘算法,该方法仅需扫描数据库一次,避免了Apriori算法
UML缺乏精确的语义,难以对其所表示的系统进行形式化分析和一致性检验.为了使UML能够更精确地对系统模型进行描述,学者们提出了一些形式化的方法.论文对比分析了用Petri网、
针对传统的地震属性图像可视化过程中存在的缺点,论文提出一种基于直方图技术的地震属性图像配色阈值选取算法,该算法利用直方图统计的结果,首先进行阈值预选,然后在区间内进行阈值调整,最后根据所确定的阈值对地震属性图像进行重新配色,很好地解决了传统地震属性图像视觉上的杂乱以及区域性差的缺点。经过对大庆油田多个区块地震属性图像的分析,该算法可有效解决地震图像可视化中的不足,提高了地震解释工作的效率。