一种结合关键词与共现词对的向量空间模型

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:l_zhijie1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种结合关键词特征和共现词对特征的向量空间模型.首先,通过分词和去除停用词提取文本中的候选关键词,利用文本频率筛选关键词特征.然后,基于获得的关键词特征两两构造候选共现词对,定义支持度和置信度筛选共现词对特征.最后,结合关键词特征和共现词对特征构建向量空间模型.文本分类实验结果表明,提出的模型具有更强的文本分类能力.
其他文献
闽东北沿海是福建乃至全国晚第四纪海面变化研究比较薄弱的地区之一。本文根据该区的钻孔岩芯和地表露头沉积相及测年资料的综合分析,揭示了闽东北沿海晚更新世以来的海侵和海
在柏拉图的<理想国>中,诗的教化与哲学的教化之间的争吵贯穿全篇.在柏拉图看来,哲学的教化能够引导人以理性的态度追寻永恒之善良,实现灵魂的不朽;而诗的教化则只会煽动人的
鉴于应用单一主成分分析(PCA)或非下采样Contourlet(NSCT)变换进行多光谱和全色图像融合存在的问题,提出了一种2DPCA-NSCT变换图像融合算法。首先对多光谱图像各波段进行二维PCA变换,视其主成分为信号而少量非主成分为噪声予以忽略;然后对全色图像和第一主成分做NSCT分解,在频域对近似分量和多方向高频分量按不同的融合规则融合;最后通过NSCT反变换得到融合图像。实验结果表明,所提
法律与道德是教师职业生活中不可或缺的行为规范,但由于二者分属不同的范畴,在具体的教育实践中就难免出现矛盾与冲突。由于矛盾冲突的多样性和教育情境的复杂性,要想穷尽所有的
针对传统智能卡进行数据传输时仅支持单一模式的缺点,提出一种改进的基于模式控制字的数据传输安全策略.此模式控制字支持多种数据传输模式,数据可以采用明文、密文、明文MAC
随着数据的极端稀疏性,仅仅依赖于传统的协同过滤相似性的度量方法已无法取得精确的推荐结果.针对这一问题,提出基于用户特征属性和云模型的协同过滤算法.首先,算法利用云模
<正>深度教学是触及教学本质的教学,向更高层级发展的教学,是学生行为、认知和情感参与的深刻性教学,是教学场域中知识线、认知线和教学线相互赋能的教学。深度教学能帮助学