基于查询日志分析的中文网页关键词抽取方法

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:yxhzhy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标,并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面,也做了特殊处理。实验结果表明:抽取关键词的准确率较高,综合性能也高于TF.IDF和SVM方法。该方法能得到较满意的关键词抽取效果。
其他文献
旗传递性是附加在2-设计的自同构群上的重要条件之一。1988年,Zieschang证明了旗传递2-(v,k,λ)设计当(r,λ)=1时其自同构群G只能是仿射群或者几乎单群,故可以利用有限单群分类定
基于RFID技术的室内定位算法,大多都要求阅读器具有记录RSSI、TOA等测量参数的功能,这对于阅读器和标签的要求较高,从而导致整个系统的成本较高。RFID动态定位方法是一种新型的通过参考标签和移动RFID阅读器进行定位的方法,无须记录RSSI等测量参数,思路简单,却实现了较高精度的定位(可达数10cm级),然而定位路径较为盲目,定位效率低下。为改善这一问题,本文提出了一种功率可调的动态定位方法,
好的管理,就是一种“服务”,是和煦温暖的人性春风。  有家上市公司招聘,面试题目是“10減1,等于几?”应试者有各种“脑洞大开”的回答。如有巧答说:“10减1等于0,是亏本;等于15,是贸易;等于20,是金融;等于100,是贿赂……”  只有一名应试者怯懦回答:“等于9。”  考官问为什么不够自信?应试者说怕自己回答“显得很愚蠢”。  这名应试者后来被录用了。公司主管说,我们公司宗旨是“不把复杂的
河口、近岸物质的输运时间尺度是将海洋物理过程与生态过程联系起来的一个重要指标,反映了水体内物质更新速率。为有效控制北仑河口及其临近海域环境污染和促进海岸线资源的合
在新的教学形势下,我们数学教师要树立教学新思维,探索教学新方法。在数学教学实践中,要培养学生的创新思维,教师就应根据学生的认知规律,从学生的实际出发,在充分发挥教师主导作用
在塔类设备的定期检验中,经常会遇到由于种种原因设备无法打开而将原定的方案由内部检验改为外部检验。而塔类设备受限于高度,如果没有足够的外部平台只能搭设很高的脚手架,
本文在Greenberg-Hastings激发介质元胞自动机模型规则网格基础上施加位置扰动,以此模拟激发介质中激发元之间相互作用距离的改变。计算机数值模拟结果表明:对于在规则网格下
《英语课程标准》提出了寓情感教育于课堂教学之中的要求。大家都知道,中学英语课堂中的情感渗透是实施素质教育的一个重要而又必要的手段和措施。情感教育是维系师生关系的重
合成了香兰素与对甲苯胺希夫(Schiff)碱的重稀土配合物,(LnL2Cl·3H2O)Cl2(Ln:Gd,Dy;L:希夫碱配体)和(LnL2Cl2·2H2O)Cl·H2O(Ln:Ho,Er,Tm,Yb,Lu),并用元素分析、红外光谱
目的探讨基质金属蛋白酶(MMP)-9和可溶性人基质裂解素(sST)2在老年射血分数保留及舒张性心力衰竭患者中的表达水平及与B型脑钠肽(BNP)的相互关系,同时分析两者对老年射血分数