风险价值在信息检索风险评价中的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:po54321s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索中的风险的主要来源有查询的二义性,查询和文档的相关度的不确定性以及文档集中的文档是相关的,并非独立的。基于这些风险,很多风险评价方法都被提出。但是,它们大部分都只是考虑检索结果相对于初次检索性能下降的查询数目或是性能提高的查询数目与总的查询数目的比率。因此,它们存在一定的限制,当两个系统具有相同的有效性得分,但是返回的文档列表的顺序是不同的时候,它们就不能区分出系统风险的大小。本文研究的重点是:针对目前风险评价方法的缺陷,我们提出一种新颖的计算风险的方法:风险价值(Value at Risk),它被广泛应用于金融领域,我们把它应用到信息检索中并命名为VaR_IR。它不仅考虑了有效性的得分,而且考虑了文档排名中文档之间的相关度。之后,我们又研究了引起系统性能方差来源的因素。主要是用混合效应模型从查询和系统两个方面进行了分析。实验结果表明,我们提出的风险价值这一新的风险评价方法相对于其它的风险评价方法更加的全面,可以解决系统具有相同的有效性得分,但是返回不同的文档顺序确实不同的情景。对于性能方差来源的分析,也证明了查询和系统确实对性能方差产生影响。
其他文献
近年来,由先天性缺陷、运动和交通事故等原因引起的骨植入修复病例急剧增加,对性能优异的骨材料需求量与日俱增。众所周知,自体骨是骨移植的优选材料,但是其来源有限且容易引起供给部位坏死。相对于自体骨,异体骨的来源则较为广泛,但其依然存在着整合与重塑缓慢、免疫排斥反应以及疾病传播等诸多问题。理想的人工骨植入材料,应能够模拟天然骨的成分和结构,促进骨缺损部位的修复,并在体内提供长期良好的生理环境。然而,目前
沥青路面使用一段时间以后,其整体性能将不能满足路用要求,但作为路用材料仍有很高的利用价值。通过路面再生技术,可以使旧沥青路面材料重新满足路用要求。沥青路面再生时如
本研究利用SDO、SOHO/LASCO等获取的太阳耀斑和日冕物质抛射(coronal mass ejection,CME)数据,筛选出太阳24周20112015年期间所有M级和X级的强耀斑伴随有CME出现的事件。接下来
在当前手性分离材料(Chiral Stationary Materials,CSMs)的发展基础上,为进一步提升环糊精手性分离材料(CD-CSMs)的应用水平,制备了一系列新型CD-CSMs并将其应用于手性分离中,探究了CD官能团、键合臂等因素对不同种类手性分离的影响。并且,针对CSMs原有种类研究逐渐饱和的现状,从材料层面对手性固定相的设计进行创新。(1)通过“叠氮-炔”点击化学反应将手性氨基酸
在口语对话系统中,为了更好地和用户进行交互,正确理解用户的意图是非常重要的。有研究证明,对口语语言进行句法分析对于口语语言理解任务是至关重要的。然而,现在的很多对口
期权作为一种非线性金融衍生工具,投资者可以通过利用期权构造灵活多样的资产组合,以满足不同投资目的和复杂风险管理的需要。因此,作为风险管理的重要工具,期权在世界范围内迅速发展,国际化趋势明显。2019年12月23日,沪深300股指期权在中国金融期货交易所(简称“中金所”)正式上市交易,意味着股指期权在国内正式破冰,标志着我国金融市场风险管理体系的建设取得了新的突破。然而,我国衍生品市场发端较晚,其发
作为连通模拟世界和数字世界之间的桥梁,模数转换器(ADC)是现代通信系统和片上系统的(SoC)的重要组成模块。近年来,在通信终端和便携类消费电子的巨大需求推动下,中等精度、
硕士学位论文的质量水平是衡量硕士研究生教育质量的重要标志。进入21世纪以来,随着我国研究生招生规模的扩张,提高学位论文质量已经成为各学位授予单位的首要任务和研究生教育改革的核心话题。与国际高水平研究生教育相比,我国研究生教育质量仍然存在明显差距,保障和提高硕士研究生学位论文的质量,把我国从研究生教育大国进一步建设成研究生教育强国的历史使命刻不容缓。本研究以布尔迪厄的场域理论为理论框架,以访谈调查为
本文基于CMOS工艺实现的同步型逐次逼近(Successive-Approximation)模数转换器(ADC)具有低功耗,小尺寸,易于实现多路转换的特点。其转换精度和转换速度处于中等水平,满足当前
现阶段,我国农村金融受抑制情况严重,从而阻碍了我国农村经济的发展。导致我国农村金融受抑制的根本原因在于我国农村金融体系尚不够完善,这种不完善体现在于农户与金融机构