【摘 要】
:
在当今网络时代,互联网早已成为名符其实的最快捷、最方便、传播面最为广泛的新闻信息传播媒介。网络新闻具有信息量大、即时性强、增长快速等特点,而单位与个人所关注的新闻
论文部分内容阅读
在当今网络时代,互联网早已成为名符其实的最快捷、最方便、传播面最为广泛的新闻信息传播媒介。网络新闻具有信息量大、即时性强、增长快速等特点,而单位与个人所关注的新闻则具有主题性强、时变性弱等特点。研究如何从海量的、动态的网络信息中,自动识别出用户长期关心的专项主题信息,主动为用户提供感兴趣的信息服务,具有重要的社会意义和实际应用价值。本文针对自动构建企业门户网站的新闻栏目等专项应用,在研究网络新闻自动识别与检索等相关技术的基础上,采用元搜索引擎系统架构,结合分布式信息检索/融合、基于内容的文本分类识别、领域本体处理等智能信息处理技术,设计并实现了一套专项主题新闻自动检索系统。主要工作与贡献如下:1.研究了元搜索引擎实现的相关技术,并重点研究了其中融合排序这一关键技术环节,提出了一种利用粒子群算法优化多源检索融合排序结果的方法,并通过一组科技文献检索的相关试验,验证了该算法的有效性。目前,该算法已被应用到本文目标系统中,作为其中的一个重要模块。2.通过大量算法实验,深入研究和分析了利用SVM进行文本分类和主题识别应用时,有关文本特征、核函数等有效选择与处理方面的一些关键技术问题。相关试验表明,当使用互信息(IM)算法选择特征项在4000左右、设定SVM的核函数为SIGMOID时,新闻文本的识别准确率在97%以上。这部分研究成果,现都已融合应用到本文的目标系统中。3.设计并实现了一套专项主题新闻自动检索系统。该系统可基于用户提供的主题关键词和主题样本语料库工作。通过使用主体领域本体库,对用户给定的主题关键词进行查询语义扩展后,提交元搜索引擎机构进行主题新闻采集和融合等处理,所产生的结果经进一步的主题识别过滤后,主动推送给客户。目前,关于目标系统的主体框架及原型搭建已基本完成,部分核心模块已可正常执行。
其他文献
随着现代电子信息技术的快速发展,汽车呈现智能化、电子化和网络化的发展趋势,越来越多的电控单元被引入到汽车中。为了解决电控单元之间的数据交换问题,汽车电子领域使用了多种
近年来,矿难的频繁发生严重地威胁到了广大矿工的生命安全。我国煤炭行业信息化还处于刚刚起步阶段,其中产生的诸多问题需要借助于计算机信息化技术来解决。
虚拟现实技术
近年来,作为一种新型的成像检测技术,宇宙射线μ子成像技术在辐射成像领域受到越来越多的重视,发展很快。该技术是通过测量天然宇宙线中的μ子在穿透被检物体的过程中产生散射
DNA遗传算法是在遗传算法的基础上,受DNA生物特性及DNA计算的启发,将DNA编码方式、分子操作机制等引入遗传算法,有效的提高了遗传算法的性能。本文对变异算子和变异概率进行
污水中有机污染物浓度的检测对水质监控有着重要作用,而传统的检测方法主要是化学法,这种方法由于耗时较长、容易造成二次污染等不足,难以应用于污水的在线检测。三维荧光光
针织行业中针织物重要参数中的密度参数对于控制产品的质量是至关重要的,实际生产中由测量人员进行主观手工检测,存在工作枯燥、效率低下、误差大、不能客观测试等弊端。本文
本文针对应用于军用直升机上的Doppler/SINS组合导航系统对导航计算机高精度、高性能的要求,设计出一种基于DSP(TMS320C6713)和FPGA (Spartan-3E XC3S500E)协同合作的机载导
光纤陀螺和加速度计作为光纤惯性测量组合的核心组成器件,由于其对温度的敏感性,温度漂移成为主要的误差源,从而降低了惯性导航系统的测量精度,因此对光纤惯性测量组合进行温度控
在提供直线机械能方面,直线电机比传统方式具有更加优异的表现,尤其是在以高速高精度为主要特征的数控加工领域。为了提高直线电机的控制性能,目前越来越多的先进控制技术被研究应用到其中,并取得了丰硕的成果。因此,研究如何将先进控制技术应用于直线电机以提高伺服系统的控制性能具有十分重要的现实意义。本文主要研究分析滑模变结构控制技术和重复控制技术在直线电机上应用的可行性。本文的主要工作和成果包括以下几个方面: