序列标注的在线算法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:cg120900230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列模型就是结构化模型中的一个经典模型,在自然语言处理、计算机视觉、生物信息学等领域得到了广泛的应用。对其模型及算法的研究和改进,具有重大的意义和实用价值。在过去的几年里,研究人员对序列模型的研究取得了一定的成果,但仍然存在很多值得探索的问题,本文就对序列模型的若干问题进行了深入的研究。首先,提出了基于标签对分类间隔最大化的方法,克服了传统优化分类间隔最大化方法,倾向于使整个序列间隔最大,而会忽略局部标签正确性的缺点。利用标签对分类间隔最大的准则来代替在线被动主动算法中参数更新过程的优化目标,得到一种新的在线算法。并且通过实验验证该算法相比原算法能够使序列标注的性能得到改进。其次,本文还对在线被动主动算法的并行化方法进行了研究,对在线被动主动算法的训练过程进行了修改,提出了并行化在线被动主动算法。并且从理论上证明了并行化的算法拥有同原算法相同的分类累积错误上界,还通过实验验证了并行算法的正确性,同时试验了该算法在分布式平台上能够达到一定的加速比,为利用多核平台的计算能力提供了一套可行有效的解决方案。本文研究了用于序列标注的在线主动被动算法相关的两个问题,提出了该模型和算法的改进,通过实验验证了改进后的算法获得了性能上的提升。
其他文献
无线传感网络(Wireless Sensor Networks, WSN)是目前国际前沿领域的研究热点,综合了传感器、嵌入式以及无线通讯等技术,具有广泛的应用前景。无线传感网络节点相对传统网络
随着多媒体技术、移动通信技术、网络技术的发展,视频通信的应用越来越广泛。然而,由于网络拥塞造成的数据丢失,或者网络信道的干扰造成的数据接收错误,以及采取重传策略造成
目前,无线自组网的应用范围已经从军事、探险领域延伸到日常生活领域,给人们的生活带来更多便利。但是,安全问题一直是阻碍无线自组网进一步发展的技术壁垒。无线自组网作为
虚拟手术是虚拟现实技术和现代医学交叉融合的一门新兴学科,融合了计算机技术、计算机图形学、现代医学、生物力学、图像处理、人工智能等多个领域的知识。虚拟手术是指利用虚拟现实技术和医学影像数据,给医生提供一个虚拟的手术环境,使医生借助虚拟环境中的信息进行手术操作,并且对医生的操作给出相应的多通道反馈,提供给逼真的手术体验。虚拟手术的出现,为手术训练提供了新的办法。传统的训练方式是用人造模型、尸体或动物等
二维条码是对一维条码的扩展,目前已被广泛应用于出版业、制造业、医疗卫生、证件管理等领域。至今为止,国内外研制的二维条码已达数十种之多,但这些条码的设计都面向于一般
随着互联网的迅猛发展,网络上的文本信息呈指数级的增长。网络信息的高流动性使得这些文本中存在大量重复的信息。这些重复文本会给信息检索工具带来巨大的挑战,所以如何快速
随着计算机软件技术的快速发展,软件产品已经应用到社会的各个领域,现今的软件已经逐步成为构件组装的集合体,这样,每个构件的质量的好坏将直接影响到软件的整体质量。所以,
流水作业调度问题是一类具有广泛应用的组合优化问题。总完工时间、总误工时间、最大完工时间和总加权误工时间是几个重要的性能指标。论文对最小化总完工时间的流水作业调度
近年来,软件网络化、服务化的趋势使得软件的交付模式、应用模式、产品形态和商业模式都产生了巨大变化,软件已经成为一种服务(Software as a service,SaaS),即人们以“使用
随着计算机互联网的蓬勃发展,网络攻击频繁发生,如蠕虫病毒、分布式拒绝服务攻击(DDoS)、端口扫描等。这些攻击事件在短时间内产生大量的网络链接,导致网络堵塞甚至瘫痪。如