基于双语平行语料的中文缩略语提取方法

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:qqsskk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语缩略语在现代汉语中被广泛使用,其相关研究对于中文信息处理有着重要的意义.本文提出了一种从英汉平行语料库中自动提取汉语缩略语的方法.首先对双语语料进行词对齐训练,利用训练得到的词对齐信息抽取出候选中英文短语对.然后用SVM分类器提取出质量高的短语对.最后再从质量高的短语对集合中利用英文翻译及一些汉语缩略-全称对应规则提取出汉语缩略语及全称语对.实验结果表明,该方法提取出的缩略语具有较高的准确率,可以作为一种自动提取缩略语词典的有效方法.
其他文献
三、模拟量输出方式 M16机心共有十个模拟量输出,除了音量VOL是PWM输出之外,其余九个模拟量都是0~5V直流电压输出,其相应引脚内部都设计有专门的D/A转换器,因而在片内已将“P
故障现象 一台夏警VC—A5080T录像机,接通电源VTR开关能进行加载,多功能显示屏工作状态显示也正常,按重放或录像健时加载导柱、副加载臂、压带轮均能到位,磁鼓电机转动,但主
南希·罗宾斯有一个天赋,能用表面上看起来再寻常不过的物件创造出极不寻常的雕塑作品。许多年来,她一直在废物堆积场搜寻家用电器、床垫、飞机部件用以创作,最近则改成使用
淮北选煤厂入厂原煤性质变化大、配选方案多、换选频繁,重介精煤灰分控制难度大,在生产实践中,通过运用“信息库比对定位法”、“多节点产率计算法”、“离线结合目测精煤灰
论述了在从数字化矿山向智慧矿山建设的进化中,煤炭相关数据大量产生,针对数据治理研究了与其相关的关键技术.首先实现数据交换,打破“数据孤岛”,通过数据载体和数据传输通
国际民航组织于1983年成立了未来航行系统(FANS)特别委员会,对现行使用的陆基系统的局限性与未来星基系统进行了充分的研究与论证,并于1988年提出了以卫星技术为特征的通信、
介绍了煤矿井下用梭车的主要作用和整体结构,结合多年的维护经验,对梭车制动器的日常维护和故障排查进行了详细说明,并对梭车卷电缆装置的维护以及拆解安装过程进行了详细介
采用高压密闭微波消解仪预处理煤样,并用冷原子吸收分光光度法测定其中的汞.研究发现,选择硝酸-盐酸-氢氟酸-双氧水体系可将煤样有效消解,利用国家标准物质GBW(E)110108煤103
评价是信息检索研究长期关注的焦点,推动信息检索技术的进步.在简要分析Cranfield评价的优点和不足、基于检索日志进行检索评价的巨大潜力后,本文论述从搜索日志中获得可靠文
会议
利用计算流体力学的原理和方法,结合水力旋流器的分离机理,采用RSM湍流模型对水力旋流器湍流场进行数值模拟研究,揭示了尚不能用实验方法获得的湍流特征参数——湍动能和湍流