面向单一双语网页的双语资源挖掘方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:chenxiaoyi1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包含双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源。实验结果表明,该方法能够有效改进双语资源挖掘的质量。
其他文献
以丙烯酰胺(AM)、2-丙烯酰胺-2-甲基丙磺酸(AMPS)、甲基丙烯酰氧乙基二甲基十二烷基溴化铵(AQ12)和乙烯基三乙氧基硅烷(VTEO)为原料,采用水溶液自由基聚合法合成了ASQV系列四
利用Petro-SIM炼油模拟软件对某催化裂化装置的反应和分离系统进行全流程模拟,在所建立模型能准确模拟原生产流程的基础上,进一步分析了循环入提升管的粗汽油流量和反应温度
该文引入框架知识思想,对框架知识的构成过程进行了举例分析,并根据框架知识的构成、结构描述、内部组织、内部表示等,研究了藏文字框架知识表示的若干问题,构建了藏文字框架
【正】 1996年公司销售各类调味食品等近6万吨,连续三年被评为上海工业企业销售收入500强之一,并列全国酱油、酱类制造行业年销售收入前十名。公司工业总产值、产品销售收入
训练语料库的规模对基于机器学习的命名实体间语义关系抽取具有重要的作用,而语料库的人工标注需要花费大量的时间和人力。该文提出了使用机器翻译的方法将源语言的关系实例
经国务院批准,中国中文信息学会将于2010年8月23日-27日举办“第23届国际计算语言学大会”。会前会后有Tutorials和Workshops。经大会筹备组一年多的不懈努力,现已步入正轨。
应用图模型来研究多文档自动摘要是当前研究的一个热点,它以句子为顶点,以句子之间相似度为边的权重构造无向图结构.由于此模型没有充分考虑句子中的词项权重信息以及句子所
日化店渠道的竞争已经进入白热化的程度,日化店想要提升业绩,离不开有效的广告宣传和推广。但是,日化店规模有限,资金有限,不太可能花很多的费用去做广告。那么,我们应该用什么比较
重质化、劣质化是未来原油供应的主要趋势,经济环保的渣油加氢技术正逐步成为渣油加工最主要的技术手段,目前,固定床渣油加氢技术应用最为广泛。主要分析了国内外固定床渣油
阮与月琴是具有显著民族特色的弹拨乐器,深受人民的喜爱。因二者均为竖抱之器,且形制有些近似,故人们(非专业人士)常把二者混为一谈。其实,二者大有不同。阮,古称秦琵琶、阮