中文信息处理开放平台的设计

来源 :第一届学生计算语言学研讨会 | 被引量 : 0次 | 上传用户:bigtim1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国的自然语言处理研究,在很大程度上处于一种低水平重复状态,由于缺乏一些公共的基础设施,很多研究工作都要花费大量的精力从底层模板做起,造成研究工作难以深入.本文提出,可以将开放式的开发模式应用于自然语言处理领域,并给出了一个面向中文的自然语言处理开放平台的设计.这个平台能够共享代码、语料、语言知识库等资源,并支持协作开发.这个平台的上层管理采用项目方式,实现了资源的重复利用.随着参与者的增多,和项目的发展,这个平台一定会为中文信息处理提供大量的资源.
其他文献
为了减少无线传感器网络中的通信量,使数据融合技术得到广泛应用,同时网络的结构与人工神经网络有许多相同之处,本文就是利用这两种网络的共同特点提出了基于主元分析(PCA)的
该文通过对营运船舶柴油机在用润滑油作动态跟踪监测,进行了运动粘度、斑点法、污染综合指数、光谱、铁谱等检测,对实验数据进行了趋势分析并对各种分析手段进行了对比分析。认
该文进行了斜拉桥模型的多参数试验分析。在参数特征抽取的基础上研究信息融合技术。最后基于自组织特征映照神经网络,以知识处理中的地势搜索原理为出发点,应用以初始化技术、
外太空高辐照和高温差的恶劣环境以及空间机器人系统在轨任务的复杂性,对空间机器人数据处理和通信系统的可靠性提出了较高的要求。本文针对六关节空间机器人系统CAN网络构架,
本文介绍了川电东送工程安全稳定控制系统,包括该系统的总体配置和主要功能,500kV洪沟控制主站和二滩水电厂控制子站的配置和主要功能,三类220kV切负荷执行站的配置和主要功
水轮机状态在线监测系统采用声学监测方式,通过监测空化空蚀过程中产生的噪声信号和超声波信号达到监测的目的.在简要阐述该系统的框架结构、运行机制、数据采集与存储、信号
对水电机组实施状态监测具有重要意义,而在建设初期就对状态监测进行统筹规划和设计则有利于系统全面、完整和统一.本文结合彭水水电站大型水电机组的特点,比较详细地叙述了
本文设计并实现了一个基于常问问题库的中文问答系统.对用户以自然语言输入的问题,该系统能够自动地在FAQ(Frequently-Asked Question)库中寻找候选问题集,通过计算句子相似
本文对两本信息技术术语词典中的术语的用字、用词、术语长度等进行了统计,并做了比较分析.另外,还对术语系统的经济指数等做了一些初步的探讨.
随着计算机应用的发展和普及,特别是因特网的普及,获取语料、建立大规模语料库变得越来越容易.本文讨论了如何从因特网上下载语料,如何解析HTML页面并提取出其中对语料库有用