基于词平台的中文文档实验系统的构建

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：wj3852

【摘要】

：

文章提出一种新的中文文档实验系统,力求建立一个克服束缚中文信息处理发展的自动分词问题的实验研究平台。文章采用一种新的基于中文词的文本编码方法,对每个词进行编码,并

【作者】

：

焦慧刘迁贾惠波

【机构】

：

清华大学精密仪器与机械学系

【出处】

：

微计算机信息

【发表日期】

：

2008年18期

【关键词】

：

中文信息处理汉字编码词平台自动分词 Chinese Information Processing Chinese character coding wo

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文章提出一种新的中文文档实验系统,力求建立一个克服束缚中文信息处理发展的自动分词问题的实验研究平台。文章采用一种新的基于中文词的文本编码方法,对每个词进行编码,并使新编码与机内码联系起来。使用这种基于词的编码格式可以使词成为计算机中文处理中的最小信息载体,无须再进行中文分词。文章使用该方法进行了关键词自动抽取的实验研究。结果显示,基于词编码的中文文档实验系统能很好的解决中文分词问题,并给其它中文文本分析奠定良好基础。

其他文献

可穿戴设备在慢性非传染性疾病中的研究进展

慢性非传染性疾病主要会造成对心、脑、肺等重要器官的损害,其中心脑血管疾病、恶性肿瘤、糖尿病等慢性疾病已成为目前导致患者死亡的主要因素,防控形势严峻。随着科学技术的

期刊

可穿戴设备慢性非传染性疾病研究进展综述Wearable devicesChronic non-communicable diseasesResear

试论抗战时期沦陷区女性文学的叙事策略

在抗争时期，沦陷区女性文学书写不仅在内容方面表现出某种特有的“诗意”，在叙事策略上亦呈现出新的气象。而叙事方法对内容的有效烘托及其二者的巧妙融合使女性书写拥有了独特

期刊

沦陷区女性文学叙事策略enemy - occupied area female literature narrative strafegy

急性冠脉综合征患者在胸痛中心的救治模式研究

目的急性冠脉综合征患者在胸痛中心的救治模式的应用分析。方法选择该院从2016年9月—2019年9月收诊的326例急性冠脉综合征患者为研究对象,对患者的治疗中采取急诊经皮冠状动

期刊

急性冠脉综合征胸痛中心救治模式Acute coronary syndromeChest pain centerTreatment model

依法管理好土地资源促进梅州经济可持续发展

梅州市位于广东省北部,全市辖6县、1市、1区,人口485万人,土地总面积1.58万平方公里,其中耕地面积16.65万公顷,人均耕地0.034公顷,素有"八山一水一分田"之称.人多地少、耕地

期刊

代表国家管理土地管理法行规权力成立法律政统立国国土

山区也要富而崇德

1949年10月12日,佛冈宣告解放.在解放50年特别是改革开放20多年以来,佛冈人民在历届县委、县政府的领导下,艰苦创业,逐步解决了温饱,走脱贫致富奔小康之路.当然,这与珠三角等

期刊

致富思源富而思进县委干部群众江泽民人民先富倡导地方县政府

战火中的燕子红——《圣天门口》中的女性形象解读

《圣天门口》中成功地塑造了一批意蕴丰富的女性形象，体现了作者自觉的女性意识。作者描写了革命历史中女性命运和精神成长的轨迹，表现了女性在社会进程中的苦难与坚韧，表达了作

期刊

《圣天门口》女性形象审美意蕴Sheng Tian Men Kou feminine figure aesthetic meaning

基于词平台的中文文档实验系统的构建

其他学术论文