分词器相关论文
随着计算机、平板电脑,以及手机等终端的普及,传播的数据量与日俱增。常用的数据传播方式有图像、文字、音频、视频等,这其中,包含......
借助于信息技术的不断发展,传统的教育领域也在发生着深远的变革。计算机辅助教学(CAI,Computer Aided Instruction)正在逐渐成为......
本文针对社交媒体的信息安全的重要性,对已经发生的安全威胁事件及时做出反应,帮助目标用户更好的控制风险、消除安全隐患。本文以......
本文提出了一种改进的电子作业批改方法,主要适用于主观性作业的批改.算法总体分为四步,第一步是建立训练集,给出样本,由计算机自......
给出了系统的实现思路,介绍了系统的主要功能和实现过程,并给出了主要功能的测试结果。...
宁波广播电视大学各个部门的网站基本上都是在十年前独自开发的。近年来,随着学校转型发展和机构改革等变化,这种重复建站、技术架构......
面对与日俱增的中文信息检索需求,Nutch作为一个开源的搜索引擎系统平台受到众多开发者的青睐.但由于Nutch是基于英文的系统,不具备中......
该文设计了一个基于复杂形式最大匹配算法(MMSeg_Complex)的自定义中文分词器,该分词器采用四种歧义消除规则,并实现了用户自定义......
采用TESL算法优化处理了中文领域的知识库,构建得到了流式中文知识图谱自动问答系统CEQA,可以显著提高商品咨询效率并统计推理各个......
目前,在信息检索方面,一般分词器对英文的支持相对较好,但对中文分词效果不太理想;随着web搜索在互联网中的广泛应用,中文分词器也......
Lucene自身提供的StandardAnalyzer虽然已经具备中文分词的功能,但是其分词正确率和切分速度不能够满足大多数应用的需要。为更好......
近年来,通过国家一些专项项目的实施,使藏文信息处理研究和开发领域取得了长足的发展,从标准统一到关键性藏文基础软件开发等各方面都......
现存的企业信息检索系统有着很大的缺陷,一方面只能提供数据库检索功能,无法检索存储在服务器上的文件信息,检索不够全面;另一方面......
摘要:目前,获取信息的最快捷方式,莫过于使用搜索引擎。而对于地理信息而言,由于地理数据的复杂性和数据格式的差异性,对于地理信息......