基于频繁模式挖掘的维吾尔文智能组词方法

来源 :计算机应用 | 被引量 : 10次 | 上传用户:ljkstar007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特点,将无先验知识的模式挖掘问题转化为特定模式的匹配问题,提出了一种快速高效的频繁模式挖掘算法,来获取语义完整的维吾尔文词。实验结果表明,通过该算法获取的维吾尔文词,在结构上是稳定的,语义上是完整而独立的。
其他文献
目的 探讨加强护理干预在老年重症肺炎并发呼吸机相关性肺炎患者中的应用效果.方法 选取2009年11月至2010年11月收治的78例老年重症肺炎并发呼吸机相关性肺炎患者作为研究对
目的 探讨自动化酸碱平衡图在急诊科社区获得性肺炎(CAP)患者诊断中的价值.方法 根据病史、肺功能测定结果、慢性阻塞性肺疾病(COPD)诊断标准,将111例CAP患者分为单纯CAP组(5
蛋白尿不仅是反映肾小球损伤的标志,还是导致小管间质纤维化的一个独立因素,这一观点已成为共识.目前有大量研究致力于探讨尿蛋白成分与小管间质纤维化的关系.本文综述了蛋白
溶血磷脂酸(LPA)属于脂介质家族的一个新成员,这些脂介质是内源性的生长因子,可引发多种生物学效应.无论在男性还是女性生殖生理学和病理学方面LPA起着多种作用.本文阐述了关
目的探讨1950~2000年间湛江地区鼠形动物种群的动态变化。方法收集整理湛江地区50年来的鼠疫监测资料,依次按年代进行鼠形动物的分类统计。结果50年来共捕获家栖、野栖鼠形动
应用RT-PCR方法扩增出猪繁殖与呼吸综合征病毒国内分离株S1毒株的GP5基因序列,然后通过KpnI和XhoI酶切位点把该基因克隆入经过同样双酶切的穿梭载体pShuttle-CMV中.重组穿梭
目的:探讨具有"永生化"特性的正常小鼠卵巢上皮细胞(MOSE)系建立的方法和可行性.方法:用胰酶消化法从温度敏感抗原(TsAg)转基因小鼠中分离MOSE,用4%血清培养液培养,通过细胞
甲型肝炎是一种经粪-口传播的疾病,在不同地区控制水平不同,在发展中国家仍然是一个重要的公共卫生问题。全国血清流行病学调查的结果显示,甲肝的发病率约为100/10万。表现为
类固醇5α还原酶(SRD5A)分为1型和2型,它们均能催化类固醇激素产生活性代谢产物,并有相对特异的组织定位。多数研究表明,在激素相关肿瘤组织SRD5A表达和(或)活性升高。该基因