维吾尔语网站识别方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:wintelchia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过调查与分析大量维吾尔文网页结构,对互联网中现有的维吾尔文网页进行网页识别研究。探讨维吾尔文不规范网页的字符编码转换方法,为此进行维吾尔文编码标准化处理。考虑维吾尔文网页独有的节点属性,提出一种基于维吾尔文网页文本节点特征的方法,但该方法显示略低的准确率及较多的误判率。结合维吾尔语常用候选词语料和向量空间模型(vector space module),提出一种基于维吾尔语常用词统计学特征的方法,利用测试网页内容和维吾尔语常用候选词语料,并将其以向量来表示,计算测试网页文本的词语在维吾尔语常用候选词中的相
其他文献
随着我国经济社会不断的上行发展,政府不断向全社会倡导反腐并且鼓励廉政建设。在这种形势的不断发展之下,为了对政府部门领导人的经济责任进行界定,防止贪污腐败事项的发生,并且
本文从现有传统电视媒体薪酬管理普遍存在的问题入手,结合现代人力资源管理理论,提出了解决的办法和对策,对提高传统电视媒体薪酬竞争力具有一定的意义。
<正> 浙江省所需能源的供给大多来自外省,本省只能满足目前需要的五分之一。经过近30年的煤田地质勘探工作,探明本省原煤总储量仅1.7亿吨,其中93%的储量又分布在浙北。目前全
Swift是开源云计算平台OpenStack中云存储服务组件,为平台提供廉价、可靠、安全的云存储服务。针对Swift没有充分利用存储系统的备份数据来实现并行读取操作及负载均衡的这一
资料与办法    2002年以来收治外伤性泪小管断裂患者23例,男20例,女3例,年龄15~60岁。上下泪小管均断裂者3例,单纯下泪小管断裂者20例,均为单眼,就诊时间在24小时以内。
颈部淋巴结病变CT扫描技术:采用GE-lightspeed8层 CT机所有患者均作颈部平扫加双期增强。患者仰卧位扫描范围自颅底至胸廓入口增强时从肘静脉打针高压注射器注射碘海醇8~1ml压力1注射速率ml/秒。扫描参数:1V5mAs,层厚层距各5mm标准算法动脉期5~秒,静脉期55~6秒。  颈部淋巴结的划分  按照国际通用七分区法对检出的淋巴结进行分区记录[1]。Ⅰ:颌下和颏下淋巴结;Ⅱ:颈内静脉
为了满足国际热核聚变实验堆(ITER)计划全球网络不断增长的性能需求,提出了一种结合高速协议和改进传输机制的广域网链路优化解决方案。通过分析和研究快速传输协议XTP,根据XTP提
为满足车载自组织网络的应用安全性和实时性要求,提出一种基于智能卡的用户认证方法。研究当前几种主要用户认证方法,指出现有方法在安全性能或计算开销方面存在的不足;讨论基于
为了进一步提高扩频通信中数据传输的准确率和可靠性,提出改进相空间混沌信号并将其所产生混沌序列作为扩频码应用于扩频通信系统中。针对混沌扩频码中0、1数目太过均匀的不足
传统充填法重点研究胶结充填体充填井下后自身的强度问题,而忽略了不同龄期所呈现的不同强度胶结充填体对围岩稳定性影响不同。胶结充填体与围岩共同承载能力直接影响井下采