中文农业搜索引擎字符编码识别

来源 :新疆农业大学学报 | 被引量 : 0次 | 上传用户:sdbradycn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对农业网页中汉字编码标识混乱的情况,提出了一种综合运用编码规则和网页文本特征的字符编码识别模型。利用卡方检验算法,结合最小二乘多元线性回归方法,得到了基于网页文本特征的字符识别模型。实验结果显示,在适当的选取阈值(r =1,阈值=属于某一编码的字符数/网页总字符数)和文本特征数(≥65)的基础上,模型准确率达到100%,且结果稳定。
其他文献
随着社会、科技的进步,无线电技术在各个领域得到了广泛的运用。然而由于各种无线电设备的大量使用,发射设备质量的参差不齐,再加上一些无线用户非法设置、改变设备发射机的
ERP(Enterprise Resource Planning)即企业资源规划,它是一个以管理会计为核心的信息系统,通过此系统能够识别和规划企业资源,从而获取客户订单,完成加工和交付,最后得到客户付
对乌鲁木齐市周边稻田土壤不同季节、不同剖面的全硫和有效硫以及植物的全硫含量进行测定和分析,结果表明该供试土壤全硫含量在196.71~165.77mm/kg有效硫含量在121.83~5542.01mg
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
疾病的发生往往伴随着炎症反应,并进一步加剧病情,因此炎症研究对疾病的控制和治疗有重要意义。受体相互作用蛋白3(RIP3)是炎症反应的关键分子,在炎症的发生、发展过程中起到重
目的 观察美能联合拉米夫定治疗E抗原阳性的慢性乙型肝炎的效果。方法 将90例慢性乙型肝炎患者随机分成美能联合拉米夫定组(治疗)49例。美能组(对照)41例,疗程均为6个月.观察临床症
全球经济衰退,报业面临严峻挑战,有的国家迫使政府出面救济。像法国政府就出资9000万美元.资助报纸与杂志的分派费用,同时也增加在印刷媒体的广告支出,另外给满十八岁的青年一份生