基于光学字符识别维汉翻译软件的研究与实现

来源 :新疆大学 | 被引量 : 0次 | 上传用户:wi7474974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今随着社会科学技术的飞速发展,由于手机携带方便、功能日趋完善等原因,导致智能手机的普及率成直线上升趋势,移动互联网用户的规模愈来愈大。如今在国内外,英语、汉语等语言文字的OCR识别技术已经相当成熟,利用OCR技术进行某种语言的文本翻译也越来越火爆,但在新疆,利用OCR技术实现维吾尔文的识别与翻译的研究尚不成熟,因此研究维吾尔文的OCR技术与机器翻译技术,对于新疆的经济建设、各民族的文化交流、以及加快维吾尔文字信息化发展具有积极的作用。本文主要研究了维吾尔文的光学字符识别技术(OCR)和维汉统计机器翻译技术,在Tessetact-OCR平台上训练出维吾尔语图文识别训练模型,并其作为基础在Android平台开发维汉光学字符识别与翻译一体化的应用程序,实现了从维吾尔图文中识别出文字信息、并实时翻译功能。首先在包含维吾尔文字的图片识别方面,系统利用局部自适应阈值二值化和形态学闭运算去噪等图像处理算法对目标图文进行预处理,提高Tessetact-OCR识别成功率,基于改进的多尺度分水岭分割算法对维吾尔文图片进行切分,再利用Tesseract引擎对维吾尔文进行识别训练。然后在词汇存储及翻译方面,准备了4.9万条维汉单词和平行句对,利用NiuTrans Server工具包搭建维汉翻译系统,并在Azure云平台上实现翻译功能为客户端提供API接口,最后使用Java语言在Android Studio集成开发环境上实现Android客户端。
其他文献
从生态主义理论对托尼·莫里森的小说《所罗门之歌》中所反映出的生态现象进行解读,作者指出有色人种和自然界是相互依存、和谐统一的一个整体,他们之间的分离将导致黑人无家
重庆照明学会霓虹技术专业委员会于2004年5月29日正式成立。它的成立,标志着重庆霓虹行业走上了一个新的台阶,霓虹行业将越来越成熟,越来越完善。专业委员会自成立以来进行了一
期刊
随着对产业集聚问题的深入研究,人们逐渐发现很多大学都对产业的集聚起着重要的作用,同济大学就是其中之一。同济大学周围自20世纪80年代以来,逐渐聚集了诸多设计公司和相关
本文通过对北京地区铁尾矿资源情况调查和铁尾矿原材料性能试验检测分析,尝试将铁尾矿与机制砂按照合理比例搭配配制混合砂混凝土,对其拌合物性能、力学性能、碳化性能和干缩
作者指出,由于商业迅速地发展,对照明的要求越来越高.在这种趋势下,商业照明设计和商业照明光源产品都有了很多新的变化.文中指出,恰当的商品照明可以吸引顾客的视线,合适的
<正>随着本世纪60年代新考古学的兴起,在考古学领域里,欧美的研究者不断地开拓民族考古学这一分支研究.英国剑桥大学考古学家伊思·荷德(Ian Hodder)就是其中富有声誉的一位.
2005年1月13日,终于在一起民事索赔案中赢了官司的贵阳市老人张业广在得到医疗器械公司赔偿的13万元后,专程来上海拜见了杭敏.张业广紧紧握住杭敏的双手说:"好人哪,真是太感
<正>城市环境与建筑的灯光问题己经超出了其原有简单的“照明”意义,而直接上升到了灯光艺术的范畴。特别是进入21世纪,仅仅是照明己不能满足人类的要求,人们正以千姿百态的
据德国联合工程物理执行局(即B)和美国国家标准及工艺规程研究所(NAST)格札乌捷尔、穆&#183;林杰马、阿&#183;施珀尔林格、伊&#183;奥恩奥在俄刊《照明技术》上报导,任何发光二极
某养殖户于2005年4月20日购进3月龄仔猪40头.一周后有13头发病.并有一头已死亡,即前来就诊。