面向信息处理的藏文字词统计分析设计

来源 :电子技术与软件工程 | 被引量 : 3次 | 上传用户:caichengzyokokok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文按照软件工程的基本思路,宏观上设计出藏文字词统计软件的基本架构,从微观上设计出藏文字词量化的功能模块,实现了藏文字词统计分析的算法,并通过语料库语言学的理论和研究方法对规模为36万词种的词典语料库中统计出总数为9111个藏文音节数,60万次词构成的藏语教材语料库中统计出藏文音节总词量、文本数、词种数、词频、词性、频次、词长、累加频率、分布率、使用度等大量珍贵的数据,这对于促进藏语语言学研究和语言教学领域字词量化研究及教材编写等提供较为科学的数据。
其他文献
<21世纪大学英语>自99年出版使用以来,受到广大师生的普遍关注.本文以99年修订的<大学英语教学大纲>为依据,探讨了该套教材的编写体例及其所体现的主要优点,并提出了几点供商
1998、1999年国家教育部考试命题中心推出的《普通高校招收保送生综合能力测试题》中,绝大多数试题采用文理综合的形式,手法新颖,匠心独运,令人耳目一新.且试题本身呈现出学
一、现行学制与初等教育课程台湾将义务教育称为"国民教育",从事义务教育的学校称"国民小学"、"国民中学".目前台湾实施9年制义务教育.接受义务教育前,学生先在学前教育机构-
一看学生是否想写施教之功,贵在激趣.有人说"兴趣是火种".因此激发学生写作热情,培养学生良好的作文心理是作文教学的一个重要目标.这个目标落实到教学中,就要看学生是否想写
电力线噪声一直以来作为电力线通信研究对象,但由于其突发性及不重复性,导致无法对其进行精确的模型化。本文设计一种电力线噪声采集及回放系统,为系统进行电力线上噪声提供依据
新课程背景下,教学关系发生了重要变化,学校管理也将随之发生变化,传统的学校管理过分重视学校工作的静态性,导致学校工作形成统一、封闭的管理系统,严重阻碍学校教学工作的创新,因
本文给出寻找一批奇异恒等式的一般方法.这些在分划集上求和的恒等式包含一些著名的特殊数列及特殊多项式作为被加项因子.
设{Xi}i.i.d.为寿命随机变量叙列,分布函数为F(x);{Yi}i.i.d.为相应的与之独立的截断随机变量叙列,其分布函数为G(y)。当τF=sup{t:F(t)<1}时,Kaplan-Meier估计的强一致性为Foldes与Rejeto于1981年证明。本文则研究了较为复杂的τF≥τG情况,证明了在某些条件
本文将强绝对连续性和绝对连续性两个概念推广到取值于任意拓扑向量空间的函数,和将弱绝对连续性推广到取值于局部凸空间的函数.描述了这些概念之间的关系及特征,并推广了马
竞争作为一种是弱肉强食,优胜劣汰.而竞争作为一种方法,却有下面三种情形:(一)是由竞争者各自实力决定和展开的,充分体现竞争规律的自由竞争.