基于回归模型的对外汉语阅读材料的可读性自动评估研究

来源 :中国教育信息化 | 被引量 : 0次 | 上传用户:sdwudipaopao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究开展对外汉语阅读材料难度评估,也称可读性研究,即应用特征结合机器学习的方法,通过计算机文本分析工具对六套对外汉语中高级上下册教材文章和阅读材料进行自然语言处理,提取文本中汉字、词语、句子、段落等影响文本可读性(难度)的不同维度特征,通过均匀分割的方法解决设置可读性取值标签的问题,并利用SVM算法进行回归建模。在独立的测试集上实验结果显示,相比SVM算法的分类方法,本研究提出的均匀标签后的回归方法具有显著更高的准确性。
其他文献
有研究表明,沪深两市指数的相关系数达96.3%,并且两市股价指数属于长程相关.由此可见,尽管沪深两市在形式上和地理上是分割的,但它们之间存在很强的内在联系.
农村第三产业的发展是保持农村经济持续增长和全面繁荣的必要条件.当前条件下,农民收入水平的提高和消费结构的变化要求为农村居民提供生活服务的农村第三产业有所发展.同时,
对比了国内外薄膜绕包烧结电磁线的制备自动控制技术,分析比较了高频恒温恒压装置、红外线测温仪、恒张力控制器、压轮距感应器出口距离的设计原理。结果表明:改用螺旋形感应
选取美国、加拿大和德国等10个世界人造板强国作为比较对象,利用FAOSTAT的1961--2004年期间的纤维板统计数据,首先对中国纤维板的生产和贸易状况进行国际比较,然后从国际市场占
服装专卖店是服饰营销渠道的重要组成部分,是目前服装零售中比较有效的一种方式,它是将服饰商品传递给最终消费者的最直接场所,也是生产者快速获取市场真实信息的重要渠道。
提出了潜艇成像的全新概念。现代潜艇的获取外部图像信息的方式不再局限于潜艇潜望镜和光电桅杆 ,而是通过空中、水上和水下三维方式的多种成像传感器实时地向潜艇指挥员提供
<正>我国车轮行业的总体规模很大,企业数量较多,产能相对过剩,企业发展不均衡,生产技术水平参差不齐,产品质量差距较大。车轮专用配套装备行业已经形成。目前全国车轮制造企
研究了H-C-G光束通过光阑-像散透镜分离系统的焦开关现象,尤其研究了透镜的像散对焦开关的影响,结果表明:当系统参数和光束参数满足一定的条件时,H-C-G光束通过光阑-像散透镜分离
俄塔斯社3月5日报道,俄罗斯驻华代表伊纽申称,俄罗斯正在向中国市场供应首批冷冻禽肉。虽然供货量只有两个集装箱,但这是俄中务实合作的新方向,是发展双边贸易的新切入口。