基于LDA模型的HSK作文生成

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:wangliubaobao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】研究HSK5作文自动生成,为汉语教师写作教学以及汉语学习者备考提供参考。【方法】将"HSK动态作文语料库"作为基本语料库,基于LDA模型训练语料库,融合交叉熵选择句子的策略,生成包含关键词的文本。通过人工评价,对比待评价文本和参考标准,对生成文本进行评分。【结果】实验结果表明,生成的文本内容包含所有关键词,且与主题相关。【局限】训练文本有一部分是改正后的HSK作文语料,来自母语为非汉语的外国人的作文,以致内容连贯性不强、内容不够丰富。【结论】该方法完成了根据关键词写作的任务,生成的文本可以很好地围绕关键词展开,并切合主题,本文提出的融合策略使生成的文本可读性较强。
其他文献
<正>地理过程是指地理事物和现象发生、发展、演变的过程,强调陆地表层系统地理事物和现象随时间变化的特征,主要包括地理事物的时间演变、结构演变和数量演变。学习地理,重
自从改革开放后, 我国人们的生活质量与生活水平大大提升,人们对健康要求越发提高, 在生活和工作中都非常重视健康.近些年来,茶疗成为人们饭后休闲的一种方式.我国作为茶叶大
随着新的REAL/WHO恶性淋巴瘤病理分类的广泛应用和化疗的进展,放射治疗在非霍奇金淋巴瘤治疗中的地位发生了很大的变化。放射治疗仍然是大部分早期低度恶性/惰性淋巴瘤的主要
<正>升级热销产品是"保险业姓保"的具体实践2017年4月1日,人保寿险一口气推出"无忧人生"、"美好赢家"、"百万畅行"三款主打产品,将人生三大风险:重疾、养老和意外全覆盖。"我
文章利用2002~2010年进出口贸易总额以及我国主要行业企业景气度指数季度数据构建了VAR模型,并通过脉冲响应函数和方差分解分析得出我国制造业和建筑业与进出口贸易关系较其它
<正>小时候,每到夏天,我总是咽喉不舒服,母亲说是不喝水的缘故。我不喜欢喝水,主要害怕上课的时候去上厕所,惹同学笑。母亲深知我的"小心眼",她自有"对付"我的妙计。我们村外
为提升职业教育教学质量,国外职教发达国家普遍重视职教师资的职前培养与职后培训。对其在职前培养与职后培训方面的特点进行总结和研究,对推动和促进我国职教师资队伍的建设
文章首次将参照群体理论引入技术接受模型(TAM),探讨了消费者首次网购时参照群体的三种影响对TAM模型各变量的影响机制。研究结果表明,首次网购时:(1)参照群体对消费者的网站
美国宪法规定总统与国会分掌美国的外交决策权。在权力分配上,宪法倾向于国会的权力稍微占优势,但两者大体上呈现均衡状态的关系格局。但从历史发展来看,总统在外交决策领域
随着325路最后一辆纯电动公交车辆更换完毕,今年市运管部门新购置的700辆纯电动公交车辆全部投运上路,这也意味着,湖州城市、农村公交达到100%纯电动零排放,在全国率先实现市