论文部分内容阅读
对很多人来说,写作是一件令人非常头疼的事。在当今这个互联网高速发展的社会,很多人会通过网络来解决自己在写作中遇到的困难,然而这是相当费时费力的。于是越来越多的写作辅助软件不断涌现,它们试图为人们提供一个集文本编辑与写作辅助于一体的软件系统。但是,传统的写作辅助系统依旧存在着一些不足:系统较庞大、检索功能相对简单、不够智能等。另一方面,对于广大的中文用户而言,中文输入法系统是其使用计算机的基础软件。除了向用户提供较精准的音字转换结果外,目前的中文输入法系统并不能为人们的写作带来较有价值的参考。因此,通过借鉴写作辅助系统和中文输入法系统彼此的优点和长处,本文提出寓写作辅助功能于输入法之中的构想,从而试图为中文写作的人们提供实时且智能的写作帮助。在本文提出的面向写作辅助的智能输入法系统的构思下,我们最终设计并实现了系统WINGS。通过WINGS的帮助,用户在输入汉字的同时便可享受到智能的词级和句子级的写作辅助,从而获得思维上的扩展和灵感上的启发。本文的研究内容主要包括了以下几点:第一、给出了系统核心模块的关键技术。本文所提系统的核心模块为词推荐模块和句子推荐模块:在词推荐中,我们试图通过基于词向量表示的词间相似度计算和词性搭配规则的共同作用来实现相关且多样的词推荐;在句子推荐中,先使用Lucene快速的检索候选,然后为了使推荐的句子质量好且上下文相关,本文对句子进行了质量评价和主题建模。第二、作文语料的获取、处理和挖掘。大量写作相关语料的获取为我们提供了丰富的词和句子资源,这为系统提供了坚实的基础。而接下来对语料进行词级和句子级的处理和挖掘则为系统的智能提供了保障。词级的语料处理和挖掘主要包括词性的统计和词向量的训练;句子级的语料处理和挖掘主要有:使用有监督机器学习对句子进行质量评价,采用无监督的LDA模型对句子进行主题建模。第三、WINGS的设计和实现。整个WINGS系统是对IBus框架和IBus-Pinyin进行的扩展。它一共包括四个模块:音字转换模块、词推荐模块、句子推荐模块和用户反馈模块。系统中的四个模块通过相互配合,最终为用户提供了实时且智能的写作帮助。第四、对WINGS的评价。为了获得系统在不同层面的表现,我们对WINGS进行了多方位的评价。首先是通过人工的方法对WINGS的词推荐和句子推荐做出了评价。接下来我们通过对系统的响应时间进行统计,展示了系统的实时性性能。最后,通过志愿者实际的安装和体验系统,我们得到志愿者对系统的整体性评价。