基于AttentionSBGMC模型的引文情感和引文目的自动分类研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:zhangyuhan13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]提出AttentionSBGMC深度学习模型,以提升引文情感和引文目的分类的性能.[方法]采用SciBERT预训练模型得到语料集中句子的语义表示向量,根据文本特点,依次通过BiGRU神经网络和多尺度卷积神经网络(Multi-CNN)提取句子中的时序全局特征和局部关键特征,引入注意力机制对提取出的特征重新分配权重,达到突出关键特征的目的,最后通过线性层实现引文情感和引文目的自动分类.[结果]在Abu-Jbara数据集上,引文情感主客观、引文情感正负面、引文目的三项分类任务的F1值分别为86.74%、91.14%和84.92%;在Athar数据集上,引文情感主客观、引文情感正负面两项分类任务的F1值分别为88.50%和86.59%.[局限]鉴于公开的引文数据集的有限性,该模型仅在两个英文数据集上进行验证,在其他数据集上的泛化性能有待进一步验证.[结论]所提AttentionSBGMC深度学习模型能全面、有效地提取出语料文本中的重要特征,可以更为准确地实现引文情感和引文目的自动分类.
其他文献
学术写作通常涉及作者对命题和论点的立场、态度及评价.本研究基于评价系统,通过分析写作文本、访谈及小组讨论记录,考察研究生在小组合作写作中的评价资源运用及其背后的社会互动要素.结果 显示,合作写作文本以鉴赏资源为主导,抑制个人情感表达,同时通过投射外部声音及运用模糊词来扩张潜在对话空间.活动系统分析发现,各级写作共同体能够帮助作者感知文本多声性,写作资源使学生积极应对语类及学科差异,矛盾和冲突的解决利于作者创设恰当的评价理念.总之,学生通过活动系统内的互动和中介效应实现了评价意义主体性及主体间性的双重构建.
动态系统有两个主要特点:构成系统的所有变量相互影响;这种影响不断改变作为整体的系统(de Bot 2005:14).语言作为一个复杂的动态适应系统,影响它的变量有哪些?这些变量如何相互影响并形成语言系统的动态性?2020年牛津大学出版社出版了Schmid的《语言系统的动态性》,在动态系统理论的框架中建构了固化-规约化模型,阐述了规约化和固化过程对结构、变化以及变异的影响,系统论证了语言系统的动态性.
[目的]将国际主流的信息交换标准HL7FHIR核心框架引入医疗领域,使医疗数据类型和疾病术语表达标准化.[方法]提出FHIR框架下医疗领域信息交换方法,阐述FHIR在医疗领域层面的含义和应用,通过本体构建、本体映射与迁移予以实现,并结合疾病本体(Disease Ontology,DO)规范疾病术语的表达.[结果]利用Python爬虫挖掘“医享网”发布的真实电子病历,在本体映射与迁移后,176份患者病例记录实现了 FHIR数据格式的标准化转换以及标准疾病术语编码.[局限]未能实现异源多类型术语的语义标准化.
[目的]为解决开放式创新社区中因信息过载导致用户创意价值未能及时发现的问题,探索用户创意潜在价值早期发现方法,提高社区创新资源的利用效果.[方法]设计用户创意的双重网络结构,构建基于图注意力网络的用户创意潜在价值发现模型,学习表达双重网络的节点特征及网络间映射关系,实现用户创意潜在价值早期发现.[结果]应用典型开放式创新社区数据进行实证研究,结果表明,基于图注意力网络、使用双重网络结构特征的用户创意潜在价值发现模型的准确率为90.49%,高于其他相关基线模型.[局限]仅在魅族社区数据集上验证模型,未来可拓
[目的]梳理和总结自然语言处理和机器学习技术在自动引文分类中的应用现状.[文献范围]在Scopus数据库以citation classification、citation polarity、citation function、feature selection等关键词为基础构建检索策略,筛选出代表性文献共46篇.[方法]从引文分类流程、引文分类任务、技术方法等角度对当前研究进行分析和评述,并探讨研究趋势和挑战.[结果]引文功能分类研究有从多分类向二分类转移的趋势;深度学习模型可以同时实现引文情感和功能分类
[目的]系统揭示知识图谱表示模型的内在原理和影响因素,探究其在特定任务上的效果差异.[方法]面向链接预测任务,采用对比研究方法,比较基于翻译的知识图谱表示模型和基于语义匹配的知识图谱表示模型在FB15K、WN18、FB15K-237和WN18RR这4个数据集上的效果差异.[结果]在Hits@1指标上,TuckER模型在WN18、FB15K-237、WN18RR数据集上取得最优值(分别为0.946 0、0.263 3和0.443 0);ComplEx模型在FB15K数据集上取得了最优值(0.731 4).[
[目的]研究突发事件网络舆情发展趋势的预测问题.[方法]综合考虑多重不确定因素对网络舆情演化的影响,本文基于数据分解的研究思路,利用自适应噪声完备集成经验模态分解、BP神经网络以及相空间重构理论构建基于CEEMDAN-BP的舆情预测方法,并结合多起突发事件案例进行实证研究.[结果]研究结果表明,CEEMDAN-BP模型能够较好地预测突发事件网络舆情的发展趋势,三个案例事件舆情预测的平均绝对误差分别为8.60%、17.98%、11.97%,其模型的预测性能优于CEEMDAN-SVM、EMD-BP、EMD-S
[目的]构建基于项目类别的神经网络与模糊聚类混合时序预测模型,结合用户兴趣波动幅度的趋势以提升推荐准确度.[方法]对不同幅度的兴趣波动分别采用神经网络和模糊聚类的方法构建趋势预测模型.本文采用神经网络对小幅波动序列数据进行滑动特征提取并预测,而大幅波动序列数据则通过模糊聚类的隶属度划分模糊关系.[结果]通过4组数据的仿真实验,结果表明针对不同幅度兴趣波动的数据特征提取可以获得更准确的预测效果,较其他时序推荐对比算法,RMSE最大降低了 19.18%,Hit Ratio最大提高了45.78%.[局限]由于兴
[目的]针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法.[方法]构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计规则抽取同义词.[结果]词对齐方法可以用来解决古汉语同义词自动抽取问题,该方法在前四史语料上实现了 16 272组同义词的抽取,抽样评估结果显示第一次序结果词抽取准确率达到40.12%.[局限]该方法难以适用于没有古白句子级别对齐语料的典籍;同时,抽取结果依赖分词算法和词对齐算法的效果,抽取
[目的]研究准确率较高的技术供需文本匹配模型,提高技术供需匹配的效率,促进技术转移.[方法]考虑技术供需文本的标题和正文两种文本结构层次,通过多种方法计算技术供需文本中的词相似度和语句相似度,借助深度学习模型进行融合,构建了基于多层语义相似的文本匹配模型.[结果]实验结果表明不同层次的信息对匹配结果的影响程度不同,多层次信息融合的准确率达到96.50%,高于单一BERT方法的90.70%、DSSM的87.80%以及ESIM的87.50%.[局限]模型只考虑了两个文本结构层次,未探讨更多种结构层次的效果.[