【摘 要】
:
资源指代表一切可被人类开发利用的物质、能量和信息的总称。资源文本指描述资源相关信息的文本,它主要包含资源名称、属性、参数、量值、用途以及应用领域。对资源用途按照
论文部分内容阅读
资源指代表一切可被人类开发利用的物质、能量和信息的总称。资源文本指描述资源相关信息的文本,它主要包含资源名称、属性、参数、量值、用途以及应用领域。对资源用途按照应用领域进行分类可以帮助人们在检索资源时更有针对性,对资源文本进行合理的表示将对人们解决现实生活中遇到的问题提供很大帮助。资源文本中的用途通常是短文本,短文本具有稀疏性、实时性、非标准性等特点,在分类时会影响分类精度。部分专家学者在文本特征选择方面,通过对特征项进行不同程度的加权,来挑选优质的特征项。还有部分专家学者通过对短文本特征项进行扩充,在文本表示上进行改进。本文也将从文本特征选择和文本表示两方面入手,来提高资源用途文本分类精度。针对文本特征选择存在较高特征维数灾难的问题,提出一种二阶段的文本特征选择算法。在互信息算法的基础上,引入平衡因子、频度、集中度、词性及词在文本中的位置五个指标对互信息值进行计算,然后将排序结果靠前的特征集初始化进行遗传算法的训练,进一步得到较优的特征集合。针对文本表示方面没有考虑类间分布不均的情况,使用改进的TFIDF公式对Word2Vec词向量加权,将改进算法应用在对资源用途按照应用领域分类上。本文还提出一种构建资源库的方法。其中数据源来自百度百科中化工专业的词条。在资源库构建中最为关键的知识表示中,应用可拓学的知识表示方法。对于资源名称、属性、参数、量值,采用结构化的四元组形式。对于资源名称、用途、应用领域,采用结构化的复合三元组形式,并实现资源库系统的可视化展示。
其他文献
随着互联网技术的不断发展,人工智能也成为了一个热门课题,而智能问答系统也是人工智能领域里的一个研究热点。网络技术的发展也带来了整个互联网信息量的爆炸式增长,问答系统可以帮助用户可以从繁杂的信息中找到自己所需要的;同时,在电商网络领域,智能问答系统的研究可以帮助提高智能客服的准确性,具有很好的实际应用价值。目前,对于传统的问答系统研究大都采用基于检索匹配等方式,该方法存在着对不同场景的适应性欠佳、对
Hastelloy X哈氏合金具有优异的抗氧化性、延展性和高温强度,广泛用于燃气涡轮发动机中的燃烧区隔热罩、燃烧室和排气管等领域。本文使用激光增材制备Hastelloy X合金及石墨
随着中国经济的发展,尤其是国家对文化软实力的重视,中国丰富的人文景观以及优美的自然风光引得越来越多的外国友人纷至沓来。由于旅游产业的蓬勃发展,对于旅游陪同口译人员的需求也是与日俱增,口译员在中外文化交流的过程中起着至关重要的作用。本篇报告旨在探究如何将释意理论应用在导游陪同口译中。释意理论认为口译的对象是意义而非语言。这就要求译者必须专注于意义的理解与表达,而不是寻求语言形式的对等。且译员不必拘泥
本文关注低合金高强钢在海洋大气环境中的应力腐蚀(SCC)问题,通过基于SCC机理的微合金元素设计来降低海洋工程中低合金高强钢的SCC风险。首先采用真空冶炼和热机械轧制技术制
随着文本数据的不断增加,越来越需要使用自然语言处理技术来处理文本信息。多数中文自然语言处理任务要先进行分词才能进行下一步处理,分词结果对后续工作有很大影响,所以中文分词成为自然语言处理的基础任务。中文分词技术不断进步,从词典规则方法到统计学习方法,再到深度学习方法,分词中的难题不断被解决。深度学习方法是现在中文分词的主流方法,解决了统计学习方法中特征工程的问题,主要采用的结构是双向长短记忆网络,这
随着互联网大数据时代的到来,图像数据作为其中重要的数据形式得到了大规模的增长。面对如此庞大的图像数据,如何快速且高精度的对其进行高效检索,进而满足用户对感兴趣图像的快速浏览和查询需求,是目前亟待解决的问题。深度学习是大数据时代应运而生的产物,是人工智能领域必不可少的关键技术,并且可以有效地从大数据中自动学习特征。同时,图像分类技术可以在一定程度上对图像数据进行自动分析与理解,进一步达到与用户的认知
明代是中国文献辨伪学持续发展时期,在这一时期内,诞生了宋濂、杨慎、方以智、胡应麟、梅鷟等文献辨伪学大家。文章以宋濂的辨伪学思想及其著作《诸子辨》为主要研究内容,首
广义逆自提出以来,各国学者对其进行了深入的研究,它在算子理论,数值分析,特征值扰动,密码学,Markov链等领域有着广泛的应用.研究过程中,学者们又提出很多新的广义逆,如核逆,
地理学科是自然学科之一,是指在世界范围内,某地区、国家中的自然环境、山川河流、水文气候、社会要素的综合性学科。地理学科研究的是地球表面的各类自然景观与人文现象,属
随着信息技术的快速发展,越来越多的信息充斥于人们的生活当中,“信息过载”成为当下的热门话题,为了解决这一问题,个性化推荐系统应运而生。IPTV平台和网络视频平台中的视频