基于图神经网络的商品HS编码分类方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:Roy163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着跨境贸易的快速发展,商品的协调制度(Harmonization System,HS)编码分类作为企业进出口贸易的重要海关程序,其准确性和高效性越来越受到相关部门的重视。如果能够自动、准确、高效地进行商品HS编码分类,将有助于海关部门通关查验、关税计算等工作的顺利进行,同时也可以帮助企业提高通关效率,降低通关成本。商品HS编码分类任务可以看作是一个文本分类任务,即给定商品的一段描述信息,目标是确定商品所属的由HS编码表示的类别。然而与一般的文本分类任务相比,商品HS编码分类任务更具有挑战性。首先,商品描述文本具有特定的组织结构。其次,商品描述文本包含多个独立的语义片段而不是一个统一的、连续的语义主题。此外,分类标签(即HS编码)之间具有隐藏的层次关系。本文着眼于商品HS编码分类任务面临的挑战,对商品HS编码分类方法开展研究。首先,针对商品描述文本的结构特点和现有文本分类方法特征捕获不全面的问题,本文提出了一种融合文本序列和空间信息的HS编码分类模型(TSSINN)。其中,针对商品描述文本在两个层次呈现出序列性的特点,设计了一种序列信息建模方法捕获文本中多层次的序列信息。此外,设计了一种基于文本图的空间信息建模方法,利用整个语料的词共现信息构建全语料文本图,并为每个商品抽取一个对应的商品文本图。利用图神经网络建模图中词节点间的空间关系,捕获文本中的空间信息。最后通过融合文本序列特征和空间特征来实现最终的分类。其次,本文在TSSINN模型的基础上,进一步挖掘商品描述文本的全局空间信息和标签空间的层次相关性约束,提出了结合标签层次结构的HS编码分类模型(HScode Net)。针对TSSINN模型对文本中远距离依赖考虑不足的问题,本文设计了一种全局空间信息建模方法来学习文本中远距离的空间关系,捕获文本的全局空间信息。此外,针对TSSINN模型尚未考虑标签空间隐藏的层次相关性约束的问题,设计了一种标签相关性损失函数,通过计算任意标签与样本之间的相关性得到样本的真实标签分布,并通过拟合标签分布的方法优化整个模型。最后,本文在四个真实的海关数据集上开展了大量的实验。实验表明,TSSINN模型的分类性能明显优于基线模型,而进一步优化后的HScode Net模型在TSSINN模型已经取得较优分类效果的基础上又获得了明显的性能提升。总体而言,本文提出的HS编码分类方法能够有效地结合商品描述文本的结构特点和标签空间的层次结构,捕获文本中的序列信息和空间信息,最终实现对商品HS编码的准确分类。
其他文献
人脸聚类是利用未标记人脸数据必不可少的工具,在人脸数据库构建、人脸图像标注等方面具有广泛的应用。一般来说,人脸聚类效果的优劣,主要受到所采用的特征提取方法和聚类算法设计这两方面的影响。随着深度学习在人脸识别上的应用,深度面部模型已经成为目前主要的人脸特征提取方式。现有多数人脸聚类算法是基于卷积神经网络提出的,聚类规则采用相似性度量,但卷积神经网络更适合处理欧式空间的数据,因此,如何有效学习到不同簇
随着数据通信业务量的指数级增长,人们对高速无线技术的带宽和质量要求不断提高,云无线接入网(Cloud Radio Access Network,C-RAN)前传链路的容量受限问题难以忽视,为降低数据存储对带宽的需求,本文将压缩感知(Compressed Sensing,CS)技术应用到C-RAN前传受限链路,并进行射频拉远端和基带处理池功能分配,减少了C-RAN前传链路负载,提升了传输信号的恢复精
近些年来,多智能体系统的协同控制被广泛应用于智能机器人、无人机编队、人造卫星等领域,引起了诸多学者的注意。目前,多智能体系统的协同控制问题主要包括一致性控制、编队控制和包含控制等,在此类问题的研究中,智能体之间的信息传递是至关重要的。通常情况下,我们用拓扑图来表示智能体之间的通信关系。在以往的研究中,多智能体系统的通信拓扑大多被假设为固定拓扑,而考虑到多智能体系统所处操作环境的复杂性,智能体之间的
实际工程系统往往都设有物理安全边界,例如流水线工业系统,风力发电系统,电力系统,高铁系统等,运行过程中系统自身状态受物理边界严格约束,以确保长期稳定可靠运行。一旦这样的物理约束装置被忽略或发生故障,系统就面临超界运行风险甚至发生重大安全事故。随着工业生产复杂化,相应的生产装置和系统的非线性特性日益凸显,系统参数不确定性也随之增加,系统控制器设计难度也随之增加。因此,针对具有参数不确定的非线性系统的
定位技术是实现移动机器人自主导航的关键技术之一。视觉SLAM是一种同时完成定位与地图构建的技术,目前得到了越来越多的应用和研究。针对视觉SLAM在一些室内场景无法有效定位的问题,通常借助自身算法框架的冗余性完成重定位。但是该方法导致了定位实时性的下降,当机器人快速移动时,这种影响尤其明显。为了避免冗余的算法框架对视觉SLAM定位实时性的影响,本文通过引入IMU来辅助视觉SLAM,实现多种工况下机器
头部运动障碍或头部下垂综合征(DHS)在许多运动神经元疾病中十分常见,患者的颈部肌肉发生退行性减弱,使得抬头或移动头部变得十分困难。目前该疾病没有较好的治疗方法,主要使用颈托设备来缓解头部下垂的症状。然而,颈托使得头部的运动受到局限,也不能按照患者想要的移动方向进行调整。因此,研究一种可以实现临床治疗、功能全面、康复机理完善、操作方便的颈椎康复机器人,对于治疗、康复头部下垂综合征有着重要意义。本文
不均衡分类问题在实际生产生活中频繁出现,如生物信息学、电信或金融风险评估和文本分类等。传统分类器由于期望整体精度最大化,常常忽略少数类(样本较少的类别)的分类精度,然而少数类的分类精度往往比多数类(样本较多的类别)更为重要。针对这一问题,一种有效的解决方法是基于数据增强将不均衡数据恢复为均衡数据。这种方法的目标是生成具有较强类判别性和多样性,且真正有助于分类器构建的少数类新样本。然而,在不均衡数据
标记分布学习是一种新的可以用来解决标记多义性问题的学习范式,是对单标记学习和多标记学习的进一步泛化,已经成功应用于人脸情感分析、头部姿态识别以及人脸年龄估计等领域。在标记分布学习的标记集合中,标记间关系广泛存在并且有助于提升标记分布学习性能。因此本文从标记间关系这一角度出发,对标记分布学习展开深入研究。首先,针对局部标记间关系展开研究。当前存在的利用局部标记间关系的算法都服从一个假设,即样本之间的
闭链连杆式移动机器人是一种具有大尺度变形能力,高越障能力的地面移动机器人。目前对闭链连杆式移动机器人的研究主要集中于论证移动的可行性,对于其移动能力及评价体系仅有较少的涉及。本文从平面6R单环运动链的理论研究出发,对平面6R单环运动链为基础构造的闭链连杆式机器人的移动进行数学建模并进行了运动学分析、动力学分析和步态规划,提出6R机器人移动理论,新理论得到了这种运动链连续移动和越障过程的步态通解,并
随着科学技术的发展,各行各业对材料以及结构的安全性要求日益提高。由于材质自身缺陷以及长期受到各种载荷的影响,材料和结构在生产及服役的过程中会产生各种类型的缺陷,比如裂纹、孔洞以及夹杂等,进而导致重大安全事故,造成人员伤亡和巨额财产损失。因此发展有效的无损检测技术至关重要。超声检测技术由于其具有灵敏度高、穿透能力强、缺陷定位准确、操作简单、对人体无害等优点被广泛应用。但是该方法针对复杂形状缺陷的定位