NEMTF:基于多维度文本特征的新闻网页信息提取方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:mario2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前主流的网页抽取方法存在两大问题:提取信息类型单一,难以获取多种类新闻信息;多依赖HTML标签,难以扩展至不同来源。因此提出一种基于多维度文本特征的新闻网页信息提取方法,利用新闻文本的写作特点划分出写作特征、语义特征和位置特征,通过多通道卷积神经网络融合为多维度文本特征,用于提取多种类新闻网页信息;仅需少量数据集训练,就可提取新来源的新闻网页信息。实验结果表明该方法在性能上高于当前最优方法。
其他文献
针对无线传感器网络中能量受限的特点,提出了基于时空相关加权目标函数粒子群优化算法(SC-WOFPSO)的分簇协议。首先,该协议使用Kohonen神经网络提取节点间的数据相似性。在分簇过程中,该协议综合考虑了节点间的数据相似性、节点间距离以及节点剩余能量等因素,使用PSO算法进行迭代寻优,寻找最优的簇头集合。在成簇过程中,网络中的非簇头节点为每个簇头分别计算Goal函数值,选择加入函数值最大的簇头。
期刊
针对司法领域标记数据匮乏、标注质量不高、存在强逻辑性导致裁判文书量刑情节识别效果不佳的问题,提出了一种基于反绎学习的量刑情节识别模型(ABL-CON)。首先结合神经网络与领域逻辑推理,通过半监督学习方法,使用置信学习方法表征情节识别置信度,然后修正无标签数据经过神经网络产生的不合逻辑的错误情节,再重新训练识别模型,以提高识别精度。在自构建的司法数据集上,与BERT、SS-ABL等模型进行对比,AB
期刊
指纹探测作为网络侦察的重要组成部分,是攻击者成功实施网络攻击的先决条件。针对攻防双方在指纹探测过程中的博弈对抗特征,设计了一种新型对抗攻击者指纹探测的欺骗机制,并通过建立不完全信息动态博弈模型有效刻画指纹探测欺骗过程,在此基础上讨论了欺骗指纹生成的基本方法。针对扩展指纹库规模导致的解空间爆炸问题,提出了一种基于遗传算法思想的智能指纹混淆算法,两阶段最优策略选取算法(TSOSA,Two-Stage
期刊
利用城市大数据发现社区结构是城市计算中重要的研究方向。有效表示面向“15分钟生活圈”社区的结构特征,可以细粒度地评价生活圈社区周围设施情况,有利于城市规划建设、创造宜居的生活环境。本文定义了面向“15分钟生活圈”的城市社区结构,采用表示学习方法获取生活圈社区的结构特征。提出了生活圈社区结构的嵌入表示框架,框架中利用居民的出行轨迹数据确定兴趣点(POI)与居民区的关系,构建反映不同时段居民出行规律的
期刊
伴随着植物交配系统从异交向自交演化过程,植物花性状和基因组结构呈现自交综合征.本文系统探讨了形成有关综合征的理论基础与分子机制,分析了交配系统与不同进化过程互作基本理论.自交导致有效群体大小、突变率、重组率以及选择功效降低,但漂变效应、连锁不平衡等增强.这些理论较好地解释了同义和非同义突变相对比值变化、转座子数量变化、基因家族成员遗传相关性以及基因组结构特征.虽然分子标记被应用于交配系统参数估计,
期刊
软件安全的根源在于软件开发人员开发的源代码。伴随软件的规模和复杂性不断提高,仅靠人工检测漏洞代价高昂且难以扩展,而现有的代码分析工具有较高的误报率与漏报率。为此,本文提出了一种基于代码属性图的自动化漏洞检测方法以进一步提高漏洞检测的精度。首先将程序源代码转换为包含语法、语义特征信息的代码属性图;然后使用关系图卷积网络对图结构进行表示学习;最后训练神经网络模型预测程序源代码中的漏洞。为验证所提方法的
期刊
不法分子利用洋葱路由器(Tor)匿名通信系统从事暗网犯罪活动,为社会治安带来了严峻挑战。Tor网站流量分析技术通过捕获分析Tor匿名网络流量,及时发现隐匿在互联网上的违法行为进行网络监管。文章提出一种基于自注意力机制和时空特征的Tor网站流量分析模型——SA-HST(Self-Attention and Hierarchical Spatiotemporal)。首先引入注意力机制为网络流量特征分配
期刊
针对现有电力物资配送路径问题(EVRP)优化时考虑目标函数较为单一、约束不够全面,并且传统求解算法效率不高的问题,本文首先充分考虑了电力物资配送区域的加油站分布情况、物资运输车辆的油耗等约束,建立了以电力物资配送路径总长度最小化、成本最低、物资需求点满意度最高为目标的多目标电力物资配送模型。其次,本文设计了一种基于深度强化学习(DRL)的电力物资配送路径优化算法DRL-EVRP求解该模型,该算法使
期刊
为了研究三次加权Lupa? q-Bézier曲线表示圆锥曲线, 讨论了三次加权Lupa? q-Bézier曲线是圆锥曲线的充要条件和分类情况. 在得到三次加权Lupa? q-Bézier曲线退化成二次加权Lupa? q-Bézier曲线的充要条件的基础上, 采用Wachspress坐标表示三次加权Lupa? q-Bézier曲线, 得到三次加权Lupa? q-Bézier曲线是圆锥曲线的几个充要条
期刊
针对现有语音混沌加密算法密钥空间小、安全性差、加密效率低且无法实现密钥复杂度与加密效率的权衡等问题,提出了一种改进Henon映射和超混沌的双重语音加密算法。首先,为了使Henon映射具有更大的混沌空间和更高的混沌复杂度,通过扩展控制参数范围将非线性三角函数作为输入参数变量等手段对经典Henon映射进行了改进;其次,利用改进的Henon映射生成伪随机序列,并对语音数据进行单次不重复置乱加密,获得语音
期刊