【摘 要】
:
随着中国互联网技术的快速发展,手机网络新闻用户的规模逐年增加,用户需求体验也不断提升,这对使用数字技术生产和加工新闻的方法提出了更高的要求。如何从爆炸式增长且杂乱无序的新闻来源中低成本的生产出数量巨大、内容准确无误的新闻,需要互联网新闻资讯的生产方式发生改变。本文以新闻资讯的生产方法为切入点,以机器学习算法为理论基础,提出了一种基于多种算法融合的新闻自动推荐配图的方法。首先运用基于词袋模型的逻辑回
论文部分内容阅读
随着中国互联网技术的快速发展,手机网络新闻用户的规模逐年增加,用户需求体验也不断提升,这对使用数字技术生产和加工新闻的方法提出了更高的要求。如何从爆炸式增长且杂乱无序的新闻来源中低成本的生产出数量巨大、内容准确无误的新闻,需要互联网新闻资讯的生产方式发生改变。本文以新闻资讯的生产方法为切入点,以机器学习算法为理论基础,提出了一种基于多种算法融合的新闻自动推荐配图的方法。首先运用基于词袋模型的逻辑回归分类器将新闻文本二分类为配图上有文字的新闻文本和配图上无文字的新闻文本,然后针对不同的分类结果分别进行基于二类型文本相似度计算交叉融合的配图推荐和基于BP(Back Propagation)神经网络的配图推荐。前者分别用曼哈顿距离和潜在语义索引LSI(Latent Semantic Indexing)算法进行相似度计算,并将结果进行了交叉融合,为用户自动推荐与文本内容最匹配的10张图片。后者将图片和文本特征拼接作为输入特征,以预测图片和文本之间的关系,最后根据预测关系为用户自动推荐与文本内容最匹配的10张图片。该方法能够在新闻加工和生产的过程中减少人工匹配和校对的时间,促进了“机器+人工”的新闻资讯生产方式的发展,从而进一步推进了图片与文本之间的关系研究。
其他文献
心电信号是人体心脏电生理活动的反映,自从上世纪初心电图机问世以来,人们一直致力于通过心电图进行心脏疾病的研究。随着信息技术的发展,利用计算机结合人工智能技术进行心电信号的自动分析已经得到广泛应用。然而由于心电数据采集环境的限制以及医生诊断可能存在的错误,心电信号自动分类领域存在训练样本错误标记的问题,会使得心电分类成为弱监督学习,分类器会被严重破坏,分类准确率明显降低。本文针对这一问题提出了基于交
高压直流输电具有传输容量大、调节输送功率的大小和方向方便、运行稳定性高、线路投资少、可连接异步电网等优点,其发展日益受到重视。随着柔性直流输电技术的日益成熟,交联
本文是在介绍了矩阵空间保持问题的发展概况及必要的基本概念之后,对主理想整环上的对称阵模上保秩相等关系的线性映射进行了研究,主要工作如下:(1)刻画了主理想整环上的对称
【摘 要】激发中职学生的斗志,是我们教学任务中的重要目标之一。励志教育在课堂上的实施,是通过在富有魅力的教学活动中逐步激发学生内在的精神动力,引导学生确立正确志气,促进学生的思想觉悟,形成良好的学习氛围。 【关键词】励志;中职;教师 【中图分类号】G630 【文献标识码】A 【文章编号】2095-3089(2018)15-0263-02 在中国的中职学校的学生特点是:一是学生学习成绩较低,