PDF论文的重编辑与处理系统的研究与开发

来源 :湖南大学 | 被引量 : 0次 | 上传用户：bluebird2000

【摘要】

：

自从PDF文档问世以来,以其诸多的优良特性已经在学术界和工业界被广泛的使用。大量的文档资料以PDF格式被存档,读者只需要借助任意的PDF阅读器就可以方便的浏览其中所包含的信息。随着科技和文化的飞速发展,学术界已经积累了海量以PDF格式存档的论文,这其中绝大多数的论文内容的排版结构都是可以适配于PC端,在PC端可以渲染出良好的效果。目前移动互联网时代已经来临,各式各样的移动设备已经普及,由于移动设备

【作者】

：

金鹏

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2021年07期

【关键词】

：

PDF格式学术论文编辑处理系统移动设备文本信息渲染内容排版 PDF文档提取学术界

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自从PDF文档问世以来，以其诸多的优良特性已经在学术界和工业界被广泛的使用。大量的文档资料以PDF格式被存档，读者只需要借助任意的PDF阅读器就可以方便的浏览其中所包含的信息。随着科技和文化的飞速发展，学术界已经积累了海量以PDF格式存档的论文，这其中绝大多数的论文内容的排版结构都是可以适配于PC端，在PC端可以渲染出良好的效果。目前移动互联网时代已经来临，各式各样的移动设备已经普及，由于移动设备不受时间和空间的约束同时具备良好的交互性等优势，越来越多的人群倾向于通过移动设备浏览和获取信息。然而PDF格式文件一旦被生成，其包含信息的排版格式是固定不变的，对于在PC端渲染良好的PDF学术论文，并不一定适合在屏幕尺寸较小移动设备上，这使得PDF学术论文在移动设备端的阅读体验大打折扣。
　　本文以学术界PDF格式论文作为研究对象，介绍了当前PDF文档格式的转换技术，PDF包含信息的提取技术和渲染技术，同时对系统中涉及到的处理流程进行深入分析，设计了高效的处理模型用于优化系统的处理能力提高系统的处理效率。本文完成了对PDF学术论文多种格式的转化工作，并借助现有技术对PDF论文的内容进行分块处理，设计了基于HTML文档树的文本信息抽取算法和渲染样式信息的抽取算法，将提取出的本文信息按照一定的顺序结构进行重排版，同时对控制文本的渲染信息进行过滤处理，使得渲染信息能够良好的控制文本信息的渲染样式，最后将排版后的内容基于HTML格式作为输出结果。总的来说，本文的工作是提出一种高效的解决方案，使得PDF论文能够在移动设备端被渲染得更优雅。
　　最后对系统进行实际测试，验证了本系统可以自动化的对PDF论文的内容进行提取，而后对提取出的内容进行编辑排版，使得排版后的内容在移动终端能够达到较好的展示效果，本文的研究内容有利于使PDF文档在移动设备端呈现更加友好的渲染方式，同时对PDF文件文包含文本信息和非文信息的提取工作开阔了新的思路。

其他文献

用实“活字典”提高组织工作质量

中共中央印发的《中国共产党组织工作条例》（以下简称《条例》），是组工干部做好新时代党的组织工作的基本遵循，我们不仅要在学深悟透上下功夫，更要在贯彻落实上出实招，全面推动组织工作高质量发展。　　要在提升组织力上下功夫，构建严密的组织体系。要统筹推进各领域党组织建设，认真贯彻执行党支部工作条例和农村、机关党组织等工作条例，在有形覆盖的基础上推进有效覆盖。一是大力推进党支部规范化建设。坚持和完善民主生

期刊

基于属性基加密的可搜索加密协议研究

近年来，随着互联网产业的快速发展，每天数以万计的数据从各类应用中产生。而物联网、工业4.0以及机器智能等技术的不断成熟，更使得数据的价值不断凸显。云存储服务因存储量大、计算空间大、存取方便、价格低廉等优点成为许多公司和个人的优先选择。然而，深受欢迎的云存储也存在着一些安全性与数据隐私问题，这些问题在机器学习和大数据分析等相关技术被深入研究与应用的当今时代变得尤为危险。
　　“可搜索加密”能够同时保证数据的安全性和实现密文数据下的查询服务，是解决云存储中数据安全性问题的一项重要技术。而在利用云存储的应

学位

属性加密协议搜索数据安全授权中心问题时间开销关键字查询细粒度访问控制安全性正确性分析存储

以党建为统领打造硬核智慧城管队伍

大连智慧城管监督指挥中心担负着大连市主城区300平方公里1345个网格智慧监管任务，负责为应急、安全生产、营商环境等城市基础建设运行方面提供重要信息数据保障，是大连市受住建部和国家文明办直接调度监督，直连直通国家城管的唯一綜合性城市管理平台。面对党和人民赋予的使命责任，大连智慧城管监督指挥中心党支部始终坚持以“党建铸魂、奋斗筑梦”为指引，积极探索“以党建为统领全方位打造一流智慧城管中心”的新实践新

期刊

基于生成对抗网络的人脸图像反取证方法研究

随着图像处理软件的普及，复杂的计算机图像处理技术能制作出逼真的计算生成图像，单用肉眼难以区分计算机生成图像和自然图像。因此，计算机生成图像和自然图像来源取证研究应运而生。然而，当前的取证方法大多都是通过3DMax、Maya和Photoshop等计算机生成软件产生的计算机生成图像来进行性能评估，很少考虑对生成对抗网络产生的计算机生成图像的检测能力，因此利用生成对抗网络实现图像来源反取证研究具有十分重要的意义。
　　本文首先介绍了数字图像来源取证技术与反取证技术的研究背景、意义及研究现状，综合分析出目前

学位

计算机生成图像对抗网络实现人脸图像反取证技术自然图像取证方法视觉质量计算机图像处理技术数字图像实验结果能力

提升研究生培养教育质效

高校研究生教育要紧紧围绕“培养什么人、怎样培养人、为谁培养人”这一根本问题，立足立德树人根本任务，坚守育人初心，勇担时代使命，为培养可堪大用、能担重任的栋梁之才提供坚强保证。　　以培根铸魂为目标，推进“课程+”育人。研究生教育在培养创新人才、提高創新能力、服务经济社会发展、推进国家治理体系和治理能力现代化方面具有重要作用。在研究生的诸多素质中，“德”的素质是摆在第一位的。要以习近平新时代中国特色

期刊

以组织振兴推动乡村振兴

实施乡村振兴战略，是以习近平同志为核心的党中央从党和国家事业全局出发作出的重大决策部署，是新时代“三农”工作的总抓手，是“三农”工作重心的历史性转移。各级党委要切实提高政治站位，加强农村党建工作，充分发挥农村基层党组织在乡村振兴中的领导作用，坚持建强阵地、建好队伍、健全体系，以组织振兴推动乡村振兴。　　建强农村基层党组织这个“主阵地”，把习近平新时代中国特色社会主义思想转化为推动乡村振兴的强大力

期刊

以科技创新引领高质量发展

科技创新是企业的灵魂，是企业持续发展的制胜法宝。本溪鹤腾科技发展有限公司（以下简称“鹤腾科技”）、辽宁亿通钢塑复合管制造有限公司（以下简称“亿通管业”）、辽宁壹立方砂业有限公司（以下简称“壹立方砂业”）作为本溪市以科技创新引领高质量发展的典型代表，紧紧抓住科技创新这个“牛鼻子”，实现了高质量发展，探索走出了一条向科技要效益的发展新路。　　主要经验做法　　紧盯市场需求，研发具有竞争力的新产品。三家

期刊

善于把方向抓大事

我有过四年党委书记、两年半党委副书记的任职经历，我感到，企业要有效贯彻民主集中制原则，就必须善于把方向、抓大事，切实从宏观上谋篇布势、统筹全局。　　把住方向，防“偏”。坚持集体领导、把握正确方向是贯彻民主集中制的首要职责。一是安稳方向要把牢。务必把安全生产和保持稳定摆到重要位置，强化企业主体责任落实，特别是要狠抓安全隐患排查，牢牢守住安全生产底线。安全欠账是较多老国企、老军企共性现象，要改变重人

期刊

基于商品评论的细粒度用户观点演化研究

随着智能设备和社交媒体的快速发展，电商平台已经成为人们日常生活中不可缺少的组成部分。面对日益激增的交易数据，推荐系统有利于用户更快地筛选产品。在现在的电子商务领域中，在线评论和打分信息能够帮助用户进行更好的购买决策，因此，如何更好地利用这些信息成为一个关键的挑战。近年来，已经有大量的研究人员开始致力于探索用户的评论、打分、偏好和行为信息，深入挖掘用户的喜好，从而为用户进行更加个性化的推荐。
　　然而，现有的研究对用户偏好和商品属性的动态演化尚缺少深入理解和量化分析。此外，现有研究还没有进行方面级的细

学位

品评论细粒度用户观点商品属性动态特征时间间隔模型数据集动态预测预测问题分割算法信息

做实组织工作“点、线、面”

营口市站前区坚持把问题导向贯穿党的建设制度改革全过程，通过找准症结、开好药方、提实措施，不断强化顶层设计、系统设计、制度设计，做实新时代组织工作的“点、线、面”。　　把好用人源头关，定好政治过硬“中心点”。紧盯干部群众最关心、最关切、最关注的干部选拔任用工作，认真执行新修订的《党政干部选拔任用工作条例》和省委“一个意见、七个办法、两个通知”规定，坚决把好人选政治关、作风关、能力关、廉洁关。进一步

期刊

PDF论文的重编辑与处理系统的研究与开发

与本文相关的学术论文