切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于HTML5语义化标签的Web文本提取技术
基于HTML5语义化标签的Web文本提取技术
来源 :贵阳学院学报:自然科学版 | 被引量 : 0次 | 上传用户:gaoyeye
【摘 要】
:
本文通过研究新Web标准网页的数据结构,并在信息抽取技术的基础上,提出了一种基于HTML5语义化标签的网页正文提取技术。该技术能够有效的过滤掉与网页主题无关的噪音信息,从
【作 者】
:
韦佳佳
【机 构】
:
安徽机电职业技术学院信息工程系
【出 处】
:
贵阳学院学报:自然科学版
【发表日期】
:
2017年3期
【关键词】
:
网页
文本抽取
HTML5
语义化标记
Web
Text extaction
HTML 5
Semantic tags
【基金项目】
:
2015院级青年教师发展支持计划教科研项目(项目编号:2015yjjy022).
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过研究新Web标准网页的数据结构,并在信息抽取技术的基础上,提出了一种基于HTML5语义化标签的网页正文提取技术。该技术能够有效的过滤掉与网页主题无关的噪音信息,从而能有效提取有价值文本信息。
其他文献
国外图书馆PDA实践案例分析与国内高校图书馆实施策略探析
文章在分析国外PDA案例的基础上,从读者决策采购产生的背景、英国Nottingham Trent Universily PDA项目、国内高校图书馆实施PDA项目面临的问题等方面进行探讨,围绕促使PDA项目
期刊
PDA
高校图书馆
用户需求
PDA
university library
user's requirement
其他学术论文