中文网络产品评论的特征抽取及观点分类研究

被引量 : 0次 | 上传用户:rttrthjfds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展使信息的传播和共享越来越便捷,人们现在既可以在商业网站上发布产品评价,也可以在论坛、博客、社交网络等媒体上对几乎任何事物发表自己的意见或者看法。在信息分享方便和快捷的同时,网络上提供的大量用户评论信息也导致了人们获取有用信息比较困难。所以,采用现有的技术对这些评论信息进行挖掘研究,获取有价值的信息有着重大的意义。论文针对这类问题进行了研究,主要完成了以下工作:对现有的网络产品评论挖掘的相关理论和技术进行了深入细致的研究,从研究分类到技术支持,从研究框架到相关算法,并进行了对比分析;在现有研究的基础上,分别采用传统文本分类方法和加入观点词汇库的方法进行了观点分类的研究,采用机器学习的方法进行实验并对结果进行了评估;从语义的角度出发,采用频繁模式抽取和PMI信息检索算法相结合的方法来提取产品特征,并进行了实证性的研究,给出了自己的结论和建议;构建了集成产品特征抽取技术的观点分类系统的分析和设计框架,将挖掘结果以可视化的形式展现给用户,帮助用户进行决策分析和判断。论文严格按照设计科学的研究方法,对于论文提出的方法都进行了实验验证,并对结果进行了分析。相对于其它中文产品评论挖掘的研究而言,论文主要有以下三个创新点:(1)提出了通过构建观点词汇库的方法来进行观点分类,以达到优化传统文本分类方法在观点性文本分类中的应用。论文以酒店评论为例,运用机器学习的方法,通过构建观点词汇库,构建了小型领域观点词库,对传统的文本分类结果进行了优化;(2)从观点挖掘的粒度出发,提出了产品特征级别的观点分类问题,通过关联分析技术挖掘频繁特征,结合语义的方法对挖掘结果进行修正;(3)将产品的特征抽取与观点分类结合,提出了集成的系统分析与设计框架,针对抽取出的产品特征进行观点分类,提高分类的准确度,并以可视化的结果展现给用户。
其他文献
基于山西省平顺县白马小流域标准坡面径流小区的观测试验,以裸地作为对照,运用统计学分析方法,对不同降水量和降雨强度下典型植物措施坡面的产流产沙量进行对比,同时分析各坡
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
目的:本课题以专科护士为目标,以岗位需求为导向,参考《专科护理领域护士培训大纲(试行)》、《新入职护士培训大纲(试行)》文件要求,并借鉴临床医学《住院医师规范化培训内容
随着指人类词缀不断涌现并参与构造新词,指人类词缀逐渐成为现代汉语类词缀研究中一个重要的组成部分,也因此成为了学术界研究的热点。但由于汉语词缀的独特性和复杂性,学者
“顺手”是现代汉语中一个使用频率较高的词,本文将从历时和共时的角度,对“顺手”一词的词汇化和语法化进行考察,并运用比较分析法,将副词“顺手”和“顺便”进行句法、语义
目的对门冬胰岛素用于妊娠期糖尿病的有效性及安全性进行探讨,分析临床意义,从而更好地指导临床工作。方法选择该院收治的110例妊娠期糖尿病患者作为研究对象,随机分成实验组
2002年6月,湘西里耶古城出土了大批的秦代簡牘,數量共計36000余枚,幾乎相當於此前出土的秦簡總量的10倍。該批簡牘內容涉及範圍甚廣,為研究資料匱乏的秦代史提供了寶貴的“同
在矿业活动结束后,附近的水环境、土壤环境、大气环境都会受到不同程度的破坏,使矿山环境修复治理工程十分繁重。因此,人类在进行矿山活动时,要格外重视可能引起的环境问题,
<正>习近平总书记指出:"推出一批能叫得响、立得住、群众认可的硬招实招,处理好改革‘最先一公里’和‘最后一公里’的关系,突破‘中梗阻’,防止不作为,把改革方案的含金量充
马丁·路德是德国著名的宗教改革家、神学家和《圣经》翻译家。他用通俗、明了、大众化的德语翻译了《新约》和《旧约》,因此,他的《圣经》德译本被誉为第一部“民众的圣经”。