面向社交商务的大数据分析方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ltt3221340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,面向海量、异构和非结构化数据的分析技术得到越来越广泛的应用。社交商务作为一种新兴的电子商务模式,其融合了社交媒体的社交互动功能与电子商务的商务功能,并且已经成为重要的大数据来源,其蕴含的大量非结构化数据,尤其是文本数据具有极大的商业价值。在这些复杂的文本数据当中隐含着用户的喜好偏向、行为习惯、消费倾向等,对这些文本数据的分析可以很好地为社交商务中的社交购物和社交营销服务。在这种背景下,面向社交商务的大数据分析显得迫切和必要,本文围绕社交商务中的文本数据进行大数据分析。首先,分析了社交商务环境下商务数据的复杂性,其社交商务数据具有典型的大数据特征,并且对社交商务中的非结构化数据进行了分析,重点讨论了社交商务环境下的数据管理以及中文文本数据挖掘过程的复杂性,给出了中文文本数据挖掘的流程。其次,提出了利用Apriori算法抽取产品特征的方法,并应用于社交购物中的产品评论情感分析。在社交商务领域,众多的用户对众多的产品进行了纷繁复杂地评论,这些评论是非结构化的文本数据,复杂的非结构化特征使得用户在查看评论时遇到了很大的困难。基于此,对社交商务环境下的产品评论进行情感挖掘,提出一种利用Apriori算法来挖掘产品的频繁特征,并讨论如何对频繁特征进行剪枝操作以提高抽取的特征的有效性,利用语义词典HowNet来确定情感词的情感倾向。最后,提出了识别电商微博数据进行热点话题的EM-LDA综合模型。电商微博是一种非结构化的文本信息载体,但却具备不同于其他非结构化文本信息的特点,通过对电商微博的分析,提出了一种面向电商微博的EM-LDA综合模型。首先对电商微博依据是否含有哈希标签进行分类,将含有哈希标签的微博称为显式话题微博,并用ET-LDA模型进行主题挖掘;对于不含哈希标签的微博,称为隐式话题微博,通过细分此类微博的类型来改进LDA模型,提出IT-LDA模型。
其他文献
6月12日上午,由浙江老茶缘茶叶研究中心和吴觉农茶学思想研究会杭州联络处共同主办,临安市农业局承办的“2013天目青顶老茶缘端午茶会”在杭举行。原浙江省省长沈祖伦,原杭州
在美丽的皖南山区,有一块神奇的土地.它风光之雄、之秀、之幽、之古,它动植物之多、之珍、之奇、之异,令人叹为观止.生态专家称,它是洒落在安徽大地上的一颗最为神秘而璀璨的
随着信息技术的高速发展和信息管理理论的日益成熟,人们对于信息安全概念的认识,正经历一个从保密到保护,又发展到保障的趋近真理的发展过程。信息安全问题不仅仅由技术原因引起,它还涉及到人和社会的因素。因此,只靠技术是不能有效地解决信息安全问题的。只有依靠科学有效的管理和有着良好信息安全技能的人,实施综合规范的保障手段,才能取得良好的效果。传统信息系统安全风险评估从系统运行维护环境出发,分析其漏洞和威胁。
企业经营环境的变化是推动管理实践和管理理论不断发展的重要力量,作为企业主要的经营环境——资本市场的不断壮大和完善对企业管理的目标和行为产生了极大的推动作用,资本市场
改进新闻,是办好报纸的重要环节。我们党历来重视新闻报道。周恩来同志在1946年11月30日给廖承志等同志的信中指出:新闻必须有特点,如“具体生动”,“报道各地政治、经济、
真有必要用古树料作熟茶吗?自述:近两年来,市场上出现了一些自称用古树料制作的熟茶,班章、易武、景迈等等都有,价格都高得离谱,虽然量不多,但感觉有—年比一年增加的趋势。
改革开放以后,军工企业也必将进入了重要的转型时期,先后实施了调整、改造、搬迁、转化军工技术、开发民用产品、军品采购制度改革以及借鉴民品高新技术等措施。总的来说,当前对
金鹰国际集团,创立于1992年,是南京市批准的首家外资企业集团。历经23年快速成长,曾屡获国家最高荣誉。金鹰国际虏产集团,是金鹰国际旗下专业从事地产开发的专业集团,拥有虏
主要读者是农民的小报,在农村实行生产责任制的新形势下,怎样把宣传搞得尽可能通俗化,使所宣传的科技知识,既适合农民的需要,很有用,又让农民看得懂,愿意看,这是小报小办的