基于数据挖掘的网络小说价值预测分析

来源 :沈阳航空航天大学 | 被引量 : 5次 | 上传用户:tom_7758
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着2015年网络小说改编热潮的爆发,大量由网络小说改编的影视剧获得巨大成功的案例让人们看到了网络小说所蕴含的巨大商业价值,版权运营商纷纷寻找购买有商业价值的网络小说版权,一度引发版权争夺大战,甚至炒出天价版权,引起人们的广泛关注和激烈的讨论。在版权竞争中,为了避免和减少由于盲目竞价所带来的必须要承担的投资风险,对网络小说的商业价值有一个准确的预测和估计是影响企业出版商做出正确决策的依据,也是非常有必要且有意义的。由于目前国内针对网络小说的研究以定性研究为主,缺乏对网络小说的定量研究和分析,针对这一现状,本文从隐藏价值量和热度两方面对网络小说进行定量预测分析,为企业出版商正确判断网络小说商业价值提供依据。具体研究工作如下:(1)研究网络小说隐含价值量预测。首先确定能够反映网络小说隐含价值量的变量,根据在电影和电视剧的预测研究中分别选用电影票房和电视剧点播量为预测对象的启发,本文选择用网络小说的总点击量来反映网络小说隐含价值量,选择自变量进行数值预测研究。采用M5模型树算法、线性回归算法和决策表算法对比预测,预测的结果显示M5模型树拥有更准确的预测结果。同时发现应该对网络小说总点击量起推动作用的网络小说推荐量却呈现负相关关系。而在创作前期,网络小说总字数对网络小说总点击量的增长同样呈负相关关系,当字数达到临界值后才会开始呈现正相关关系,本文针对这些与人们惯性思维认识不相符的现象进行了详细的分析,做出合理的解释。(2)研究网络小说热度。由于采用单一维度表征网络小说价值具有局限性,因此在内容分发网络的应用背景下,本文从阅读基群、阅读收益和阅读讨论三个维度综合定义了网络小说热度的概念,对在起点中文网爬取到的网络小说数据进行预处理,根据幂律分布的数据拟合规律,建立热度等级评价标准,分别采用贝叶斯网络、随机森林算法与Logistic回归建立预测模型,对网络小说进行热度预测对比研究。结果显示,随机森林算法的预测正确率达到97.097%,均方误差为0.1128,分类预测效果更优,且误差率更低。对网络小说热度的预测不仅为内容分发网络的内容副本部署提供决策依据,提高内容分发网络的服务质量,同时补充了从单一维度表征网络小说价值的局限性,更深入客观的识别网络小说价值,为企业运营商运营决策提供支持。
其他文献
为适应行政伦理学的发展,以行政伦理研究脉络的逻辑展开为线索看,有三个理论问题尚需进一步研究,这就是厘清行政伦理的价值根源、明确行政伦理的价值核心以及寻求实现正当与
<正> 一、从几件与公民权利有关的事例谈起 事例一:1995年12月,浙江医科大学作出一则决定,从1996年起该校不招收吸烟学生,其理由是:吸烟是当今世界公认的三大不良生活习惯之
企业信息化建设过程中经常出现信息化管理失效、信息化投资回报低、信息设备和信息资源浪费的情况,这些现象的产生与信息化绩效评价缺失有着重要的内在联系。积极提升企业信
萤石是氟工业的重要原料,根据伴生矿物组分不同,萤石矿可分为石英型、方解石型、重晶石型以及多金属共生型等4种类型,归纳总结不同类型萤石矿的浮选工艺技术研究现状,有利于
针对以传统的软件开发方法开发出的软件安全程度低的情况,提出了基于主动防御技术的软件开发方法设计。本文从软件安全角度出发,对软件领域需求分析,确定需要使用服务的应用
方位知觉和空间定向是语言空间认知研究的重要内容之一,不同民族或族群对空间关系的认知因对事物的审美和环境能动认知的视角差异而不同。本文以云南省昆明市禄劝县彝语东部
《庖丁论书》是萧娴日常书写阐发的片段性散论。虽是片断性的论言,但却能发人深省。今择其四则转录如下:1.我这庖丁,在中国书坛一角,劳动有四分之三世纪,同书翰结下不解缘,同
一个人学会说英语的前提主要是学会听。听在人们的交际中占45%,说占30%,读占16%,写占9%,这些数据都充分体现出了听是人们学习英语中的最基本形式。听不是一种消极接受信息的
“人设”的标签化预设契合大众文化传播浅表性、碎片化的特点,使“人设”传播迅速成为流行的大众文化传播现象;“人设”的文化商品属性主要指向经济价值;“人设”的生产体现