非平衡文本情感分类的数据集设计与评价指标

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:SoDoLa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着非平衡分类问题研究的深入,训练数据与测试数据如何划分成为一个值得思考的问题。针对非平衡文本情感分类数据集设计问题,通过下采样方法,对测试数据集设计了平衡与非平衡两种方案,给出了在不同任务需求下,选择相应的实验方案,并对验证分类器分类性能的评价指标进行了讨论。通过在真实的网络评论数据上的实验,验证了这些方案的合理性和适用性。
其他文献
1故障起因某ZK6100HGM宇通公交客车,搭载玉柴YC6J210N-30天然气CNG单燃料气体发动机,装有三元催化转化器。该车行驶了2.76万km后,起动着车运行途中,发觉动力明显下降,中速行
本刊今年第五期曾以《日本8驱电动客车带来的启示》为题,介绍了日本正在研发的8轮驱动电动客车。10月26日,这款客车在日本横滨市正式亮相了。
论文以CSSCI(1998-2010)收录的题名包含“数字图书馆”的来源文献和被引期刊论文为样本,统计论文产出机构及其相关数据,从发文量、被引量、高被引文论文量等多个角度,揭示国内数字
论文提出了一种云环境下基于满足用户分析的数字图书馆虚拟机部署策略。该策略能够改善服务器资源的利用效率,减少数据中心能量损耗,并降低数据中心运营成本。
论文在对海南省地方文献资源状况进行调研分析的基础上,提出了本省地方文献资源建设的关键在于尽快从宏观、微观和中观三个角度,实现多层次、多形式、全方位省内外良好有效的多
目的利用双通道视觉质量系统研究强脉冲激光(IPL)对睑板腺功能障碍(MGD)的治疗效果。方法选取2016年10月至2017年10月在武汉大学人民医院眼科中心确诊为MGD患者20例(40只眼)
目的对复方樟柳碱联合降糖药物治疗血管性假性视乳头炎的可行性及依从性进行研究,为临床治疗提供指导。方法选取我院2013年3月至2014年3月间治疗的糖尿病伴血管性假性视乳头炎
目的:根据重型肝炎发病的临床特点,探讨其中医辨证的原则和方法,制定重型肝炎的辨证标准。方法:回顾性调查湖北中医学院附属医院(国家中医肝病医疗中心)1985年1月~1999年10月
车辆底盘集中润滑系统作为省时、省工、延长车辆使用寿命的重要装置,自20世纪80年代起,在国外已得到了普遍应用,如奔驰、沃尔沃等已将其作为标准配制,而在国内由于该系统技术
近日在美国汽车混合动力系统开发中具有优势的艾里逊变速箱公司,获得了美国能源部"2009美国复苏和再投资"法案颁发的6280万美元奖金,用于继续设计、开发和制造具有价格竞争力