基于依存关系的中文微博作者性别识别

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户：yesw04

【摘要】

：

【目的】针对网络文本篇幅短小、传统文体特征集稀疏等特点,探讨依存关系在中文微博作者性别识别中的应用。【方法】选取腾讯公开微博作为实验语料,抽取依存关系特征与现有文

【作者】

：

祁瑞华

【机构】

：

大连外国语大学软件学院;

【出处】

：

数据分析与知识发现

【发表日期】

：

2004年期

【关键词】

：

依存关系中文微博性别识别

【基金项目】

：

国家社会科学基金一般项目“典籍英译国外读者网上评论观点挖掘研究”(项目编号:15BYY028);国家教育部回国人员科研启动基金项目(项目编号:教外司[2015]1098)的研究成果之一

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

【目的】针对网络文本篇幅短小、传统文体特征集稀疏等特点,探讨依存关系在中文微博作者性别识别中的应用。【方法】选取腾讯公开微博作为实验语料,抽取依存关系特征与现有文献中的词汇特征、结构特征、功能词特征、词性标注特征和微博特征进行对照实验。【结果】采用支持向量机、朴素贝叶斯、最近邻和决策树算法的对照实验验证了本文方法在中文微博作者性别识别任务中的准确率、召回率和F-Measure最高。【局限】依存关系在微博作者性别识别中的有效性还需在大规模语料上进一步验证。【结论】本文模型能够避免短文本特征集的稀疏性,与其他对照特征集相比,能更有效地识别作者性别。

其他文献

基于有限元法的阀门力学与密封性能分析

通过有限元分析方法，考虑各部件间的相互影响，建立闸阀系统级的三维非线性有限元模型。计算钛合金阀体、座圈与闸板在外载荷作用下的应力值和变形量，分析各部件的力学性能、密封

期刊

数值模拟有限元应力密封性能扭矩阀门

鄂尔多斯经济发展相关问题思考

本文对近年内蒙古鄂尔多斯市经济高速成长的优势及制约因素进行探讨,指出:鄂尔多斯市经济高速成长得益于其丰富的自然资源条件、我国经济崛起所形成的巨大能源资源需求及鄂尔

期刊

鄂尔多斯经济发展优势制约因素

文化语境下的专业术语的翻译——以《红楼梦》中的首饰加工工艺语的英译为例

《红楼梦》中的部分首饰的命名采用了"材料+工艺+功能"的模式,其中的工艺术语专业技术术语,在翻译的时候,特别要考虑到其表达的含意,因为这不仅关系到技术层面对等和再创造,

期刊

《红楼梦》工艺英译

聚马来酸酐和二氧化硅修饰的水溶性CdSe/ZnS荧光量子点的制备及应用研究

量子点作为一种新型的荧光材料，与传统的有机染料荧光物质相比，具有连续的激发光谱、窄的发射光谱、荧光寿命长、稳定性高、并且通过调节粒径大小和化学组成可以发射不同颜色的

学位

量子点配体交换法包覆法细胞标记生物检测

土壤团聚体水稳定性对水分运动过程影响的试验研究

良好的土壤结构和高团聚体水稳定性对提高土壤肥力，增加农作物生产力，提高孔隙度和降低抗蚀性是非常重要的。土壤团聚体稳定性的改善为提高有限的土地资源利用率、了解土壤结构

学位

土地利用方式水稳性团聚体供水方式入渗饱和导水率土壤有机质

周围型肺癌空洞MSCT表现与VEGF表达的相关性研究

目的：探讨周围型肺癌空洞的多层螺旋CT（Multi-slice computed tomography, MSCT）征象及其诊断与鉴别诊断价值。研究周围型肺癌空洞MSCT征象与血管内皮生长因子(vascular endothe

学位

周围型肺癌肺结核空洞体层摄影术X线计算机血管内皮生长因子

优化结构构思引导仿生建筑的创新设计

本文通过分析仿生建筑的发展现状,分别从自然、传统和地域的建筑特征;结构构思的意图表达能力;动态虚拟设计模拟与完善结构构思及经济价值与结构构思这几点探讨了如何引导仿

期刊

结构构思仿生建筑创新设计

翼伞设计及其气动性能研究

翼伞尽管因其优良的气动性能得到广泛的应用，但是针对翼伞的研究成果却远远低于以圆伞为代表的弹道型伞的研究成果，对于翼伞的理论研究主要集中在气动性能计算、飞行特性研究、

学位

翼伞翼型设计鼓包气动性能数值研究试验研究

谈网站的安全性管理

本文首先介绍了网络与网站安全的隐患,其中包括常见的网络安全隐患和网站自身经常出现的安全隐患,之后作者又简要介绍了网络安全的防御问题,并详细介绍了网站自身的安全防御

期刊

网站安全性管理

基于运动想象脑电信号非线性特性分析的脑—机接口研究

脑-机接口（Brain-Computer Interface，BCI）是一种帮助人们利用他们的大脑控制和使用外部设备的一种通信系统，在此过程中不需要外周神经和肌肉的参与。BCI是一门涉及神经科学、信

学位

脑机接口非线性特征近似熵相空间重构共空间模式

基于依存关系的中文微博作者性别识别

其他学术论文