基于语料库的我国职业性别无意识偏见共时历时研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:haixinkp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
性别偏见是社会学研究的热点.近年来,机器学习算法从数据中学到偏见,使之得到更广泛的关注,但目前尚无基于语料库的方法对文本数据中职业性别偏见的研究.该文基于标记理论,利用BCC和DCC语料库,从共时和历时两个层面考察了63个职业的性别无意识偏见现象.首先,以调查问卷的形式调研了不同性别和不同年龄段的人群对63个职业的性别倾向,发现和BCC语料库中多领域的职业性别偏见度呈显著的正相关关系.然后从共时的角度,利用BCC语料库中不同领域的语料,以及DCC语料库中2018年全国31个省级行政单位(不含港澳台地区)的报纸语料,发现从口语至书面语语体,大部分职业表现出对女性的性别偏见逐渐升高,且不同地区对职业的性别偏见存在差异.最后,从历时的角度,利用DCC语料库2005至2018年的报纸语料进行统计分析,发现职业性别无意识偏见现象随着时间的推移,呈现总体弱化趋势.
其他文献
传统村落是承载中国农耕文化,体现乡土智慧的特殊聚落形态,是民间物质文化和非物质文化遗产的重要生存土壤和空间载体。经济社会的发展和快速城市化进程中,传统村落衰败、传
牛年话牛,牛属于哺乳纲,牛科,是一种革食性反刍家畜,无犬齿,上颚无门齿,鼻头光滑湿润,给人以温和之感.牛属有四种:普通牛、驼峰牛、牦牛、野牛,世界各地均有分布.rn我国亦多
期刊
知识表示学习在关系抽取、自动问答等自然语言处理任务中获得了广泛关注,该技术旨在将知识库中的实体与关系表示为稠密低维实值向量.然而,已有的模型在建模知识库中的三元组
智能推荐型对话系统通过丰富的交互方式与用户进行交流,首先收集用户兴趣和偏好,然后主动地向用户推荐其感兴趣的内容.因此,该类系统通常涵盖多种对话类型,如问答、闲聊、推
从海量生物医学文献中挖掘变异信息对生物医学复杂疾病研究具有重要意义.在当前的变异实体识别方法中,基于条件随机场模型的方法取得了不错效果并成为主流方法,但存在需要大
文章从BIM模型设计、协同管理和智能化施工设备三方面介绍了BIM技术在高速铁路隧道工程机械化智能建造方面的应用。该技术对于加强工程的管控、优化施工工序具有重要意义。
  由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战.现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练.本文提出一种基于
对于故宫的印象,我脑海里是五颜六色.红墙白雪琉璃瓦,雪中故宫美如画.走进故宫,映入眼帘是一大片红墙,飞檐峭壁矗立殿前,听钟楼声起,望城墙内外,惟余莽莽.阳春三月,草长莺飞,
期刊
属性是实体的重要组成部分,因此实体属性的获取是知识图谱构建的关键步骤。由哈尔滨工业大学社会计算与信息检索研究中心推出的开放域中文知识图谱《大词林》是通过从文本中自动挖掘实体及实体间的关系构建而成的,因此为《大词林》中缺少属性的实体添加属性也成为必须研究的问题之一。该文提出了一种解决方案:基于贝叶斯网络的概率统计模型,通过上位词概念与属性之间的依赖关系和实体与上位词概念的依赖关系来自动地为《大词林》中没有属性的实体添加属性,并与相似度计算方法对比证明了其有效性,可大规模提高《大词林》的属性覆盖率。
角色识别任务是近年来提出的一项自然语言处理任务,面向多方参与的对话场景,目标是将对话中的人物提及映射到具体的人物实体.目前在该任务的最优系统中,只使用了较为简单的编