海量标注语料库智能构建系统的设计与实现

来源 :现代计算机 | 被引量 : 0次 | 上传用户:wuchaoli87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
构建了一个基于海量语料库的智能标注系统,用于大规模语料数据的标注处理,系统主要用户角色分为管理员、众包标注用户和专家标注用户.采用三级标注的方法来保证语料标注的效率和准确度,众包标注用户在已经由算法预标注过的语料基础上进行二次标注,系统通过判断语料状态三元组的值来决定是接受该标注结果还是继续分发给下一个众包标注用户,或是将语料派发给专家用户进行标注.专家用户仅仅对困难语料进行标注,同时通过错误反馈进一步提高算法标注和众包标注的准确度.系统设定了三个自定义标注参数以适应不同标注任务,同时提供词性查询字典、用户留言、查询统计等辅助功能,操作界面简易、友好,应用结果显示该系统能较好的完成海量语料库的标注任务.
其他文献
内燃机供油系统主要包括高压油泵、高压油管、高压喷嘴,三者协调工作有助于燃机工作效率的稳定.为了实现对高压油管压力精确控制,本文从燃油流动的油量守恒和燃油物态特性方程出发,利用流体力学对高压油管的压力变化进行数学建模,确定油管压力变化规律.通过对模型求解,针对稳定压强下的单向阀,得到其开启时长为0.28 ms.同时,针对凸轮运动模型,确定其角速度为25 rad/s.
针对制造业批量型流水线上夹具对产品的适应性单一问题,本文论述了一种夹具设计方案.通过实际生产使用,该方案有效地解决了上述问题,同时生产效益得到大幅提高.