【摘 要】
:
随着互联网的日益普及,问答社区(Community-Based Question Answering,CQA)已经成为用户信息获取与知识分享的重要平台。然而问答社区中大量的答案资源存在冗余度大、可信度
论文部分内容阅读
随着互联网的日益普及,问答社区(Community-Based Question Answering,CQA)已经成为用户信息获取与知识分享的重要平台。然而问答社区中大量的答案资源存在冗余度大、可信度低、不完整等质量问题。这些问题导致答案资源不能直接分享和再利用。虽然近年来对答案摘要和答案质量评价做了很多研究,但对其中答案不唯一的开放类问题的研究仍然不足。本文通过研究答案关键词获取和质量评价,在一定程度上解决开放类问题的答案片面、不完整等问题,从而提高答案获取质量,增加人们获取信息的效率。论文提出了一种基于多特征的跨领域的答案关键词提取算法,该算法综合了LDA主题模型、语义资源、统计特征以及上下文特征。首先使用主题模型获取领域种子关键词,然后通过两种方法对种子关键词进行扩充:上下文和同义词词典。与传统关键词获取和扩充方法相比,该算法得到的关键词规模和准确率都有一定程度提高。论文提出了一种基于语义的答案质量评价算法。首先利用领域关键词对答案进行过滤,然后使用卷积神经网络进行训练得到评价模型,最后使用该模型进行答案质量测试。通过“知乎”数据集的实验分析表明,与传统答案质量评价方法相比,本文算法的准确率有了明显提高。
其他文献
牛、羊肠道病毒感染为国内新近报道的动物传染病,其流行病学本底在国内缺乏。为了解牛、羊肠道病毒感染的情况,本研究应用双抗体夹心ELISA方法对采集于山东省某地区的奶牛、
分别采用聚醋酸乙烯酯、聚苯乙烯及聚甲基丙烯酸甲酯作致孔剂制备苯乙烯/二乙烯基苯共聚物(大孔树脂)。通过扫描电子显微镜与压汞法研究了这种大孔树脂的形态与孔结构。对大
重庆市城镇居民家庭恩格尔系数不断下降,表现出食品和衣着消费支出比重平稳下降、交通通讯支出比重持续增长、居住和医疗及娱乐教育文化消费比重升幅较大、家庭设备用品支出
碳源是微生物增殖最常见的物质和能量基础,污水中的碳源不应该粗暴去除,应该尝试资源化利用或生态净化处理。本文首先综述了污水中碳源资源化利用的思路、途径和现状;然后分
为确定冀东地区春小麦不同生育期各器官中主要矿质营养元素的吸收与分配规律,以春小麦品种冀张春3号为材料,研究了在盆栽试验条件下春小麦不同生育期、不同器官中Ni,Cu,Zn,Fe
关于哲学何为的问题,哲学史上有两种观点:一是认为,把握人与存在合一(或者说天人合一)的整体是哲学的最高任务;一是认为,哲学的最高任务只是认识外在的客观事物之本质。本文同意海德
对早脆王枣和冬枣两个鲜食枣品种结果习性进行了调查研究。结果表明:枣股有效结果年龄,早脆王为1-3年生,冬枣2~6年生。
运用线性回归分析方法及扩展线性支出系统(ELES)模型,分析研究重庆市居民消费行为与消费结构的变化及其原因,提出政府和企业面对新的消费环境的政策与策略.
毕业论文往往是本科生在学校期间完成的最后一项学业,其代表的是学生们整个大学的学习成果,往往毕业论文的选题、形式、内容和考核的方式都和本专业有着密切的联系,但是现如
安定区气候冷凉,适宜于马铃薯生产。引进耐旱抗病及适宜于主粮化的品种,能够加快品种更新,促进安定区马铃薯产业发展。试验引进中晚熟马铃薯新品种10个,以‘陇薯6号’为对照,