基于多维语义的互联网药品信息抽取的研究与应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:dgsbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来互联网药品市场随着电子商务的发展日益扩大,但随之而来的隐患也在不断加剧。面对互联网上充斥的大量不规范甚至是虚假的药品信息,监管部门急需一种先进的互联网药品信息监测手段来加强对这个市场的规范管理。为此,复旦大学和清华大学成立了“互联网药品信息管理及智能监测技术与系统研究开发”联合课题组,对相关技术进行了深入研究,并取得了突出的研究成果。目前已有的互联网信息抽取技术普遍存在着需要过多人工干预、灵活性适应性不足等诸多缺陷,无法适应不断产生的新信息源。本文针对互联网药品信息的特点,在大量调查研究以及相关工作的基础上,提出了一种基于多维语义的互联网药品信息抽取方法,通过从多个维度描述与互联网药品信息抽取相关的语义信息,来屏蔽不同药品信息发布网站在网页内容以及结构上的异构性、找出其共性。同时,利用了基于信息熵理论的结构语义熵算法来对网页中的药品信息进行准确识别与定位。本文详细介绍了多维语义词典以及信息抽取系统的设计思路与实现,并且通过实验对文中提出的方法进行了实验验证。实验证明,该方法可以在大大降低人工干预的同时,具有较高的准确率与召回率,并且可以自动识别未知网站内的药品信息,具有较高的灵活性与适应性。应用本文提出的基于多维语义的互联网药品信息抽取方法以及系统框架,可以为实现准确、全面、实时、自动的药品信息监测提供数据支持,为政府监管部提供智能化的监测手段,对其规范市场、保障百姓的用药安全有着重要意义。
其他文献
报道用左金丸加味治疗吐酸112例,含高酸性胃炎69例、浅表性胃炎26例、胃溃疡17例,结果治愈48例,显效11例,无效5例,总有效率92.2%。
山西天脊煤化工集团年产25万吨硝酸铵钙项目于2010年11月25日开工建设,同时开工的还有年产13万吨苯胺项目,这两个项目是山西煤化工“十二五”发展规划首个开工的、全国唯一完整
教育就是培养习惯,要教育学生凡事从细节入手,从平时的一言一行、一举一动出发,养成良好的行为习惯。养成良好的行为习惯和学习习惯,对孩子的成才会起到促进作用,从小养成良
目的:观察山茶油治疗婴儿尿布性皮炎的应用效果。方法:64例尿布性皮炎的婴儿随机分为两组各32例。治疗组臀部涂山茶油,对照组臀部涂鞣酸软膏,观察两组的治疗效果。结果:治疗组治
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
从级数和的定义、幂级数和函数的性质、常见函数的幂级数展开,以及Fourier级数理论等多种途径可以来求级数和函数.
在对国家质量标准、专业规范和国际认证标准进行比较的基础上,分析了新形势对建设管理类本科专业人才培养的新要求,以及国家质量标准对建设管理类本科专业创新人才培养的要求
陈旧性肛裂倒“V”形皮瓣移植术是一种有所创新的手术方法。手术特点是充分利用原术式切除废弃的赘皮外奔(哨兵痔)上被有的皮肤做成一“ ”形皮瓣,向上向内翻盖在肛裂梭形溃疡切
作为新时期下开展体育锻炼的重要目标与核心要求,增强体质与提升广大青少年的脑功能发展已经成为了现阶段每一名学生家长以及教练员所追求的基础。在各项体育锻炼当中,孩子们
沙特石油部副部长阿卜杜拉·阿齐兹·本·萨利姆今天在此间表示:作为OPEC的重要成员,沙特可以充分满足中国经济持续发展所带来的对石油资源日益增长的全部需求。