MAP Framework及其在中文分词中的消歧应用

来源 :桂林工学院 桂林理工大学 | 被引量 : 0次 | 上传用户:cao678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是各个学科不断融合,共同发展的一个世纪。人工智能科学也必将融入到多学科交叉的趋势之中。但是,人工智能的传统处理方法有着自己的局限性,这种局限性从根本上制约了人工智能的发展。自然语言处理作为人工智能的分支也遇到了类似的情况。文章首先对人工智能和自然语言处理的现状和困境进行了论述,认为人工智能和自然语言处理要从困境中走出,不能停留在传统中,必须在神经、认知和计算三个层次有所突破才行。 在神经层次,文章基于生物神经系统的进化和现代脑科学对人脑的研究,提出了大脑皮层功能分区形成假说,并用狼孩、左利手与右利手、说英语者与说汉语者等三个实例对假说进一步论证。根据这个假说,作者认为大脑内部应有一个统一的智能信息处理体系。结合认知心理学和Jeff Hawkins的记忆预测模型,在认知层次,文章提出了MAP Framework作为这个统一的智能信息处理体系框架。同时,认为联想在智能信息处理过程中起到了重要作用,记忆、联想、预测三个过程是MAP Framework的关键。文章对MAP Framework的基本组成和工作机制也进行了阐述。虽然MAP Framework目前比较粗糙,但从MAP中文分词系统看来,它具有一定的有效性和可行性。 MAP中文分词系统是作者基于MAP Framework智能体系框架设计开发的一个中文分词系统。这个分词系统具备短时记忆、长时记忆和工作记忆三层记忆体系结构,主要保存词汇和语料记忆,能够通过已设置的联想方式进行联想,最终得到预测结果,并通过机器学习不断更新记忆,通过记忆、联想、预测最后完成中文分词工作。文章最后的测试显示:通过大量的语料训练,MAP中文分词系统对实际测试语料进行分词测试,效果远好于正向最大匹配法和逆向最大匹配法。 由此可知,基于MAP Framework智能体系框架的MAP中文分词系统具有良好的分词能力,据此可信MAP Framework智能体系框架具有一定的可行性和有效性。而人工智能和自然语言处理等科学的研究,从神经、认知和计算三个层次上来入手,也应该是一条正确的研究途径。
其他文献
随着P2P和SIP在各自领域技术的不断发展,越来越多的研究机构和组织开始了将SIP和P2P网络技术相结合的研究,以达到使二者优势互补的目的。P2P-SIP系统就是利用P2P技术来实现原
随着我国网民数量的不断增加、“互联网+”概念的提出和网络安全上升为国家战略,网络安全逐渐成为互联网发展的重要组成部分。近期,Heartbleed、Bash漏洞、反射性DDoS攻击等
我国的对虾养殖在水产养殖业中占有非常重要的地位,随着计算机技术,信息技术及网络技术的发展,水产养殖也从最开始的传统养殖方式向着信息化的方向发展,对虾养殖也不例外。当
多处理器片上系统已成为下一代嵌入式系统发展的潮流。由于各FPGA器件生产厂商、开源组织、第三方芯片设计公司已开发了大量经过验证的优秀IP软核。因此,本文重点研究使用IP软
在传统的岩土工程位移测量中,专业测量相机一直是作业设备的主流,但其不但操作复杂,而且成本较高,大大的限制了数字摄影测量在岩土工程中的应用。近年来,随着CCD技术的不断发
由于系统级芯片SoC(System on a chip)具有高效的集成性能,是替代集成电路的主要解决方案,已经成为当前微电子芯片发展的必然趋势。SoC设计规模的不断增大也使得以IP核形式实现
网络信息安全问题越来越受到人们的关注,安全审计技术的研究成为解决这一问题的有效途径之一。安全审计的研究主要集中在对审计采集技术,审计分析技术和体系结构的研究。分布
无线传感器网络常用于在面积巨大或人类不易到达的区域监控周围环境的各种信息,近年来无线传感器网络一直是研究的热点,广阔的应用前景更使其越来越受到工业界的重视。在监控
实体间语义关系抽取是自然语言处理中的一个重要问题,不仅是信息抽取的一项主要任务,而且具有广阔的应用前景。核函数的研究和使用是当前机器学习研究领域的热门课题,树核函
数据仓库是一个面向主题的、集成的、反映历史变化的、相对稳定的数据集合,用于支持管理决策。它可以用来帮助客户对数据库中纷繁的数据进行有效地统计、分析,从而帮助客户进