论文部分内容阅读
21世纪是各个学科不断融合,共同发展的一个世纪。人工智能科学也必将融入到多学科交叉的趋势之中。但是,人工智能的传统处理方法有着自己的局限性,这种局限性从根本上制约了人工智能的发展。自然语言处理作为人工智能的分支也遇到了类似的情况。文章首先对人工智能和自然语言处理的现状和困境进行了论述,认为人工智能和自然语言处理要从困境中走出,不能停留在传统中,必须在神经、认知和计算三个层次有所突破才行。
在神经层次,文章基于生物神经系统的进化和现代脑科学对人脑的研究,提出了大脑皮层功能分区形成假说,并用狼孩、左利手与右利手、说英语者与说汉语者等三个实例对假说进一步论证。根据这个假说,作者认为大脑内部应有一个统一的智能信息处理体系。结合认知心理学和Jeff Hawkins的记忆预测模型,在认知层次,文章提出了MAP Framework作为这个统一的智能信息处理体系框架。同时,认为联想在智能信息处理过程中起到了重要作用,记忆、联想、预测三个过程是MAP Framework的关键。文章对MAP Framework的基本组成和工作机制也进行了阐述。虽然MAP Framework目前比较粗糙,但从MAP中文分词系统看来,它具有一定的有效性和可行性。
MAP中文分词系统是作者基于MAP Framework智能体系框架设计开发的一个中文分词系统。这个分词系统具备短时记忆、长时记忆和工作记忆三层记忆体系结构,主要保存词汇和语料记忆,能够通过已设置的联想方式进行联想,最终得到预测结果,并通过机器学习不断更新记忆,通过记忆、联想、预测最后完成中文分词工作。文章最后的测试显示:通过大量的语料训练,MAP中文分词系统对实际测试语料进行分词测试,效果远好于正向最大匹配法和逆向最大匹配法。
由此可知,基于MAP Framework智能体系框架的MAP中文分词系统具有良好的分词能力,据此可信MAP Framework智能体系框架具有一定的可行性和有效性。而人工智能和自然语言处理等科学的研究,从神经、认知和计算三个层次上来入手,也应该是一条正确的研究途径。