【摘 要】
:
本文介绍自组织中文语义映射网络,并分别基于集合论、代数理论和概率论研究和提出六种不同的特征编码方法,这对自组织语义映射效果有很重要的影响.通过性能评价得出如下结论:
【机 构】
:
清华大学计算机科学与技术系智能技术与系统国家重点实验室,CommunicationsResearchLaboratory
【基金项目】
:
国家重点基础研究发展计划(973计划),国家自然科学基金,国家高技术研究发展计划(863计划)
论文部分内容阅读
本文介绍自组织中文语义映射网络,并分别基于集合论、代数理论和概率论研究和提出六种不同的特征编码方法,这对自组织语义映射效果有很重要的影响.通过性能评价得出如下结论:使用TFIDF修正的频率密度编码能得到最佳效果,其语义映射的精确度和召回率分别为94.4%和90.7%,而基于向量模型的方法则都不适用于中文自组织语义映射.文中给出结果分析.另外比较实验结果表明文中的最好方法其系统性能好于目前广泛采用的分层聚类技术,并远好于多元统计分析技术,例如主成分分析的特征降维编码.
其他文献
于今年4月被“双规”的福州市副市长杨爱金,6月中旬被调查出,他有17套房产证。被撂倒的贪官似乎都有收集房产的癖好,比起以下落马的高官,杨爱金的17套房,根本上不了“台面”。 浙江省药监局原局长黄萌,曾任湖州市市长,于2011年6月27日15时左右,被纪检部门带走调查。据《北京晚报》评论版内容,黄萌被查有84套房产。 2011年12月,山东省原副省长黄胜因涉嫌严重违纪,中央决定免去其领导职务。据
关广富 男,满族。1931年12月出生,黑龙江省穆棱市人。曾担任中国共产党第12、13、14届中央委员。中共湖北省委书记.湖北省人大常委会主任。著有《社会牢义银行》、《现代农业发
本文介绍了一个基于转换翻译的汉日机器翻译系统中日语生成子系统的设计和实现.文章首先描述了一种基于格关系的汉语依存分析树,分析树结点记录语法语义以及格关系信息;然后,
在2009年新的竞争形势下,中小美容企业如何赢在市场?《财智》名家专栏特请著名营销策划人李志起先生用理论结合案例的形式,为大家深入剖析市场,并提出建议及策略。每期一个关键词