论文部分内容阅读
手机的普及使短信息成为人们沟通联系的重要媒介,诈骗短信屡见不鲜。识别诈骗短信,防止上当受骗,重要性不容忽视。鉴于此,本文从语篇信息角度出发,通过对实验数据和语料库数据的分析,指出了21个有效的诈骗短信检测指标。本文研究目标有三。一是根据诈骗短信的语篇信息结构及特点对诈骗短信分类;二是探索诈骗短信的识别指标;三是分析诈骗短信运用的语篇信息策略。本文研究方法为定性和定量的结合。一方面以杜金榜教授的法律语篇树状信息结构模型为框架,借鉴美国学者Zhou的谎言识别指标量表,形成新的诈骗指标量表。另一方面组织实验,提出假设,分析实验数据;并从CLIPS中提取现实生活中收集的大量诈骗短信和与之作对比分析的真实短信形成比对数据库,而后用SPSS16.0进行聚类分析和T检验进行显著性检测,以得出可靠的诈骗短信识别指标。研究结果显示,信息点和信息层等语篇信息指标是极其有效的诈骗短信识别指标;另外,数量、复杂度、间接度等语言指标也呈现出显著性结果。各个指标的具体显著性程度在不同短信类别中有所不同。本研究是中文手机诈骗短信文本识别的大胆尝试,对于提高人们对诈骗短信的防范意识和以后进一步研究汉语短信诈骗有着重要的意义,对政府和手机制造商及运营商研发新的技术识别诈骗短信提供了帮助。