【摘 要】
:
最近几年,智能手机发展势头猛涨,已经成为继广播、电视、报纸和互联网之后的新一代的媒介形式。通过智能手机收发邮件的频率飞速增长,加之垃圾邮件的肆掠扩散并没有遏制反而
论文部分内容阅读
最近几年,智能手机发展势头猛涨,已经成为继广播、电视、报纸和互联网之后的新一代的媒介形式。通过智能手机收发邮件的频率飞速增长,加之垃圾邮件的肆掠扩散并没有遏制反而愈演愈深,电子邮件运营商以几何级数的速度不断提升邮箱的容量。面对海量的邮件和频繁入侵的垃圾邮件,因此邮件自动分类就显得具有较高的实用价值。基于电子邮件内容的手机电子邮件自动分类技术,是数据挖掘中文本分类技术的一个重要应用。因此,首先从文本预处理、文本提取和中文分词等技术的概念以及文本自动分类的背景着手,系统地探讨电子邮件自动分类的流程和步骤,深入研究了实现手机电子邮件自动分类系统所涉及的理论和技术。对于涉及到文本分类的关键技术,包括中文分词、特征提取、词频统计、向量空间模型和分类算法,本文给出了详细的理论阐述和算法描述。由于是基于K近邻算法的改进算法,重点探讨了K近邻算法,并针对其缺点即选择阈值K的盲目性,提出了基于矩阵奇异值分解的K近邻算法。该改进算法基于矩阵奇异值分解技术,能够通过粗分和细分两个阶段快速获取训练样本和估计K值,然后有针对性的选取一定数目的样本作为训练样本,这种基于后验的训练样本训练出来的K近邻分类器,通过java语言实现了一个具有海量运算能力的电子邮件自动分类器,最后进行实验,验证了该分类器的查全率和查准率。
其他文献
现代机械设备对性能的要求越来越高,其结构也越来越复杂,机械装备的发展日趋大型化和自动化。在机械设备中,齿轮箱作为连接和传递动力的通用零部件,被广泛的应用现代工业设备中。在工程实践中,我们期望对齿轮箱故障的发生能够做到防微杜渐,不希望亡羊补牢般地处理事故。因此,研究有效的齿轮箱早期故障诊断技术,定量诊断故障程度并预测故障扩展趋势和齿轮箱剩余寿命,具有重要的社会意义和经济价值。小波分析是当前数学中一个
在当今的现实生活中存在着很多种微信息量的数据,如何采集这些数据中的信息并进行利用,成为了数据分析领域里一个新的研究热点。机器学习方法是处理这样的数据的理想工具。随机
本文考虑了两类非线性抛物方程解的渐进性质及平衡态.首先我们考虑了一类多孔介质方程解的全局存在与爆破条件.对于该方程在初始能量E(uo)
直觉模糊集和区间直觉模糊集作为模糊集的推广,在处理不确定问题中有着广泛的应用。在模糊理论和模糊系统的研究中,截集发挥着至关重要的作用,一直受到国内外学者的广泛关注。本
贴近度是不确定性数学理论及其应用中的重要概念之一,在模式识别、图像处理、模糊推理、决策分析等领域中具有着广泛的应用.在不确定性数学理论中,关于模糊集的贴近度理论及应
本文基于齿轮啮合原理及随机振动理论,在不考虑齿面摩擦的情况下,采用集中质量法,建立直齿圆柱齿轮传动系统四个自由度的简化模型,在该模型中,由于参数的随机扰动和随机激励的存在,使得确定性的系统变为随机系统,针对系统中随机参数作用的具体特点,建立新的齿轮系统非线性模型,研究随机参数下齿轮传动系统的响应和随机外激励下系统的响应,并结合MATLAB软件对齿轮传动系统的响应进行仿真分析。本文的主要内容有:1.