一种基于SVM的英/美式英语的文本分类方法

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:zfx523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语是国际上常用的语言。目前,经常使用的英语是英式英语和美式英语。但是从词汇到语法,它们都有根本的区别。在学习英语的过程中,人们必须确保他们要学习的英语类型。因此,该研究建立了一个文本分类系统,可以根据文本中使用的英语类型对句子进行分类。其核心是使用N-gram特征、字词频率反转文件频率加权(TF-IDF)和附加字词字典作为特征。在TF-IDF加权过程中,给出了文档频率(DF)的阈值。并采用线性核支持向量机(SVM)算法进行分类。实验结果表明,得到的最佳分类精度为96.53%。
其他文献
针对传统酒店经营管理中信息化程度低,难以有效利用客户数据的问题,提出为中小酒店建立以客户服务质量为中心的CRM酒店管理系统。根据酒店行业的CRM需求和数据类型,采用星型和雪花型的数据库结构,利用customenRFM和inhotel事实表记录客户的RFM价值和消费情况。在进行客户数据挖掘和提取中,通过数据仓库和K-means聚类算法对客户类型进行精确划分,从客户类型、价值分析和满意度方面为酒店管理做出决策,提供可视化的数据支持,实现酒店服务质量和经营利润的提升。理论和实际应用结果表明,采用基于CRM的酒店
移动互联网环境下,对海量用户数据行为的研究,可以提升用户数据的应用价值,促进商业模式的创新。大数据环境下为满足对内对外应用支撑能力以及数据开放共享能力需求,在PaaS技术应用下完成多用户架构,建构相应的大数据云化平台,支撑大数据平台能力开放建设。在PaaS技术下完成大数据云化平台的建构,完成整体架构,实现能力集成、多应用类型的分层调度、多租户及其资源调度管理以及全局优化的YARN调度技术,在完成的平台应用实践分析中发现,这一系统不但满足了相应的技术需求,同时在硬件资源准备时间、开发工具准备时间、数据准备时
随着物联网技术快速地发展、成熟,以单片机为主的智能化小车逐渐在国防、探险、巡查等多个领域崭露头角,在防控排爆、生产安全隐患巡检等领域可以采用智能化小车来替代人工操作。文中设计了一种基于STM32单片机的智能交互式平衡小车,该平衡小车以STM32F429ZTI6作为微机控制中心,使用OV5640摄像头、MPU6050陀螺仪、STM32F103最小系统、SYN7318语音模块实现图像处理、语音人机交互功能,使用MPU6050陀螺仪、TB6612电机驱动模块、稳压模块、HC-SR04超声波模块实现小车平衡、动力
为满足当前高校学生舆情监督的工作需要,针对传统网络舆情采集系统的舆情信息采集效率低下、质量差等问题,设计和开发了一套基于爬虫技术与语义分析的网络舆情采集系统。该系统通过主题网络爬虫对互联网上感兴趣的资源数据进行爬取,同时利用语义分析中的向量空间模型(VSM)算法对采集到的网页数据进行进一步过滤,充分保证所采集到的舆情数据的质量。系统的各项性能试验测试结果表明,文中所设计的系统能够按照用户需求在保证效率和质量的情况下,较好地完成互联网舆情信息采集,验证了系统的可行性。
现有的变压器故障推演系统推演误差大、故障诊断时间长,为此,基于大数据关联挖掘技术设计了一种新的变压器故障推演系统。利用防火墙、特殊交换机、信息数据库组建系统硬件环境,然后通过关联分析、故障诊断、聚类推演实现软件推演程序的设计。实验结果表明,与传统系统相比,基于大数据关联挖掘的变压器故障推演系统能够更有效地降低推演误差,缩短诊断时间。
目前提出的医院档案管控系统档案管控分类精准度较低,导致管控安全率较差。基于XGBoost算法设计了一种新的医院档案管控系统,对系统的硬件和软件进行设计。系统硬件由病历文件管理模块、个人病历管理模块、病历统计管理模块组成,软件部分设计了程序数据库、系统登录程序、Web浏览器。通过实验验证了系统的有效性,实验结果表明,基于XGBoost算法的医院档案管控系统能够有效提高管控分类精准度,增强管控安全性。
在线教育因其系统化、海量化、便捷化以及可以实现精准推送服务而被广泛应用。传统的课程推送模型通常依靠深度学习算法进行模型训练,利用其特征提取学习能力对系统的隐藏特征进行提取。在解决抓取数据过程中出现稀疏问题的同时,也对计算机性能提出了更高的要求,模型训练需要耗费大量的时间。文中针对上述传统课程推送模型算法的不足,将多层神经元模型算法与个性化推荐算法进行结合,并对课程数据进行训练验证。实验结果表明,文中所建立深度神经网络推荐模型的MAE值相较于传统算法有明显的下降,同时训练迭代次数也大幅减小,说明提出的算法模
针对抗干扰系统智能集成效果差的问题,在无人机技术下设计一种新的自然场景抗干扰规划系统.选择Parrot AR Drone 2.0操作平台作为无人机的运行平台,采用树莓PI轻量级的数据处
针对高校大学生的心理动态管理问题,基于网络与数据库等大数据技术,文中提出了具有较高可靠性和准确性的心理预警动态管理系统。通过详细分析当今高校大学生心理问题的产生与原因,制定了科学、有效的心理动态管理机制与模式。在此基础上,利用Hadoop与HDFS技术建立了具有较优实时性的动态管理平台,同时引入SQL数据库软件技术,实现了大学生心理问题的查询、记录和预警等数据处理功能,形成了以校园网为共享平台的心理预警动态管理系统。实验与数据测试结果表明,该系统可以完整地实现设计功能且运行良好,所得出的分析结果与数据也具
群体医疗数据的分析技术对于提高区域医疗资源利用率有着重要的意义,特别是对于高职院校等集体生活人数较多的特殊群体,智能化的数据分析可以有效保障群体的健康水平。文中针对群体医疗数据中的影像数据,提出了一种卷积自动编码器深度学习框架,并建立了医疗数据分析系统。该方案通过未标记的数据实现了对肺结节的无监督图像特征学习,且该过程仅需要少量的标记数据即可进行有效的特征学习。综合实验测试数据结果表明,该方案的性