基于FCM的文本迁移学习算法

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:a273582760
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的机器学习方法是在训练数据和测试数据分布一致的前提下进行的,但在一些现实世界中的应用中,训练数据和测试数据是来自不同领域的。在不考虑数据分布的情况下,传统的机器学习算法可能会失效。针对这一问题,提出一种基于模糊C-均值(FCM)的文本迁移学习算法。通过简单分类器对测试样本分类,利用自然邻算法构建样本初始模糊隶属度,再利用FCM算法通过迭代更新样本模糊隶属度,修正样本标签,对样本孤立点进行处理,得到最终的分类结果。实验结果表明,该算法具有较好的正确率,有效地解决了在训练数据和测试数据分布不一致的情
其他文献
(一)发病情况2013年10月17日,开县某养羊场从四川简阳引进大耳羊312只,体重都在25kg左右。引进4 d后发现1-2只轻微咳、流浆液性鼻液、食欲不振、精神沉郁。3d后,有不同程度发病
随着经济的发展和社会的全面进步,我国正进入现代畜牧业建设的新时期,畜牧业生产结构也正从食粮型向草食型和节粮型的方向发展。以羊为主的草食家畜,其数量和规模在不断增加,
鸭传染性浆膜炎在鸭中较为常见,属于一种比较严重的传染性疾病,如果不能及时发现和治疗,将会对影响鸭的健康成长,同时也会影响养鸭场的经济效益,因而,及时对鸭进行检查,对传染性浆膜
猪圆环病毒病己成为养猪业危害较为严重的疾病之一,各级各地都加大了该病的防控力度,为使广大养殖从业者更加全面深入地了解本病,科学合理的预防疾病发生,减少疾病经济损失,本文从
传统的属性基加密方案中存在着访问策略所包含的属性会泄露用户的敏感信息以及恶意用户泄露私钥获取非法利益而不会被追责的问题。同时私钥长度、密文长度和解密运算量均会随属性数量增加而带来较大的通信开销和计算开销。针对以上问题提出了一种可追踪且隐藏访问结构的属性基加密方案。该方案在不影响加/解密效率的前提下提高了加密算法的安全性,并采用双因子身份认证机制实现了更安全高效的访问控制。并且引入一个安全的签名机制
否定选择算法(NSA)是免疫检测器生成的重要算法。传统否定选择算法在亲和力计算过程中未考虑不同种类抗原关键特征与冗余特征之间的差异性,存在算法检测性能较低的问题。对此,提出了一种基于抗原软子空间聚类的否定选择算法(ASSC-NSA)。该算法首先利用抗原软子空间聚类计算出不同种类抗原的各个关键特征及其权值,然后通过这些关键特征引导检测器生成以有效地减少冗余特征的影响,从而提高算法检测性能。实验结果表
随着社会经济不断发展,我国畜牧养殖行业发展迅速,其中牛养殖业无论是养殖规模还是养殖技术,均有了长足的发展和提高,对于牛养殖过程中的疫病鉴别及综合防治科学性和有效性,
牛羊等反刍动物在贪食大量易发酵的食物后,瘤胃中会集聚大量气体导致瘤胃胀气,往往牛都会出现呼吸困难或是心脏麻痹等一系列的状况。此时就需要及时的对病牛进行医治,无论是瘤胃
针对符号序列聚类中表示模型及序列间距离度量定义的困难问题,提出一种基于概率向量的表示模型及基于该模型的符号序列聚类算法。该模型引入符号序列的概率分布表示法,定义了一种基于概率分布差异的符号序列距离度量及该模型的目标函数,最后给出了一种符号序列K-均值型聚类算法,并在来自不同领域的实际应用序列集上进行了实验验证。实验结果表明,与基于子序列表示模型的符号序列聚类算法相比,所提方法在DNA序列和语音序列
现代畜牧业在实际放牧中依靠定位设备对牲畜进行管理。为了从牧区牲畜海量日常移动轨迹中挖掘出潜在的有用价值,提出一种新的基于轨迹速度扰动划分与聚类方法。该方法首先将连续定位轨迹以所设速度阈值进行划分;然后以聚类方法将所划分轨迹数据进行地理位置聚类,识别出牲畜不同生活区域。为处理海量数据,以云计算进行数据挖掘。最后为展示各区域不同强度,以核密度分析法对不同轨迹聚类区域进行可视化。理论与实验表明,提出的方