论文部分内容阅读
摘要:随着社会不断的进步与发展,生物信息学也在不断的发展,但是生物信息学的发展需要生物数据的有力支持。生物数据中的生物信息挖掘主要依赖于日益发展的电子计算机技术与大数据技术。在大规模的生物数据信息中对相关的生物信息进行挖掘,能够有效的利用生物数据信息为研究者提供相关疾病的研究机制。本文主要对大规模生物数据中的生物信息挖掘技术的研究意义进行概述,然后对生物信息挖掘技术的应用进行相应的解析工作。
关键词:大规模生物数据;生物信息;挖掘技术
由于社会不断的变化发展,生物信息学也在不断的发展,对生物学领域的研究导致了生物数据的多样性出现,在大规模生物数据中进行生物信息的挖掘,能够建立生物数据库,为人类的基因研究、蛋白质、以及相关疾病的研究提供有力的信息基础。所以要对大规模生物数据中的生物信息挖掘技术进行研究,促进我国生物学领域的发展。
一、生物信息学的研究意义
生物信息学是以计算机学科、信息技术以及数学理论、统计方法为基础的综合性学科。通过计算机技术对生物学的相关数据进行分析、研究、整理、显示与存档,能够建立生物信息学数据库,为生物领域的基因研究、蛋白质研究提供相应的信息支撑。
生物信息学的发展将会对生物领域带来巨大的影响,通过对基因组学。蛋白质组学的研究,能够影响社会各领域的发展。通过生物信息学的相关信息,嫩够为农业新品种的出现带来科学的理论基础,在医学领域中蛋白质的研究能够促进新疫苗的产生,攻克医学上的疾病。通过生物信息学的相关知识,可以使更多的人了解到在生物的基因中会携带各种各样的生物信息,基因片段与蛋白质或者病菌相互作用,将会导致疾病的产生。学者们了解相关知识后,能够结合生物信息学的知识设计出新的药物,攻克更多的疑难病症。
二、大规模生物信息挖掘技术的应用与解析
DNA微阵列技术主要是以原位合成技术或者是合成技术后的点样法为基础,将DNA的探针片段固定在支持物的表面。将其与荧光标记的生物进行杂家,然后对荧光发出的信号进行扫描,最后得到不同的基因片段所要表达的内容。
使用这种方式首先要进行阵列的设计工作,为了使测量的据银族的基因放到芯片上,一般情况下使用酵母菌等简单的生物进行基因的测量工作。因为简单的生物基因片段较少,方面研究。
其次是进行芯片的制备工作,在这一过程中首先要选择芯片的载体。例如,膜、玻璃片、硅片等,这些材料能够保障DNA探针片段能够在载体的表现稳定的与目标分析杂交。
然后,要进行样品的制备工作,在样品制作的过程中,一般情况下生物样品不能直接和芯片进行反应的,在所以在样品制作的过程中首先要进行RNA的提取工作,然后从RNA中提取mRNA。但是要注意在反应的过程中并不是mRNA直接进行反应,还需要将其转变成为cDNA才能进行反应。所以在标记的过程中要将cDNA进行标记,在标记的过程中要进行红色的标记,因为在检测的过程中仪器主要是根据特定的波长范围进行激光的照射,红色的荧光标记在反射的过程中更加的灵敏。
再次进行杂交反应,将样品制作完成后与芯片进行研究,在杂交的过程中要在42℃的保温箱中进行1-2h的反应。其中芯片中的DNA探针、荧光标记靶都会影响结果。
最后要进行微阵列数据的反应,首先要对微阵列的数据进行获取。在信息获取时,主要使用的是Affymetrix公司生产的基因芯片,在原始数据生成的过程中文件名的后缀一般是CEL形式的,在这类文件中记录的是芯片扫描后的荧光数据点的信息。但是在计算的过程中这种格式的数据信息不能直接进行数据挖掘算法,所以要对数据进行进一步的加工处理。
在对数据文件进行加工处理中使用的软件是dChip软件,它能够对基因的表达微阵列数据进行分析。它能够将CEL格式数据文件转变成为Excel格式的基因表达式。但是在试验的过程中能够发现,微阵列试验中的噪声以及相应的系统性因素,将会对试验造成一定的干扰,所以在进行数据处理的过程中要进行降噪处理工作,保障数据的准确性。
在数据进行处理后要对数据进行过滤处理选择合适的数据,如果在数据基因表达谱中的单个Ratio值较大,则这个数据点存在异常,这种异常往往是因为噪声的原因引起的,所以在数据过滤时要进行去除。在基因数据过滤的过程中,还能够使用绝对值。标准差已经均方根的方式进行数据过滤工作。
总结:综上所述,由于大数据时代的到来,科学信息技术不断的进步,生物学与信息技术进行结合能够建立完整的生物学数据库,为相关学者的生物学研究提供信息支持。因为生物数据库的建立形成了大规模的生物数据信息,在这些信息中进行生物信息中的DNA基因片段进行挖掘,主要使用的技术是微列阵技术法,在得到相应的数据后,对数据进行过滤,将数据中的异常数据过滤,得到标准的数据信息。
参考文献
[1]何远,张丽娜,朱兴文.大数据技术在生物信息学中的应用综述[J].软件导刊,2016,15(4):147-148.
[2]赵婧,魏彬.生物序列数据挖掘技术的若干研究论述[J].山东工业技术,2016(15):257-257.
[3]施偉,孙华.生物信息数据挖掘若干关键问题研究与应用[J].信息与电脑(理论版),2017(21):117-119.
[4]罗文奇.计算机技术在生物信息学研究中的应用分析[J].中国管理信息化,2017(20):151-152.
[5]孙红敏,姜楠楠,李想.基于文档集的生物信息挖掘模型研究[J].计算机工程与应用,2016,52(24):102-106.
关键词:大规模生物数据;生物信息;挖掘技术
由于社会不断的变化发展,生物信息学也在不断的发展,对生物学领域的研究导致了生物数据的多样性出现,在大规模生物数据中进行生物信息的挖掘,能够建立生物数据库,为人类的基因研究、蛋白质、以及相关疾病的研究提供有力的信息基础。所以要对大规模生物数据中的生物信息挖掘技术进行研究,促进我国生物学领域的发展。
一、生物信息学的研究意义
生物信息学是以计算机学科、信息技术以及数学理论、统计方法为基础的综合性学科。通过计算机技术对生物学的相关数据进行分析、研究、整理、显示与存档,能够建立生物信息学数据库,为生物领域的基因研究、蛋白质研究提供相应的信息支撑。
生物信息学的发展将会对生物领域带来巨大的影响,通过对基因组学。蛋白质组学的研究,能够影响社会各领域的发展。通过生物信息学的相关信息,嫩够为农业新品种的出现带来科学的理论基础,在医学领域中蛋白质的研究能够促进新疫苗的产生,攻克医学上的疾病。通过生物信息学的相关知识,可以使更多的人了解到在生物的基因中会携带各种各样的生物信息,基因片段与蛋白质或者病菌相互作用,将会导致疾病的产生。学者们了解相关知识后,能够结合生物信息学的知识设计出新的药物,攻克更多的疑难病症。
二、大规模生物信息挖掘技术的应用与解析
DNA微阵列技术主要是以原位合成技术或者是合成技术后的点样法为基础,将DNA的探针片段固定在支持物的表面。将其与荧光标记的生物进行杂家,然后对荧光发出的信号进行扫描,最后得到不同的基因片段所要表达的内容。
使用这种方式首先要进行阵列的设计工作,为了使测量的据银族的基因放到芯片上,一般情况下使用酵母菌等简单的生物进行基因的测量工作。因为简单的生物基因片段较少,方面研究。
其次是进行芯片的制备工作,在这一过程中首先要选择芯片的载体。例如,膜、玻璃片、硅片等,这些材料能够保障DNA探针片段能够在载体的表现稳定的与目标分析杂交。
然后,要进行样品的制备工作,在样品制作的过程中,一般情况下生物样品不能直接和芯片进行反应的,在所以在样品制作的过程中首先要进行RNA的提取工作,然后从RNA中提取mRNA。但是要注意在反应的过程中并不是mRNA直接进行反应,还需要将其转变成为cDNA才能进行反应。所以在标记的过程中要将cDNA进行标记,在标记的过程中要进行红色的标记,因为在检测的过程中仪器主要是根据特定的波长范围进行激光的照射,红色的荧光标记在反射的过程中更加的灵敏。
再次进行杂交反应,将样品制作完成后与芯片进行研究,在杂交的过程中要在42℃的保温箱中进行1-2h的反应。其中芯片中的DNA探针、荧光标记靶都会影响结果。
最后要进行微阵列数据的反应,首先要对微阵列的数据进行获取。在信息获取时,主要使用的是Affymetrix公司生产的基因芯片,在原始数据生成的过程中文件名的后缀一般是CEL形式的,在这类文件中记录的是芯片扫描后的荧光数据点的信息。但是在计算的过程中这种格式的数据信息不能直接进行数据挖掘算法,所以要对数据进行进一步的加工处理。
在对数据文件进行加工处理中使用的软件是dChip软件,它能够对基因的表达微阵列数据进行分析。它能够将CEL格式数据文件转变成为Excel格式的基因表达式。但是在试验的过程中能够发现,微阵列试验中的噪声以及相应的系统性因素,将会对试验造成一定的干扰,所以在进行数据处理的过程中要进行降噪处理工作,保障数据的准确性。
在数据进行处理后要对数据进行过滤处理选择合适的数据,如果在数据基因表达谱中的单个Ratio值较大,则这个数据点存在异常,这种异常往往是因为噪声的原因引起的,所以在数据过滤时要进行去除。在基因数据过滤的过程中,还能够使用绝对值。标准差已经均方根的方式进行数据过滤工作。
总结:综上所述,由于大数据时代的到来,科学信息技术不断的进步,生物学与信息技术进行结合能够建立完整的生物学数据库,为相关学者的生物学研究提供信息支持。因为生物数据库的建立形成了大规模的生物数据信息,在这些信息中进行生物信息中的DNA基因片段进行挖掘,主要使用的技术是微列阵技术法,在得到相应的数据后,对数据进行过滤,将数据中的异常数据过滤,得到标准的数据信息。
参考文献
[1]何远,张丽娜,朱兴文.大数据技术在生物信息学中的应用综述[J].软件导刊,2016,15(4):147-148.
[2]赵婧,魏彬.生物序列数据挖掘技术的若干研究论述[J].山东工业技术,2016(15):257-257.
[3]施偉,孙华.生物信息数据挖掘若干关键问题研究与应用[J].信息与电脑(理论版),2017(21):117-119.
[4]罗文奇.计算机技术在生物信息学研究中的应用分析[J].中国管理信息化,2017(20):151-152.
[5]孙红敏,姜楠楠,李想.基于文档集的生物信息挖掘模型研究[J].计算机工程与应用,2016,52(24):102-106.