论文部分内容阅读
近年来,随着大规模人类基因组测序计划的完成,越来越多的关于疾病早期诊断、药物筛选等方面研究开始从基因水平入手,而生物芯片技术以其高通量、自动化、高灵敏度的特点为基因水平上的研究提供了一条效率较高的解决思路。虽然生物芯片目前已成为生命科学领域一种重要的研究工具,但由于其制作过程复杂、实验要求精度高,芯片的实际应用过程还是容易受到诸多因素影响。而我们认为通过高效的芯片实验方案设计、合适的探针选择、准确的芯片数据分析等关键环节的改进,能够改善生物芯片实验整体的可靠性,提高探针杂交成功率并提高实验结果数据分析的准确性。本课题围绕生物芯片这一主题,发展了以上关键环节中面向生物芯片的生物信息学方法,制定了以下三方面的研究目标:(1)芯片实验方案设计环节,要提出可行性较强的大样本实验设计理论;(2)探针选择环节,欲结合序列标签合并生物发光技术进行多靶标SNP检测的实验,提出序列标签探针的设计算法,并开发相应探针设计软件;(3)芯片数据分析环节,计划针对凝胶微球芯片扫描的图像,发展一种新的方法对图像进行处理和分析,并开发相应计数软件。
基于以上研究目标,我们分别开展了以下研究内容,并着重解决了一些关键问题:
(1)提出基于群试理论和样本混合方法的实验设计方案优化算法,并运用于人类基因组多态性检测的实验设计。在如何设计高效实验方案的问题上,我们深入研究了群试理论,剖析其应用于生物检测领域的作用机制,寻找其在SNP检测中可能的结合点并深入挖掘,进而设计出合理高效的实验方案。
(2)发展生物芯片设计方法,研究序列标签探针的设计方案,建立了探针设计算法,编写了相应软件。针对探针设计中的关键问题:Tm值优化与探针长度之间的平衡,我们优先考虑Tm值,因为Tm值设计不合理会直接导致探针杂交失败。然后在Tm值合格的基础上,尽量选择长度短的探针,从而提高杂交效率,节约成本。
(3)研究基因芯片实验图像数据分析和提取的各种算法,发展用于微球凝胶基因芯片结果图像数据分析的算法。针对如何对凝胶微球芯片的扫描结果图像进行准确图像分割的问题上,使用大小可选的圆点标识图像中代表微球的信号点,标识用的圆点避免粘连,同时尽量覆盖当前信号点,从而实现有效的图像分割,然后可以成功计数。
通过以上三方面的研究,我们基本实现了制定的研究目标,为生物信息学在生物芯片技术中的应用做出了积极有益的探索。