多重压缩DNA序列数据

来源 :计算机应用 | 被引量 : 7次 | 上传用户:xxzjlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据DNA序列数据的特点,提出对DNA序列数据进行多重压缩的思想。多重压缩的首要步骤是扩展字母表。首先对DNA序列数据进行0/1编码,然后每8位转换成一个ASCII码字符,将原来的DNA序列数据仅含有的4个字符扩展到256个字符。第二步采取基于统计模型的Huffman编码压缩算法和基于转换模型的Burrows-Wheeler算法,对扩展后的DNA序列数据进行二次压缩。最后对各种算法的压缩结果进行性能分析比较,比较结果显示,多重压缩算法有较优的压缩比。
其他文献
随着教育信息化的发展,信息技术越来越多的被教师应用于课堂教学中,多媒体课件是教师们使用最多的教学资源之一,在众多制作课件的软件中,多媒体演示文稿型课件是教师们最常用也是
凌久传真服务器系统充分利用网络资源,使网络用户可以共享传真线路,直接在自己的电脑桌面上收发传真。系统分为服务端和客户端,服务端安装Modem卡或者多用户传真卡.由服务端软件
根据非结构化P2P系统中资源分布的特点,提出一种基于复本网络的非结构化P2P系统,即RNP2P。通过查询反馈、主动探测和反向探测三种方式协调复本节点之间的相互感知,构建数据结构存储每种资源的其他复本节点信息,针对每种资源均构成一个复本网络。基于这种复本管理机制,RNP2P平均能够以命中3~5个复本的消息开销获得100%的命中率,其他查询方法均可以和RNP2P有效结合。模拟结果表明RNP2P的查询性
给出了对N-path重路由匿名通信系统成员负载的理论计算,研究了节点负载性能与路径可靠性的关系,分析了决定系统负载性能的主要因素。计算结果表明,节点负载取决于路径长度和可靠性需求的数学期望,管理员可通过配置这两个参数,平衡匿名系统的可靠性和负载特性,以适应不同需求。
以典型工作任务为引领,采用项目教学法,探索理财规划与实务课程的教学设计,实现教学与岗位需求的零距离接轨。
厚德至善在南山。南山集团所在的山东省龙口市东江镇前宋村,历史上是有名的穷村。改革开放后,该村坚持集体经营,靠发展工副业迅速发展壮大。现已发展为辖3大园区、20余个居民生
说起传统,我们已倍感厌倦;这并不是由传统本身引出的,绝大多数的情景是,在缺少一个理论的基础平台上的讨论,极难对问题的推进有所作为。相对地说,现代这个题目面临的问题也几乎一样
期刊
数码时代的到来为插图带来勃勃生机.而插图又为数字世界增添新的景象,为视觉传达增添活力与激情.新一代的插图家把目光转向了数码设备,它带来了高效、新奇、多样的数码插图.
随着“入世”的到来,中国服装业在面临前所未有的发展机遇的同时,也将面临着更多的挑战:失去双边配额的保护作用,对服装的出口造成不利影响,国外品牌不请自来,将会越来越多地占据国