DNA 存储是由DNA 高通量合成与测序技术催生的信息与生物相融合的新领域,通过DNA 分子的碱基序列直接编码数字信息,由高通量合成技术合成序列进行信息写入,并利用高通量测序技术实现信息的读取,以实现存储数据的信息还原。DNA 存储的编解码,是DNA 存储中最重要的环节之一,直接影响了存储信息的稳定性及可靠恢复性。直接套用的信道编码技术有较强的数据类型偏好性,因此在实际的存储应用中存在较高的数据无法恢复的风险。
近日,深圳华大生命科学研究院研究团队在《Nature Computational Science》上发表了题为“Towards Practical and Robust DNA- Based Data Archiving Using‘Yin-Yang Co⁃ dec’System”的研究论文,提出了一套DNA 信息存储专用的比特-碱基编解码系统。
研究团队从DNA 双链模型中受到启发,结合中华文化中“阴阳”对立统一的思想,将其巧妙应用到DNA 编解码系统当中,以两套不同的规则,分别对两条二进制信息进行“一对一”编译转换,再取两者统一交集的部分为最终解,实现将两条独立的信息组合统一为一串DNA序列。同时引入筛选机制,将与现有合成测序技术兼容性不佳的序列通過预先设置的筛选条件进行过滤。研究通过编码学的理论推导以及不同数据类型文件的模拟编码与实验验证,证明了该系统在保证信息密度的前提下,在数据恢复稳定性与存储密度方面体现显著的性能提升,每克 DNA 能存储的信息量约为432.2 EB。
该研究为DNA 信息存储的应用提供了一种高密度、高稳定性的比特-碱基编解码方法,并完成了体内外两种模式的信息存储实验验证;研究开发了一种全新的DNA 存储编码方法,为DNA 存储的多类型应用提供了重要工具,有望在海量数据长期存储的新型介质研究中起到积极的推动作用。
(来源:中华人民共和国科学技术部http://www.most.gov.cn2022-05-19)
猜你喜欢 高通量碱基测序 高通量血液透析治疗老年慢性肾衰竭对治疗有效率、Hb及ALB指标的影响研究中国典型病例大全(2022年11期)2022-05-13新一代高通量二代测序技术诊断耐药结核病的临床意义中国典型病例大全(2022年11期)2022-05-13高通量卫星通信综述中国新通信(2022年4期)2022-04-23宏基因组测序辅助诊断原发性肺隐球菌中国典型病例大全(2022年7期)2022-04-22生物测序走在前科学导报(2021年29期)2021-06-03基因“字母表”扩充后的生命科学之谜(2021年2期)2021-04-25创建新型糖基化酶碱基编辑器科学导报(2020年54期)2020-09-09生命“字母表”迎来新成员学苑创造·B版(2019年5期)2019-06-14生命“字母表”迎来4名新成员科学24小时(2019年5期)2019-06-11基因测序技术研究进展科海故事博览·下旬刊(2019年6期)2019-04-16