在DNA中存储信息使用纳米级电极孔改善DNA存储
由于其密度、易于复制、寿命长和可持续性,遗传学家可以将数据存储在合成DNA中,作为长期存储的媒介。该领域的研究最近在新的编码算法、自动化、保存和排序方面取得了进展。然而,DNA存储部署中最具挑战性的障碍仍然是写入吞吐量,这会限制数据存储容量。在一份新报告中,BichlienH.Nguyen和美国西雅图华盛顿大学微软研究院和计算机科学与工程的一组科学家开发了第一个纳米级DNA存储写入器。该团队打算将DNA写入密度扩展到25x106每平方厘米的序列数,与现有的DNA合成阵列相比,存储容量有所提高。科学家们成功地在DNA中编写和解码了一条信息,以建立一个实用的DNA数据存储系统。结果现在发表在《科学进展》上。
长期DNA档案
当前的数据生成速度超过了现有的存储容量,DNA是解决这个问题的有希望的解决方案,预计实际密度超过60PB/立方厘米。该材料在各种条件下都经久耐用,具有相关性且易于复制,有望比商业媒体更具可持续性或更环保。在此过程中,可以将比特序列形式的数字数据编码为四种天然DNA碱基的序列-鸟嘌呤、腺嘌呤、硫胺素和胞嘧啶,尽管其他碱基也是可能的。该团队接下来可以通过从头DNA寡核苷酸合成将序列写入分子形式,以基于一组重复的化学步骤创建特定分子。合成后可以保存和储存所得寡核苷酸。为了访问数据,可以使用聚合酶链反应放大DNA存储并进行测序,将DNA碱基序列返回到数字域,然后可以对DNA碱基序列进行解码以恢复原始位序列。
在这项研究中,Nguyen等人。产生了一个电极阵列,它展示了DNA合成的独立电极特异性控制,具有电极尺寸和间距,以建立每厘米22500万个寡核苷酸的合成密度。该值被估计为在DNA中实现每秒千字节数据存储的最小目标所需的电极密度。该团队推动了电子化学控制的最新技术,并为DNA数据存储所需的写入带宽提供了实验证据。
该团队以芯片上的微型DNA存储写入机制的形式引入了概念验证分子控制器。该芯片可以以比以前高3个数量级的方式紧密地进行DNA合成,以实现更高的DNA写入吞吐量。要将信息以商业用途所需的规模存储在DNA中,需要两个关键过程。首先,该团队必须使用编码软件和DNA合成器将数字位(1和0)转换为代表位的合成DNA链。然后他们必须能够读取信息并将其解码回其位,以使用DNA测序仪和解码软件将该信息再次恢复为数字形式。
开发用于纳米级特征的电化学阵列
在传统的DNA链合成过程中,科学家们使用一种称为亚磷酰胺化学的多步方法,其中可以通过添加DNA碱基来顺序生长DNA链。每个DNA碱基都包含一个封闭基团,以防止将DNA碱基多次添加到不断增长的链中。在连接到DNA链时,可以在设置中传递酸以切割封闭基团并引发DNA链以添加下一个碱基。在电化学DNA合成过程中,阵列中的每个点都包含一个电极,当施加电压时,在工作电极(阳极)处产生酸以解除生长的DNA链的封闭,同时在对电极(阴极)处产生等效的碱。该团队通过设计一个电极阵列来防止酸在装置中扩散,其中每个在DNA合成过程中发生酸形成的工作电极都沉入井中,并被四个共同的反电极包围,即驱动碱基形成的阴极,以限制特定区域的酸。阮等人。使用有限元分析验证了设计的有效性.在实验过程中,当酸以足够的浓度存在时,酸会解封表面结合的核苷酸以允许下一个核苷酸偶联。使用包含特征点的芯片设置来限制酸,他们开发了具有四个独立电极的电化学阵列来调节DNA合成。然后,该团队用绿色和红色的两种荧光标记碱基进行了实验。作为概念证明,他们通过合成四个独特的DNA链展示了该设备写入数据的能力,每条DNA链长100个碱基,并带有编码信息,没有错误。
展望:在电极阵列上合成短寡核苷酸用于数据存储
Nguyen等人使用该设置。还展示了电极阵列上短寡核苷酸的空间控制合成,以评估可以形成的最大DNA长度。科学家们创建了一个具有180个核苷酸的DNA序列,并从寡核苷酸的全长中对不同长度的产物进行PCR扩增。随着扩增子变长,预期的PCR产物显得更微弱且定义不明确,而较短的扩增子显示出更强且更明确的条带,表明合成率更高错误。根据结果,研究人员选择了占100个碱基的序列长度,以便于纯化,以提供DNA数据存储的实际演示,无需进一步优化。通过这种方式,BichlienH.Nguyen及其同事在这项工作中展示的概念验证方法为并行生成大规模和独特的DNA序列以用于数据存储铺平了道路。工作超过了之前的报告在密集的合成DNA序列上提供第一个实验指示,以实现纳米级特征尺寸数据存储所需的写入带宽。科学家们期待这些设备在信息技术中的直接应用,并预见它们在材料科学、合成生物学和大规模分子生物学分析中的实际应用。
标签: