Genome assembly in the telomere-to-telomere era | Nature Reviews Genetics
基因组序列在很大程度上决定了生物体的生物学特性并编码了生物体的历史,而从头组装(从测序读数重建生物体基因组序列的过程)四十年来一直是生物信息学的中心问题。直到最近,基因组通常最多只能组装成几兆碱基的片段,但现在长读长测序技术的进步使得许多生物体的每条染色体几乎完全组装(也称为端粒到端粒组装)。在这里,作者回顾了组装算法和协议的最新进展,重点是如何衍生近端粒到端粒的组装。
hadge: a comprehensive pipeline for donor deconvolution in single-cell studies | Genome Biology
单细胞多重技术(细胞散列和遗传多重)结合多个样本,优化样本处理并降低成本。细胞散列将抗体标签或化学寡核苷酸缀合到细胞膜上,而基因多重分析允许混合遗传多样性的样本,并依赖于已知基因组坐标处 RNA 读数的聚合。研究人员开发了 hadge (hashing deconvolution combined with genotype information),这是一种 Nextflow 计算流程,它结合了 12 种方法来执行基于哈希和基因型的反卷积。
Prospective de novo drug design with deep interactome learning | Nature Communications
从头药物设计旨在从头开始生成具有特定化学和药理学特性的分子。研究人员提出了一种利用基于相互作用组的深度学习来基于配体和结构生成药物样分子的计算方法。这种方法利用了图神经网络和化学语言模型的独特优势,为特定应用的强化、迁移或几次学习的需求提供了替代方案。它能够“零次”构建具有特定生物活性、可合成性和结构新颖性的化合物库。