每日文摘 | 2024年04月24日

Generative models improve fairness of medical classifiers under distribution shifts | Nature Medicine

领域泛化是医疗保健领域机器学习面临的普遍挑战。由于部署和开发期间遇到的数据之间存在差异,实际条件下的模型性能可能低于预期。模型开发过程中某些群体或条件的代表性不足是造成这种现象的常见原因。这一挑战通常无法通过专家临床医生的有针对性的数据采集和“标记”来轻松解决,由于条件的稀有或可用的临床专业知识,这可能非常昂贵或实际上是不可能的。研究人员假设,生成人工智能的进步可以帮助以可引导的方式缓解这种未满足的需求,通过合成示例丰富训练数据集,解决代表性不足的条件或子群体的不足。

论文链接

 

Single Cell Atlas: a single-cell multi-omics human cell encyclopedia | Genome Biology

单细胞测序数据集是生物学和医学领域的关键,能够以前所未有的分辨率深入了解异质细胞群。在这里,研究人员通过对来自 125 个健康成人和胎儿组织的五个单细胞组学、空间转录组学和两个批量组学的数据集进行深入表征,构建了人体组织的单细胞多组学图谱。他们构建了其补充的基于网络的平台,即单细胞图谱(SCA,www.singlecellatlas.org),以实现对人类胎儿和成人组织的深层多组学特征的大量交互式数据探索。

论文链接

 

brainlife.io: a decentralized and open-source cloud platform to support neuroscience research | Nature Methods

神经科学正在推进标准化和工具开发,以支持严谨性和透明度。因此,数据管道的复杂性增加了,阻碍了公平(可查找、可访问、可互操作和可重用)访问。 Brainlife.io 平台提供数据标准化、管理、可视化和处理,并自动跟踪数千个数据对象的来源历史。

论文链接

 

发表评论

邮箱地址不会被公开。 必填项已用*标注