当前位置: 首页 > 学生工作 > 公示公告 > 正文
公示公告

活动回顾| 学术讲座——谢於颖副教授:单细胞是生物标记:走向细胞语言模型

来源: 发布时间 : 2025-05-27 点击量:

2025年5月22日下午,由南京农业大学动物科技学院主办的学术讲座在卫岗校区教学楼B306顺利举行。本次讲座邀请了美国密歇根州立大学计算数学、科学与工程系以及统计与概率系副教授谢於颖博士,主题为《单细胞是生物标记:走向细胞语言模型》。

谢於颖博士首先介绍了当前单细胞领域的前沿技术,重点探讨了现有单细胞预训练模型与大规模语言模型之间的关系及其异同。他指出,尽管目前的单细胞预训练模型受到了大规模语言模型的启发,但三大关键的不同之处——如scRNA-seq数据的表示方式、细胞间关系的重要性以及单细胞数据的数量差异——都在现有模型中被忽视。

针对上述难题,谢於颖博士团队创新性提出了CellPLM(Cell Pre-trained Language Model)模型:这一新范式把“细胞”视作建模的最小标记(token),把“组织”比作句子,通过整合空间分辨转录组信息,有效刻画和学习细胞间关系。同时,CellPLM引入高斯混合先验分布,针对单细胞数据体量小、噪声大的难题,提供了更强的归纳偏置。谢博士还展示了CellPLM模型在多个实际应用中的优异表现,强调其相较于现有模型的速度和精确度优势。

在提问和讨论环节,现场师生踊跃互动,讨论内容涵盖了细胞语言模型在多组学数据分析、生物医学工程等领域的应用前景。有同学结合畜牧学科背景提出:“基因间相互作用模型是否适用于非单细胞测序样本?”谢於颖博士给予了详细解答。他表示,基因间相互作用模型不仅适用于单细胞测序数据,也广泛适用于传统组织水平的测序(如bulk RNA-seq、微阵列等),可用于构建共表达网络、调控关系等。不过,传统非单细胞数据所反映的是细胞群体的平均水平,难以分辨细胞类型特异性的调控模式。因此,模型在不同数据类型下的解释力和分辨率需结合具体生物学问题来权衡。

讲座结束后,谢於颖博士还与同学们就科研方法与经验进行了深入交流。他鼓励同学们将先进的计算方法与生物科学实际问题紧密结合,为传统畜牧育种和健康管理注入新的数据动力。

本次讲座不仅为参会者提供了最新的单细胞数据处理技术和细胞语言模型的前沿动态,也为学院师生深入了解细胞生物学与计算生物学的结合提供了重要的学术支持。

【编辑:靳俪雅 校对:何清芬 审核:汪浩】

2025年5月27日


关闭