汕头大学数学系

学术报告

当前位置: 首页 >> 科学研究 >> 学术报告 >> 正文
面向单细胞转录组数据缺失值填补的统计建模与算法研究
日期: 2024-03-06      信息来源:      点击数:

走向现代数学学术报告 - 靳柯博士(No. 688)

报告题目:面向单细胞转录组数据缺失值填补的统计建模与算法研究

报告人:靳柯 博士(华中师范大学)

报告时间:2024年3月7日 9:00

报告地点:东海岸校区-D209

摘要:单细胞转录组测序技术作为生物学研究的一项重要创新,为我们提供了全新的视角和手段,使得研究者能够更深入地了解细胞的异质性和功能。然而,由于测序技术的缺陷,单细胞转录组数据在实际应用中存在着缺失值的问题,这可能会对下游实验分析的准确性和可靠性造成较大影响,因此在进行下游生物实验分析前,需要对缺失值进行填补。立足于单细胞转录组数据,以机器学习和统计学中相关模型为理论基础,我们提出一系列数学模型和计算方法对单细胞转录组数据中的缺失值进行填补,以显著提升单细胞转录组数据分析的深度和广度,为后续的生物学解释和发现提供更为可靠的基础。首先,考虑到单细胞转录组数据具有高稀疏度的特点,仅仅使用相似基因之间或相似细胞之间的信息是不够的。我们提出可以同时学习相似基因和相似细胞之间信息的双侧稀疏自表示模型来填补缺失值。其次,考虑到随着单细胞转录组测序技术的快速发展而至的单细胞转录组数据高维度的特点,计算上高效的填补算法将更具有竞争力。我们在第一个工作基础上,结合矩阵分解和双侧稀疏自表示模型,提出快速双侧稀疏自表示模型。最后,考虑到单细胞转录组数据内结构是复杂且未知的,只考虑单一内在结构可能会产生误导性结果。不同于前两个研究工作假设单一结构,我们假设复杂的单细胞转录组数据内在结构存在三种常见形式(水平结构、垂直结构以及低秩结构),并提出多目标优化模型去自动学习这三种结构以及对应权重,以进行更准确的填补。这三个研究工作都通过大量的下游生物实验分析证明了填补的准确性。

报告人简介:靳柯,华中师范大学在读博士,统计学专业,研究方向为生物信息学。在Bioinformatic、IEEE/ACM Transactions on Computational Biology and Bioinformatics等期刊上发表论文3篇。曾参与两个国家自然科学基金面上项目,并主持一个校级研究生教育创新资助项目。

广东省汕头市翠峰路5号,汕头大学数学系 515821,Email:math@stu.edu.cn

Copyright 2003-2023 汕头大学数学系