二维凝胶电泳连配聚类统计算法的任务书
二维凝胶电泳连配聚类统计算法的任务书一、任务背景二维凝胶电泳是一种常用的蛋白质组分析技术。它通过将样品中的蛋白质分离出来,并将其在凝胶板上进行空间分布,来对蛋白质的性质进行研究。然而,由于在两个方向上
二维凝胶电泳连配聚类统计算法的任务书 一、任务背景 二维凝胶电泳是一种常用的蛋白质组分析技术。它通过将样品中的蛋白 质分离出来,并将其在凝胶板上进行空间分布,来对蛋白质的性质进行 研究。然而,由于在两个方向上分离蛋白质所需的物理性质的差异,每 个凝胶板上只能检测数百个蛋白质。这意味着要对包括多个样本的大型 数据集进行分析,需要运用一些高级的统计和数据挖掘技术。 二、任务要求 本次任务要求完成二维凝胶电泳连配聚类统计算法,具体流程如下: 1.对凝胶电泳图像进行进行预处理,包括去噪、背景校准、矫直等操作。 2.提取蛋白质的表达量信息。通过量化分析,得到不同样本的蛋白质表达 差异。 3.通过聚类分析,确定哪些蛋白质在不同的样本中具有类似的表达模式。 4.利用连配分析,将具有相似表达模式的蛋白质聚合在一起,并确认它们 在蛋白质相互作用网络中的位置。 5.至少实现一个可视化界面,展示聚类结果。 三、参考资料 1.Tu,C.,Rudnick,P.A.,Martinez,M.Y.,Cheek,K.L.,Stein,S.E., Slebos,R.J.C.,&Tabb,D.L.(2015).Depletionofabundantplasma proteinsandlimitationsofplasmaproteomics.Journalof proteomeresearch,14(10),3637-3641. 2.Tabb,D.L.,Vega-Montoto,L.,Rudnick,P.A.,Variyath,A.M., Ham,A.J.L.,Bunk,D.M.,...&Bild,A.H.(2010).Repeatabilityand reproducibilityinproteomicidentificationsbyliquid chromatography-tandemmassspectrometry.Journalofproteome research,9(2),761-776.

