图核及其在化合物分类中的研究的开题报告

图核及其在化合物分类中的研究的开题报告一、研究背景随着化学计算机辅助设计在新药开发中的应用越来越广泛,准确可靠的化合物分类方法也变得越来越重要。化合物的分类可以帮助研究人员快速有效地评估化合物的性质和

图核及其在化合物分类中的研究的开题报告 一、研究背景 随着化学计算机辅助设计在新药开发中的应用越来越广泛,准确可 靠的化合物分类方法也变得越来越重要。化合物的分类可以帮助研究人 员快速有效地评估化合物的性质和活性,以进行更精确的分析和预测。 因此,需要寻求一种实用可行的化合物分类方法。 Molecular Graph KernelMGK 分子图核(,)是一种化合物分类的有 MGKGraphGraph 效方法。将化合物表示为图(),并使用图核( Kernel )方法比较不同的图。图核是通过计算图之间的相似度,实现化合 物分类的方法。 MGK 然而,方法的应用仍存在一些问题,例如计算效率低下、核特 ——Graph 征难以提取等。为此,提出了一种新的化合物分类方法图核( Kernel )。 二、研究内容 本研究旨在对图核在化合物分类中的应用进行深入研究。主要研究 内容包括: 1. 理论基础。了解图核的基本原理和应用情况,以及图核在化合物 SVM 分类中的优势和局限性。研究图核算法中所涉及的数学理论,如、 SVD 等。 2. 特征提取。对于数据集中的化合物,提取出能够表达化合物特征 的特征向量。考虑到图核所需的特征向量具有高维度,需要对其进行降 维。 3. 分类方法。利用图核计算两个化合物的相似度,使用相似度作为 输入,采用机器学习算法对化合物进行分类。比较不同机器学习算法的 分类效果,选择相对优秀的算法。

腾讯文库图核及其在化合物分类中的研究的开题报告