细胞周期蛋白是通过激活细胞周期蛋白依赖性激酶或细胞周期所需的一组酶来调节细胞周期的蛋白质家族。构建一个模型来对细胞周期蛋白进行分类对于理解其功能非常重要。由于细胞周期蛋白序列之间的相似度低,因此迫切需要构建一个基于机器学习的模型来识别细胞周期蛋白。在这项研究中,作者开发了一种基于支持向量机(SVM)的方法,仅使用氨基酸序列信息来识别细胞周期蛋白。提取了18个特征描述符,总共具有13151维特征,并且通过特征选择技术将特征维减少为8个。保留的特征显示了一些特征描述符,例如自相关,AAC和CTDC在细胞周期蛋白的识别中很重要。折刀交叉验证的结果表明,作者的模型可以对Cyclins进行分类,准确性为91.9%,优于最近使用相同数据集进行的研究。作者的工作提供了区分细胞周期蛋白的重要工具。
本论文中使用的特征描述符
以上研究成果发表于IEEE Access(中科院Q1),论文通讯作者之一为西南医科大学基础医学院唐华教授(厅市共建中枢神经系统药物四川省重点实验室固定人员)。
Prediction of Cyclin Protein Using Two-Step Feature Selection Technique. IEEE Access, 2020, 8, 109535-109542.
Jia-Nan Sun, Hua-Yi Yang, Jing Yao, Hui Ding, Shu-Guang Han*, Cheng-Yan Wu*, Hua Tang*
论文链接:https://ieeexplore.ieee.org/document/9106346