登录

科学网—EMCON|基于小样本数据集的机器学习模型在预测有机磷杀虫剂对明亮发光杆菌毒性中的应用


速读:本研究提出了低毒有机磷杀虫剂的分子设计思路,旨在推动计算毒理学在工程实践中的应用。 因此,对OPIs毒性数据的预测可为开发高效、低毒、经济的有机磷杀虫剂提供关键参考信息。 本研究可为绿色有机磷杀虫剂的分子设计提供参考依据,有助于推动计算毒理学在实际工程中的应用。 通过特征描述符对QSAR变量进行筛选,可简化模型并提升其捕捉有机磷杀虫剂结构与毒性之间相关性的能力。 利用集成策略优化各模型参数,提升模型泛化能力。
EMCON | 基于小样本数据集的机器学习模型在预测有机磷杀虫剂对明亮发光杆菌毒性中的应用 精选

已有 195 次阅读

2026-4-23 14:21

| 系统分类: 科研笔记

image.png有机磷杀虫剂(OPIs)因其毒性对环境与人类健康构成日益严重的威胁。为解决传统方法依赖实验室研究的局限性。目前,采用传统机器学习方法、基于小样本数据集预测OPIs急性毒性仍存在诸多局限,如过拟合与泛化能力不足等问题。OPIs毒性与其分子结构之间的关联尚未完全阐明,这制约了新型OPIs的高效研发。因此,对OPIs毒性数据的预测可为开发高效、低毒、经济的有机磷杀虫剂提供关键参考信息。本研究旨在利用细菌生物发光效应替代实验动物,并作为检测有机磷杀虫剂(OPIs)毒性的补充手段。研究构建了7种机器学习模型以预测OPIs对明亮发光杆菌的毒性,并探究基于小数据集的最优毒性预测模型与方法。结合OPIs独特的结构与性质,采用结构片段分析对不同机器学习方法进行系统比较与分析;通过三级筛选策略严格优选特征描述符;利用集成策略优化各模型参数,提升模型泛化能力。同时,采用SHAP可解释性分析识别影响OPIs毒性的关键因素。本研究提出了低毒有机磷杀虫剂的分子设计思路,旨在推动计算毒理学在工程实践中的应用。通过特征描述符对 QSAR 变量进行筛选,可简化模型并提升其捕捉有机磷杀虫剂结构与毒性之间相关性的能力。采用集成预测与留一交叉验证(LOOCV)保证了模型的稳健性并避免过拟合。结果表明,集成模型表现最优(R²=0.961,RMSE=0.184,MAE=0.156)。模型可解释性分析显示,电荷平衡与亲电位点是决定有机磷杀虫剂毒性的关键因素。结合结构片段分析发现,将氯苯基替换为氟苯基、硫原子替换为氧原子,以及用短烷基链替代长烷基链均可降低有机磷杀虫剂的毒性。本研究可为绿色有机磷杀虫剂的分子设计提供参考依据,有助于推动计算毒理学在实际工程中的应用。该成果发表在Emerging Contaminants期刊上。image.png 摘要图

image.png

图1. 16种取代磷酸酯与硫代磷酸酯的化学结构

图2. 基于留一交叉验证(LOO‑CV)与训练集对7种机器学习模型的预测性能

image.png

图3. PAV与BOC影响明亮发光杆菌发光抑制的作用机制图

文章信息

Insight into machine learning models to predict toxicity of organophosphorus insecticides to Photobacterium phosphoreum based on a small datasetYongqiangYang, Yuying Dong*, Huanbo Ni, Ruiyan Bi, Huixin Luo, Xuejun ZouEmerging Contaminants Volume 12, Issue 1, March 2026, 100599https://doi.org/10.1016/j.emcon.2025.100599 期刊简介

Emerging Contaminants是世界领先的研究解决由新污染物引起的环境污染问题及其解决方案的期刊,该刊入选2020年中国科技期刊卓越行动计划高起点新刊项目。

Emerging Contaminants所有文章将经过严格的同行评审,一经收录将发表在月活用户超过2000万的ScienceDirect平台,供领域内的学者、及全球读者免费阅读、下载及引用。

目前,期刊已被ESCI、Scopus、DOAJ等数据库收录。

转载本文请联系原作者获取授权,同时请注明本文来自科爱KeAi科学网博客。 链接地址: https://blog.sciencenet.cn/blog-3496796-1531731.html

上一篇: 浙江省人民医院叶祥明团队:利用肌腱干/祖细胞与微环境之间的相互作用促进肌腱组织再生 |ER 下一篇: ESI | 反渗透膜的简易接枝改性以提升渗透性能与抗污染性能

主题:毒性|有机磷杀虫剂|模型