Поиск | Личный кабинет | Авторизация |
Проблема отбора релевантных дескрипторов при прогнозировании токсичности химических веществ
Аннотация:
Математические модели широко применимы при проведении токсикологических исследований и могут использоваться для заполнения пробелов, возникающих при оценке химической безопасности. Большая часть внимания уделяется вопросам изучения алгоритмов построения моделей, а не подходам к выбору наиболее информативных признаков. Поэтому, цель настоящей работы — осветить аспекты проблемы выбора полезных переменных при проведении математического моделирования. Материал и методы. В интерактивной среде Google Colaboratory на основании программного кода при помощи обеспечения RDKit, Mordred были сгенерированы SMILES и молекулярные дескрипторы для фосфорорганических инсектицидов. С помощью инструментов библиотеки scikit-learn Ver. 1.2.2 происходил отбор признаков методом фильтрации и методом рекурсивного исключения признаков. Из официальных информационных источников о химических веществах были взяты значения параметров острой пероральной токсичности. Полученные модели прошли процедуру внутренней валидации, проведена сравнительная оценка производительности моделей. Результаты. Необходимо отметить, что модели, где использовалось рекурсивное исключение признаков, обладают лучшими характеристиками, чем модели на основе дескрипторов, отобранных методом фильтрации. В частности, модель прогнозирования острой токсичности для органотио-фосфатов на основе метода дерева принятия решения с рекурсивным исключением признаков обладает высоким коэффициентом детерминации (R2=0,91713), сравнительно небольшой среднеквадратичной ошибкой (RMSE= 0,35099), а также высоким значением коэффициента детерминации кросс-валидации (Q2LOO= 0,79756). Ограничения исследования. Полученные результаты могут быть использованы только при прогнозировании токсичности указанной группы химических веществ со сходным механизмом действия. Заключение. Использование математического моделирования — перспективный инструмент оценки токсичности химических веществ, имеющий ряд особенностей: с одной стороны, это быстрый и удобный ресурс для проведения скрининга токсичности веществ, с другой — модель необходимо обучить на основе не только надежных данных исследований, но и провести процедуру качественного отбора признаков, вносящих значительный вклад в функционирование прогностической модели.
Авторы:
Гусева Е.А.
Издание:
Токсикологический вестник
Год издания: 2023
Объем: 5с.
Дополнительная информация: 2023.-N 6.-С.413-417. Библ. 12 назв.
Просмотров: 10