欢迎访问北京化工大学学报(自然科学版),今天是
Email Alert  RSS
化学与化学工程

吲哚芳砜类化合物定量构效关系研究

  • 俞青芬
展开
  • 青海民族大学 化学化工学院, 西宁 810007

俞青芬, 女, 1975年生, 教授, E-mail:

收稿日期: 2023-12-07

  网络出版日期: 2024-10-15

基金资助

国家自然科学基金(51963018)

版权

版权所有,未经授权。

Quantitative structure-activity relationships for indolyl aryl sulfone compounds

  • QingFen YU
Expand
  • School of Chemistry and Chemical Engineering, Qinghai Minzu University, Xining 810007, China

Received date: 2023-12-07

  Online published: 2024-10-15

Copyright

All rights reserved, without authorization

摘要

从文献中选取76种具有抗人类免疫缺陷病毒(HIV)活性的吲哚芳砜类化合物,采用分子结构描述符对其进行结构表征。通过逐步回归分析法,从28个结构参数中筛选出10个参数作为回归方程的最终变量,构建了吲哚芳砜类化合物的分子结构与抗HIV活性之间的定量关系模型。所建模型的复相关系数R为0.904 9,表明该模型的拟合效果较好,可以反映吲哚芳砜类化合物分子结构与生物活性之间的相关关系。留一法(LOO)交互检验结果表明,R为0.856 7,标准偏差(Std)为0.445 5,说明所建模型具有较好的稳定性和可靠性,可以用于预测吲哚芳砜类化合物的抗HIV活性。

本文引用格式

俞青芬 . 吲哚芳砜类化合物定量构效关系研究[J]. 北京化工大学学报(自然科学版), 2024 , 51(5) : 29 -38 . DOI: 10.13543/j.bhxbzr.2024.05.004

Abstract

Seventy-six indole aryl sulfone compounds with anti-human immunodeficiency virus (HIV) activity were selected from the literature and their structures were characterized by molecular structure descriptors. Using stepwise regression analysis, 10 parameters were selected from 28 structural parameters as the final variables of the regression equation, and a quantitative relationship model between the molecular structure and anti-HIV activity of indole aryl sulfone compounds was constructed. The multiple correlation coefficient R of the model was 0. 904 9, indicating that the model had a good fitting effect and could reflect the correlation between the molecular structure and biological activity of indole aryl sulfone compounds. The results of leave-one-out (LOO) cross-validation showed that R was 0. 856 7, and the standard deviation Std was 0. 445 5, indicating that the model had good stability and reliability and can be used to predict the anti-HIV activity of indole aryl sulfone compounds.

引言

艾滋病,全称为获得性免疫缺陷综合征(AIDS),是人体感染人类免疫缺陷病毒(HIV)所导致的传染病[1-2]。作为一种逆转录病毒,HIV在复制周期中须借助逆转录酶(RT)将mRNA反转录成前病毒DNA,然后借助宿主细胞完成整个复制过程[3]。HIV分为HIV-1和HIV-2两种亚型,其中HIV-1是世界上主要流行的亚型。为了对艾滋病进行有效治疗,近年来人们对HIV-1逆转录酶(HIV-1RT)抑制剂开展了大量研究,并将其分为核苷与非核苷类化合物。其中,核苷类药物在体内干扰病毒正常的RNA或DNA复制,抑制病毒繁殖,从而产生抗病毒作用。但这类药物同时也干扰人体正常的DNA复制,产生强烈的毒副作用。为了降低药物毒性、提高疗效,人们开始将目光转向非核苷类化合物,这类化合物现已成为抗病毒药物研究的重点[4-7]
近年来,药物化学家发现结构独特的非核苷类化合物——吲哚芳砜类化合物具有强大的抗病毒活性和广谱的抗耐药性[8-9]。药物的生物活性与其分子结构密切相关,研究药物分子的构效关系可以帮助人们理解药物的作用机制,指导药物的设计和优化[10]。目前国内外对吲哚芳砜化合物构效关系的研究甚少,本文从吲哚芳砜类化合物的分子结构出发,采用分子结构描述符对其进行结构表征,通过逐步回归分析法构建了其分子结构与生物活性之间的定量相关模型,所建模型具有较好的预测能力和稳定性,研究结果可为辅助设计和合成高效安全的抗艾滋病药物提供理论依据。

1 吲哚芳砜类化合物的选取及活性数据来源

本文选取Ragno等[11]报道的76种吲哚芳砜类化合物作为构效关系的研究对象,其分子量在236.19~299.16之间,母体结构分为A、B两种类型(图 1),二者的主要区别是芳砜基团与吲哚环连接的位置不同。吲哚芳砜类化合物的抗HIV活性数据来自文献[11],以半数有效剂量(EC50)表示。本文选取的吲哚芳砜类化合物的官能团及活性数据列于表 1中。
图 1 吲哚芳砜类化合物的分子结构类型

Fig. 1 Molecular structure types of indolyl aryl sulfone compounds

表 1 吲哚芳砜类化合物的官能团及活性数据[11]

Table 1 Functional groups and activity data of indolyl aryl sulfone compounds[11]

化合物编号 结构类型 X取代基 Y取代基 Z取代基 W取代基 EC50/(μmol·L-1
3a A SO2 H NH2 Cl 0.001
14a A S H OEt H 1.4
17a A S 2-NH2 OEt Cl 2.3
18a A S 2-NH2-5-Cl OEt Cl 2.5
19a A SO2 H OEt H 3.7
21a A SO2 2-NH2-5-Cl OEt H 2.5
22a A SO2 2-NH2-5-Cl OEt Cl 1.9
23a A S H NH2 Cl 1.4
24a A S 2-NH2-5-Cl NH2 Cl 9
25a A S H NH2 Cl 0.02
26a A S 2-Me NH2 Cl 0.3
28a A S 4-F NH2 Cl 1.4
29a A S 4-Cl NH2 Cl 3.1
32a A S 3,5-Me2 NH2 Cl 0.006
33a A S 2,6-Cl2 NH2 Cl 1.2
34a A S 2-NH2-5-Cl NH2 Cl 1.6
35a A SO2 H NH2 H 0.18
36a A SO2 2-NH2-5-Cl NH2 H 0.3
37a A SO2 2-Me NH2 Cl 0.001
38a A SO2 3-Me NH2 Cl 0.001
39a A SO2 4-Me NH2 Cl 0.003
40a A SO2 4-F NH2 Cl 0.014
41a A SO2 4-Cl NH2 Cl 0.011
44a A SO2 2,4-Me2 NH2 Cl 0.004
45a A SO2 3,5-Me2 NH2 Cl 0.004
47a A SO2 2-NH2-5-Cl NH2 Cl 0.04
49a A SO2 3,5-Me2 NH2 COMe 0.015
50a A SO2 3,5-Me2 NH2 CH(OH)Me 0.025
51a A S H NHNH2 Cl 0.55
52a A S 4-Me NHNH2 Cl 1.5
53a A S 4-F NHNH2 Cl 5
54a A S 4-Cl NHNH2 Cl 10
55a A S 2-NH2-5-Cl NHNH2 Cl 13
56a A SO2 H NHNH2 H 0.53
57a A SO2 H NHNH2 Cl 0.01
58a A SO2 4-Me NHNH2 Cl 0.05
59a A SO2 4-F NHNH2 Cl 0.32
60a A SO2 4-Cl NHNH2 Cl 0.19
61a A SO2 3,5-Me2 NHNH2 Cl 0.13
62a A SO2 2-NH2-5-Cl NHNH2 Cl 0.3
65a B SO2 2-NO2 COOEt H 1.8
67a B SO2 2-NH2-5-Cl COOEt H 1.8
75a B SO2 2-NH2-5-Cl COOEt 5-Cl 8.3
78a B SO2 H CONH2 H 15
80a B SO2 H CONH2 5-Cl 66.6
83b B SO2 2-NO2 H H 5.3
84b B SO2 2-NH2 H H 4.96
85b B SO2 2-NO2-5-Cl H H 5.40
86b B SO2 2-NH2-5-Cl H H 6.00
87b B SO2 2-NO2-4-Cl H H 4.80
88b B SO2 2-NH2-4-Cl H H 4.13
89b B SO2 2-Cl-5-NO2 H H 5.22
90b B SO2 2-Cl-5-NH2 H H 3.82
91c A S H NHNHCH2CH2OH 5-Cl 0.04
92c A S 2-Me NHNHCH2CH2OH 5-Cl 0.05
93c A S 3-Me NHNHCH2CH2OH 5-Cl 0.08
94c A S 4-Me NHNHCH2CH2OH 5-Cl 0.12
95c A S 2,3-Me2 NHNHCH2CH2OH 5-Cl 0.1
96c A S 3,5-Me2 NHNHCH2CH2OH 5-Cl 0.012
97c A SO2 H NHNHCH2CH2OH 5-Cl 0.001
98c A SO2 2-Me NHNHCH2CH2OH 5-Cl 0.031
99c A SO2 3-Me NHNHCH2CH2OH 5-Cl 0.003
100c A SO2 4-Me NHNHCH2CH2OH 5-Cl 0.043
101c A SO2 2,4-Me2 NHNHCH2CH2OH 5-Cl 0.008
4c A SO2 3,5-Me2 NHNHCH2CH2OH 5-Cl 0.000 8
102c A S H NHNHCH2CH2OH 5-Cl 0.2
103c A S 2-Me NHNHCH2CH2OH 5-Cl 0.1
104c A S 4-Me NHNHCH2CH2OH 5-Cl 0.6
105c A S 2,4-Me2 NHNHCH2CH2OH 5-Cl 1.2
106c A S 3,5-Me2 NHNHCH2CH2OH 5-Cl 0.03
107c A SO2 H NHNHCH2CH2OH 5-Cl 0.01
108c A SO2 2-Me NHNHCH2CH2OH 5-Cl 0.05
109c A SO2 3-Me NHNHCH2CH2OH 5-Cl 0.007
110c A SO2 4-Me NHNHCH2CH2OH 5-Cl 0.04
111c A SO2 2,4-Me2 NHNHCH2CH2OH 5-Cl 0.08
5c A SO2 3,5-Me2 NHNHCH2CH2OH 5-Cl 0.001

化合物编号的上标字母a、b、c用来区分不同的化合物变体或衍生物。

2 吲哚芳砜类化合物的分子结构表征

表征吲哚芳砜类化合物分子结构的参数有拓扑指数类参数和量子化学参数两种。拓扑指数类参数共14个:母体为A或B型的参数C、X取代基为S或SO2的参数QX、片段连接性指数mX0X1X2X3X4X)、片段连接性指数mF0F1F2F3F4F)、Z取代基是否有羰基和氨基的参数QZ、W取代基是否有氯元素的参数QW。量子化学参数共14个:分子体积(V)、分子范德华表面积(SAS)、极化率(polar)、水合能(EHE)、折射率(refrac)、分子摩尔质量(M)、RMS倾斜度(grad)、总能量(ETE)、电子能(Eelec)、生成热(HHOF)、最高轨道占据能(EHOMO)、最低空轨道能(ELUMO)、偶极矩(dipol)、疏水性参数(lgP)。

2.1 拓扑指数类参数计算

(1)C
$C= \begin{cases}1, & \text { 结构为母体 } \mathrm{A} \\ 2, & \text { 结构为母体 } \mathrm{B}\end{cases}$
(2)QX
$Q_{\mathrm{X}}=\left\{\begin{array}{cc}0, & \mathrm{X} \text { 取代基为 } \mathrm{S} \\1, & \mathrm{X} \text { 取代基为 } \mathrm{SO}_2\end{array}\right.$
(3)mXmF
本文根据吲哚芳砜类分子的结构特征,定义原子结构参数δi[12]
$\delta_i=\left(n_i-1\right) m_i-h_i$
式中:nii原子(非氢任意原子)的主量子数,即电子层数;mii原子的价电子数;hi为与i原子连接的氢原子数。
构建拓扑指数mX
${ }^m X=\sum\left(\delta_i \times \delta_j \times \cdots \times \delta_m\right)^{0.5}$
这是一个指数系列,其中0X1X2X3X4X依次为零阶、一阶、二阶、三阶、四阶拓扑指数。
原子的电性结构对分子的性质起着重要作用,为了量化原子的电性特征,参数计算中充分考虑到原子的电负性,定义了另一种原子结构参数λi
$\lambda_i=n_i^* m_i / X_i-h_i$
式中:ni*i原子(非氢任意原子)的有效主量子数,Xii原子的Pauling电负性。
构建拓扑指数mF
${ }^m F=\sum\left(\lambda_i \times \lambda_j \times \cdots \times \lambda_m\right)^{0.5}$
其中0F1F2F3F4F依次为零阶、一阶、二阶、三阶、四阶拓扑指数,没有四阶指数的取值为0。
表 2为主量子数n与有效主量子数n*的对应表[13]
表 2 主量子数n与有效主量子数n*对应表[13]

Table 2 Table of principal quantum number n and the corresponding effective principal quantum number n*[13]

n n* n n*
1 1.0 5 3.0
2 2.0 6 3.05
3 2.6 7 3.3
4 2.85
本文选取的片段为Y取代基所在的苯环,其编号如图 2所示。
图 2 Y取代基所在的苯环编号

Fig. 2 Carbon atom number of the benzene ring where the Y substituent resides

本文以Y取代基为2-NH2-5-Cl为例说明mXmF的计算过程。
由式(1)计算得到δ-NH2δ-Cl,原子结构参数δi的计算结果如图 3所示。
$\begin{aligned}& \delta_{-\mathrm{NH}_2}=(2-1) \times 5-2=3 \\& \delta_{-\mathrm{Cl}}=(3-1) \times 7-0=14\end{aligned}$
图 3 原子结构参数δi的计算值

Fig. 3 Calculated values of the atomic structure parameter δi

由式(2)计算得到0X~4X
$\begin{aligned}& { }^0 X=\sum\left(\delta_i\right)^{0.5}=12.928\;4 \\& { }^1 X=\sum\left(\delta_i \times \delta_j\right)^{0.5}=7.464\;1 \\& { }^2 X=\sum\left(\delta_i \times \delta_j \times \delta_k\right)^{0.5}=20.784\;6 \\& { }^3 X=\sum\left(\delta_i \times \delta_j \times \delta_k \times \delta_l\right)^{0.5}=36.961\;5 \\& { }^4 X=0\end{aligned}$
由式(3)计算得到λ-NH2λ-Cl,原子结构参数λi的计算结果如图 4所示。
$\begin{aligned}& \lambda_{-\mathrm{NH}_2}=2 \times 5 \div 3-2=1.333\;3 \\& \lambda_{-\mathrm{Cl}}=2.6 \times 7 \div 3-0=6.066\;7\end{aligned}$
图 4 原子结构参数λi的计算值

Fig. 4 Calculated values of the atomic structure parameter λi

由式(4)计算得到0F~4F
$\begin{aligned}& { }^0 F=\sum\left(\lambda_i\right)^{0.5}=13.434\;0 \\& { }^1 F=\sum\left(\lambda_i \times \lambda_j\right)^{0.5}=5.853\;3 \\& { }^2 F=\sum\left(\lambda_i \times \lambda_j \times \lambda_k\right)^{0.5}=13.187\;7 \\& { }^3 F=\sum\left(\lambda_i \times \lambda_j \times \lambda_k \times \lambda_l\right)^{0.5}=25.770\;6 \\& { }^4 F=0\end{aligned}$
(4)QZ
$Q_{\mathrm{Z}}= \begin{cases}0, & \mathrm{Z} \text { 取代基无羰基和氨基 } \\ 1, & \mathrm{Z} \text { 取代基有羰基和氨基 }\end{cases}$
(5)QW
$Q_{\mathrm{W}}= \begin{cases}0, & \mathrm{~W} \text { 取代基无 } \mathrm{Cl} \\ 1, & \mathrm{~W} \text { 取代基有 } \mathrm{Cl}\end{cases}$

2.2 量子化学参数计算

采用Chemoffice 2020软件中的ChemDraw组件进行分子绘制,并使用Chem 3D和HyperChem v8.0软件进行优化,得到能量最低、最稳定的分子结构。优化步骤如下:
(1)选择HyperChem中的分子力学方法(MM)进行初步优化;
(2)选择更精确的半经验方法PM3进行二次优化,得到最终的几何构型;
(3)用MOPAC量子化学软件对HyperChem中得到的几何构型进行最后优化,方法仍采用PM3,最后一步优化的目的在于产生MOPAC输出文件,用于计算分子的量子化学参数。

3 定量构效关系(QSAR)模型构建

为了便于计算,本文对吲哚芳砜类化合物的活性数据进行预处理,将EC50转换为lg(1/EC50),以pEC50表示。对表 1中的化合物重新编号,总共76个样本,其中10个样本作为预测集,66个样本作为检测集。利用MATLAB2022a软件,采用逐步回归分析法从28个参数中筛选出与吲哚芳砜类化合物生物活性相关联的10个参数作为回归方程的最终变量:CQXQZ1X1FMETEHHOFVELUMO,逐步回归分析结果见表 3,所得回归方程如下。
$\begin{aligned}& \quad\quad \mathrm{pEC}_{\text {50 }}=3.605\;8-2.476 C+1.7668 Q_{\mathrm{X}}-0.4445 Q_{\mathrm{Z}}+ \\& 0.163\;6^6 X-0.467\;6^1 F-0.025\;8 \mathrm{V}+0.067\;3 M+ \\& 0.000\;2 E_{\text {TE }}+0.000\;9 H_{\text {НоF }}-0.226\;7 E_{\text {LUMO }}\end{aligned}$
表 3 本文所选的参数变量及逐步回归分析结果

Table 3 Parameter variables selected in this paper and the results of stepwise regression analysis

化合物编号 C QX QZ 1X 1F V/(cm3·mol-1 M/(g·mol-1 ETE/(kJ·mol-1 HHOF/(kJ·mol-1 ELUMO/(kJ·mol-1 pEC50(实验值) pEC50(预测值) 残差
1 1 1 1 10.660 5 9.205 0 225.17 303.64 -77 822.247 0 942.592 9 -6.643 9 3.000 0 1.818 2 -1.181 8
2 1 0 0 10.660 5 9.205 0 229.86 262.20 -65 499.831 6 959.425 1 -6.055 5 -0.146 1 -0.140 6 0.005 5
3 1 0 0 12.660 5 10.665 4 265.32 311.66 -76 553.152 5 951.542 5 -5.881 7 -0.361 7 -0.272 4 0.089 3
4 1 0 0 16.670 1 13.434 0 265.72 323.67 -79 100.364 0 1 140.296 1 -6.509 4 -0.397 9 -0.287 6 0.110 3
5 1 1 0 10.660 5 9.205 0 250.70 294.20 -78 797.828 7 1 125.577 7 -5.906 9 -0.568 2 0.784 7 1.352 9
6 1 1 0 16.670 1 13.434 0 271.87 320.22 -85 151.636 6 1 255.471 3 -5.247 8 -0.397 9 -0.264 1 0.133 8
7* 1 1 0 16.670 1 13.434 0 265.21 332.23 -87 450.848 4 1 692.224 5 -5.194 4 -0.278 8 0.668 1 0.946 9
8 1 0 1 10.660 5 9.205 0 201.67 236.19 -56 996.541 1 1 006.447 2 -4.892 2 -0.146 1 -0.178 8 -0.032 7
9 1 0 1 16.670 1 13.434 0 222.77 262.21 -63 225.806 1 1 260.883 7 -6.569 5 -0.954 2 -0.555 0 0.399 2
10 1 0 1 10.660 5 9.205 0 217.45 271.64 -64 185.966 0 1 114.724 1 -6.276 6 1.699 0 0.821 4 -0.877 6
11 1 0 1 11.928 4 9.957 9 229.54 283.65 -66 890.984 9 1 145.670 2 -6.152 8 0.522 9 0.649 8 0.126 9
12 1 0 1 10.928 4 11.381 5 231.44 283.65 -66 701.556 7 1 335.098 5 -5.165 1 -0.146 1 -0.237 7 -0.091 6
13 1 0 1 14.670 1 11.973 7 230.89 307.09 -71 643.396 2 954.995 9 -3.623 2 -0.491 4 0.024 1 0.515 5
14* 1 0 1 17.196 3 10.710 7 242.84 272.22 -64 780.171 8 1 430.711 6 -3.734 9 2.221 8 0.176 7 -2.045 1
15 1 0 1 18.679 7 14.742 4 247.98 319.11 -74 375.285 0 959.072 1 -4.730 4 -0.079 2 -0.521 2 -0.442 0
16 1 0 1 16.670 1 13.434 0 235.59 274.22 -65 714.997 2 1 507.657 5 -5.703 4 -0.204 1 -0.524 4 -0.320 3
17 1 1 1 10.660 5 9.205 0 209.28 268.19 -69 985.876 8 1 481.261 2 -3.779 4 0.744 7 1.218 8 0.474 1
18 1 1 1 16.670 1 13.434 0 231.49 294.21 -76 863.398 6 1 087.440 9 -6.549 7 0.522 9 0.326 9 -0.196 0
19 1 1 1 11.928 4 9.957 9 238.49 315.65 -80 086.368 6 1 414.436 3 -6.387 4 3.000 0 2.084 7 -0.915 3
20 1 1 1 11.928 4 9.957 9 237.44 315.65 -79 982.402 8 1 518.402 1 -5.905 9 3.000 0 2.120 5 -0.879 5
21* 1 1 1 11.928 4 9.957 9 238.75 315.65 -80 053.182 6 1 447.622 3 -5.572 5 2.522 9 1.930 9 -0.592 0
22 1 1 1 10.928 4 11.381 5 235.90 315.65 -79 807.314 1 1 693.490 8 -5.071 2 1.853 9 1.340 1 -0.513 8
23 1 1 1 14.670 1 11.973 7 242.92 339.09 -84 848.766 8 1 213.775 0 -3.945 7 1.958 6 1.388 2 -0.570 4
24 1 1 1 13.196 3 10.710 7 248.15 327.66 -83 017.670 5 1 219.099 4 -5.872 6 2.397 9 1.630 5 -0.767 4
25 1 1 1 17.196 3 10.710 7 251.02 327.66 -82 732.514 5 1 504.255 4 -6.099 0 2.397 9 2.585 6 0.187 7
26 1 1 1 16.670 1 13.434 0 249.83 353.10 -88 886.794 0 923.484 3 -6.174 3 1.397 9 1.246 4 -0.151 5
27 1 1 1 17.196 3 10.710 7 261.36 332.23 -87 645.255 3 1 497.817 6 -4.111 8 1.823 9 1.216 6 -0.607 3
28* 1 1 1 17.196 3 10.710 7 265.44 332.23 -87 751.608 9 1 391.464 1 -4.447 8 1.602 1 1.067 1 -0.535 0
29 1 0 1 10.660 5 9.205 0 224.00 262.21 -62 999.209 8 1 487.479 9 -3.242 8 0.259 6 -0.089 5 -0.349 1
30 1 0 1 11.928 4 9.957 9 238.34 274.22 -66 124.460 7 1 098.194 1 -6.485 2 -0.176 1 -0.032 5 0.143 6
31 1 0 1 10.928 4 11.381 5 235.41 274.22 -65 626.925 9 1 595.728 9 -5.562 5 -0.699 0 -0.431 4 0.267 6
32 1 0 1 14.670 1 11.973 7 237.06 274.22 -66 014.227 6 1 208.427 2 -5.430 1 -1.000 0 -0.607 8 0.392 2
33 1 0 1 16.670 1 13.434 0 242.50 288.22 -69 367.255 9 1 603.135 3 -4.141 4 -1.113 9 -0.733 1 0.380 8
34 1 1 1 10.660 5 9.205 0 231.24 282.19 -73 782.598 2 1 432.276 3 -4.215 3 0.275 7 0.911 3 0.635 6
35* 1 1 1 10.660 5 9.205 0 247.26 317.65 -81 118.210 4 1 394.365 9 -4.614 9 2.000 0 1.517 0 -0.483 0
36 1 1 1 11.928 4 9.957 9 246.94 329.66 -83 966.570 4 1 281.971 0 -4.246 1 1.301 0 1.447 2 0.146 2
37 1 1 1 10.928 4 11.381 5 246.69 329.66 -83 875.428 5 1 373.112 9 -4.401 8 0.494 9 0.762 9 0.268 0
38 1 1 1 14.670 1 11.973 7 249.67 353.10 -88 822.459 8 987.818 5 -4.524 7 0.721 2 1.305 2 0.584 0
39 1 1 1 17.196 3 10.710 7 260.40 341.67 -86 613.301 9 1 371.204 5 -4.068 6 0.886 1 1.948 6 1.062 5
40 1 1 1 16.670 1 13.434 0 256.61 367.11 -92 360.476 7 1 197.538 0 -5.409 1 0.522 9 1.424 7 0.901 8
41 2 1 0 10.928 4 11.336 4 284.55 348.29 -85 247.631 6 1 460.399 1 -4.311 4 -0.255 3 -1.173 6 -0.918 3
42* 2 1 0 16.670 1 13.434 0 278.28 363.71 -91 366.397 3 1 163.515 1 -5.797 5 -0.255 3 -1.145 2 -0.889 9
43 2 1 0 16.670 1 13.434 0 293.21 399.16 -98 538.383 5 1 289.230 8 -5.442 3 -0.919 1 -0.497 6 0.421 5
44 2 1 1 10.660 5 9.205 0 216.11 288.24 -71 941.051 0 1 087.154 6 -4.103 7 -1.176 1 -0.759 5 0.416 6
45 2 1 1 10.660 5 9.205 0 242.39 300.25 -74 391.017 7 1 373.152 9 -4.127 4 -1.823 5 -0.829 6 0.993 9
46 2 1 0 10.928 4 11.336 4 219.31 288.24 -71 792.854 5 1 235.351 1 -3.712 9 -0.724 3 -1.270 9 -0.546 6
47 2 1 0 12.660 5 10.665 4 201.89 260.23 -62 536.513 6 1 023.652 1 -3.558 5 -0.695 5 -0.547 8 0.147 7
48 2 1 0 17.174 1 14.105 1 237.32 323.69 -79 284.032 0 1 041.875 5 -6.514 2 -0.732 4 -0.621 9 0.110 5
49* 2 1 0 16.670 1 13.434 0 215.47 272.24 -65 189.471 4 1 106.659 4 -3.168 8 -0.778 2 -1.253 1 -0.474 9
50 2 1 0 17.174 1 14.105 1 237.31 323.69 -79 285.156 7 1 040.750 8 -4.047 5 -0.681 2 -1.182 1 -0.500 9
51 2 1 0 16.670 1 13.434 0 212.18 272.24 -65 039.206 1 1 256.924 7 -3.949 6 -0.616 0 -0.821 0 -0.205 0
52 2 1 0 17.174 1 14.105 1 257.43 317.71 -74 086.657 3 1 231.369 0 -3.758 5 -0.717 7 -0.980 5 -0.262 8
53 2 1 0 16.670 1 13.434 0 227.12 295.68 -69 886.037 1 971.830 6 -6.586 7 -0.582 1 -0.238 7 0.343 4
54 1 0 0 10.660 5 9.205 0 258.86 331.71 -78 026.545 8 1 039.216 9 -6.002 5 1.397 9 1.423 6 0.025 7
55 1 0 0 11.928 4 9.957 9 273.01 343.72 -80 443.994 8 1 357.733 0 -6.450 9 1.301 0 1.654 6 0.353 6
56* 1 0 0 11.928 4 9.957 9 273.20 343.72 -80 646.340 0 1 155.387 8 -6.333 9 1.096 9 1.393 8 0.296 9
57 1 0 0 11.928 4 9.957 9 280.23 343.72 -80 680.802 0 1 120.925 7 -6.592 2 0.920 8 1.232 1 0.311 3
58 1 0 0 13.193 6 10.710 7 285.38 355.73 -83 232.364 8 1 305.328 0 -6.069 7 1.000 0 1.322 5 0.322 5
59 1 0 0 17.196 3 10.710 7 297.54 355.73 -83 555.157 5 982.535 3 -5.844 1 1.920 8 1.246 9 -0.673 9
60 1 1 0 10.660 5 9.205 0 267.20 363.71 -91 305.016 7 1 224.895 7 -6.674 7 3.000 0 2.879 2 -0.120 8
61 1 1 0 11.928 4 9.957 9 280.03 375.72 -93 953.376 6 1 312.500 9 -6.596 7 1.508 6 2.763 1 1.254 5
62 1 1 0 11.928 4 9.957 9 276.94 375.72 -93 699.738 8 1 566.138 6 -4.837 0 2.522 9 2.731 4 0.208 5
63* 1 1 0 11.928 4 9.957 9 279.44 375.72 -93 973.604 7 1 292.272 8 -5.519 5 1.366 5 2.511 2 1.144 7
64 1 1 0 13.196 3 10.710 7 292.06 387.73 -96 328.641 4 1 673.201 1 -5.570 6 2.096 9 2.762 4 0.665 5
65 1 1 0 17.196 3 10.710 7 294.57 387.73 -96 565.801 8 1 436.040 7 -3.938 9 3.096 9 2.713 4 -0.383 5
66 1 0 0 10.660 5 9.205 0 262.04 325.67 -79 969.872 8 1 282.558 7 -5.416 4 0.699 0 0.653 5 -0.045 5
67 1 0 0 11.928 4 9.957 9 273.03 337.68 -82 526.295 5 1 462.101 1 -3.800 9 1.000 0 0.340 5 -0.659 5
68 1 0 0 11.928 4 9.957 9 275.66 337.68 -82 660.288 4 1 328.108 1 -4.011 9 0.221 8 0.168 7 -0.053 1
69 1 0 0 13.196 3 10.710 7 291.40 349.69 -85 300.196 1 1 424.165 5 -4.087 1 -0.079 2 0.021 9 0.101 1
70* 1 0 0 17.196 3 10.710 7 288.04 349.69 -85 324.372 9 1 399.988 7 -4.558 6 1.522 9 0.842 4 -0.680 5
71 1 1 0 10.660 5 9.205 0 282.68 357.67 -93 395.845 1 1 320.736 2 -5.340 3 2.000 0 1.455 3 -0.544 7
72 1 1 0 11.928 4 9.957 9 278.61 369.68 -95 968.704 2 1 483.842 1 -4.518 8 1.301 0 1.691 8 0.390 8
73 1 1 0 11.928 4 9.957 9 295.25 369.68 -96 296.125 4 1 156.420 8 -7.386 6 2.154 9 1.541 8 -0.613 1
74 1 1 0 11.928 4 9.957 9 295.48 369.68 -95 760.620 6 1 691.925 7 -4.965 6 1.397 9 1.594 2 0.196 3
75 1 1 0 13.196 3 10.710 7 309.97 381.69 -98 946.290 1 1 242.221 2 -4.268 4 1.096 9 0.685 9 -0.411 0
76 1 1 0 17.196 3 10.710 7 291.14 381.69 -98 397.246 8 1 791.264 5 -4.029 5 3.000 0 2.393 9 -0.606 1

*表示预测集。

样本含量n=66,复相关系数R=0.904 9,F=24.872 3,P=0.000,标准偏差Std=0.352 8。结果表明所建模型的拟合效果较好,回归方程具有统计学意义。
从回归方程来看,分子总能量ETE和生成热HHOF与pEC50呈正相关,这是因为结构特异性药物的分子要与受体结合产生生物效应,必须符合受体的空间要求,而分子的空间构象又与能量因素密不可分,这也从一个侧面体现了空间因素对结构特异性药物生物效应的重要性。分子体积V与生物活性呈负相关,这是因为分子体积越大,空间位阻越大,生物活性降低,即体积越大,分子越不容易与受体结合,从而抑制了分子的生物活性。分子摩尔质量M对分子生物活性也有影响,M越大,生物活性也越大,二者呈正相关。
图 5为吲哚芳砜类化合物活性的实验值与预测值,图 6为pEC50实验值与预测值之间的相关性。从结果中可以发现化合物1、5、14、39、61、63的预测值和实验值的误差相对较大,这是由于这些化合物在X位置引入的基团是SO2,砜为对称结构,可以使分子极性减小,此外砜基团的引入可能会改变药物分子与生物靶点的结合方式和选择性,从而影响生物活性。另外,在Z位置引入—NH2、—NHNH2、—NHNHCH2CH2OH等基团时,可形成酰胺类化合物,酰胺能够与生物大分子形成氢键而容易与受体结合,通常显示出结构特异性,从而影响生物活性。
图 5 吲哚芳砜类化合物活性的实验值与预测值

Fig. 5 Experimental and predicted values of the activity of indole aryl sulfone compounds

图 6 pEC50实验值与预测值之间的相关性

Fig. 6 Correlation between experimental and predicted values of pEC50

4 QSAR模型评价

为了进一步评价QSAR模型的稳定性以及对外部样本的预测能力,对模型进行留一法(leave-one-out,LOO)交互检验,结果如下:
$\begin{aligned}& \quad\quad n=66, R=0.856\;7, F=176.539\;8, P=0.000, S t d= \\& 0.445\;5 \text { 。 }\end{aligned}$
LOO检验结果表明,所建模型具有统计学意义,各参数变量与生物活性之间的相关性较好。
图 7图 8分别是模型的重要统计量标准偏差Std和复相关系数R随变量个数m的变化曲线。由结果可知,在建模(modeling)过程中Stdm的增加而减小,Rm的增加而增大。在LOO交互检验预测(LOO prediction)过程中,StdRm之间的变化关系没有明显的规律性,但是R的最大值与Std的最小值所对应的m是一致的。因此,可以根据LOO交互检验中StdR值选择最佳变量个数。在LOO预测过程中,m=10时Std值最小(0.445 5),相应地R值最大(0.856 7),因此本文选择最佳变量个数m为10,这与前文筛选出的变量个数一致,说明原模型不存在过拟合现象,模型的稳定性较强,预测能力较好。
图 7 Stdm的变化曲线

Fig. 7 Change of Std with m

图 8 Rm的变化曲线

Fig. 8 Change of R with m

5 结论

从吲哚芳砜类化合物的分子结构出发,采用改进的化学计量学方法,从28个结构参数中筛选出10个参数作为回归方程的最终变量,构建了吲哚芳砜类化合物的分子结构与抗HIV活性之间的定量关系模型。所建模型的复相关系数R为0.904 9,P值为0.000,说明该模型可以反映影响吲哚芳砜类化合物活性的主要因素,揭示其分子结构与生物活性之间的相关关系。对模型进行LOO交互检验,结果表明复相关系数R为0.856 7,标准偏差Std为0.445 5,说明所建模型具有较好的稳定性和可靠性,可以用于预测吲哚芳砜类化合物的抗HIV活性。
1
刘新泳. 抗艾滋病药物研究[M]. 北京: 人民卫生出版社, 2006.

LIU X Y . Study on anti-AIDS drugs[M]. Beijing: People's Medical Publishing House, 2006.

2
宋明明, 张娜娜, 刘晓芹, 等. 我国艾滋病流行及抗病毒治疗的研究进展[J]. 预防医学论坛, 2023, 29 (8): 637- 640.

SONG M M , ZHANG N N , LIU X Q , et al. Research progress of AIDS epidemic and antiretroviral treatment in China[J]. Preventive Medicine Tribune, 2023, 29 (8): 637- 640.

3
朱玉贤, 李毅. 现代分子生物学[M]. 北京: 高等教育出版社, 1997: 414- 424.

ZHU Y X , LI Y . Modern molecular biology[M]. Beijing: Higher Education Press, 1997: 414- 424.

4
杨维林, 宋贤. HIV整合酶抑制剂临床药代动力学研究进展[J]. 现代临床医学, 2023, 49 (5): 382- 386.

YANG W L , SONG X . Progress in the clinical pharmacokinetics of HIV integrase inhibitors[J]. Journal of Modern Clinical Medicine, 2023, 49 (5): 382- 386.

5
孟歌, 陈芬儿. HEPT类HIV-1逆转录酶抑制剂的研究进展[J]. 中国药物化学杂志, 2004, 14 (1): 56- 64.

MENG G , CHEN F E . Research progress of HEPT analogs as nonnucleoside HIV-1 reverse transcriptase inhibitors[J]. Chinese Journal of Medicinal Chemistry, 2004, 14 (1): 56- 64.

6
FEINSTEIN M J , ACHENBACH C J , STONE N J , et al. A systematic review of the usefulness of statin therapy in HIV-infected patients[J]. The American Journal of Cardiology, 2015, 115 (12): 1760- 1766.

DOI

7
GU S X , XIAO T , ZHU Y Y , et al. Recent progress in HIV-1 inhibitors targeting the entrance channel of HIV-1 non-nucleoside reverse transcriptase inhibitor binding pocket[J]. European Journal of Medicinal Chemistry, 2019, 174, 277- 291.

DOI

8
胡荣静. HIV-1逆转录酶及其抑制剂的分子模拟研究[D]. 兰州: 兰州大学, 2009.

HU R J. Molecular modeling studies of HIV-1 reverse transcriptase and some of its inhibitors[D]. Lanzhou: Lanzhou University, 2009. (in Chinese)

9
GAO S H , SONG L T , CHENG Y S , et al. Discovery of novel sulfonamide substituted indolylarylsulfones as potent HIV-1 inhibitors with better safety profiles[J]. Acta Pharmaceutica Sinica B, 2023, 13 (6): 2747- 2764.

DOI

10
相秉仁, 董颖, 刘浩. 粗糙集方法在吲哚芳砜类化合物抗HIV构效关系研究中的应用[J]. 计算机与应用化学, 2007, 24 (1): 77- 82.

XIANG B R , DONG Y , LIU H . Application of rough sets theory in the study on relationship between structure and anti-HIV activity of indolyl aryl sulfones[J]. Computers and Applied Chemistry, 2007, 24 (1): 77- 82.

11
RAGNO R , COLUCCIA A , LA REGINA G , et al. Design, molecular modeling, synthesis, and anti-HIV-1 activity of new indolyl aryl sulfones. Novel derivatives of the indole-2-carboxamide[J]. Journal of Medicinal Chemistry, 2006, 49 (11): 3172- 3184.

DOI

12
堵锡华, 冯长君. 价连接性指数mX与有机污染物lgKsw的相关性[J]. 分析科学学报, 2001, 17 (4): 321- 323.

DU X H , FENG C J . Studies on the relationship between valence connectivity index mX and lgKsw of organic pollutants[J]. Journal of Analytical Science, 2001, 17 (4): 321- 323.

13
徐光宪, 王祥云. 物质结构[M]. 2版 北京: 高等教育出版社, 1987.

XU G X , WANG X Y . Material structure[M]. 2nd ed Beijing: Higher Education Press, 1987.

文章导航

/