中国学术期刊网 » 论文 » 理学论文 » 地理地质论文 » 主成分分析与支持向量机下砂土渗透系数预测模型的构建论文正文

主成分分析与支持向量机下砂土渗透系数预测模型的构建

中国学术期刊网【地理地质论文】 编辑:天问 云南大学学报(自然科学版) 2016-11-03主成分分析与支持向量机下砂土渗透系数预测模型的构建论文作者:周爱红 尹超 袁颖,原文发表在《云南大学学报(自然科学版)杂志》,经中国学术期刊网小编精心整理,仅供您参考。

关键词: 渗透系数; 渗透固结仪; 主成分分析; 支持向量机; 华北
摘要:渗透系数不仅是描述土体透水性能的重要指标,同时也是影响固结沉降和渗透变形的重要因素.首先对华北平原中东部地区的28个砂土样本通过自行改装的渗透固结仪进行渗透固结试验,得到不同孔隙比下的渗透系数.然后选取有效粒径 d10、限制粒径 d60、不均匀系数 Cu、曲率系数 Cc和孔隙比 e5个指标作为渗透系数k的影响因子,采用主成分分析(PCA)方法提取3个主成分,对影响渗透系数的主成分进行了全新的解释.最后,引入支持向量机(SVM)方法建立了华北平原中东部地区砂土渗透系数的预测模型,并利用该模型对华北平原中东部地区随机选取的20组样本进行渗透系数的预测.结果表明:自行改装的渗透固结仪可以较好地进行渗透固结试验;预测模型的精度较高,可以为华北平原中东部地区砂土渗透系数的研究提供参考依据.

中图分类号:P641.1 文献标志码:A 文章编号:0258-7971(2016)05-0742-08 doi: 10.7540/j.ynu.20150781

土体的渗透性是土力学中的重要课题之一, 不仅与土木工程领域内许多工程实践紧密结合, 同时与土体的强度、变形密切相关.大量实验表明, 土体的渗透系数受到很多因素影响.21世纪初, 国外学者S.Thevanayagam、C.Xenaki和P.Chapuis Robert对砂类土进行了渗透特性的探究, 研究表明细粒掺入后引起的孔隙比改变对渗透系数产生影响[1, 2, 3].朱崇辉、樊贵盛等[4, 5, 6]通过大量试验, 得出砂土的渗透系数与不均匀系数和曲率系数存在较大的相关性并且得到了与有效粒径之间的多项式关系.周中、王俊杰、邱珍锋等采用正交实验的方法对试验数据进行分析, 表明颗粒形状也是影响渗透系数的因素之一[7, 8, 9, 10].孔隙比是反映土体密实程度的物理指标, 邓永锋、苏立君、张宜健、孔令伟等通过大量试验表明渗透系数随孔隙比呈线性增加关系[11, 12, 13, 14].因此, 为了更加清楚地刻画渗透系数的影响因素, 国内许多研究人员[15, 16, 17, 18]采用人工神经网络法、聚类分析、分形理论等数学分析方法对不同地区的试验数据进行研究分析, 模拟并建立了不同地区渗透系数模型, 并且在一定范围内得到应用.

根据水文地质条件将华北平原自西北向东南划分为滹沱河、滏阳河和漳卫河3个冲洪积水文地质亚区.文献[19]指出整个华北平原是一个大的地下水流系统.华北平原中东部地区的武强县和深州县位于滹沱河与滏阳河冲积平原上, 因此选取该区域内的28个取样点进行渗透试验分析, 计算得到的渗透系数可以代表华北平原中东部地区的渗透规律.考虑实际土体一般都受到压力作用, 而压力对土体渗透性有明显影响, 因此, 研究土体渗透性时需考虑压力的影响.文中通过对WG型单杠杆固结仪进行改装, 得到可以同时进行渗透试验和固结试验的渗透固结仪, 并使用该渗透固结仪对试样进行渗透固结试验得到不同压力下的渗透系数[20, 21].在饱和状态下, 相同颗粒级配土体的孔隙比与压力直接相关, 因此用较易获得的表征土体物理性质的孔隙比来体现压力影响.然后使用PCA对选取的有效粒径d10、限制粒径d60、不均匀系数Cu、曲率系数Cc和孔隙比e这5个指标进行分析, 剔除指标之间的关联性, 重新线性组合得到3个主成分并对其进行解释.最后通过SVM对华北平原中东部地区砂土的渗透系数k进行训练并建立相应的模型, 以期为进一步研究砂土的渗透系数提供依据.

1 试验原理
1.1 级配试验
首先对砂土试样进行风干, 称取200g土样置于标准筛上, 标准筛孔径为5、2、1、0.5、0.25、0.1mm和0.075mm, 将标准筛由上到下置于振筛机上振摇15min, 分别称取留置在各筛上的土样, 精确至0.01g; 称取30g留置在底盘的土样使用密度计法进行量测; 综合筛分法和密度计法得到小于某粒径的百分数, 绘制颗粒级配曲线; 最后, 计算得到d10、d60、Cu和Cc以备后续数据分析[22].

1.2 渗透固结试验仪器的改装
由于渗透系数与孔隙比有关[6], 因此为了试验数据的准确性, 必须考虑在不同孔隙比下(即不同压力条件下)的渗透系数.以WG型单杠杆固结仪为基础, 以构造简单、安装方便和密封良好为原则, 通过对固结仪的改装, 使得该仪器可进行渗透试验和固结试验.改装仪器示意图如图1所示.


图1
Fig.1
Figure OptionView
Download
New Window
图1 改装的渗透固结仪
Fig.1 Modified osmotic oedometer

1.3 渗透固结试验步骤及数据对比
在实验开始之前应先制备土样.使用2cm× 50cm2的环刀对土样进行切削, 将切削后的环刀安置在固结桶内; 为防止水从透水石与固结仪的边缝处流出造成误差, 在透水石a、透水石b与固结桶壁之间使用O型密封圈进行密封并旋紧透水石; 最后盖上顶盖, 将固结仪安放在加荷系统上并安装测微表.随后进行渗透压缩试验:首先读取测微表的初始读数; 然后打开止水夹13并预压25kPa; 待测微表读数稳定后记录读数并打开止水夹12, 排出容器底部的空气, 直至排气管9溢出的水中无气泡产生时, 关闭止水夹13; 在一定水头作用下静置一段时间, 待透水石a处有水溢出后将蓄水瓶注水至指定高度, 并在开动秒表的同时记录初始水头高度h1, 在量测时间Δ t后, 记录终了水头h2; 如此连续量测2~3次, 再将蓄水瓶注水至指定高度, 重复量测6次, 并记录初始与终了时刻的水温.以上过程是在压力为25kPa条件下对渗透系数的量测, 随后依次施加50、100、200、300、400kPa的压力, 并按照上述过程依次量测记录水头.

为了验证渗透固结装置的可靠性, 分别采用改装的渗透固结仪与传统固结仪对同种试验土样进行侧限压缩试验.采用试验结束后量测得到的含水率w和密度ρ 加上在试验中排出的水的质量计算得到初始孔隙比e0.选取一组试样进行计算得到如下物理指标:土粒比重ds=2.793, 含水率w=27.72%, 密度ρ =1.8146g/cm3, 计算得到初始孔隙比e0=0.96584.表1是渗透固结仪与传统固结仪对同一组试样进行对比的结果, 结果表明在相同压力作用下得到的孔隙比误差小于3%, 说明该改装的渗透固结仪可同时进行固结试验并且效果良好.

表1
Tab.1
表1(Tab.1)

表1 渗透固结仪与标准固结仪试验结果比较 Tab.1 The comparison between osmotic oedometer and traditional oedometer使用仪器 压力/kPa 孔隙比
传统固结仪 25 0.952
50 0.942
100 0.928
200 0.911
300 0.898
400 0.889
渗透固结仪 25 0.940
50 0.928
100 0.910
200 0.890
300 0.877
400 0.868
表1 渗透固结仪与标准固结仪试验结果比较
Tab.1 The comparison between osmotic oedometer and traditional oedometer
利用南土TST55渗透仪进行常规渗透试验以及使用新改装的渗透固结仪按照渗透固结试验步骤对土样逐级加荷至稳定后进行渗透试验.为了保证数据的准确性, 消除蒸发量的影响, 在每组试验结束后需要对蓄水瓶静置24h, 求出平均蒸发量对渗透试验结果进行修正.表2为分别使用南土TST55渗透仪与改装的渗透固结仪对同一组试样进行渗透试验并对数据进行修正后的结果对比, 表明压力对渗透系数有明显影响, 改装的渗透固结仪比传统的渗透仪适用性更广.

表2
Tab.2
表2(Tab.2)

表2 渗透固结仪与TST55渗透仪试验结果比较 Tab.2 The comparison between osmotic oedometer and TST55 osmoscope使用仪器 压力/kPa 渗透系数/
(μ m· s-1)
TST55渗透仪 3.953
渗透固结仪 25 3.869
50 3.373
100 2.911
200 2.514
300 2.300
400 2.157
表2 渗透固结仪与TST55渗透仪试验结果比较
Tab.2 The comparison between osmotic oedometer and TST55 osmoscope
2 主成分分析
主成分分析是经由人工“ 改造” 对原始变量构造新的线性组合关系, 选取少数几个互不相关的新变量, 并使他们含有足够多的原始变量信息.目的是为了避免由于数据信息的冗余和各指标间的相关性影响造成对预测结果的误差以及产生的数据量过大导致的计算复杂的问题.

颗粒级配试验和渗透固结试验成果如表3.提取5个原始变量d10、d60、Cu、Cc和e及其分别对应的渗透系数k.采用主成分分析方法对表3数据进行重新整理和归纳, 以尽可能多地提取有效信息为前提, 采用较少的主成分代替5个原始变量, 简化分析和解释过程.

表3
Tab.3
表3(Tab.3)

表3 试验成果表 Tab.3 Test results table样号 d10 d60 Cu Cc e k/(μ m· s-1)
1 0.078 0.417 2.346 5.354 0.747 0.297
2 0.040 0.516 5.873 12.977 0.653 0.097
3 0.047 0.512 3.817 11.018 0.611 0.157
4 0.055 0.484 4.331 8.771 0.693 0.717
5 0.036 0.148 1.290 4.073 0.590 0.702
6 0.025 0.371 4.344 14.901 0.587 0.015
7 0.042 0.099 1.621 2.334 0.753 1.768
… … … … … … …
165 0.149 0.428 2.883 1.445 0.552 6.377
166 0.077 0.291 3.785 1.062 0.515 0.782
167 0.069 0.279 4.029 0.498 0.579 1.144
168 0.078 0.417 5.354 2.346 0.683 0.207
表3 试验成果表
Tab.3 Test results table
在主成分分析中, 提取的每一个主成分都是对单一原始变量的线性组合, 如有i个原始变量x1, x2, …, xi, 则可提取出i个主成分Y1, Y2, …, Yi, 例如:Y1=a1x1+a2x2+…+aixi, Y2=b1x1+b2x2+…+bixi, 等等.理论上来说, 有i个原始变量是可以提取i个主成分的.多数情况下只需要提取出包含85%以上信息的前2~3个主成分进行分析就足以满足精度要求, 其余的可以忽略不计[23].

由表4相关系数矩阵可以看出, e与d10有较强的相关性, e和d10都是关于土体透水性的参量, 它们可以共同反映土体的透水性方面的特征; d60与Cu、Cc都有较强的相关性, 它们都是反映颗粒级配程度的相关参量; 如果把上述具有相关关系的因素直接用于分析, 可能会产生严重的共线性问题.所以采用主成分分析方法提取适当数量的主成分, 重新对各试验指标进行线性组合, 可以进一步清楚地阐述影响渗透系数的因素.

表4
Tab.4
表4(Tab.4)

表4 相关系数矩阵 Tab.4 Correlation coefficient matrix试验指标 d10 d60 Cu Cc e
d10 1.000 -0.020 -0.485 -0.420 0.470
d60 -0.020 1.000 0.562 0.736 -0.342
Cu -0.485 0.562 1.000 0.508 -0.361
Cc -0.420 0.736 0.508 1.000 -0.325
e 0.470 -0.342 -0.361 -0.325 1.000
表4 相关系数矩阵
Tab.4 Correlation coefficient matrix
表5为各试验指标的公因子方差比.可见, 除了Cu有26.5%及Cc尚有20.6%的信息未被提取外, 其余3个试验指标的信息被提取得很充分.

表5
Tab.5
表5(Tab.5)

表5 公因子方差比 Tab.5 Commonalties试验指标 原始值 公因子方差比
d10 1.000 0.951
d60 1.000 0.964
Cu 1.000 0.735
Cc 1.000 0.794
e 1.000 0.994
表5 公因子方差比
Tab.5 Commonalties
表6为对5个试验指标进行主成分分析的列表, 表中可以得到5个主成分, 按照从大到小排序, 分别为第1、第2、……、第5主成分, 第1主成分的特征根为2.718, 其解释方差的贡献率为54.356%, 第2主成分的特征根为1.085, 其解释方差的贡献率为21.693%, 第3主成分为0.636, 其解释方差的贡献率为12.726%, 累计到第3主成分, 其解释方差的累计贡献率为88.775%, 结合图2的碎石图可以看出, 从第4个主成分开始, 后面的特征根都相对较低, 表明可以用前3个主成分对原始数据进行分析.

表6
Tab.6
表6(Tab.6)

表6 主成分特征值及贡献率 Tab.6 Eigenvalues and contribution rate of principle component主成分 初始特征根 提取的主成分
特征根 方差/% 累计方差/% 特征根 方差/% 累计方差/%
1 2.718 54.356 54.356 2.718 54.356 54.356
2 1.085 21.693 76.049 1.085 21.693 46.049
3 0.636 12.726 88.775 0.636 12.726 88.775
4 0.476 9.518 98.293
5 0.085 1.707 100.00
表6 主成分特征值及贡献率
Tab.6 Eigenvalues and contribution rate of principle component

图2
Fig.2
Figure OptionView
Download
New Window
图2 主成分分析碎石图
Fig.2 Principle component analysis of scree plot

表7为因子负荷矩阵, 给出了前3个主成分在各项指标影响下的权重系数.从表中可以看出, 第1主成分对d60、Cc和Cu的提取比较充分, 表明第1主成分是反映与土体颗粒级配有关的变量; 第2主成分是d10、d60和e的加权和.d10是可以有效反映土体透水性的粒径, e是反映土体密实程度的变量, d10和e与土体的透水性能息息相关, 表明第2主成分反映的是土体透水性能强弱关系的参量.第2主成分越大, 表明整体的颗粒偏大, 透水性较好; 第3主成分对d10和e提取得较充分, 所以第3主成分也可以概括为土体的透水性能, 是对第2主成分的补充.

表7
Tab.7
表7(Tab.7)

表7 因子负荷矩阵 Tab.7 Matrix of factor loading试验指标 主成分
1 2 3
d60 0.952 0.121 -0.208
Cc 0.830 -0.304 -0.113
Cu 0.645 -0.560 -0.075
d10 -0.062 0.937 0.263
e -0.192 0.240 0.949
表7 因子负荷矩阵
Tab.7 Matrix of factor loading
表8为通过主成分分析得到的因子得分系数矩阵, 通过该系数矩阵可以使用各试验指标对各主成分线性组合, 即:Y1=0.19x1+0.545x2+0.268x3+0.417x4+0.138x5.式中, Y1为第1主成分, x1~x5对应5个试验指标.同理可以写出第2主成分和第3主成分的表达式[24].

表8
Tab.8
表8(Tab.8)

表8 因子得分系数矩阵 Tab.8 Matrix of factor scores试验指标 主成分
1 2 3
d10 0.190 0.795 -0.051
d60 0.545 0.373 -0.107
Cu 0.268 -0.399 0.271
Cc 0.417 -0.101 0.160
e 0.138 -0.182 1.085
表8 因子得分系数矩阵
Tab.8 Matrix of factor scores
使用主成分分析方法对上述试验数据进行分析, 剔除了冗余数据, 降低了数据之间的相关性, 对数据的解释更加合理.

3 SVM预测模型
为了建立华北平原中东部地区砂土渗透系数的预测模型, 引入SVM方法对试验数据进行分析.SVM方法作为一种有坚实理论基础的新颖的小样本学习方法, 高效地实现了从训练样本到预测样本的过程, 大大简化了分类、预测问题, 避免了“ 维数灾难” 和“ 过学习” 的问题[25].

随机抽取20组样本作为预测样本, 余下的148组样本作为训练样本.为了确保预测模型的精度, 使用多次随机交叉验证试验来确定支持向量机模型的参数c和g的值.经比较发现, 当c=32, g=2时模型预测精度最高, 训练样本和预测样本的原始值与预测值对比, 如图3所示.