0 引言
1 方法原理
1.1 LightGBM算法
1.2 贝叶斯优化
1.3 SHAP算法
2 地质背景与数据准备
2.1 地质背景
2.2 数据收集与探索
表1 川南深层页岩储层分级标准Table 1 Grading standard of deep shale reservoirs in southern Sichuan Basin |
| 页岩储层参数 | 单参数分级标准 | 单参数权重系数 | 不同级别储层赋值 | 综合分级标准 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Ⅰ类储层 | Ⅱ类储层 | Ⅲ类储层 | Ⅰ类储层 | Ⅱ类储层 | Ⅲ类储层 | Ⅰ类储层 | Ⅱ类储层 | Ⅲ类储层 | ||
| TOC含量/% | ≥3 | [2,3) | <2 | 0.3 | 1 | 0.7 | 0.4 | ≥0.85 | [0.6,0.85) | <0.6 |
| 孔隙度/% | ≥5 | [3,5) | <3 | 0.2 | ||||||
| 含气量/(cm3/g) | ≥3 | [2,3) | <2 | 0.3 | ||||||
| 脆性指数/% | ≥55 | [35,55) | <35 | 0.2 | ||||||
2.3 数据预处理及评价指标
表2 回归和分类模型的评价指标Table 2 Evaluation indicators for regression and classification models |
| 评价指标 | 计算公式 | |
|---|---|---|
| 回归 模型 | RMSE | |
| R 2 | ||
| 分类 模型 | P | |
| R | ||
| Weighted-P | ||
| Weighted-R | ||
|
3 页岩储层类型识别模型
3.1 超参数调优
表3 基于LightGBM算法的4个页岩储层参数回归预测模型超参数搜索范围及最优值Table 3 Range and optimal values of hyperparameters for four shale reservoir parameter regression prediction models based on LightGBM algorithm |
表4 基于LightGBM、RF和SVM的页岩储层类型识别模型超参数搜索范围及最优值Table 4 Range and optimal values of hyperparameters for shale reservoir type identification model based on LightGBM, RF, and SVM |
| 算法类型 | 超参数 | 搜索范围 | 步长 | 最优值 |
|---|---|---|---|---|
| LightGBM | n_estimators | [50,200] | 1 | 90 |
| max_depth | [3,8] | 1 | 3 | |
| learning_rate | [0.001,0.1] | 对数空间均匀采样 | 0.087 | |
| num_leaves | [5,31] | 1 | 7 | |
| min_child_samples | [5,20] | 1 | 9 | |
| reg_alpha | [0.4,0.7] | 线性空间均匀采样 | 0.444 | |
| reg_lambda | [0.4,0.7] | 线性空间均匀采样 | 0.401 | |
| RF | n_estimators | [50,200] | 1 | 63 |
| max_depth | [3,8] | 1 | 8 | |
| min_samples_split | [5,15] | 1 | 7 | |
| min_samples_leaf | [5,15] | 1 | 15 | |
| SVM | C | [0.01,5] | 对数空间均匀采样 | 0.150 |
| gmma | [0.01,5] | 对数空间均匀采样 | 0.083 |

甘公网安备 62010202000678号