近几年来,前人在机器学习预测岩性方面也取得较好的进展,武中原等
[8]采用LSTM方法,通过提取岩性沉积序列特征提升了碳酸盐岩岩性识别精度,但该模型计算复杂、训练耗时,对长序列及岩性界面突变的响应仍显不足。周恒等
[9]引入胶囊网络,利用其向量表达特性挖掘测井参数与岩性之间的深层关系,提高了识别精度,但该网络训练复杂、计算成本高,应用经验有限,稳定性易受影响。曹茂俊等
[10]结合INPEFA技术、中值滤波与K-means聚类构建一维CNN模型,实现了地层识别与划分,但方法依赖预处理质量,K-means对噪声敏感且需预设类别数,难以捕捉复杂非线性特征。罗永亮等
[11]提出改进的Stacking算法,融合多模型优势以增强特征提取能力,但模型结构复杂、训练成本高,模型选择不当易导致过拟合和可解释性降低。孙婧等
[12]提出SSMO-SSA-LGBM模型,缓解了样本不平衡问题,但模型结构庞大、计算资源消耗高,决策过程复杂且可解释性较差。王勃等
[13] 将KAN网络用于岩性识别,但该技术尚不成熟,易过拟合且缺乏真实测井数据验证,应用风险较高。尹琼
[14]采用两步法及生成对抗网络处理类别不均衡问题,但存在误差累积风险,且GAN训练不稳定,可能生成噪声样本误导分类。王婷婷等
[15]提出基于MSCNN-GRU与XGBoost的混合方法,增强了可解释性,但模型结构复杂、训练困难,曲线补全质量直接影响识别效果。秦志军等
[16]采用递归特征消除与随机森林优选特征,提升了准确率与效率,但递归消除可能丢失弱相关或非线性重要特征。曹志民等
[17]结合SMOTE与极端随机树应对样本不平衡问题,但SMOTE生成的合成数据可能不符合实际地质规律,对边界模糊岩性提升有限。从目前的研究现状来看,基于机器学习的方法有效地提高了岩性识别的效率。但已有成果所用到的机器学习模型局限于测井数据,尤其针对垂向非均质性强、岩性变化快、成分复杂的陆相页岩
[18-19],其不同岩性的测井响应特征相似性高,难以实现岩性的精确判别,更多的机器学习算法只关注到了数据的单一特征,未能发掘数据中的关联性和潜在信息。