在储层地质建模领域中,地质统计学是建立地下地质模型非常重要的数学工具。20世纪90年代以前,传统建模方法主要是以变差函数为基本工具再现研究对象的统计特征和空间相关性。由于地下地质条件的复杂性,变差函数刻画的两点统计难以表征曲流河等复杂地质体的空间结构
[1,2,3,4]。90年代多点地质统计学算法(MPS)应运而生,多点地质统计学使用训练图像代替变差函数来表征地质体的空间相关性
[5]。训练图像是一种先验地质模式,多点统计模拟过程实际上就是对训练图像中地质模式再现的过程。在每个网格点的模拟过程中,GUARDIANO等
[5]提出的多点统计模拟算法都需要遍历整个训练图像来寻找最优解,因此整个模拟过程非常耗时,使得该算法难以实际应用。STREBELLE
[6,7]提出采用搜索树的数据结构存储数据事件,通过这种方式整个模拟过程只需要扫描一次训练图像,在后续模拟中待模拟网格点的累计概率分布函数直接由搜索树得到。这个方法大大提高了多点统计模拟的效率,使得多点地质统计学进入实用阶段。GUVEN提出了SIMPAT算法
[8],不同于基于概率的方法,SIMPAT方法首先把训练图像中的全部样式建立一个样式库。在模拟时寻找与数据事件最相似的数据样式,将得到的数据样式整体覆盖到待模拟网格点处,解决了基于概率的多点地质统计学方法存在的非平稳性问题。在进行三维模拟时,由于提取的数据样式数量巨大,且模拟过程中需要计算数据事件与每一个数据样式的相似度,因此计算量非常大,难以满足实际应用。ZHANG等
[9]提出一种针对SIMPAT的改进方法(FLITERSIM),FLITERSIM方法在模拟之前使用一系列过滤模板扫描训练图像,在训练图像上的每个节点都能得到一组“过滤分数”,然后依据“过滤分数”对训练图像中提取到的数据样式进行聚类。该方法在实际应用过程中如何选择合适的过滤模板是个难点。GREGOIRE提出一种直接抽样模拟方法(DS)
[10,11],它是一种基于像元的多点统计模拟方法。DS方法在模拟时,不需要扫描整个训练图像。DS方法设定一个相似度阈值,在对比数据事件与数据样式相似度时,一旦二者的相似度小于给定阈值,则该网格点的模拟结束,不需要继续比对其他数据样式,因此也在一定程度上提高了计算效率,但是存在阈值的给定具有一定主观性。HONARKHAH等
[12]提出了一种基于距离的多点统计建模方法(DISPAT),该方法计算样式之间的相似度并建立距离矩阵,通过多维尺度分析进行降维处理,然后根据K均值聚类法来对样式进行聚类分析,DISPAT方法能够显著提高模拟效率,但其内存开销已远远超出普通计算机可承受的范围。针对上述问题,本文提出一种基于众数法聚类的多点地质统计学建模方法(CMMS),该方法能够显著提高模拟计算的效率,能够很好地再现训练图像中地质模式及统计特征,并且可以直接应用于连续性变量。