利用Kmeans聚类分析进行储层分类 下载本文

用K-means聚类分析进行储层分类

薛敬桃1,闫长辉1,杨鹏1 ,王栎霖1

(1成都理工大学能源学院)

摘要:对于储层进行分类时,由于地质参数比较多,常常给分类带来很多困难。本文介绍的聚类方法,能够实现储层分类,并通过实例介绍了该方法的应用,具有积极意义。

K-means cluster analysis to reservoir classification

Xuejintao,Yuanenlai,Yangpeng,Wangliling

(Energy Institute of Chengdu University of Technology)

Abstract: For the classification of the reservoir, the geological parameters are more often caused many difficulties to classification. This article describes the clustering approach to achieve reservoir classification, introduced by an example application of this method of positive meaning. Keywords: Cluster;Reservoir;Classification

关键字:聚类方法;储层;分类

在进行储层评价时,常常需要对储层进行正确合理地分类。通常以某一个地质参数为主要分类的依据,并根据相关经验来确定出分类界限。但对于一个实际储层的分类,往往其影响的地质因素是多个。在多地质参数影响的情况下,为了能够更有效更快速地确定出分类界限,并减小人为确定分类界限的误差,常需要使用聚类分析[1]的方法。

1.K-means聚类分析原理

K-means是一种聚类分析的方法,是一种无监督式的学习算法,其中K表示的是最终分类个数。它是根据分类个数K随机的选取K个初始的聚类中心,不断迭代。在每一次迭代中,通过每一个点计算和各聚类中心的距离,并将距离最近的类作为该点所属的类,即当目标函数达到最小值时,得到聚类为最终聚类结果,并将数据分为k类。K-means算法目的是将一个集合进行等价类划分,即对数据结构相同的记录按照某种分类规则,将其划分为几个同类型的记录集[2]。目标函数采用平方误差准则,即E=ΣΣ|P-mi|2,其中E为各个聚类对象的平方误差之和,P为聚类对象,mi是类ci的各聚类对象的平均值,即:

式中,|ci|表示的是类ci聚类对象的数目。K-means聚类法的计算复杂度为O(knt),其中k表示聚类数,n表示聚类对象样本数目,t表示迭代次数。

K-means算法的迭代过程可以描述为下面的过程: a)将样本分为K类;

b)选择K个点作为“种子”;

c)计算各个样本数据点到种子之间的距离,将样本重新分为K类;

d)再将每类的平均值做为新的种子,重新进行聚类运算;

e)重复上述计算过程,当目标函数达到最小值时运算结束,最终将样本分为K类。

2.应用实例

2.1选择分类参数

在进行储层分类的时候,要正确选择能够反映储层特征的地质参数。这些地质参数可以是宏观参数也可以是微观参数,可以是静态数据资料或者动态资料。本次选取做储层分类的参数为孔隙度、渗透率、渗透率突进系数以及泥质含量这四个参数。这四个地质参数能够从储层的物性和均质性方面反映出储层特征。表1为某井的典型样品参数。 作者简介:薛敬桃(1980-),2004年本科毕业。现为成都理工大学油气田开发地质专业在读硕士研究生,主

1

要从事油气藏地质及储层评价研究。地址:(610059)四川省成都市成华区成都理工大学银二公寓615。电话:13402810946。

2

表1储层参数表

序渗透率突进系数 号 1 2 3 4 5 6 7 8 9 1.8550 3.3688 2.7762 2.6827 1.6194 2.1175 2.3053 2.4053 0.8081 孔隙度(%) 渗透率(×10μm) 泥质含量(%) 岩性 22.5 20.6 22.3 23.9 21.2 16.5 24.9 24.9 27.6 27.8 23.6 19.3 18.3 17.2 24.4 19.6 15.8 15.6 17.5 14.9 16.7 18.7 530.6 17.6 44 86.1 574.6 169 103.1 103.1 1651 1521.1 149.5 53.8 45.7 42.1 122.6 44.3 9.7 14.6 18.5 21.6 30.2 13.4 14.5 32.8 18.4 11.5 16.7 27.9 26.8 26.8 9.5 12.2 21.8 22.4 20.4 18.5 18.5 10.8 15.5 24.3 22.5 19.8 24.6 19.6 细砂岩 粉砂岩 细砂岩 细砂岩 中砂岩 粉砂岩 粉砂岩 粉砂岩 中砂岩 中砂岩 粉砂岩 粉砂岩 粉砂岩 细砂岩 细砂岩 中砂岩 细砂岩 粉砂岩 粉砂岩 细砂岩 粉砂岩 粉砂岩 -3210 1.1264 11 2.2407 12 2.4580 13 2.5530 14 2.8580 15 2.0752 16 3.0944 17 3.3616 18 3.8458 19 3.3428 20 3.5453 21 3.8251 22 3.0458 2.2建立模型 这里采用spss clementine数据挖掘软件建立模型。该软件是基于数据流的思想进行建模操作的。采用该软件的优点是整个建模过程为可视化操作,操作直观,而且能够清楚地看到数据流向。利用clementin建立的模型,如图1所示。该模型的意思是,首先读取excel格式的储层参数文件,通过类型节点设置数据列的类型,通过过滤节点设置不需要参与运算的数据列,通过K-means节点进行聚类分析,将聚类分析的结果传送到输出节点。

K-Means聚类分析 储层参数表 类型 过滤 分布图 K-Means 类型 过滤 聚类结果

图1 K-means聚类分析模型

3