查找区域工具可识别输入栅格中,符合特定大小要求和空间约束的最佳区域。 区域是含有相同值的连续像元组。 可在此工具中定义一些要求和约束,其中包括:要选择的总面积、总面积将分布的区域数、所需区域的形状以及区域间的最小距离和最大距离。
定位区域通常与最佳区域连接工具结合使用,以选择最佳可用区域,并以最有效的方式将其连接。 要进行此项分析,您首先需要一个适宜性表面,该表面可通过使用此工具集中的其他工具进行创建。 接下来,使用查找区域识别最佳可用区域。 最后,使用最佳区域连接确定区域间成本最低的路径网络。 有关如何创建适用性模型的详细信息,请参阅了解叠加分析。
查找区域所解决的示例问题
利用通过适用性模型创建的表面,您将能够在下列情况中识别最佳区域:
- 要保护的鹿最为偏爱的栖息地。 为了维持种群活力,需要八个栖息地(区域),且每个区域必须达到约 连续的 50 英亩。 为了维持兽群内的繁育机会,这些区域间的距离需要足够近,以便彼此之间可通过野生动物廊道相连。
- 采伐作业中取得木材的最佳位置。 为使其具有经济可行性,要采伐的面积(区域)必须至少达到连续的 250 英亩,且相邻区域间的距离必须在一英里以内。
- 新建购物中心的理想位置。 购物中心的最佳面积为 60 英亩,而建造用地应为连续区域,且建筑用地(区域)的形状应尽量紧凑。
将像元分组为区域
要在适宜性栅格中将各个像元创建为区域,有六种主要的方式。
- 将像元分组为单个区域。
- 将像元分组为指定数量的等面积区域。
- 将像元分组为指定数量的等面积区域,同时支持区域间指定的距离约束。
- 将像元分组为指定数量的非等面积区域,这些区域的大小将通过已定义的最小和最大区域面积要求进行控制。
- 将像元分组为指定数量的非等面积区域,这些区域的大小将通过已定义的最小和最大区域面积要求进行控制,这样,任意两个区域的距离均不会小于所标识的最小值,也不会大于所标识的最大值。
- 与前一选项相同,但在选择过程中必须考虑已经分配到研究区域中的既有区域。
查找区域的常规算法
查找区域将栅格作为输入,在栅格中较高的值表示较高的效用程度。 此工具能够从该栅格中选择符合指定区域要求和空间约束的最佳区域。
使用此工具查找区域可分为四个步骤。 下面列出了四个一般步骤,且附有详细的说明:
- 消除认为不适合此选择过程的位置。 位置的示例通常包括水体、现有建筑物以及过陡区域内的位置。 这是预处理步骤。
- 定义所需的一个或多个区域的特征。 这些特征的示例包括其大小、形状和方向等。 本步骤可通过在此工具中设置参数来完成。
- 根据用户定义的维持区域形状与效用最大化之间的折衷来识别输入栅格中的所有候选区域。 本步骤可通过此工具采用的区域增长算法完成。
- 使用用户定义的评估标准从候选区域中选出一个或多个最佳的区域。 例如,仅选择平均值最高的区域。 本步骤可运用采用了指定评估方法的选择算法在此工具中执行。
用于识别候选区域的主要算法采用了参数化区域增长 (PRG) 技术,可将每个识别的像元都看作是区域增长的潜在种子。 可根据像元在保持所需区域形状与像元属性值效用(适宜性)两方面的折衷评估来选择向区域添加哪些连续像元。 属性值越高,效用越大。 潜在的候选区域将持续增长,直到满足该区域指定的面积要求为止。 将针对所有种子执行此增长过程。 生成的每个区域均被视为候选选项,在这一阶段会有许多重叠的候选区域。 本步骤中不会分配任何像元,而一个像元可以作为多个候选区域的成员。
要选择一个或多个最佳区域,需采用选择算法对通过 PRG 技术识别的候选区域进行评估,以根据下列首选项选出最理想的配置:
- 指定的评估方法标准,例如最高平均值、最高总和或最大边数。
- 由最大距离和最小距离参数定义的区域间评估标准。
需要多个区域时,选择方法可在如何选择最佳区域方法方面提供额外控制。 包括 COMBINATORIAL 和 SEQUENTIAL。
- 如果选择 COMBINATORIAL 方法,则系统将对所需区域数的所有可能的组合数进行评估。 例如,使用这种方法时,如果将区域数设置为 8,且根据 PRG 创建的潜在区域数为 150,000,则系统将对 150,000 个候选区域中所有可用的 8 个区域的组合进行测试,以便根据评估方法和空间约束识别出最佳的 8 个区域。 如果某单个最佳区域不在最佳 8 区域组合范围之内,则系统可能不会选择此区域。
- 如果选择 SEQUENTIAL 方法,则系统选中的第一个区域即为基于评估方法且符合空间约束的最佳区域。 系统选中的第二个区域为基于评估方法且符合空间约束的次优区域,仅次于第一个选中区域。 此过程将持续进行,直到区域数达到为止。
候选区域可以重叠,但是,一个像元只能分配给一个区域。 一旦选择了某个区域,则在后续区域的选择过程中系统将不会考虑任何包含已分配像元的剩余候选区域。 而上述候选区域内的其余像元仍在其他候选区域的考虑范围之内。
种子的分布方式
为了减少处理时间,可从某些已识别的像元位置(称为种子)增长候选区域,而无需从输入栅格范围内的每个可用像元位置增长区域。 增长区域所用的种子数将通过可用于增长的种子数参数进行控制。
在整个栅格中,指定数量的种子将根据输入栅格中效用值的空间分布情况进行分布。 也就是说,效用值最高的输入栅格区域内种子较多。 假设最佳区域更有可能位于输入栅格效用值最高的区域。
要识别种子的特定位置,则可根据所有输入栅格像元及其效用值创建分布。 高效用值较高的像元所占的分布比例也会更大。 系统会从该分布中随机选择一个值,以识别种子应处的像元位置。 因为效用值较高的像元所代表的分布比例较大,所以系统更有可能选择这些位置。
在确保给定区域内种子数的分布与该区域内像元总效用成正比的同时,还需进行额外的调整以确保种子间的距离不会过近。
种子分布示例
举一个简单的例子,我们有一个效用值分别为 1、2、3 和 4 的四像元栅格。 根据这四个值创建分布。 此处像元值的总和为 10。 然后,将上述值调整到 0 到 1 数值范围内。 效用值为 1 的像元占分布的 10%(分布的 0 到 0.1),效用值为 2 的像元占 20%(分布的 0.1 到 0.3),效用值为 3 的像元占 30%(分布的 0.3 到 0.6),效用值为 4 的像元占 40%(分布的 0.6 到 1)。 将在 0 与 1 之间随机选择一个值。 此随机值有 40% 的机会落到分布中 0.6 到 1 的范围内,这表示在分配了效用值 4 的像元位置放置一个种子时,该像元的效用值最高。
根据所需区域大小调整区域增长分辨率
除了使用可用于增长的种子数参数减少处理时间外,您也可通过使用增长分辨率参数来提高性能。 您可使用增长分辨率参数控制 PRG 算法,以使其在更为粗略的输入栅格中间版本上增长。 在这种情况下,如果所需区域是通过中间栅格从候选区域中选择的,则系统会将生成的栅格重采样至像元大小,以生成最终输出栅格。 中间栅格的分辨率根据与指定增长分辨率相关联的像元数决定。
为确保生成的每个区域中均有足够的像元并减少不必要的处理,由中间栅格的每个目标增长分辨率确定的分辨率和像元总数可能需要进行二次调整。 平均区域大小范围内的像元数可根据已指定的增长分辨率决定的分辨率进行确定。 平均区域大小的计算方法为:用所需总面积除以指定区域数。 为确保每个选中区域中均能有足够的像元,平均区域大小范围内的像元过少时,则需要将中间栅格的分辨率设置得更为精细(像元尺寸减小,则像元数量会增加)。 为减少不必要的处理,平均区域大小范围内的像元过多时,则可将中间栅格的分辨率设置得更为粗略。
用于界定平均区域大小范围内的像元数是否过大或过小的阈值,要根据选定的增长分辨率而定。 例如,如果选中了 LOW 分辨率选项,且平均区域大小范围内的像元数过低而不足以生成合理的结果时,则针对少于 1,800 个像元的选择,系统会将中间栅格的分辨率设置得更细,以使平均区域大小范围内的像元不少于 1,800 个。 此举可确保提供足够的像元来生成合理的区域。 相反,平均区域大小范围内的像元超过 5,400 个时,为减少不必要的处理,可将中间栅格分辨率中的 LOW 分辨率设置得更为粗略,直到平均区域大小范围内的像元达到 5,400 个为止。
增长分辨率的 MEDIUM 和 HIGH 选择也需要进行同样的调整,但阈值会有所不同。 对于 MEDIUM 分辨率,其平均区域大小的阈值下限为 3,200 个像元,上限为 9,600 个像元。 对于 HIGH 分辨率,其平均区域大小的阈值下限为 7,200 个像元,上限为 21,600 个像元。
经过二次调整后,针对每个指定的增长分辨率执行 PRG 的重采样中间栅格,其像元总数可能低于或高于目标像元数。
指定最小面积和最大面积的情况下区域的界定方式
当区域最小面积和区域最大面积均已指定时,如果要考虑每个种子中介于指定的最小尺寸和最大尺寸间的所有可能区域大小,则需要比较的区域组合就会过多。 所以,该算法将确定每个种子中尺寸介于最小尺寸和最大尺寸间的区域(在 PRG 过程中创建并在 COMBINATORIAL 和 SEQUENTIAL 选择过程中经过考虑)的数量,以识别最佳区域。
所有区域大小均是根据最小、最大和平均区域大小生成的。 为确定平均区域大小,此算法将利用总面积除以指定区域数。 平均区域大小是要从每个种子生成的第一个区域大小。 通常,平均区域大小会较为接近指定的最小或最大区域大小。 也就是说,它是 Abs(最大 - 平均)或 Abs(最小 - 平均)间的较大距离。 该值被称为 LargerDist。
要计算用于定义落在平均区域大小和较大距离间区域大小的步长间隔,需要用到以下公式:
StepInterval = LargerDist/(N - 1)
- 其中 N 为指定区域数。
从平均区域大小开始,连续加上或减去 StepInterval,直到达到较大的距离值为止。 然后执行与上一步相反的运算,依次减去或加上相等的 StepInterval,直到达到较小的距离值为止。
在本处理步骤中,如果区域大小的数量小于 4,则在每个现有值之间添加两个额外的大小。 如果大小的数量小于 7 但大于 3,则在每个现有值之间添加一个额外的大小。 因此,根据指定区域数的不同,每个种子中创建的区域大小数量最少为 7,最多为 15。
本节的后文中给出了一些可说明上述参数交互情况的示例。
如果指定了区域最小面积和区域最大面积,则在 COMBINATORIAL 或 SEQUENTIAL 选择过程中,系统会将每个种子的每个区域大小均作为候选区域进行考虑,并在选择过程中对其进行测试,以识别最佳区域。
如果仅指定了区域最小面积而未确定区域最大面积,则最大面积将根据指定的最小面积大小、总面积和区域数进行确定。 例如,将区域最小面积设置为 5 平方英里,将总面积设置为 50 平方英里,并将区域数设置为 5。 可能的最大面积可通过以下方法确定:假设其中有 4 个区域的大小等于最小面积,本示例中最小面积为 5 平方英里,则总数为 20 平方英里。 而剩下的 30 平方英里即为可能出现的最大面积,因此可将其指定为区域最大面积。 类似的逻辑同样适用于仅指定了区域最大面积的情况,但最小面积必须大于 0。
示例 1
此示例中设置了以下参数:
- 总面积设置为 300 平方英里
- 区域数设置为 6
- 区域最小面积设置为 40 平方英里
- 区域最大面积设置为 100 平方英里
由 PRG 创建的第一个区域大小即为平均区域大小,此面积可通过将总面积除以区域数得出;其值为 50 平方英里 (300/6)。 LargerDist 为 50 (LargerDist = Abs(100 - 50))。 StepInterval 为 10 (StepInterval = 50/(6 - 1))。
要确定每个种子中创建的第二个区域大小,可将 StepInterval 加上平均区域大小 (10 + 50),由此得出 60 平方英里。 继续计算平均区域大小加 StepInterval (10),直到获得较大的距离值为止。 应用此法可确定第三、第四、第五和第六个区域的大小,结果分别为 70、80、90 和 100 平方英里。 最后,将平均区域大小与 StepInterval 迭代相减,直到达到较小距离值为止,在本例中可确定要创建的第七个区域大小为 40 平方英里。 在此示例中,每个种子中将要创建的区域数为 7;面积分别为 40、50、60、70、80、90 和 100 平方英里。
示例 2
此示例中设置了以下参数:
- 总面积设置为 100 平方英里
- 区域数设置为 4
- 区域最小面积设置为 10 平方英里
- 区域最大面积设置为 60 平方英里
由 PRG 创建的第一个区域大小即为平均区域大小,通过总面积除以区域数计算得出;其值为 25 平方英里。
LargerDist 为 35 平方英里 (Abs(60 - 25))。 StepInterval 为 11.6667 (35/(4 - 1))。 将平均区域大小与 11.6667 进行迭代相加,直到获得较大距离值 36.6667、48.3334 和 60 为止。 从平均区域大小中反复减去 StepInterval,直到差值等于或小于最小结果 13.3333 为止。 目前,区域大小的数量为 5;分别为 13.3333、25、36.6667、48.3334 和 60。 请注意,用于创建较小距离的最小值或最大值并不一定包含在区域大小范围内(本示例中,13.3333 - 11.6667 = 1.6666,结果小于 10)。 此外,每个种子中可创建的区域大小数量最少为 7,最多为 15。 因为 5 小于所要求的最小值 7,因此,所有区域大小为 5 的区域需要额外添加区域大小。 在本示例中,每个种子中将要创建的区域数为 9;面积分别为 13.3333、19.1667、25、30.8334、36.6667、42.5001、48.3334、54.1667 和 60 平方英里。
参考资料
Brooks, Christopher J. 1997。 A parameterized region growing programme for site allocation on raster suitability maps. International Journal of Geographic Information Science, 11:4, 375-396.
Brooks, Christopher J. 1997。 A genetic algorithm for location optimal sites on raster suitability maps. Transactions in GIS, Vol. 2, No. 3, p 201-212.
Brooks, Christopher J. 1998。 A genetic algorithm for designing optimal region configurations in GIS. 本文是由伦敦的伦敦大学、大学学院提交的哲学博士学位论文。
Brooks, Christopher J. 2001。 A genetic algorithm for designing optimal patch configurations in GIS. International Journal of Geographic Information Science, Vol. 15, No. 6, 539-559.
Li, Xia and Anthony Gar-On Yeh, 2005. Integration of genetic algorithms and GIS for optimal location search, International Journal of Geographic Information Science, Vol. 19, No. 5, 581-601.