Dividindo muitos polígonos em partes (quase) iguais por meio de um simples script no PyQGIS, o Console Python do QGIS

Colegas pesquisadores e entusiastas do GIS de código-livre,

Primeiramente, bem-vindos ao meu blog!

Gostaria de começar com um aviso - posso ser uma pesquisadora desta área, mas isso não quer dizer que tudo o que faço ou escrevo aqui funcionará para você, em suas próprias configurações de desktop e versões de packages. Não assumo responsabilidade nenhuma se você perder dados ou bagunçar sua instalação. Eu também não autorizo nenhum tipo de cópia do meu conteúdo. Exceto pelos gists no GitHub, que são disponibilizados com a licença do MIT.

Seja qual for o seu geo-trabalho, você pode ter trabalhado com um polígono que precisava ser dividido ao meio, em três partes, em cinco partes (ou em cem partes, talvez?). Duas possíveis aplicações para estes polígonos divididos são o cálculo de estatísticas zonais e parcelamento do terreno (agricultura).

Já existe um pipeline conhecido usado para dividir polígonos no software GIS. Foi desenvolvido por Darafei Praliaskouski para PostGIS e testado por Paul Ramsey (Obrigada!), e está disponível no site do Paul Ramsey. O mesmo pipeline também foi adaptado por Ujaval Gandhi para ser usado no QGIS (através da Interface do Usuário QGIS) e pode ser encontrado no blog dele. Se você está lidando com um pequeno número de polígonos a serem divididos no QGIS, o post recém-mencionado do Ujaval Gandhi pode ser útil para você, especialmente se você não estiver familiarizado com o Console Python do QGIS (PyQGIS).

Você também pode conferir este vídeo no canal do YouTube da Geoaplicada, no qual Jocilene Barros usa o plugin Polygon Divider.

Por que usar o PyQGIS?

Ah, tantas opções! Mas se você ainda está aqui, acho que você quer usar o PyQGIS para esta tarefa. Por que você quereria isso? Listei quatro motivos abaixo:

  1. Você tem muitos polígonos para dividir cada um em partes iguais. Fazer o processo um por um é uma perda de tempo. Honestamente, este foi o meu motivo.

  2. Você não quer instalar mais plugins, mas também não quer gastar muito tempo dividindo polígonos.

  3. Você é um novato/intermediário/avançado em Python e deseja ver um exemplo funcional de como usar o PyQGIS.

  4. Você quer usar apenas ferramentas nativas do QGIS. Este pipeline aqui usa apenas ferramentas nativas.

Um aviso sobre o uso da palavra “Igual”

Os polígonos resultantes gerados por pipelines que envolvem clustering do tipo K-means e polígonos de Voronoi/Thiessen (como o meu pipeline, por exemplo) na maioria das vezes não geram uma divisão perfeita em termos de área. Há um erro associado a cada divisão, que iremos explorar mais adiante, na seção “Verificação dos resultados e erros associados”. Não use meu pipeline se você precisa de polígonos resultantes perfeitamente iguais em termos de área.

Meu pipeline

Para este desenvolvimento, eu estou usando um pipeline ligeiramente diferente do descrito no site do Paul Ramsey, mas eu me inspirei naquele pipeline para construir este.

Meu pipeline, em linhas gerais:

  1. Pré-processamento: Divida o arquivo vetorial original em N outros arquivos, cada um com um polígono.

  2. No PyQGIS: obtenha as extensões da camada vetorial

  3. Gere pontos de espaçamento regulares dentro dessas extensões

  4. Recorte os pontos regulares na área do polígono

  5. Agrupe seus pontos usando o algoritmo K-Means, use o número de clusters igual ao número de divisões pretendidas

  6. Calcule as coordenadas médias para cada agrupamento de pontos

  7. Calcule os polígonos de Voronoi para as coordenadas médias

  8. Recorte o polígono original com base nos polígonos de Voronoi

  9. Pós-processamento: confira os resultados

Exemplo

Eu começo com este Shapefile:

shapefile qgis

Esta é a tabela de atributos:

shapefile qgis attribute table

E, neste exemplo, quero dividir cada um dos polígonos em três partes.

Estou usando o QGIS 3.22 Bialowieza para este tutorial.

Detalhes sobre o pré-processamento

Para garantir que os polígonos sejam divididos em partes iguais (ou quase iguais), é importante conhecer previamente a área de cada um deles. Na tabela de atributos, abra a calculadora de campo e crie um novo campo chamado área. Dei ao novo campo o tipo “Decimal number (real)”. A expressão a ser calculada é simplesmente “$area”. Gere esta coluna, salve e desative o modo de edição. Minha tabela de atributos agora está assim:

shapefile qgis attribute table

Importante: use um sistema de coordenadas projetado ao realizar cálculos de área.

Outra etapa importante de pré-processamento. Para executar o código PyQGIS fornecido neste post, eu preciso ter cada polígono em um shapefile diferente. Se você tiver todos os polígonos que deseja dividir no mesmo shapefile, use “Split Vector Layer” (native:splitvectorlayer) para separar os polígonos. No meu caso, usei a coluna id para dividi-los.

split vector layer qgis

Salve-os em uma pasta, de preferência, permanente.

Os shapefiles resultantes são:

split vector layer qgis result

Rodando a rotina no PyQGIS

Este é o gist, hospedado no GitHub e disponibilizado sob a licença do MIT.

#
# dividing a Polygon in (almost) equal parts using PyQGIS
# by Luisa Vieira Lucchese
# luisalucchese.com
# February 2022
# MIT License
#Copyright (c) 2022 Luisa V. Lucchese
#Permission is hereby granted, free of charge, to any person obtaining a copy
#of this software and associated documentation files (the "Software"), to deal
#in the Software without restriction, including without limitation the rights
#to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
#copies of the Software, and to permit persons to whom the Software is
#furnished to do so, subject to the following conditions:
#The above copyright notice and this permission notice shall be included in all
#copies or substantial portions of the Software.
#THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
#IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
#FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
#AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
#LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
#OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
#SOFTWARE.
#
from qgis.core import *
import processing
#
# use split vector layer before running this code
# and refer to the blog post about this code to know how to use it
#
#### EDIT INPUTS BELOW ####
# provide the folder of the polygons below
POLYLOC='C:/.../'
POLYLOC_ID=POLYLOC+'id_'
# spacing of regular points
SPACING_REG=100.0
#number of divisions
N_DIV=3
# provide the folder to save the resulting points and polygons
OUTLOC='C:/.../'
OUTPOLYGONS=OUTLOC+'polygon_'
# coordinate system
CRS_PTS='EPSG:32722'
# min number and max number of id to process
MINNUM=1
MAXNUM=4
#################################################
for cycle in range(MINNUM,MAXNUM+1):
try:
# open
polyloc_compose=POLYLOC_ID+str(cycle)+'.shp'
poly_qgs = QgsVectorLayer(polyloc_compose, 'poly_id_'+str(cycle), 'ogr')
QgsProject.instance().addMapLayers([poly_qgs])
# extent of the polygon
extentrect=poly_qgs.extent()
xmax = extentrect.xMaximum()
ymax = extentrect.yMaximum()
xmin = extentrect.xMinimum()
ymin = extentrect.yMinimum()
extentreg=str(xmin) + ',' + str(xmax) + ','+ str(ymin)+ ',' + str(ymax)
# generate regular points
paramreg ={'EXTENT':extentreg, 'SPACING':SPACING_REG, 'INSET':5, 'RANDOMIZE':0, 'IS_SPACING':1, 'CRS': CRS_PTS, 'OUTPUT':'memory:'}
regpoints=processing.run("qgis:regularpoints", paramreg)#temp
# extract the points inside the polygons
paramclip= {'INPUT': regpoints['OUTPUT'],'OVERLAY':poly_qgs, 'OUTPUT':'memory:'}
regpointsclip=processing.run("native:clip", paramclip)#temp
QgsProject.instance().addMapLayers([regpointsclip['OUTPUT']])
# clustering
paramcluster= {'CLUSTERS' : N_DIV, 'FIELD_NAME' : 'CLUSTER_ID','INPUT': regpointsclip['OUTPUT'],'OUTPUT':'memory:','SIZE_FIELD_NAME' : 'CLUSTER_SIZE'}
regpointsclusters=processing.run("native:kmeansclustering", paramcluster)#temp
# mean coordinates
parammean= {'INPUT': regpointsclusters['OUTPUT'],'OUTPUT':'memory:','UID' : 'CLUSTER_ID', 'WEIGHT' : ''}
regpointsmean=processing.run("native:meancoordinates", parammean)
QgsProject.instance().addMapLayers([regpointsmean['OUTPUT']])
# voronoi polygons
paramvoro={'BUFFER' : 100, 'INPUT' : regpointsmean['OUTPUT'], 'OUTPUT' : 'memory:' }
voronoi_poly=processing.run("qgis:voronoipolygons", paramvoro)
QgsProject.instance().addMapLayers([voronoi_poly['OUTPUT']])
# clip voronoi polygons by the original polygons
paramclip= {'INPUT': voronoi_poly['OUTPUT'],'OVERLAY':poly_qgs, 'OUTPUT':OUTPOLYGONS+str(cycle)}
polyclip=processing.run("native:clip", paramclip)
polyclip_qgs = QgsVectorLayer(OUTPOLYGONS+str(cycle)+'.gpkg', 'divided_'+str(cycle))
QgsProject.instance().addMapLayers([polyclip_qgs])
except:
print('the following polygon could not be processed:', cycle)

Faça as adaptações necessárias para cada caso, a saber, sistema de coordenadas, número de divisões, espaçamento dos pontos regulares usados para dividir os polígonos, localização dos arquivos no sistema e nome da coluna da tabela de atributos usada para dividir os polígonos em diferentes arquivos.

E… execute o código!

Esta é a divisão resultante para os polígonos do exemplo:

divided polygons

Verificação dos resultados e erros associados

Para o polígono 4, tenho que a área total é: 7080260,638, o que significa que um terço dela é 2360086,879.

Na tabela de atributos do polígono dividido, faço o cálculo “$area” (o mesmo que fiz antes). Resulta nos valores: 2050355.0129558295, 2675185.5178783312 e 2354716.308374524.

Portanto, podemos notar que há uma variação na área entre as partes divididas. Isso acontece principalmente porque os clusters gerados pelo K-Means Clustering possuem tamanhos diferentes. Usar pontos aleatórios em vez de pontos regulares não ajuda nisso e pode até introduzir erros maiores, em alguns casos (ex: se você usar um número muito pequeno de pontos aleatórios). Se você encontrar uma maneira de driblar este problema, por favor, me informe.

Extras

  • Quando NÃO devo usar este script para dividir meus polígonos?

Você não deve usar este script, ou qualquer pipeline que envolva clusters de tamanhos diferentes, se for necessária precisão na divisão dos polígonos.

  • Se já existem pipelines para dividir polígonos em pedaços menores, o que exatamente você fez aqui?

A automatização de um processo potencialmente tedioso, sem a necessidade de instalar nenhum plugin.

  • A-há! Você disse que não usa nenhum plugin, mas o Python Console é um plugin!

Você está certo, “Python Console” é um plugin, assim como “Processing” e “GRASS GIS Provider” também são plugins. Mencionei que não há a necessidade de instalar plugins extras para executar o script.

Luísa Vieira Lucchese
Luísa Vieira Lucchese
Professora-Pesquisadora Assistente

Professora-Pesquisadora Assistente na Universidade de Pittsburgh

Relacionados