|
|
 |
 |
 |
|
Auditoria/Higienização de
Endereços
|
Auditoria
é um processo semi-automático que
compara os dados de endereço em relação a uma base de
dados de referência, no caso o Guia Postal Brasileiro, visando
identificar e padronizar os dados de endereçamento de acordo com os
Correios.
Incialmente
o endereço é separado em seus componentes básicos:
Tipo do Logradouro, Nome do Logradouro, Numero,
Complemento, Bairro, Cidade, UF e CEP.
O
registro é processado diversas vezes, até que seja
identificado a informação
correspondente na base de referência. A combinação sempre
é feita pelo Nome. Um endereço só é retornado se as
seguintes condições forem satisfeitas:
- apenas
um registro encontrado: Se o Tipo combinar (ou se o endereço fornecido
não possuir Tipo.
- mais
de um registro encontrado: Neste caso, o programa verifica se, entre todos os
registros encontrados, apenas um possui o mesmo Tipo do endereço
fornecido (neste caso, a comparação dos três primeiros
dígitos do CEP também se aplica), ou se apenas um possui o
mesmo Bairro, ou se o Tipo e o Bairro combinam, ou se apenas um
possui os mesmos oito dígitos do CEP, além do mesmo
Tipo.
NOTAS:
- O
GPB é acrescido de novos registros através de consulta a fontes
de informação confiáveis, como listas telefônicas,
guias de ruas, agências de Correios em cidades
de menor porte, etc.
- O
número precisa combinar com o endereço encontrado tanto no Lado
(par ou ímpar) quanto na faixa (número inicial e final do
endereço coberto pelo CEP), para que este seja considerado
selecionável.
O
endereço é processado por diversos algoritmos, utilizando
dicionários, substituições e pesquisa fonética,
visando identificar com precisão o nome da rua, faixas de ceps e lado
par/impar do logradouro exceto para Cidade de CEP Único, onde não
existem endereços disponíveis.
Cidade de CEP
Único:
Qualquer endereço daquela cidade possui um único CEP. Não
existe relação de endereços para a cidade, portanto os
endereços não podem ser validados, apenas o
CEP.
Verificação de Caixa
Postal: Quando o endereço for CAIXA POSTAL, o cadastro de caixas
postais será consultado.
Os
seguintes métodos não são aplicáveis ao
processamento automático de registros, mas são utilizados no
processamento manual.
Pesquisa
do CEP de Oito Dígitos: Todos os registros no GPB com o CEP
idêntico ao fornecido são apresentados. O operador seleciona uma
das opções ou as descarta.
Pesquisa
dos Cinco Dígitos do CEP: Todos os registros no GPB que tenham o CEP
antigo de 5 dígitos idêntico aos primeiros 5 dígitos do CEP
fornecido são apresentados (independentemente do CEP original ter ou
não 5 dígitos). O operador seleciona uma das opções
ou as descarta.
Além
do processamento automático, o programa dispõe de um modo
interativo, permitindo que os dados sejam editados e processados
novamente.
Ao
final do processo de auditoria, um relatório sumário pode ser
impresso, mostrando o número de registros do arquivo, e o total de
registros que tiveram endereços encontrados e não encontrados.
Para registros com endereço encontrado, segue uma relação
do número de registros convertidos por cada método, e para os que
não tiveram endereço encontrado, a relação é
agrupada pela razão de não localização.
De
acordo com o especificado pelo cliente, os endereços padronizados e seus
CEPs encontrados correspondentes são retornados para os campos originais
da massa de endereços. Endereços padronizados com comprimento
maior que o comprimento máximo do campo original, bem como
endereços não encontrados não atualizam o endereço original.
. Resultados
da Auditoria .
Ao
final do processo de Auditoria teremos além do endereço original,
o endereço auditado e padronizado de acordo com a
formatação dos CORREIOS e o CEP de 8 dígitos oficial do
logradouro ou cidade. As informações padronizadas do
endereço poderão substituir ou não a
informação original do arquivoa.
A cada
passagem de verificação, um campo do arquivo (Resultado) é
valorizado, indicando o método de conversão usado para verificar
o endereço, ou a razão pela qual o endereço não foi
encontrado.
- Quando
a Ocorrência possuir uma letra, o endereço correto
não foi localizado.
- Se
Ocorrência estiver vazio, o endereço foi encontrado e o CEP
encontrado é idêntico ao original.
- Se
Ocorrência possuir um dígito ou J, o endereço foi
localizado através do método correspondente, mas o CEP encontrado
é diferente do original.
Após
a Auditoria, verifique os endereços que tiveram CEP convertido, mas
resultaram em Ocorrências 6 ou 7. O endereço
informado não possui número e pode ser inválido.
. Modelo
de Relatório Sumário de Auditoria .
Equacao Informatica e
Comercio Ltda. Sumario da Auditoria de Enderecos Cliente: Equacao - Uso
Interno Arquivo: I:\CONVCEP\MODELO.DBF Total
de Registros : 222991 CEPs Encontrados : 208524 ( 93.51%) CEPs Nao
Encontrados: 14467 ( 6.49%)
Sumario dos CEPs
Encontrados
|
Significado
|
Numero
|
Percentual
|
Sigla
|
|
CEP Original
Identico
|
147677
|
(70.82%)
|
(
)
|
|
Cidade de CEP
Unico
|
6357
|
(
3.05%)
|
(0) |
|
Combinacao Exata do
Logradouro
|
42506
|
(20.38%)
|
(1) |
|
Combinacao Exata Logradouro
s/ numero
|
447
|
(
0.21%)
|
(6) |
|
Combinacao Aproximada do
Logradouro
|
2345
|
(
1.12%)
|
(2) |
|
Eliminacao de
Titulos/Preposicoes |
5227
|
(
2.51%)
|
(3) |
|
Eliminacao Tit/Prep. sem
numero
|
89 |
(
0.04%)
|
(7) |
|
Abrev. Palavras (menos
primeira)
|
2037
|
(
0.98%)
|
(8) |
|
Abrev. Palavras (menos
ultima)
|
533 |
(
0.26%)
|
(9) |
|
Eliminacao de Palavras
Intermediarias
|
330 |
(
0.16%)
|
(4) |
|
Pesquisa
Fonetica
|
858
|
(
0.41%)
|
(5) |
|
Outras
Ocorrencias
|
118 |
(
0.06%)
|
(?) |
|
Sumario dos CEPs Não
Encontrados
|
Significado
|
Numero
|
Percentual
|
Sigla
|
|
Cidade Nao
Encontrada
|
158
|
(
1.09%)
|
(A) |
|
Cidade/Logradouro Nao
Preenchido
|
144
|
(
1.00%)
|
(C) |
|
Cidade em Duplicata no
Estado
|
141
|
(
0.97%)
|
(B) |
|
Logradouro em Duplicata na
Cidade
|
1858
|
(12.84%)
|
(F) |
|
Logradouro e CEP Nao
Encontrados
|
11913
|
(82.35%)
|
(G) |
|
Logradouro Sem
Numero
|
204 |
(
1.41%)
|
(I) |
|
Outras
Ocorrencias
|
49 |
(
0.34%)
|
(?) |
|
|