Home Page
Guia Postal
DataEase
S.O.S. Backup
Mapa do Site

Download
Clientes
Revendas
Preços

Auditoria de Endereços

:. O PROCESSO DE AUDITORIA .:

O processo de auditoria é feito através da comparação do endereço e CEP informados por um endereço e CEP encontrados através de um programa de computador.

A massa de endereços é transformada em arquivo padrão DBF, e campos são inseridos ao final de cada registro, para uso pelo programa. O programa se vale de algoritmos próprios para determinar, no endereço original, as porções Tipo, Nome, Número e Complemento. Cidade e Estado também necessários para o processo, embora seja possível determiná-los a partir do CEP. O Bairro é uma informação opcional, mas útil quando mais de um logradouro com a mesma grafia é encontrado na cidade. O CEP também é opcional, mas sem ele o processo de auditoria iria se transformar apenas numa conversão de CEPs. O endereço original nunca é afetado pelo programa, que usa apenas campos de trabalho, facilitando a comparação entre endereços original e auditado, bem como a recuperação de possíveis erros.

O arquivo é processado várias vezes, até que sejam auditados pelo menos 90% dos endereços existentes, quando então a auditoria é considerada terminada. Um endereço é verificado contra o GPB de várias maneiras, comentadas mais à frente. A combinação sempre é feita pelo Nome. Um endereço só é retornado se as seguintes condições forem satisfeitas:

  • apenas um registro encontrado: Se o Tipo combinar (ou se o endereço fornecido não possuir Tipo), e os primeiros três dígitos do CEP fornecido combinarem com os primeiros três dígitos do CEP encontrado.
  • mais de um registro encontrado: Neste caso, o programa verifica se, entre todos os registros encontrados, apenas um possui o mesmo Tipo do endereço fornecido (neste caso, a comparação dos três primeiros dígitos do CEP também se aplica), ou se apenas um possui o mesmo Bairro, ou se o Tipo e o Bairro combinam, ou se apenas um possui os mesmos oito dígitos do CEP, além do mesmo Tipo.

NOTAS:

  1. O GPB é acrescido de novos registros através de consulta a fontes de informação confiáveis, como listas telefônicas, guias de ruas, agências de Correios em cidade do interior, etc.
  2. O número do endereço fornecido precisa combinar com o endereço encontrado tanto no Lado (par ou ímpar) quanto na faixa (número inicial e final do endereço coberto pelo CEP), para que este seja considerado ‘selecionável’.
  3. A comparação dos primeiros três dígitos dos CEPs fornecido e encontrado foi implementada como medida preventiva contra possíveis erros induzidos por grafia incorreta do endereço fornecido.

Quando um endereço é retornado, os campos de trabalho são atualizados com as informações sobre os novos Tipo, Nome, Bairro e CEP, além de um Resultado indicando qual método foi usado para encontrar aquele endereço (ou vazio, se o CEP encontrado for idêntico ao CEP fornecido). O Resultado também contém a razão pela qual um endereço não pôde ser encontrado.

Os métodos de pesquisa são comentados a seguir. As regras discutidas são válidas para todos os métodos, exceto para Cidade de CEP Único, onde não existem endereços disponíveis.

Cidade de CEP Único: Qualquer endereço daquela cidade possui um único CEP. Não existe relação de endereços para a cidade, portanto os endereços não podem ser validados, apenas o CEP. Exemplos de Cidade de CEP Único são Mongaguá/SP e Serra Negra/SP.

Verificação de Caixa Postal: Quando o endereço for CAIXA POSTAL, o cadastro de caixas postais será consultado.

Combinação Exata do Endereço: O endereço, da forma como está grafado (original ou editado) existe no GPB. Um exemplo é R SANTA ISABEL 137.

Verificação de Endereço Sem Número: O endereço, da forma como está grafado (e com o identificador S/N), é processado duas vezes através da Combinação Exata, tendo seu número substituido por 1 (menor número ímpar) e 999998 (maior número par). Um CEP é retornado se o encontrado na primeira passagem for idêntico ao encontrado na segunda.

Combinação Aproximada do Endereço: O endereço é pesquisado no GPB, permitindo a presença ou ausência de algumas letras, ou mesmo posicionamento incorreto das mesmas. Um exemplo é R SANTA ISABELL 137, ou R SANTA ISABELA 137.

Eliminação de Títulos e Preposições: Títulos e Patentes, bem como preposições, são removidos do endereço, e o mesmo é aplicado ao GPB. Exemplos são R ISABEL 137 (R SANTA ISABEL) ou AV LUIS ANTONIO 1343 (AV BRIGADEIRO LUIS ANTONIO).

Eliminação de Palavras Intermediárias: Após eliminar Títulos e Preposições do endereço original, apenas a primeira e última palavras são utilizadas, e o mesmo é aplicado ao GPB. Um exemplo é AV HEITOR GARCIA 100 (AV ENGENHEIRO HEITOR A EIRAS GARCIA).

Abreviatura de Palavras: Após eliminar Títulos e Preposições do endereço original, quando o endereço tiver três ou mais palavras, da segunda à última palavras são abreviadas, e o mesmo é aplicado ao GPB. A segunda variação deste método é abreviar todas as palavras, menos a última. Exemplos destes métodos são AV ENGENHEIRO HEITOR A E GARC 100 e AV ENGENHEIRO H A E GARCIA 100.

Pesquisa Fonética: Após eliminar Títulos e Preposições do endereço original, um algoritmo é aplicado à sentença resultante para transformá-la numa sequência de fonemas, e o mesmo é aplicado ao GPB. Como exemplo, a palavra CARLOS se transforma na sequência de fonemas KRLS, e CESAR se transforma em SZR.

Os seguintes métodos não são aplicáveis ao processamento automático de registros, mas são utilizados no processamento manual.

Pesquisa do CEP de Oito Dígitos: Todos os registros no GPB com o CEP idêntico ao fornecido são apresentados. O operador seleciona uma das opções ou as descarta.

Pesquisa dos Cinco Dígitos do CEP: Todos os registros no GPB que tenham o CEP antigo de 5 dígitos idêntico aos primeiros 5 dígitos do CEP fornecido são apresentados (independentemente do CEP original ter ou não 5 dígitos). O operador seleciona uma das opções ou as descarta.

Além do processamento automático, o programa dispõe de um modo interativo, permitindo que cidades sejam selecionadas, seus endereços ordenados e apresentados em formato tabular, para edição dos mesmos antes do arquivo ser processado novamente.

Ao final do processo de auditoria, um relatório sumário pode ser impresso, mostrando o número de registros do arquivo, e o total de registros que tiveram endereços encontrados e não encontrados. Para registros com endereço encontrado, segue uma relação do número de registros convertidos por cada método, e para os que não tiveram endereço encontrado, a relação é agrupada pela razão de não localização.

De acordo com o especificado pelo cliente, os endereços padronizados e seus CEPs encontrados correspondentes são retornados para os campos originais da massa de endereços. Endereços padronizados com comprimento maior que o comprimento máximo do campo original, bem como endereços não encontrados não atualizam o endereço original.


. Exemplos de Erros de Digitação Catálogados .

RUA RROUXINOL NR 575

R ROUCHINOL 575

RUA AV ROUXINOL 575

R AVENIDA ROUXINOL 575

R ROXINOL NUM 575

R REGIONOL 575

R ROXINO 575

SENDO O ENDEREÇO CORRETO R ROUXINOL 575

OU DIGITAR

APULO SENDO O CORRETO PAULO

MEN SA SENDO O CORRETO MEM DE SA

BENTEVI SENDO O CORRETO BEM-TI-VI

PRINCEZA SENDO O CORRETO PRINCESA

MARIMS SENDO O CORRETO MARTINS

CONDE SENDO O CORRETO CACONDE

ENTRE OUTRAS POSSIBILIDADES.

ALÉM DE BAIRROS, CIDADES E OS CEPS.


. Resultados da Auditoria .

Ao final do processo de Auditoria teremos além do endereço original, o endereço auditado e padronizado de acordo com a formatação dos CORREIOS e o CEP de 8 dígitos oficial do logradouro ou cidade. As informações padronizadas do endereço poderão substituir ou não a informação original do arquivo, a critério de quem executa o processo de auditoria.

A cada passagem de verificação, um campo do arquivo (Resultado) é valorizado, indicando o método de conversão usado para verificar o endereço, ou a razão pela qual o endereço não foi encontrado. O Resultado possui um único caracter, com o seguinte caracter:

A Cidade não encontrada
B Duas cidades iguais no mesmo estado
C Cidade e/ou Estado e/ou endereço (logradouro) vazios
E Endereço (logradouro) não encontrado, mas o CEP existe
F Dois ou mais endereços iguais na mesma cidade
G Endereço (logradouro) não encontrado
I Endereço (logradouro) sem número. Impossível determinar a faixa.
L Registro editado manualmente (método interativo)
K Erro ao Definir endereço
M Campo maior que o original
Vazio CEP convertido idêntico ao CEP originalmente fornecido
0 CEP convertido em Cidade de CEP único
1 CEP convertido por pesquisa exata do endereço
2 CEP convertido por pesquisa aproximada do endereço
3 CEP convertido por eliminação títulos e preposições do endereço
4 CEP convertido por eliminação de palavras intermediárias do endereço
5 CEP convertido por pesquisa fonética aplicada ao endereço
6 CEP convertido por pesquisa exata do endereço sem número
7 CEP convertido por eliminação de títulos e preposições do endereço sem número
8 CEP convertido por abreviatura de todas as palavras menos a primeira
9 CEP convertido por abreviatura de todas as palavras menos a última
J Registro editado manualmente (método interativo)
  • Quando a Ocorrência possuir uma letra, o endereço correto não foi localizado.
  • Se Ocorrência estiver vazio, o endereço foi encontrado e o CEP encontrado é idêntico ao original.
  • Se Ocorrência possuir um dígito ou J, o endereço foi localizado através do método correspondente, mas o CEP encontrado é diferente do original.

Após a Auditoria, verifique os endereços que tiveram CEP convertido, mas resultaram em Ocorrências 6 ou 7. O endereço informado não possui número e pode ser inválido.


. Modelo de Relatório Sumário de Auditoria .

Equacao Informatica e Comercio Ltda.
Sumario da Auditoria de Enderecos
Cliente: Equacao - Uso Interno
Arquivo: I:\CONVCEP\MODELO.DBF
Total de Registros : 222991
CEPs Encontrados : 208524 ( 93.51%)
CEPs Nao Encontrados: 14467 ( 6.49%)

Sumario dos CEPs Encontrados

Significado Numero Percentual Sigla
CEP Original Identico 147677 (70.82%) ( )
Cidade de CEP Unico 6357 ( 3.05%) (0)
Combinacao Exata do Logradouro 42506 (20.38%) (1)
Combinacao Exata Logradouro s/ numero 447 ( 0.21%) (6)
Combinacao Aproximada do Logradouro 2345 ( 1.12%) (2)
Eliminacao de Titulos/Preposicoes 5227 ( 2.51%) (3)
Eliminacao Tit/Prep. sem numero 89 ( 0.04%) (7)
Abrev. Palavras (menos primeira) 2037 ( 0.98%) (8)
Abrev. Palavras (menos ultima) 533 ( 0.26%) (9)
Eliminacao de Palavras Intermediarias 330 ( 0.16%) (4)
Pesquisa Fonetica 858 ( 0.41%) (5)
Outras Ocorrencias 118 ( 0.06%) (?)

Sumario dos CEPs Não Encontrados

Significado Numero Percentual Sigla
Cidade Nao Encontrada 158 ( 1.09%) (A)
Cidade/Logradouro Nao Preenchido 144 ( 1.00%) (C)
Cidade em Duplicata no Estado 141 ( 0.97%) (B)
Logradouro em Duplicata na Cidade 1858 (12.84%) (F)
Logradouro e CEP Nao Encontrados 11913 (82.35%) (G)
Logradouro Sem Numero 204 ( 1.41%) (I)
Outras Ocorrencias 49 ( 0.34%) (?)

Copyright © 1996 / 2006 Equação Informática e Comércio Ltda.
Mr. PostMan e Equação são marcas registradas da Equação.
Outras marcas mencionadas pertencem a seu respectivos proprietários.