| :. O
PROCESSO DE AUDITORIA .: |
O processo de auditoria
é feito através da comparação do endereço e
CEP informados por um endereço e CEP encontrados através de um
programa de computador.
A massa de endereços
é transformada em arquivo padrão DBF, e campos são
inseridos ao final de cada registro, para uso pelo programa. O programa se vale
de algoritmos próprios para determinar, no endereço original, as
porções Tipo, Nome, Número e Complemento. Cidade e Estado
também necessários para o processo, embora seja possível
determiná-los a partir do CEP. O Bairro é uma
informação opcional, mas útil quando mais de um logradouro
com a mesma grafia é encontrado na cidade. O CEP também é
opcional, mas sem ele o processo de auditoria iria se transformar apenas numa
conversão de CEPs. O endereço original nunca é afetado
pelo programa, que usa apenas campos de trabalho, facilitando a
comparação entre endereços original e auditado, bem como a
recuperação de possíveis erros.
O arquivo é processado
várias vezes, até que sejam auditados pelo menos 90% dos
endereços existentes, quando então a auditoria é
considerada terminada. Um endereço é verificado contra o GPB de
várias maneiras, comentadas mais à frente. A
combinação sempre é feita pelo Nome. Um endereço
só é retornado se as seguintes condições forem
satisfeitas:
- apenas um registro
encontrado: Se o Tipo combinar (ou se o endereço fornecido não
possuir Tipo), e os primeiros três dígitos do CEP fornecido
combinarem com os primeiros três dígitos do CEP
encontrado.
- mais de um registro
encontrado: Neste caso, o programa verifica se, entre todos os registros
encontrados, apenas um possui o mesmo Tipo do endereço fornecido (neste
caso, a comparação dos três primeiros dígitos do CEP
também se aplica), ou se apenas um possui o mesmo Bairro,
ou se o Tipo e o Bairro combinam, ou se apenas um possui os
mesmos oito dígitos do CEP, além do mesmo Tipo.
NOTAS:
- O GPB é acrescido de
novos registros através de consulta a fontes de informação
confiáveis, como listas telefônicas, guias de ruas, agências
de Correios em cidade do interior, etc.
- O número do
endereço fornecido precisa combinar com o endereço encontrado
tanto no Lado (par ou ímpar) quanto na faixa (número inicial e
final do endereço coberto pelo CEP), para que este seja considerado
selecionável.
- A comparação
dos primeiros três dígitos dos CEPs fornecido e encontrado foi
implementada como medida preventiva contra possíveis erros induzidos por
grafia incorreta do endereço fornecido.
Quando um endereço
é retornado, os campos de trabalho são atualizados com as
informações sobre os novos Tipo, Nome, Bairro e CEP, além
de um Resultado indicando qual método foi usado para encontrar
aquele endereço (ou vazio, se o CEP
encontrado for idêntico ao CEP fornecido). O Resultado também
contém a razão pela qual um endereço não pôde
ser encontrado.
Os métodos de pesquisa
são comentados a seguir. As regras discutidas são válidas
para todos os métodos, exceto para Cidade de CEP Único, onde
não existem endereços disponíveis.
Cidade de CEP Único:
Qualquer endereço daquela cidade possui um único CEP. Não
existe relação de endereços para a cidade, portanto os
endereços não podem ser validados, apenas o CEP. Exemplos de
Cidade de CEP Único são Mongaguá/SP e Serra
Negra/SP.
Verificação de
Caixa Postal: Quando o endereço for CAIXA POSTAL, o cadastro de caixas
postais será consultado.
Combinação Exata
do Endereço: O endereço, da forma como está grafado
(original ou editado) existe no GPB. Um exemplo é R SANTA ISABEL
137.
Verificação de
Endereço Sem Número: O endereço, da forma como está
grafado (e com o identificador S/N), é processado duas vezes
através da Combinação Exata, tendo seu número
substituido por 1 (menor número ímpar) e 999998 (maior
número par). Um CEP é retornado se o encontrado na primeira
passagem for idêntico ao encontrado na segunda.
Combinação
Aproximada do Endereço: O endereço é pesquisado no GPB,
permitindo a presença ou ausência de algumas letras, ou mesmo
posicionamento incorreto das mesmas. Um exemplo é R SANTA ISABELL 137,
ou R SANTA ISABELA 137.
Eliminação de
Títulos e Preposições: Títulos e Patentes, bem como
preposições, são removidos do endereço, e o mesmo
é aplicado ao GPB. Exemplos são R ISABEL 137 (R SANTA ISABEL) ou
AV LUIS ANTONIO 1343 (AV BRIGADEIRO LUIS ANTONIO).
Eliminação de
Palavras Intermediárias: Após eliminar Títulos e
Preposições do endereço original, apenas a primeira e
última palavras são utilizadas, e o mesmo é aplicado ao
GPB. Um exemplo é AV HEITOR GARCIA 100 (AV ENGENHEIRO HEITOR A EIRAS
GARCIA).
Abreviatura de Palavras:
Após eliminar Títulos e Preposições do
endereço original, quando o endereço tiver três ou mais
palavras, da segunda à última palavras são abreviadas, e o
mesmo é aplicado ao GPB. A segunda variação deste
método é abreviar todas as palavras, menos a última.
Exemplos destes métodos são AV ENGENHEIRO HEITOR A E GARC 100 e
AV ENGENHEIRO H A E GARCIA 100.
Pesquisa Fonética:
Após eliminar Títulos e Preposições do
endereço original, um algoritmo é aplicado à
sentença resultante para transformá-la numa sequência de
fonemas, e o mesmo é aplicado ao GPB. Como exemplo, a palavra CARLOS se
transforma na sequência de fonemas KRLS, e CESAR se transforma em
SZR.
Os seguintes métodos
não são aplicáveis ao processamento automático de
registros, mas são utilizados no processamento manual.
Pesquisa do CEP de Oito
Dígitos: Todos os registros no GPB com o CEP idêntico ao fornecido
são apresentados. O operador seleciona uma das opções ou
as descarta.
Pesquisa dos Cinco
Dígitos do CEP: Todos os registros no GPB que tenham o CEP antigo de 5
dígitos idêntico aos primeiros 5 dígitos do CEP fornecido
são apresentados (independentemente do CEP original ter ou não 5
dígitos). O operador seleciona uma das opções ou as
descarta.
Além do processamento
automático, o programa dispõe de um modo interativo, permitindo
que cidades sejam selecionadas, seus endereços ordenados e apresentados
em formato tabular, para edição dos mesmos antes do arquivo ser
processado novamente.
Ao final do processo de
auditoria, um relatório sumário pode ser impresso, mostrando o
número de registros do arquivo, e o total de registros que tiveram
endereços encontrados e não encontrados. Para registros com
endereço encontrado, segue uma relação do número de
registros convertidos por cada método, e para os que não tiveram
endereço encontrado, a relação é agrupada pela
razão de não localização.
De acordo com o especificado
pelo cliente, os endereços padronizados e seus CEPs encontrados
correspondentes são retornados para os campos originais da massa de
endereços. Endereços padronizados com comprimento maior que o
comprimento máximo do campo original, bem como endereços
não encontrados não atualizam o endereço
original.
. Exemplos de Erros de
Digitação Catálogados .
RUA RROUXINOL NR
575
R ROUCHINOL
575
RUA AV ROUXINOL
575
R AVENIDA ROUXINOL
575
R ROXINOL NUM
575
R REGIONOL
575
R ROXINO
575
SENDO O ENDEREÇO
CORRETO R ROUXINOL 575
OU
DIGITAR
APULO SENDO O
CORRETO PAULO
MEN SA SENDO O
CORRETO MEM DE SA
BENTEVI SENDO O
CORRETO BEM-TI-VI
PRINCEZA SENDO O
CORRETO PRINCESA
MARIMS SENDO O
CORRETO MARTINS
CONDE SENDO O
CORRETO CACONDE
ENTRE OUTRAS
POSSIBILIDADES.
ALÉM DE BAIRROS,
CIDADES E OS CEPS.
.
Resultados da Auditoria .
Ao final do
processo de Auditoria teremos além do endereço original, o
endereço auditado e padronizado de acordo com a formatação
dos CORREIOS e o CEP de 8 dígitos oficial do logradouro ou cidade. As
informações padronizadas do endereço poderão
substituir ou não a informação original do arquivo, a
critério de quem executa o processo de auditoria.
A cada passagem
de verificação, um campo do arquivo (Resultado) é
valorizado, indicando o método de conversão usado para verificar
o endereço, ou a razão pela qual o endereço não foi
encontrado. O Resultado possui um único caracter, com o seguinte
caracter:
| A |
Cidade não
encontrada |
| B |
Duas cidades iguais no mesmo
estado |
| C |
Cidade e/ou Estado e/ou
endereço (logradouro) vazios |
| E |
Endereço (logradouro)
não encontrado, mas o CEP existe |
| F |
Dois ou mais endereços
iguais na mesma cidade |
| G |
Endereço (logradouro)
não encontrado |
| I |
Endereço (logradouro)
sem número. Impossível determinar a faixa. |
| L |
Registro editado manualmente
(método interativo) |
| K |
Erro ao Definir
endereço |
| M |
Campo maior que o
original |
|
Vazio |
CEP convertido idêntico
ao CEP originalmente fornecido |
| 0 |
CEP convertido em Cidade de CEP
único |
| 1 |
CEP convertido por pesquisa
exata do endereço |
| 2 |
CEP convertido por pesquisa
aproximada do endereço |
| 3 |
CEP convertido por
eliminação títulos e preposições do
endereço |
| 4 |
CEP convertido por
eliminação de palavras intermediárias do
endereço |
| 5 |
CEP convertido por pesquisa
fonética aplicada ao endereço |
| 6 |
CEP convertido por pesquisa
exata do endereço sem número |
| 7 |
CEP convertido por
eliminação de títulos e preposições do
endereço sem número |
| 8 |
CEP convertido por abreviatura
de todas as palavras menos a primeira |
| 9 |
CEP convertido por abreviatura
de todas as palavras menos a última |
| J |
Registro editado manualmente
(método interativo) |
|
- Quando a Ocorrência
possuir uma letra, o endereço correto não foi
localizado.
- Se Ocorrência estiver
vazio, o endereço foi encontrado e o CEP encontrado é
idêntico ao original.
- Se Ocorrência possuir
um dígito ou J, o endereço foi localizado através
do método correspondente, mas o CEP encontrado é diferente do
original.
Após a
Auditoria, verifique os endereços que tiveram CEP convertido, mas
resultaram em Ocorrências 6 ou 7. O endereço
informado não possui número e pode ser
inválido.
.
Modelo de Relatório Sumário
de Auditoria .
Equacao Informatica e
Comercio Ltda. Sumario da Auditoria de Enderecos Cliente: Equacao - Uso
Interno Arquivo: I:\CONVCEP\MODELO.DBF Total de Registros :
222991 CEPs Encontrados : 208524 ( 93.51%) CEPs Nao Encontrados: 14467 (
6.49%)
Sumario dos CEPs
Encontrados
| Significado |
Numero |
Percentual |
Sigla |
| CEP Original Identico |
147677 |
(70.82%) |
( ) |
| Cidade de CEP Unico |
6357 |
( 3.05%) |
(0) |
| Combinacao Exata do Logradouro |
42506 |
(20.38%) |
(1) |
| Combinacao Exata Logradouro s/ numero |
447 |
( 0.21%) |
(6) |
| Combinacao Aproximada do Logradouro |
2345 |
( 1.12%) |
(2) |
| Eliminacao de Titulos/Preposicoes |
5227 |
( 2.51%) |
(3) |
| Eliminacao Tit/Prep. sem numero |
89 |
( 0.04%) |
(7) |
| Abrev. Palavras (menos primeira) |
2037 |
( 0.98%) |
(8) |
| Abrev. Palavras (menos ultima) |
533 |
( 0.26%) |
(9) |
| Eliminacao de Palavras Intermediarias |
330 |
( 0.16%) |
(4) |
| Pesquisa Fonetica |
858 |
( 0.41%) |
(5) |
| Outras Ocorrencias |
118 |
( 0.06%) |
(?) |
|
Sumario dos CEPs Não
Encontrados
| Significado |
Numero |
Percentual |
Sigla |
| Cidade Nao Encontrada |
158 |
( 1.09%) |
(A) |
| Cidade/Logradouro Nao Preenchido |
144 |
( 1.00%) |
(C) |
| Cidade em Duplicata no Estado |
141 |
( 0.97%) |
(B) |
| Logradouro em Duplicata na Cidade |
1858 |
(12.84%) |
(F) |
| Logradouro e CEP Nao Encontrados |
11913 |
(82.35%) |
(G) |
| Logradouro Sem Numero |
204 |
( 1.41%) |
(I) |
| Outras Ocorrencias |
49 |
( 0.34%) |
(?) |
|
|