unaccent: Remoção de acentuação

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 02 de julho de 2014

É boa prática de SEO (Search Engine Optimization), que a url de um documento seja também uma descrição de seu conteúdo.

Se o título de um documento chama-se "unaccent: Remoção de acentuação", a url deveria ser algo como:

http://www.dicas-l.com.br/unaccent:_remocao_de_acentuacao.php

Para obter este valor, poderíamos fazer da seguinte forma:

$ echo "unaccent: Remoção de acentuação" | sed "s/ /_/g" | unaccent iso8859-1
unaccent:_Remocao_de_acentuacao

O comando sed foi usado para converter os espaços em branco no caractere subtraço ("_").

Mas para facilitar a vida dos internautas, é conveniente também converter todos os caracteres em caixa alta para caixa baixa. Para isto podemos usar o comando tr, como abaixo:

$ echo "unaccent: Remoção de acentuação" | sed "s/ /_/g" | tr '[:upper:]' '[:lower:]' | unaccent iso8859-1
unaccent:_remocao_de_acentuacao

Para que tudo isto funcione, o comando unaccent precisa receber como parâmetro a codificação do texto (UTF8 ou ISO-8859-1).

É claro que todos estes exemplos se aplicam para sites em que a montagem das páginas é automatizada, como a Dicas-L.

[ Retornar ao Índice ]