Extração de Imagens de Arquivos PDF
Colaboração: Rubens Queiroz de Almeida
Data de Publicação: 28 de Setembro de 2004
O pacote xpdf, disponível na maioria das distribuições GNU/Linux, contém um utilitário chamado pdfimages, que permite extrair as imagens usadas na composição de um documento PDF.
As imagens podem ser extraídas no formato Portable Pixmap (PPM), Portable Bitmap (PBM), ou no formato JPEG, mais popular.
O padrão é que as imagens sejam extraídas no formato PBM (imagens não coloridas) ou PPM (imagens coloridas).
A sintaxe é bastante simples, algo como:
pdfimages arquivo.pdf figuras
Se quisermos salvar as imagens no formato jpeg:
pdfimages -j arquivo.pdf figuras
A diretiva figuras indica o prefixo com o qual as imagens serão criadas. Em nosso exemplo, onde o prefixo chama-se figuras, serão criados arquivos com os nomes figuras-001.jpg, figuras-002.jpg, e assim por diante.