|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Авг 08, 2009 - 18:01
Занимался сегодня задачей pdf2text (вытаскивания текста из PDF-файла для индексации). По возможности, хотелось решить без внешних приложений и библиотек, на чистом PHP.
В результате, что-то похожее на решение было найдено на PHP.NET, но из "коробки" оно не работало. Пришлось думать...
В общем, моими усилиями на php.net теперь в комментах доступно работающее решение этой задачи: http://nl3.php.net/manual/en/ref.pdf.php#92770
Тестировалось на PDF-1.4, PDF-1.3, PDF-1.2, правда, только на английских текстах.
Ставим :) подождите чуть-чуть!
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|