Средство просмотра CLI pdf для Linux

Эй, довольно давно, я ищу программу просмотра PDF для командной строки.

Как мне нравится работать без X на Linux и часто работать на удаленной машине, мне бы хотелось иметь инструмент для чтения pdf файлов. Есть довольно много действительно хороших графических программ (evince, okular, acroread,...), чтобы выполнить эту работу, поэтому я решил, что должен быть хотя бы один достойный инструмент текстового режима. Но я даже не знаю, как дерьмовый!

В настоящее время я либо запускаю X только для чтения pdf файлов, либо для использования pdftohtml + lynx. Однако последнее не дает очень хорошего результата, и большинство документов просто не читаются, особенно если они содержат математическую формулу.

Google полна людей, которые говорят, что это невозможно или предлагается версия pdftohtml.

Я понимаю, это не совсем вопрос программирования, но сейчас я рассматриваю возможность запуска проекта для реализации такой программы, если там уже не будет хорошего.

Спасибо за любые предложения.

+50
25 авг. '10 в 22:03
источник поделиться
7 ответов

Привет, я думаю, что вам не нужно писать программу для вашей цели. Я имею в виду чтение pdf файла в консольном режиме, потому что команда "less" уже делает это за вас. Так что используйте его и наслаждайтесь им.

less "имя файла pdf"

+62
04 мар. '12 в 7:14
источник

Хорошо, вы попросили узнать даже "дрянные". Вот два (решайте сами о своей соответствующей чепухе):

Сначала: устройство вывода txtwrite Ghostscript

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf

Второе: утилита CLI > pdftotext (лучше, чем Ghostscript):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less

Это отобразит диапазон страниц 13 ( f первая страница) до 17 ( l ast страница), сохраните макет защищенного двойным паролем имени файла PDF ( используя секретные и суперсекретные пароли пользователей и владельцев), с соглашением Unix EOL, но без вставки разрывов страниц между страницами PDF, пропущенных через меньше...

pdftotext -h отображает все доступные параметры командной строки.

Конечно, оба инструмента работают только для текстовых частей PDF файлов (если они есть). О, и математическая формула тоже не будет работать слишком хорошо...; -)


Изменить: Я неправильно набрал команду выше (изначально используя pdftops вместо pdftotext).

+13
30 авг. '10 в 3:25
источник

Кстати, я всегда в одной и той же ситуации, и я использую mc (midnight commander), который отлично обрабатывает текст pdf... Просто просмотрите файл (F3) в mc

+4
29 авг. '14 в 20:19
источник

Существует также green просмотрщик PDF. Существует демонстрация на YouTube.

+4
10 авг. '13 в 18:15
источник

fbpdf - просмотрщик фреймбуфера PDF.

Существует также вилка jfbpdf, но на данный момент я не могу заставить ее работать.

+3
06 июн. '14 в 11:54
источник

Это будет работать, только если ваш PDF-документ структурирован, т.е. это с тегами PDF.

Это необходимо для получения правильного порядка чтения текстовых объектов в документе.

Отмеченные документы в формате PDF также позволяют повторно документировать документ, хотя я не знаю о каком-либо инструменте, который делает это с выходом командной строки.

0
25 авг. '10 в 22:18
источник

Посмотрите другие вопросы по меткам или Задайте вопрос