Как конвертировать Word (doc) в PDF в linux?
У меня есть набор файлов в формате .doc, которые необходимо преобразовать в формат .pdf. Я использую Ubuntu linux.
У меня есть набор файлов в формате .doc, которые необходимо преобразовать в формат .pdf. Я использую Ubuntu linux.
Альтернатива 1)
sudo apt-get install cups-pdf
Затем перейдите к System > Администрирование > Печать и создание нового принтера, установите его в качестве PDF-принтера файлов, и назовите его “pdf”.
Затем запустите:
oowriter -pt pdf your_word_file.doc
Теперь вы найдете ваш PDF-файл в ~/PDF.
Альтернатива 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Если пакет tetex-extra недоступен в вашем дистрибутиве, попробуйте texlive-base плюс texlive-latex-base:
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
Ты можешь использовать:
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Если вы запускаете X, вы можете сделать это через Open Office. Поскольку вы собираетесь возразить против того, чтобы делать это вручную, помните, что в Open Office есть несколько замечательных макроскриптов, так что вы можете автоматизировать его . Вы можете сделать что-то подобное с AbiWord (AbiWord –to=pdf).
Если у вас нет X, то есть анти-слово, но оно просто извлекает текст - не делает никакого форматирования или графики. Также есть wvWare , который я использовал для группового извлечения изображений из doc-файлов, но я никогда не пытался использовать его для преобразования doc-файлов в pdfs. Файлы
Oh и .docx вполне могут нуждаться в чем-то другом, но так как это просто zipped xml файлы, то не должно быть слишком сложно сделать с ними что-то полезное. Для массовой распаковки образов просто распакуйте их и скопируйте каталог образов, но мне никогда не приходилось преобразовывать их в Linux.
При печати в PDF теряется много метаданных документа (заголовок, авторство, дерево заголовков, используемое для навигации и т.д.).
Установить unoconv , конвертировать с: unoconv -fpdf file1.doc file2.doc…
Я бы попробовал использовать для Linux
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Для окон:
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter требует, чтобы OpenOffice.org был запущен в качестве сервиса и прослушивал на порту (по умолчанию) 8100; самый простой способ запустить OpenOffice.org в качестве сервиса - из командной строки:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
Открытый офис - это хороший путь вперед, но верность конвертации не всегда верна.
Если вам нужно 100% решение для Linux, то это лучший путь вперед. Однако, если вы не возражаете против одного Windows Box и напишите немного кода для интерфейса с ним из вашей Linux системы, то взгляните на этот пост .
я написал этот пост, так что применяются обычные оговорки об отказе от ответственности.
dopdf
в виртуальной Windows dopdf
в качестве принтера по умолчанию во время установки.*.doc
в виртуальном офисе и распечатайте его на виртуальный принтер dopdf
.*.pdf
появится в папке My Documents
виртуальной Windows