2009-09-27 11:06:58 +0000 2009-09-27 11:06:58 +0000
40
40
Advertisement

Невозможно скопировать текст из файла pdf.

Advertisement

Я использую программу foxit PDF Reader для просмотра моего учебника. Я хотел бы скопировать текст из файла pdf в документ word, но это мне не позволяет. Я могу выбрать текст хорошо, но опция копирования текста не доступна. Я могу скопировать текст из других документов, но не из некоторых. Есть ли способ обойти эту защиту в окнах?

Advertisement
Advertisement

Ответы (10)

29
29
29
2009-09-27 11:22:46 +0000

Файл pdf, вероятно, был заблокирован от копирования текста. Ниже приведены два способа его разблокировки: Если pdf не был заблокирован от печати, вы можете распечатать его на виртуальном принтере pdf для создания разблокированного файла. См. это: “Удалить пароль и разблокировать защищенный PDF, который разрешено печатать без знания секрета”. 2. Если функция печати была заблокирована, см. следующее: “Удаление ограничений и расшифровка PDF файлов с защитой паролем с помощью PDF Unlocker” .

25
25
25
2012-07-16 09:54:15 +0000
  1. Откройте PDF в Google Chrome (перетащите PDF файл в Chrome).
  2. Распечатайте конкретную страницу в формате PDF или просто откройте предварительный просмотр печати.
  3. Теперь вы можете скопировать текст из предварительного просмотра печати или вывода PDF. Но я не думаю, что вы можете скопировать таблицу напрямую.
12
Advertisement
12
12
2012-07-15 23:33:28 +0000
Advertisement

Я смог создать DRM-бесплатную версию вашего PDF-файла, используя Ghostscript (который доступен для Windows).

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Полученный файл stripped.pdf можно загрузить в Adobe Reader, и Reader с удовольствием позволит вам скопировать любую его часть. Он также сохраняет большую часть форматирования таблицы.

2
2
2
2012-07-15 21:19:08 +0000

Я смог успешно скопировать таблицу из вашего PDF-файла, используя Okular (для Linux; часть KDE). Для этого мне пришлось зайти в настройки Okular и снять флажок “Obey DRM restrictions”.

Я знаю, что это не очень помогает, так как вы работаете под Windows, но это возможно, если у вас есть машина под Linux или вы хотите ее установить.

К сожалению, это был простой текст без форматирования, но, похоже, воссоздать таблицу не составит труда. Вы можете увидеть результаты моего приключения с копированием и вставкой здесь .

1
Advertisement
1
1
2012-07-27 07:58:44 +0000
Advertisement

Вы можете использовать GT Text - программу, которая переводит изображения (также pdf снимки = изображение) в текст. Вы можете выбрать область и скопировать ее в буфер обмена. Это бесплатно

Официальная домашняя страница http://gttext.googlecode.com .

1
1
1
2019-04-15 08:05:52 +0000

если копия серая, как это теперь сомнительно для вас, то PDF “заблокирован”, он может быть прочитан, но на самом деле останавливает вас от копирования/вставки чего-либо из него.

Этот сайт разблокирует PDF https://smallpdf.com/unlock-pdf .

0
Advertisement
0
0
2012-09-13 14:24:39 +0000
Advertisement

Другая возможность - Эвинс . В Windows , похоже, поддерживает копирование по умолчанию.

В Linux копирование можно включить, установив флажок override_restrictions, если это еще не так, следуя эти указания (dconf-editor/org/gnome/evinceoverride_restrictions).

0
0
0
2015-09-09 19:49:19 +0000

Это позволило конвертировать основной текст. Однако, он забился таблицами. http://www.onlineocr.net/documents

0
Advertisement
0
0
2012-07-15 21:07:35 +0000
Advertisement

Ответ на эндолит:

Ваш PDF защищен от копирования, но не защищен от печати.

Итак, я распечатал одну страницу, содержащую таблицу 6.15, в другой PDF, который не защищен от копирования, выделил и скопировал таблицу, а затем вставил ее в Word. К моему большому удивлению, результат вставки оказался полным мусором.

Теперь я еще раз взглянул на эту таблицу и нашел очень удивительный результат: Это не таблица!

На самом деле это монтаж маленьких кусочков текста, расположенных на странице так, чтобы выглядеть как таблица. Но это не настоящая таблица.

Лучшее, что вы можете сделать, это либо переписать все заново как таблицу, либо просто использовать в своей работе скриншот этого собранного текста, похожего на таблицу.

Вот мой скриншот таблицы, взятый из моего сгенерированного одностраничного pdf документа :

0
0
0
2012-07-11 17:34:13 +0000

Если вы ищете только короткие отрывки, вы часто можете набрать несколько слов в google внутри кавычек и найти точную кавычку, уже отсканированную в каком-то другом формате или набранную кем-то другим.

Еще один вариант - “Документ из фотографии” в приложении Google Docs Android, которое поместит текст через OCR. Это, конечно, подвержено ошибкам.

Хотелось бы, чтобы никогда не существовало функции блокировки PDF :(

Advertisement

Похожие вопросы

19
7
12
9
10
Advertisement
Advertisement