|
|
|
| Файл pdf создан с помощью программы do PDF . Можно ли на нео поставить защиту, запрещающую копирование докумета, копирование содержимого и извлечение страницы? | |
|
|
|
|
|
|
|
для: Владимир55
(09.12.2010 в 22:43)
| | Вряд ли спасёт. pdf файлы прекрасно распознаются в fine reader. Кто захочет - вытащит содержимое без проблем. | |
|
|
|
|
|
|
|
для: Axxil
(09.12.2010 в 23:38)
| | Насколько я помню, fine reader запароленные файлы не распознает. | |
|
|
|
|
|
|
|
для: Владимир55
(10.12.2010 в 00:34)
| | Все что запаролено, распаролить при желании не так сложно. Можете до кучи положить ПДФ в архив и его тоже запоролить, но это защита "от дурака". | |
|
|
|
|
|
|
|
для: mihdan
(13.12.2010 в 02:14)
| | > Можете до кучи положить ПДФ в архив и его тоже запоролить, но это защита "от дурака".
Кто ж Вам такое сказал? | |
|
|
|
|
|
|
|
для: Trianon
(13.12.2010 в 02:38)
| | Смотря о чем вы? | |
|
|
|
|
|
|
|
для: mihdan
(14.12.2010 в 00:21)
| | я точно процитировал Вашу фразу.
Именно об этом.
Или я не понял Ваше выражение "защита от дурака". | |
|
|
|
|
|
|
|
для: mihdan
(13.12.2010 в 02:14)
| | это защита "от дурака".
Полагаю, что это не так. Пароль в виде набора шестнадцати и более случайных знаков подобрать нереально. | |
|
|
|
|
|
|
|
для: Владимир55
(09.12.2010 в 22:43)
| | Если нет защиты от чтения, то все остальные ничем не помогут. Вот вы запретили копирование/извлечение/что-то ещё, но оставили доступ к прочтению, то уже ничто не поможет. Я открою документ, сделаю скриншот и отправлю его в finereader. Или даже проще — у finereader есть вспомогательная утилита под названием abbyy screenshot reader, которая распознаёт текст с того, что выводится на экран. Насколько я знаю, у PDF нету защиты от снятия скриншота. | |
|
|
|
|
|
|
|
для: Саня
(13.12.2010 в 14:13)
| | Надо в PDF делать текст с деформацией как на капче:) | |
|
|
|
|
|
|
|
для: Саня
(13.12.2010 в 14:13)
| | Абсолютной защиты нет, потому, что всегда можно прочитать тескт с экрана и продиктовать его секретарю, а она напечатает. И через скриншот тоже можно вывести. Но ведь это огромная работа! Каждую страницу надо разбить на две-три части для нормального качества изображения, допускающего распознавание, и потом еще совместить фрагменты (а они будут пересекаться!), так что трудоемкость такого решения делает работу бессмысленной.
В документе, который породил эту тему, 180 страниц. Транслировать незащищенный документ в текст - минута. Скомпоновать его из скриншотов, а затем вычитать и сличить с оригиналом - неделя.
Есть разница? | |
|
|
|
|
|
|
|
для: Владимир55
(14.12.2010 в 12:04)
| | Разумеется разница есть. Но раз есть доступ на чтение, то проще написать свою или даже воспользоваться сторонней программой просмотра, которая плюёт на все ограничения.
P.S. Таких программ я не знаю, но уверен что они существуют | |
|
|
|
|
|
|
|
для: Владимир55
(14.12.2010 в 12:04)
| | Где-то недавно упоминался продукт из семейства файнридера, который умеет распознавать данные прямо с экрана... ну, на худой конец, можно вывести данные в файл через виртуальный принтер. И кстати, точность распознавания при этом будет 100% - это вам не искаженный сканированный текст. Так что с неделей Вы хватили сильно через край. Думаю, за вечер, если начать решения вопроса с гугления. Если же есть представление как это сделать, то это дело нескольких десятков минут. | |
|
|
|
|
|
|
|
для: Loki
(16.12.2010 в 16:19)
| | Пишу так, потому что прошел этот путь. Распознавание с экрана не сработает, но сохранить как картинку можно. Потом эти картинки можно превратить в текст. Потом все это надо вычитать и убрать повторы, поскольку картинки будут (должны) налезать одна на другую, чтобы не разорвался общий текст.
Распознавание отнюдь не 100%, если в докумете есть реальная графика или таблицы (в особенности таблицы).
И после всего этого вычитанную версию надо сличить с оригиналом - 180 страниц: один человек читает, другой сличает.
А виртуальный принтер защищеннный файл не возьмет. И невиртуальный тоже.
Так что неделя - это если пахать с утра до вечера. | |
|
|
|
|
|
|
|
для: Владимир55
(16.12.2010 в 23:33)
| | Если выбрать режим по 2 страницы на экране - это 90 разворотов. Если тратить на создание скриншота такого разворота 30 сек (в реале, если настроить, то секунд 10) то получается 45 минут.
10 файнридер распознаёт даже фотки страниц книг (у меня лично фотоаппарат на треноге стоит, которым я книги "сканирую". Качество офигенное получается) не то что скриншотов. Причём прекрасно справляется с задачей сохранения форматирования.
Так что максимум пару часов понадобится на то, чтобы перегнать ваш мега защищённый пдф в ворд. | |
|
|
|
|
|
|
|
для: Axxil
(16.12.2010 в 23:49)
| | Мне остается только порадоваться тому, что у Вас так замечательно работает 10 файнридер. У меня эта же самая программа, но результаты более, чем скромные.
От обработки некоторых документов вообще приходится отказаться из-за плачевных результатов распознавания, хотя текст вполне читаемый. Таблицы почти всегда превращаются в груду мусора, а текст, нанесенный на картинку, вообще никогда не читается.
Собственно, последнюю неделю я только тем и занимаюсь, что распознаю тексты. Соотношение распознавание / ручное исправление в ворде десять к одному. Иначе говоря, двухсотстраничный текст в нетекстовом формате превращается в полноценный текст в ворде за два-три дня. | |
|
|
|
|
|
|
|
для: Владимир55
(17.12.2010 в 00:06)
| | А можно глянуть на пример типичной страницы, с которой не справляется файнридер? Может у меня, конечно, гораздо проще задачи... | |
|
|
|
|
|
|
|
для: Axxil
(17.12.2010 в 10:25)
| | Конечно. Еще мне попадется такая - пришлю.
А пока что хочу отметить вот что.
Вы писали, что для ускорения можно распознавать сразу две страницы. В реале это не так.
Разрешение при копировании с экрана всегда составляет 72 пикселя на дюйм. Одно дело, если на экране текста мало и он занимает все пространство экрана. В этом случае на каждую букву приходится относительно большое число точек. И совсем другое дело, когда на экране много текста, даже хорошего качества.
Вот что дает распознавание отдельного абзаца (для примера):
Кардинальные гласные Д. Джоунза и их транскрипционные обозначения с небольшими уточнениями и дополнениями положены в основу Международного фонетического алфавита. Нельзя не отметить, что схема кардинальных гласных. разработанная Джоунзом на основе общих артикуляционных и слуховых критериев в период, когда формантный анализ гласных был еще недоступен, оказалась впоследствии очень близкой к схеме расположения гласных в пространстве частот первой и второй формант. Это еще раз свидетельствует о том, что целевая установка артикуляции гласных связана с резонансными свойствами речевого тракта.
Этот же абзац в составе целой страницы:
Кардинальные гласные Д. Джоукза н их трансхрнппи- ОЕЕые обозначения с небольшими уточневими и дополне_ниями ПОЛОЖеЕЫ В ОСЕОЗу $0MfmratXO2O алфавита. Нельзя не отметить, что схема хардинальных глас_ных. разработанная Джоунзом на оснозе общих артикуляции_онных и слуховых критериев в период, котла форхазтнын авалю гласных был еще ЕедоступеЕ. охазалась впоследствии очень близкой х схеме расположения гласных з пространст¬ве частот первой н второй формгнт. Это еще раз свидетель¬ствует о то*, что целевая установка артнхуляпин гласных связана с резонансными свойствами речевого трахта
Так что при работе большими массивами распознать-то можно быстро, но потом умучаешься все это править.
В реале приходится ставить не две страницы на экран, а одну страницу распознавать частями за три-четыре приема. Да еще при совмещении распознанных частей возникает куча проблем. | |
|
|
|
|
|
|
|
для: Axxil
(16.12.2010 в 23:49)
| | >в реале, если настроить, то секунд 10
что-то много:) например, гугловская пикаса следит за буфером обмена и автоматом сохраняет все попавшие туда скриншоты... так что время будет уходить только на листание. | |
|
|
|