Формат PDF спочатку був розроблений для ідентичного відображення документа незалежно від операційної системи, пристрої або програми, в якій він відкривається.
На сьогоднішній день у користувачів все частіше виникає потреба не тільки переглядати, але і працювати з PDF-документами (редагувати, коментувати, захищати, порівнювати, здійснювати пошук і багато іншого) або перетворювати їх в редагований формат. Найчастіше працювати з такими документами буває непросто, особливо якщо PDF являє собою тільки зображення, отримане шляхом сканування. Найефективніше рішення для реалізації можливості пошуку, вилучення та подальшого використання даних - перетворення PDF із застосуванням технології оптичного розпізнавання символів (OCR).
Що таке OCR-технологія
Технологія оптичного розпізнавання символів (англ. - Optical Character Recognition (OCR) дозволяє отримати доступ до інформації, «запечатаній» в PDF-документах, які містять лише зображення сторінки (відсканований або сфотографований документ). Програми, засновані на технології оптичного розпізнавання символів, такі як ABBYY FineReader, зчитують зміст документа (текст і структуру), інтерпретуючи символи і переводячи їх в електронний формат. Програма додає в документ текстовий шар, що дає можливість пошуку і редагування док мента.
Дізнайтеся більше про те, що вдає із себе технологія OCR і як вона працює.
Найпоширеніші завдання з конвертування документів:
Перетворення PDF в PDF з можливістю пошуку і PDF / A
- При скануванні документа і збереження в форматі PDF ви отримуєте PDF, який представляє собою тільки зображення сторінки без текстового шару. Перетворення сканированного PDF в PDF з можливістю пошуку та редагування істотно полегшує роботу з ним, роблячи можливим копіювання та індексацію вмісту, а також повнотекстовий пошук. Це значно полегшить роботу організацій, особливо юридичних компаній, освітніх та державних установ, які зможуть отримати швидкий доступ до інформації за допомогою різних спеціалізованих систем електронного документообігу, таких як eDiscovery і DMS.
- Перетворення документів PDF в формат PDF / A забезпечує довгострокове архівне зберігання документів з дотриманням останніх стандартів для процесів архівування.
Конвертація PDF в Word
- Конвертація PDF-документа в формат Microsoft® Word® відкриває доступ до інформації, що міститься в документі (наприклад, договір, звіті, статті і т. Д.).
- Перетворивши PDF-документ в формат Microsoft Word, ви отримуєте можливість редагувати документ, не витрачаючи часу на передрук і повторне форматування.
- При перетворенні документа зберігається його первісний формат, включаючи зображення, таблиці і колонки.
Конвертація PDF в Excel
- При конвертації PDF-документа в Microsoft Excel, ви отримуєте можливість редагування і подальшої роботи з електронними таблицями.
- Зберігається вихідна структура рядків і стовпців, що дозволяє легко приступити до роботи з числовими даними з прайс-листів, аналітичних звітів або газетних статей прямо в Excel.
- Якщо при перетворенні великого багатосторінкового документа вас цікавлять тільки що містяться в ньому таблиці, ви можете виключити текст при перетворенні.
Конвертація PDF в RTF
- Конвертація PDF-документів в формат RTF дозволяє редагувати текст оригінального документа в різних операційних системах, таких як Mac®, Linux® або Windows®.
- Документ, перетворений в формат RTF, можна відкривати, з ним можна працювати за допомогою будь-яких програм для роботи з текстом, навіть якщо це застарілі версії Microsoft Word, WordPerfect®, OpenOfficeTM Writer або Apple® Pages.
Конвертація PDF в EPUB®
- Перетворення PDF в EPUB спрощує читання електронних книг з мобільних телефонів або планшетів, дозволяючи змінювати розмір шрифту і підганяти текст під параметри екрану.
Конвертація PDF в HTML
- Конвертація PDF в HTML використовується при публікації інформації в інтернеті, що дозволяє заощадити час завдяки збереженню вихідної структури документа.