ОТ PDF КЪМ DOC

Понякога ми се налага да работя с документи във формат PDF и да ги конвертирам в DOC. При това обаче възниква нещо ужасно досадно: краят на всеки ред от оригиналния текст се превръща в нов ред. Тоест един по-дълъг документ се напълва с хиляди нови редове на местата, където би трябвало да има само интервал.

Премахването на тези нови редове на ръка е досадна и бавна работа, отнемаща часове и дори дни. Опитах се да потърся съвет за това в интернет, но срещнах предимно обяснения на програмисти, които предлагат сложни и твърде дълбоки решения.

В крайна сметка открих за себе си следния начин на работа:

1. Конвертиране на документа от PDF в TXT. Опцията съществува в самия документ и не е необходимо да се използват програми за конвертиране от мрежата.

2. Прехвърляне на текста в предварително подготвен файл DOC.

3. Чрез find and replace маркираме всички ненужни нови редове, отбелязани със скрития знак „долна стрелка”.

Забележка: Долната стрелка се маркира чрез ^l (в режим „латиница”).

4. Заменяме тези излишни нови редове с нормални нови редове – техният скрит знак е ¶, а във find and replace се маркират с ^p (пак в режим „латиница”).

5. На пръв поглед нищо не се е променило. Тук обаче идва главната операция. Истинските нови редове са се удвоили, а излишните са останали непроменени.

6. Заместваме двойните нови редове – ¶¶ – със знак, който не се използва в текста, например #.

7. Заместваме всички останали нови редове ¶ (те са ненужни) с обикновен интервал.

8. Сега в документа няма нито един нов ред. Заменяме знака # с ¶ и задачата е изпълнена.

9. Възможно е да има дублирани интервали. Издирваме ги и ги заменяме с единични. Ако се наложи – повече от веднъж. Премахваме също така ненужните интервали пред препинателните знаци – . , ? !

10. Задачата е изпълнена. Евентуални дребни корекции могат да се извършат на ръка.

Повторение: Във find and replace ¶ се обозначава с ^p, а долната стрелка – с ^l.

1 like ·   •  0 comments  •  flag
Share on Twitter
Published on February 26, 2014 03:49
No comments have been added yet.


Любомир Николов-Нарви's Blog

Любомир Николов-Нарви
Любомир Николов-Нарви isn't a Goodreads Author (yet), but they do have a blog, so here are some recent posts imported from their feed.
Follow Любомир Николов-Нарви's blog with rss.