Преобразование файлов Word в открытый формат

Потребовалось извлечь данные сразу из большого количества .doc файлов. В результате чтения разнообразных руководств родился данный рецепт быстрого преобразования .doc в открытые форматы HTML, RTF, txt, и XML. Требуется наличие Windows, Word, Visual Studio. Надеюсь, результат пригодится общественности, ищущей в Google быстрого решения.

doc2txt, doc2html, doc2rtf, doc2xml

1. Запускаем Visual Studio.

2. Создаём новый проект (New Project -> Visual C# Projects -> Console Application), называем его, скажем, doc2open. Нажимаем OK.

3. В разделе “Solution Explorer” правой кнопкой мыши нажимаем на References, выбираем “Add Reference…”. В окне “Add Reference” выбираем закладку COM, в ней – Microsoft Word 11.0 Object Library. Нажимаем ОК. Теперь мы можем использовать в программе библиотеку Microsoft Word.

4. Вводим эту программу.

5. Собираем проект (Build -> Build Solution) или Debug -> Start. Результат выдаётся в ту же директорию в виде соответствующих файлов .html, .txt. .rtf, .xml.

Один комментарий to “Преобразование файлов Word в открытый формат”

  1. SSecurity Says:

    Я тоже так делал … и одно могу сказать – “работает Очень долго”.

    С Уважением,
    Сергей

Leave a Reply