Преобразование файлов Word в открытый формат
Потребовалось извлечь данные сразу из большого количества .doc файлов. В результате чтения разнообразных руководств родился данный рецепт быстрого преобразования .doc в открытые форматы HTML, RTF, txt, и XML. Требуется наличие Windows, Word, Visual Studio. Надеюсь, результат пригодится общественности, ищущей в Google быстрого решения.
doc2txt, doc2html, doc2rtf, doc2xml
1. Запускаем Visual Studio.
2. Создаём новый проект (New Project -> Visual C# Projects -> Console Application), называем его, скажем, doc2open. Нажимаем OK.
3. В разделе “Solution Explorer” правой кнопкой мыши нажимаем на References, выбираем “Add Reference…”. В окне “Add Reference” выбираем закладку COM, в ней – Microsoft Word 11.0 Object Library. Нажимаем ОК. Теперь мы можем использовать в программе библиотеку Microsoft Word.
4. Вводим эту программу.
5. Собираем проект (Build -> Build Solution) или Debug -> Start. Результат выдаётся в ту же директорию в виде соответствующих файлов .html, .txt. .rtf, .xml.

июля 15, 2007 at 18:06
Я тоже так делал … и одно могу сказать – “работает Очень долго”.
С Уважением,
Сергей