требуется консультация тыжпрограммиста, у меня не едут лыжи по асфальту разбирающегося в работе с мелкомягкими текстовыми файлами.
уважаемые пидоры, падарасы и пидарессы, вечер в ленту, часик в радость. мне нужна ваша помощь в решении непростой задачи.итак, задача: есть некоторое множество (ориентировочно - несколько тысяч) текстовых документов, по умолчанию - word. в подавляющем большинстве (количество неизвестно) имеются повторяющиеся ошибки в виде слов-паразитов и ошибок в написании. так же - присутствует такая фигня, как межстрочные интервалы "от балды", неверное форматирование страницы и прочее.
так вот, есть ли какой-либо способ массовой борьбы с этой проблемой (кроме "format с" и вливания литра кислоты в недра системника)? в приоритете - массовая замена и исправление/удаление неугодных слов, в идеале - всё вышеперечисленное.
в благодарность от меня - большое буддистское "НИЧЕГО" и маленькое, но очень редкое (а потому - ценное) крокозябровое "спасибо".
Еще на тему
По сути, цикл открытия файла по маске с сохранением, цикл замены.
У тебя какой срок задачи? Потому что время нужно на написание, а пока что на работе - его нет, только если вечером уже
https://pastebin.com/D2WmsnFK
функцию обхода файлов взял отсюда
https://github.com/jschicht/EaTools/blob/master/_RecFileListToArray.au3
Слова для замены - в ини файле. Вот архив со всем добром:
https://drive.google.com/file/d/12QKuJskVLRGsLPytMq717XwWfnSfsPVc/view?usp=sharing
Дальше сам. И не будь лошарой - проси премию и выполняй задачу хотя бы 3 недели.
https://www.autoitscript.com/autoit3/docs/libfunctions/_Word_DocFindReplace.htm
https://1drv.ms/u/s!Ag3Bea9_XiZ7gbISNI9hL7QjVT2XRA?e=yO4CGr
зип архив. в нём две папки, два файла
папка To process - туда закидываешь файлы для обработки, советую много не кидать - попробуй начать с десятка. попросту я не нашёл очистки памяти у Ворда, засрётся и привет, в Экселе хоть очищать можно
папка Processed - туда будут скидываться файлы. Я сначала не хотел её создавать, но функция проверки наличия папки сбоила, мне сейчас лень новую писать, пусть просто будет
тестовый - это я когда-то писал план экскурсии на два дня из НН в Мск, я зарандомил слово "блин" там и сбил оформление
процессор - файл с макросом. макросы надо включить - жёлтая кнопка при открытии сверху, а потом просто жмёшь на большую кнопку и ждёшь. сейчас он меняет блин на ничто, выравнивает форматирование и междустрочный интервал делает одинарным - всё это ты можешь поменять. просто открой файл, нажми alt+f11, макрос в модуле - всё закомментировал, специально выделил блок, который можно просто накопировать и изменить для замен
вот
МассивФайлов = НайтиФайлы(ПутьКФайлам, "*.doc");
Для Каждого Файл Из МассивФайлов Цикл
ТекстовыйДокумент = Новый ТекстовыйДокумент;
ТекстовыйДокумент.Прочитать(Файл.ПолноеИмя, "windows-1251");
Текст = ТекстовыйДокумент.ПолучитьТекст();
Текст = СтрЗаменить([НенужныеСимволы1], "");
Текст = СтрЗаменить([НенужныеСимволы2], "");
//------- Повторить для всех ненужных символов -----------//
Текст = СтрЗаменить([НенужныеСимволыN], "");
ТекстовыйДокумент.УстановитьТекст(Текст);
ТекстовыйДокумент.Записать(Файл.ПолноеИмя, "windows-1251");
КонецЦикла;
При этом макрос написать будет проще.
Не в лом.
Потому что подобные задачки не так уж чтобы редко попадаются...
Для начала слил с интернета самый простой макрос для составления списка с применением базовой формы, где можно размещать кнопки и тому подобное. Как правило макросы тяжко работают с закрытыми файлами, посему порой им предварительно нужно открыть некий файл из составленного списка для внесения изменений. Для Excel и Word команды я так полагаю схожие но разные, но кнопка "запись макроса" должна быть одинаковой.
Я себе сделал на форме несколько переключателей для редактирования файлов(в моём случае документации) - для подстановки, подстановки из файла, замены ну и тому подобных вещей. Вылилось это всё в плотную программу для составления документации из Excel, Visio и Pdf файлов в единый Pdf файл. Там использовались и методы для редактирования файлов, и для создания файлов из выборочных листов, и для доступа в макросы Visio из Excel, короче целая эпопея, которая даже помогла мне защитить диплом и подзаработать баблишка, чего и вам советую. Можете обращаться если нужно, для реактора мне не жалко, ибо инфы по макросам того же Visio кот наплакал.