требуется консультация тыжпрограммиста, у меня не едут лыжи по асфальту разбирающегося в работе с ме / Word :: пидоры помогите (реактор помоги)

пидоры помогите Word 

требуется консультация тыжпрограммиста, у меня не едут лыжи по асфальту разбирающегося в работе с мелкомягкими текстовыми файлами.

уважаемые пидоры, падарасы и пидарессы, вечер в ленту, часик в радость. мне нужна ваша помощь в решении непростой задачи.
итак, задача: есть некоторое множество (ориентировочно - несколько тысяч) текстовых документов, по умолчанию - word. в подавляющем большинстве (количество неизвестно) имеются повторяющиеся ошибки в виде слов-паразитов и ошибок в написании. так же - присутствует такая фигня, как межстрочные интервалы "от балды", неверное форматирование страницы и прочее.
так вот, есть ли какой-либо способ массовой борьбы с этой проблемой (кроме "format с" и вливания литра кислоты в недра системника)? в приоритете - массовая замена и исправление/удаление неугодных слов, в идеале - всё вышеперечисленное.
в благодарность от меня - большое буддистское "НИЧЕГО" и маленькое, но очень редкое (а потому - ценное) крокозябровое "спасибо".
КУПОН
НА 1 помощь,пидоры помогите,реактор помоги,Word
Подробнее
КУПОН НА 1 помощь
пидоры помогите,реактор помоги,Word
Еще на тему
Развернуть
Если я правильно понял, то ты хочешь, чтобы все замены произошли СРАЗУ ВО ВСЕХ ФАЙЛАХ? Без необходимости открывать каждый и делать автозамену?
Debro Debro 30.09.201909:54 ответить ссылка 0.4
именно. массовое редактирование в большом количестве вордовских файлов, без необходимости предварительного их открывания (их порядка трёх с копейками тысяч, чтобы просто открыть каждый - уйдёт грёбаный месяц)
Ну тогда только макросы, как уже обсудили ниже. Спецпрограмм, насколько известно, нет
Debro Debro 30.09.201910:02 ответить ссылка -0.4
Не обязательно, есть готовые программные пакеты, тот же TextPipe.
TextPipe Pro Evaluation Edition - [Softpedia]
jg)_ File Edit Filters Tools
□ & y I & U
All Available Filters
Window
Search...
*1
Filters
Wizards
^5* Filter wizard...
^ Web-based filter wizard Mainframe copybook filte ^ Fixed width to delimited i ^ Command line wizard Grep
Convert
ну бомбани парсер docx формата, например с помощью либы docx4j, так ты сможешь сделать то что тебе надо только стоит ли оно того, писанины будет оч много,а про специализированный софт не слыхал(кроме того что написан под определенного заказчика и стоит денеХ)
UFOrik UFOrik 30.09.201909:58 ответить ссылка -0.8
Автору проще найти макрос под нужную версию офиса. На форумах их десятки
Debro Debro 30.09.201909:59 ответить ссылка 0.3
Можно писануть макрос на vba, чтобы он открыл каждый файл в папке, делал замену, сохранял в другое место и переходил к следующему

По сути, цикл открытия файла по маске с сохранением, цикл замены.

У тебя какой срок задачи? Потому что время нужно на написание, а пока что на работе - его нет, только если вечером уже
времени у меня - примерно с месяц. удалось озаботить шефа, который проебался со сроками (забыл и забил), но тут внезапно очнулся и, посчитав что "да хуле там делать, к среде можно управиться" - решил свалить всё на меня. за месяц, если поставить кофейную клизму и капельницу - можно попытаться управиться, но после этого я - не жилец.
Давай я вечером писану тебе рыбу макроса, а ты потом допишешь все изменения сам, устроит?
ну нифига себе! если тебе не в напряг - конечно (я просто ламер, посему в написании с нуля, сам - полный ноль)
Не, это недолго, я такую штуку делал много раз, правда, для экселя, но там разницы особой нет. Закомменчу там, где что менять
не, тебе достаётся не маленькое, а большое крокозяброво спасибо, а это редкость уровня вифлиемской звезды (в этом тысячелетии, во всяком случае, еще не случалось)
Погоди ещё, я не сделал пока ничего
Плюс, макрос только для типовых замен и форматирования, проверку правописания все равно делать как-то придётся
это уже меньшее из зол. главное - вычистить эти авгиевы конюшни, а потом уже и орфографию им натяну.
вот скриптик накидал на автоите.
https://pastebin.com/D2WmsnFK

функцию обхода файлов взял отсюда
https://github.com/jschicht/EaTools/blob/master/_RecFileListToArray.au3

Слова для замены - в ини файле. Вот архив со всем добром:
https://drive.google.com/file/d/12QKuJskVLRGsLPytMq717XwWfnSfsPVc/view?usp=sharing

Дальше сам. И не будь лошарой - проси премию и выполняй задачу хотя бы 3 недели.
в общем, качай тут
https://1drv.ms/u/s!Ag3Bea9_XiZ7gbISNI9hL7QjVT2XRA?e=yO4CGr

зип архив. в нём две папки, два файла

папка To process - туда закидываешь файлы для обработки, советую много не кидать - попробуй начать с десятка. попросту я не нашёл очистки памяти у Ворда, засрётся и привет, в Экселе хоть очищать можно

папка Processed - туда будут скидываться файлы. Я сначала не хотел её создавать, но функция проверки наличия папки сбоила, мне сейчас лень новую писать, пусть просто будет

тестовый - это я когда-то писал план экскурсии на два дня из НН в Мск, я зарандомил слово "блин" там и сбил оформление

процессор - файл с макросом. макросы надо включить - жёлтая кнопка при открытии сверху, а потом просто жмёшь на большую кнопку и ждёшь. сейчас он меняет блин на ничто, выравнивает форматирование и междустрочный интервал делает одинарным - всё это ты можешь поменять. просто открой файл, нажми alt+f11, макрос в модуле - всё закомментировал, специально выделил блок, который можно просто накопировать и изменить для замен

вот
ах да. там тестовые файлы уже есть - погонять
офигеть. дружище, это даже не большое, а ОГРОМНОЕ крокозяброво спасибо (явление уникальное)!
да пожалста)
К сожалению знаком с подобной утилитой только для инглиша, да и то она предложит правки а не исправит все автоматически. Повезло вам с квестом, уговаривайте шефа на поиск редакторов на аутсорсе Лол.
мне не столько с квестом, сколько с шефом повезло. крайне одарённый тип уровня Совы, эффективного менеджера: "ну сам смотри, открываю файл. нажимаю "расширенный поиск", выставляю "найти", "заменить на". ентер. на всё - полторы минуты. за три дня управишься". я при нём посчитал на калькуляторе - на простую "черновую" замену (без учета склонений/спряжений и прочей орфографии), если тратить так по полторы минуты - это около 90 часов. делить на 24=3,75 суток непрерывной долбёжки "открыть, заменить, сохранить". он на меня глазами хлоп-хлоп - и изрекает: "ну а я о чём? три дня, к среде управишься". в итоге, после почти получаса попыток найти у него хоть проблеск разума - взял бумагу, накидал заявление ПСЖ - тут только его и проняло: "ну так бы сразу и сказал, что не успеешь! а сколько времени надо-то?" ну я и ляпнул, что до конца месяца
Если секретность не велика, кидай копии в гуглдиск и отдавай на редактуру за медальки, Лол. Думаю собака может одобрить нечто подобное, хоть и не уверен.
в том-то и беда, что "интеллектуальная собственность" и прочее. копировать что-то на флешку с целью доделать дома - только с разрешения шефа и под присмотром местного сисадмина (который, к слову сказать, помимо того что является племянником шефа - никакими талантами и познаниями более не обладает, в том числе - в сфере своих обязанностей)
Так а отдельные файлы так-же ценны как и все скопом?
Я к тому, нельзя ли все это делить на отдельные куски текста да выставлять на аутсорс, не опасаясь потери важных штук?
эм-м... это открыть текст, выделить-скопировать часть (половину, например) - и выложить? и так с каждым из 3400 документов? к концу месяца (не знаю, которого) как раз управлюсь
До конца месяца надеюсь следующего, иначе мои соболезнования.
октября (хотя сейчас я вздрогнул как-то особо нервно. надо сбегать к шефу и уточнить, какой месяц я имел в виду)
Заранее надо же уточнять. Чтобы экономить нервные клетки.
когда оговаривал сроки - голова была занята прощаньем на месяц с джоем, порно, играми, сериалами, джоем, порно, аниме, фильмами, джоем - и менее важными в жизни вещами, типа регулярного сна и питания. как-то не подумал о числе на календаре.
Я, конечно, не программист :P (идите нахуй, "настоящие" айтишники!), но за спасибо могу предложить вот это:


МассивФайлов = НайтиФайлы(ПутьКФайлам, "*.doc");

Для Каждого Файл Из МассивФайлов Цикл

ТекстовыйДокумент = Новый ТекстовыйДокумент;

ТекстовыйДокумент.Прочитать(Файл.ПолноеИмя, "windows-1251");

Текст = ТекстовыйДокумент.ПолучитьТекст();

Текст = СтрЗаменить([НенужныеСимволы1], "");
Текст = СтрЗаменить([НенужныеСимволы2], "");
//------- Повторить для всех ненужных символов -----------//
Текст = СтрЗаменить([НенужныеСимволыN], "");

ТекстовыйДокумент.УстановитьТекст(Текст);

ТекстовыйДокумент.Записать(Файл.ПолноеИмя, "windows-1251");

КонецЦикла;
Jadelord Jadelord 30.09.201910:31 ответить ссылка -1.9
У него 1С нет скорее всего)
ага. работаем практически при помощи каменного топора и зубила: на работе - "голые" компы, из установленных - "офис" от мелкомягких, да программы-архиваторы. ну и сетевой диск. и всё. и нет возможности даже накуканить какую-нибудь полезную софтину: любая неучтенка по ПО - минус по премии. 1С - в списке "неучтёнки". а приобретать для дома - как-то не было нужды.
Такой вариант подойдет только для txt файлов, для doc - придется поебаца с COM.
При этом макрос написать будет проще.
Да нет, внезапно, работает.
Что-то как-то странно, любой эдитор (notepad, notepad+) - открывает doc и docx файлы как мешанину спецсимволов. Если в 1с пройтись по ним как по plain-text - в результате получится практически с гарантией нечитаемое нечто. Т.е. открыть как тхт и сохранить не изменяя - все будет естественно ок. А вот после замены...
Текст реплейсер - правда не знаю работает ли она док.файлами.
Вроде как вообще то должен, поддержка ворда есть, но лично я не проверял.
enormis enormis 30.09.201910:55 ответить ссылка -0.9
От мимокрокодила - как сформируете текст на VBA, плиз, выложьте.
Не в лом.
Потому что подобные задачки не так уж чтобы редко попадаются...
tfik tfik 30.09.201911:00 ответить ссылка -0.4
см. выше
Я себе для Excel делал подобную программку под себя.
Для начала слил с интернета самый простой макрос для составления списка с применением базовой формы, где можно размещать кнопки и тому подобное. Как правило макросы тяжко работают с закрытыми файлами, посему порой им предварительно нужно открыть некий файл из составленного списка для внесения изменений. Для Excel и Word команды я так полагаю схожие но разные, но кнопка "запись макроса" должна быть одинаковой.
Я себе сделал на форме несколько переключателей для редактирования файлов(в моём случае документации) - для подстановки, подстановки из файла, замены ну и тому подобных вещей. Вылилось это всё в плотную программу для составления документации из Excel, Visio и Pdf файлов в единый Pdf файл. Там использовались и методы для редактирования файлов, и для создания файлов из выборочных листов, и для доступа в макросы Visio из Excel, короче целая эпопея, которая даже помогла мне защитить диплом и подзаработать баблишка, чего и вам советую. Можете обращаться если нужно, для реактора мне не жалко, ибо инфы по макросам того же Visio кот наплакал.
Мой тебе совет главное сохрани исходники, а то на этом столько народу погарело.
aless11 aless11 30.09.201917:51 ответить ссылка 0.3
исходники сохранены на двух разных дисках, плюс - в заархивированном виде на почте (старая-добрая паранойя).
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
КУПОН
НА 1 помощь пидоры, помогите
-Ü
05
С
< пидоры, помогите
-Ü
05
С
<