Привет, пидоры. / пидоры помогите (реактор помоги)

пидоры помогите 

Привет, пидоры. 

Ищу софт для перевода mp3 (а еще лучше mp4) в текст. То есть что-то вроде конспектирования лекций. Знаю, что Алиса от яндекса делает что-то подобное, но вроде там только краткий пересказ и к тому же видео нужно заливать на ютуб. Дело в том, что лекции никуда заливать нельзя в связи с NDA, да и к тому же конспекты нужны подробные, а видеозаписей там на 15+ часов. Гугл вывел меня на нейросетку whisper-jax, но как поднять ее локально не представляю. Может есть какая-то софтина или бесплатный сервис? По поводу последнего, пробовал https://huggingface.co/spaces/sanchit-gandhi/whisper-jax, но он 2 часовую лекцию не прожевал.

Прошу помощи

КУПОН
НА 1 помощь,пидоры помогите,реактор помоги

Подробнее
КУПОН НА 1 помощь
пидоры помогите,реактор помоги
Еще на тему
Развернуть
гугл доками попробуй.
madgod madgod 06.10.202411:35 ответить ссылка 0.0
Так у openAI есть открытые модели для распознавания Whisper.
https://huggingface.co/openai
https://huggingface.co/openai/whisper-large-v3
(кроме них в общем то нихрена открытого у них и нет)

Так уж ли нельзя никуда заливать? А то телега умеет распознавать в премиум режиме. Ютуб может генерировать сабы. Яндекс браузер вроде умеет сабы делать. Тот же OpenAI API может возвращать текст из mp3 (тот же whisper используется). Ну и сам https://huggingface.co/spaces/openai/whisper
Да, вот последний я пробовал. Загрузил файл минут 20 назад. До сих пор жду. Установил себе локально этот whisper jax. Можно тебе сюда буду писать с вопросами?
Да я сам ещё с этим не разбирался. Всё лень. Для своего бота юзал OpenAI API. Сейчас мой токен превратился в тыкву, надо новый подрубать, да и запускать это потом на сервере в нидерландах, ибо из раши не принимают запросы. Мээээ. Может через месяц-два, когда начну в 5й раз переписывать своего бота, гляну по моделям, что получится запустить локально, но пока лень.
Поставил себе локально. Он 10 минут обрабатывал 4х минутное видео. Проще видимо самому сидеть и все это вбивать руками
пробовал на чем-то более простом? например видео из Youtube? у меня было такое, что большое тоже не с первого раза пережевывает, но с небольшими частями проблем нет
MKOP MKOP 06.10.202413:25 ответить ссылка 0.0
Ну, 4х минутная запись на мой взгляд должна быть достаточно легкой, учитывая, что у меня 15 часов лекций.

Я это делаю на жирике нвидивском на линухе (для того собственно и ставил), виспер собираю с гитхаба и запускается локально, распознавание работает бодренько.

Но для лекций во времена ещё лекций, юзал гугл Транслейт на телефоне. Как вариант чтобы не ебаться, с винды приватности у тебя и так нет. А чтобы с пайтоном играть то идейе нужно и ну короче, делов на 20 минут (нет). А так можешь на другой язык заодно переводить и даже озвучивать. Возможно даже апи для этого есть у гугла.

К сожалению, я сильно ограничен во времени и хотелось бы за ближайшую ночь обработать 15 часов лекций. Жирик - это что такое? В докере если поднять будет лучше или это совсем не то?
Жирик это видеокарта от нвидии
Это можно поднять в докерк, если есть железо, можно даже в гугл ноте или как он там. Который даёт видяху бесплатно на 12 часов.
Пытался самостоятельно поднять, ничего не вышло. Зато нашел коллабу какого-то бабаха, у него все работает как часы
https://colab.research.google.com/drive/1dtcxoiH4XYV7AMUTyXZhj2kXV54HMnh9?usp=sharing#scrollTo=scAiM8ug_s1M
У него работает, а у тебя в его блокноте не работает?
У меня в блокноте 5 минутное видео обработалось отлично, а вот 2 часа не проглотил
Ты мне так и не ответил есть ли у тебя в компе видяха. Если она есть, то можно поднять в докере и там прогнать.
Видяха есть, но докер уже не актуален, смотри следующий коммент

На крайняк могу в лс линк на тг бота кинуть, там у меня уже работает, юзаю для голосовых, хотя и качество не идеальное — модель базовая.

Там ниже скинули ссылку на приложение, которое в удобной графическом интерфейсе делает вообще всё: скачивает библиотеку, модель, извлекает аудио из видеозаписи и обрабатывает. Запустил, буду смотреть
https://www.nikse.dk/subtitleedit
2х-часовую запись за 20 минут обработал. Причем не сказать, что прям все ресурсы компа максимально использовал
Да, есть несколько настроенных документов на GitHub, которые могут помочь вам использовать Whisper в Google Colab для распознавания речи. Вот несколько из них:

- **Whisper Notebook**: Этот репозиторий содержит Colab Notebook, который поддерживает OpenAI Whisper и API DeepL для транскрипции и перевода. Он предлагает простую настройку и инструкции для использования. Вы можете открыть его и следовать указаниям внутри: [Whisper Notebook](https://github.com/cnbeining/Whisper_Notebook).

- **Faster Whisper Google Colab**: Этот проект предлагает облачное развертывание Faster Whisper на Google Colab. Он позволяет автоматически генерировать субтитры или транскрипцию для загруженных видеофайлов. Это решение также бесплатное и не имеет ограничений по длине видео: [Faster Whisper Google Colab](https://github.com/ChanJianHao/Faster-Whisper-Google-Colab).

- **Deepgram Blog**: Хотя это не GitHub, в блоге Deepgram есть простой ноутбук для работы с Whisper в Google Colab, который включает установку, загрузку аудио с YouTube и оценку производительности модели: [Как запустить OpenAI Whisper в Google Colab](https://deepgram.com/learn/how-to-run-openai-whisper-in-google-colab).

Эти ресурсы помогут вам быстро начать работу с Whisper для распознавания длинных лекций на русском языке.

Citations:
[1] https://deepgram.com/learn/how-to-run-openai-whisper-in-google-colab
[2] https://github.com/cnbeining/Whisper_Notebook
[3] https://github.com/ChanJianHao/Faster-Whisper-Google-Colab
если оно несильно приватно, можешь скинуть мне часть- две , я попробую у себя распознать, если совсем времени в обрез
MKOP MKOP 06.10.202415:59 ответить ссылка 0.0
Так а чего не сюда сразу, нам всем интересно!
Ну или название предмета хотя бы.
новое обновление винды 11 должно уметь
narsus narsus 06.10.202411:41 ответить ссылка -0.8
Можно чуть подробнее
win+ctrl+S
Но нужно язык системы переключить на инглиш.
Но что-то сомневаюсь, что оно работает локально.
Пишет, что текущий язык не поддерживается. Сомневаюсь, что он в таком случае сможет нормально конвертацию русского языка сделать

Работает локально, русского нет.

В настройках видны надо установить языковые пакеты, возможно на вкладке по распознаванию речи
Кто отследит твоё NDA на ютубе, если сделаешь доступ по ссылке? Там кстати есть автогенерация субтитров от самого ютуба, потом просто удалишь видео.
yoburg yoburg 06.10.202412:13 ответить ссылка 0.2
Не хочется рисковать если есть другие пути
Если сервис подавился двух часовым файлом, по попробуй нарезать на часовые (получасовые) отрезки и скормить ему так.
Или там ограничение на количество файлов есть?
Russ_Dry Russ_Dry 06.10.202412:20 ответить ссылка 0.6
Привет,
смотри, проблема у тебя в том, что ты хочешь из mp3\mp4 вытянуть текст, да?!
Ок, есть одно приложение, которое сам использовал, https://www.nikse.dk/subtitleedit Subtitle Edit. ему только нужно библиотеки подгрузить того языка(это в самом приложении можно сделать, оно на выбор дает), с которого хочешь ему дать видео на обработку, желательно, чтобы лишних шумов не было (нет такой программы еще, что обрабатывало звуки как человек, может нейронки уже есть , не искал среди них, а так ,обычные программ не видел)
Так вот, я брал курс по видео на английском(в нем нету субтитров, но мне нужно было прокачаться), да , да, кто-то скажет , выучи ты его уже, хватит обходные способы искать, но я отвлекся... Так вот, я скачал на него библиотеки языка,вроде среднюю скачал библиотеку, там чем больше библиотека, тем дольше обрабатывает, но точнее, но зато, никакой интернет не нужен после, просто кидаешь в него видео или видюшки и уходишь по своим делам, а он уже сам создает тебе документики, который можно использовать ,как субтитры для видео.
Ты можешь сказать, но мне нужен только текст, а не таймкоды , но тут уже я скажу тебе, что тебе проще скрипт написать, я помню, что ты на C# умеешь и даже курсы по go пытался изучать(просил помощи в лучших и быстрых ,для усвоения ,курсов ), напиши там парсер, что будет искать то, что нужно удалить и все на этом, у тебя будет голый текст из видео, что тебе нужно
Сама программа проста в использовании, я ей давно не пользовался, но помню, что там несколько кнопок нажать и все
А , да, программа бесплатная и с исходным кодом, и все твои данные сохраняет там, где ты укажешь(в моем случае это был мой компьютер),а , еще кое-что, когда смотрел видео с субтитрами(после этой программы, что получил, их даже в этой программе можно перевести на другой язык, очень удобно) то сам по себе перевод меня устраивал, а значит исходный текст субтитров был более чем , но помни, я скачивал среднюю библиотеку, а если тебе нужно супер точно, то скачивай большую, и обработка видео у тебя будет очень долгой, ну и за одно проверь, есть ли там библиотеки для твоего языка из видео
Поковырял эту приложуху - бомба. У нее внутри есть всё. Даже сам whisper jax. Он прям внутри приложухи скачивает библиотеку, модель, извлекает аудио из видеозаписи и обрабатывает.
Спасибо тебе огромное!
В чём проблема? Включи этот Мп3 и открой гугл док, нажми на диктовку и следи за процессом, как пойдёт.
Чтоб без присмотра процесс оставить, так пока что вряд ли бывает.
madgod madgod 06.10.202417:51 ответить ссылка 0.5
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
пидоры, простите 'фуРшУе/
°т '
^лжтрацу
( 1Ш т№ф
наименование и местонахождение бюро
Ж& ..Я;	ríSí ,¿0fk	' ’	SgíL1
Ьрр X u,pt[u*&
Пт выдачи
подробнее»

пидоры помогите,реактор помоги

'фуРшУе/ °т ' ^лжтрацу ( 1Ш т№ф наименование и местонахождение бюро Ж& ..Я; ríSí ,¿0fk ' ’ SgíL1 Ьрр X u,pt[u*& Пт выдачи
ПИД OPbl,