Anthropic

Подписчиков: 0 Сообщений: 1 Рейтинг постов: 20.0

Языковая модель с нуля выучила новый язык, на котором не была натренирована.

Вчера компания Anthropic, один из главных конкурентов OpenAI, выпустила языковую модель Claude 3. Многие ее уже нахваливают на разный лад. Она стала первой моделью, чей IQ превышает 100 баллов. А так же продемонстрировала поведение, похожее на самосознание.

Но меня больше всего впечатлил вот этот пример:

Пользователь твиттера, видимо, лингвист по профессии, протестировал Claude 3, загрузив в него 5700 пар перевода с кабардинского на русский. Он просто прикрепил документ к промпту. Переводные пары представляли собой как отдельные слова, так и целые предложения. Это была рандомная выборка из набора в 64 тысячи пар, который он кропотливо составлял годами, чтобы получить нормальный машинный кабардино-русский перевод.

А потом он попросил модель перевести запросы. Начал с простого "Я лежу в кровати". Модель идеально перевела на кабардинский и сделала грамматический и морфологический разбор.

ru_kbd_datase t_sample This is a list of translations between Russian and Kabardian (Circassian). Translate the following sentence into Kabardian: "Я лежу в кровати." Based on the examples in the text, here is how I would translate "Я лежу в кровати" into Kabardian: Сэ гъуэлъып1эм сыхэлъщ.

Возможно, это самое предложение было в прикрепленном документе с примерами? Тогда он составил более сложное предложение, которое не могло встретиться в документе. Снова с идеальным результатом.

Дальнейшие тестирования на литературных текстах, новостных статьях и даже на других кабардинских диалектах с другой грамматикой показали, что модель постоянно демонстрирует глубокое понимание структуры языка, догадывается о смысле незнакомых терминов, правильно использует заимствованные слова, дает этимологический анализ, сохраняет стиль оригинального текста и даже придумывает новые термины, когда об этом просят. Чтобы достичь подобного уровня, лингвисту, не знакомому с языком, потребовалось бы не меньше года. А Claude 3 потребовалось 5700 пар перевода и менее минуты.

O How would you translate this text: "X-bbIMbllM M KbY3 BATP33 H Y3P3A AyHen>KbbiM 6aTap marbaw, fl33 3e3biui3p am yxcb mmmkI, A33iuxy3p Ki>biiAe/i-b3pbiuj3M, E/n>3pblLU3 /Tbarbysp flrb36blfl3LH, >Kb3nKtbip 6biAanl3iA, xcbiTlspM... Ah /TbspbiMbixb rymsxsp Aon>aKly3. Kx'byxbbliuxys rymap

о Translate this text: "Дызэрыт зэман гугъум гу щ1ы1э дищ1а е еджэхэм нэхърэ зытххэр нэхъыбэ хъуауэ дызэхэзэрыхьыжу ара, сытми куэдрэ къохъу усак1уэ нэсым и 1эдакъэ къыщ1эк1а тхылъым хуэфащэ гулъытэ щимыгъуэт. Апхуэдэ гупсысэхэр си гум къагъэк1ащ усак1уэ Сонэ Абдулчэрим «1эгу-махуэ 1эщ1-жэщ»

о How would you translate the word электричество into pure Kabardian without using the borrowed word? You're allowed to come up with a novel word in this case. To translate the word "электричество" (electricity) into pure Kabardian without using the borrowed word, we can try to create a new term

Чтобы исключить возможность того, что среди тренировочных данных Claude 3 было что-то вроде кабардинско-русского переводчика, чувак попробовал те же промпты, не прикрепляя документ с парами перевода. Модель отказалась переводить, сказав, что она не знакома с языком.

Он также попробовал проделать то же самое с GPT-4, скормив модели тот же самый документ, и ничего не получилось, модель отказалась переводить даже самые простые предложения.

Развернуть

Комментарии 1806.03.202404:30ссылка20.0

	kanabun
	Howlsfm
	brookliyn wren
	Triangle Factory
	Brazilian Miku

Anthropic

Языковая модель с нуля выучила новый язык, на котором не была натренирована.

Статистика

Юмор

Основные разделы

Интересное

Топ пользователей

Сейчас на сайте

Anthropic

Claude 3 Anthropic нейронные сети Перевод удалённое

Языковая модель с нуля выучила новый язык, на котором не была натренирована.

Статистика

Юмор

Основные разделы

Интересное

Топ пользователей

Сейчас на сайте