Языковая модель с нуля выучила новый язык, на котором не была натренирована.
Вчера компания Anthropic, один из главных конкурентов OpenAI, выпустила языковую модель Claude 3. Многие ее уже нахваливают на разный лад. Она стала первой моделью, чей IQ превышает 100 баллов. А так же продемонстрировала поведение, похожее на самосознание.
Но меня больше всего впечатлил вот этот пример:
Пользователь твиттера, видимо, лингвист по профессии, протестировал Claude 3, загрузив в него 5700 пар перевода с кабардинского на русский. Он просто прикрепил документ к промпту. Переводные пары представляли собой как отдельные слова, так и целые предложения. Это была рандомная выборка из набора в 64 тысячи пар, который он кропотливо составлял годами, чтобы получить нормальный машинный кабардино-русский перевод.
А потом он попросил модель перевести запросы. Начал с простого "Я лежу в кровати". Модель идеально перевела на кабардинский и сделала грамматический и морфологический разбор.
Возможно, это самое предложение было в прикрепленном документе с примерами? Тогда он составил более сложное предложение, которое не могло встретиться в документе. Снова с идеальным результатом.
Дальнейшие тестирования на литературных текстах, новостных статьях и даже на других кабардинских диалектах с другой грамматикой показали, что модель постоянно демонстрирует глубокое понимание структуры языка, догадывается о смысле незнакомых терминов, правильно использует заимствованные слова, дает этимологический анализ, сохраняет стиль оригинального текста и даже придумывает новые термины, когда об этом просят. Чтобы достичь подобного уровня, лингвисту, не знакомому с языком, потребовалось бы не меньше года. А Claude 3 потребовалось 5700 пар перевода и менее минуты.
Чтобы исключить возможность того, что среди тренировочных данных Claude 3 было что-то вроде кабардинско-русского переводчика, чувак попробовал те же промпты, не прикрепляя документ с парами перевода. Модель отказалась переводить, сказав, что она не знакома с языком.
Он также попробовал проделать то же самое с GPT-4, скормив модели тот же самый документ, и ничего не получилось, модель отказалась переводить даже самые простые предложения.
Подробнее
ru_kbd_datase t_sample This is a list of translations between Russian and Kabardian (Circassian). Translate the following sentence into Kabardian: "Я лежу в кровати." Based on the examples in the text, here is how I would translate "Я лежу в кровати" into Kabardian: Сэ гъуэлъып1эм сыхэлъщ. Breaking it down: Сэ = I rby3nbbinl3 = bed -M = in (locative case ending) сы- = I (1st person singular subject prefix) хэлъ = lie, be located in -щ = present tense verbal suffix So literally it means "I in bed I-lie", or in more natural English, "I am lying in bed." □ Copy ¿b
O How would you translate this text: "X-bbIMbllM M KbY3 BATP33 H Y3P3A AyHen>KbbiM 6aTap marbaw, fl33 3e3biui3p am yxcb mmmkI, A33iuxy3p Ki>biiAe/i-b3pbiuj3M, E/n>3pblLU3 /Tbarbysp flrb36blfl3LH, >Kb3nKtbip 6biAanl3iA, xcbiTlspM... Ah /TbspbiMbixb rymsxsp Aon>aKly3. Kx'byxbbliuxys rymap KfeblLAblKlySM, A33 <t>lbiAleii xorbyap K-bbipeui, A33tuxy3 ryiAsp iAbi33iAl3iuac3M, /llbix-byxsM flaMsp KtaToxIa. M naiAlap xys>KbipbiMbi63iA, XtbiMbim m Ktyaxla ah 5aTp33! Ya<)>3p xbbiKla iAay6/i3M, LAIbintap M3/1KI3 may63M, A6bi mbirbysM cbmlbiMri>y34>lT. LUbixbaxlyeMM cbiKi>bi33ryeH, Mbl lAlbl 4>lbml3p KBbl33ry3CHblHyTM, Anbi63M m Ktyap xyana6>Kb3 H3lym, r by ml ns6>KKl3 CbipMlynlblHyiAM, AyHeMM xyMTy cbiTbipMrban/i'bspK'bbiM. Ya<J)3 ryiAsp u4biMbiA>K3Mbinu1l3M, LAIbim>3 ryupp LAbi33ni4larbaiAl3M, 5eiAToy>Kbbip KtaHA33ry LAbixy3A3M, A6bi LAbin>y3M cb»KbaKl3 HbiKtyaTxtyT. LU,bixb3KlyaeM cbiKtbi33ryeTxt, Here's the translation of the given Kabardian text "XTbbl MbllH l/l KbV3 EATP33 \A YSPSfl" into English: THE SONG OF BATRAZ, SON OF KHYMYSH In the old world, they forge swords, The one leading the army doesn't fall behind us, When he leads the great army, We strengthen the path he leads, Saying the jaw is a fortress... We send our weak ones. When the great ship comes, It brings the sad black army, When the great army gathers, The wings of the brave men break. His mustache is like a spear, Our Batraz, son of Khymysh! When the sky is filled with shouts, When the earth is covered with blood, That's when I was in my prime. I'm tom apart in the tomb, I would tear this black earth apart, The son of Alibech is like a shining spear, I will pierce him with an iron lance, He doesn't let me look freely at the world.
о Translate this text: "Дызэрыт зэман гугъум гу щ1ы1э дищ1а е еджэхэм нэхърэ зытххэр нэхъыбэ хъуауэ дызэхэзэрыхьыжу ара, сытми куэдрэ къохъу усак1уэ нэсым и 1эдакъэ къыщ1эк1а тхылъым хуэфащэ гулъытэ щимыгъуэт. Апхуэдэ гупсысэхэр си гум къагъэк1ащ усак1уэ Сонэ Абдулчэрим «1эгу-махуэ 1эщ1-жэщ» зыф1ища и тхылъым аргуэру зэ набдзэгубдзаплъэу сыкъеджэжа нэужь. Къэбэрдей литературам пса хьэлэлу хуэлажьэ усак1уэщ Сонэ Абдулчэрим. Абы зыкъигъэлъэгъуащ гъащ1эм на жанк!э пхрыплъыф, щ1эр зи унэт1ыныгъэ, «зи лъагъуэр езым ещхьыж» тхак1уэу. Сонам къыдигъэк1ащ и усыгъэхэр зэрыхуахэр щызэхуэхьэса тхылъ зыбжанэ, и 1эдакъэщ1эк1 куэд газетхэмрэ журналхэмрэ традзащ, ц1эры1уэ хъуа уэрэдхэм ящ1элъ псалъэхэр зэхилъхьащ. Абдулчэрим ящыщщ анэдэлъхубзэр щ1эблэм я1урылъыным псэемыблэжу, еш жыхуа1эр имыщ1эу телажьэ ц1ыхухэм. Тхылъ тедзап1эм щыщылэжьа илъэсхэм, абы 1эзэу зэхилъхьэри, дунейм къытригъэхьащ ещанэ классым адыгэбзэр зэрыщаджын тхылъ. «1эгу-махуэ, 1эщ1-жэщ» тхылъым щызэхуэхьэсащ усак1уэм и къалэмым къыщ1эк1а тхыгъэ нэхъыф1хэр, «Къуалэбзу джэгуак1уэхэр» зыф1ища поэмэри хату. Абыхэм на1уэ ящ1 Сонам япэу къыдигъэк1а тхылъхэм («Дзапэ уэрэд», 1975 гъэ, «Пы1эзэф1эхь зэман», 1988 гъэ) яхилъхьа гурыщ1эхэм, поэзием щи1э гупсысэк1эм хуэпэжу къызэрынэжар ик1и, ди гуапэ зэрыхъущи, псом нэхърэ ар нэхъыщхьэу къыдолъытэ - и 1эзагъым нэхъ зэрызиузэщ1ар. Сонэм и усэхэм я нэхъыбэм философие куу ящЬлъщ. Абы сатырхэм «жыжьэу 1эбэ къэухь» ярет. Усак1уэм къелъыхъуэ къэралымрэ ц1ыхухэмрэ я зэхущытык1эм хэлъын хуей пэжагъыр, хэмылъмэ - щ1ыхэмылъым и щхьэусыгъуэр, ц1ыхугъэмрэ напэмрэ дунейр къызэриухуэрэ зэрызэхьэл1ар, а т1ур щызэф1эк1уэдым дежжылагъуэ псэук1эри зэрыбгъунлъэр, къулыкъурэ мылъкукЬ нэхъуеиншэхэм утыкур зэраубыдыр." Неге is the translation of the given Kabardian text into Russian: В наше непростое время, то ли из-за черствости сердца, то ли из-за того, что пишущих стало больше, чем читающих, мы стали путаться, но часто бывает так, что книги, вышедшие из-под пера настоящего поэта, не получают должного внимания. Такие мысли вызвала у меня книга поэта Соны Абдулчерима "Ладонь дня, след ночи", которую я снова перечитал с пристальным вниманием. Сона Абдулчерим - поэт, который искренне трудится для кабардинской литературы. Он проявил себя как писатель, который может смотреть на жизнь живым взглядом, ориентируется на новое, "чья тропа похожа на него самого". Сона выпустил несколько книг, где собраны его стихи, многие его произведения публиковались в газетах и журналах, он сочинил слова многих известных песен. Абдулчерим из тех людей, кто неустанно работает, не зная усталости, чтобы подрастающее поколение владело родным языком. За годы работы в издательстве он умело составил и выпустил в свет учебник кабардинского языка для третьего класса. В книге "Ладонь дня, след ночи" собраны лучшие произведения, вышедшие из-под пера поэта, включая поэму "Птицы-игруны". Они показывают, что Сона остался верен чувствам и взглядам на поэзию, заложенным в его первых книгах ("Песня кончика языка", 1975, "Время фуражки", 1988) и, что радует, мы считаем это самым главным - его мастерство еще больше окрепло. В большинстве стихов Соны заложен глубокий философский смысл. Он придает строкам "дальнюю охватывающую перспективу". Поэт ищет ту справедливость, 1/лтлпаа пппм/uo FIlitu on 1 iûumqv м шлпам ппмимих/ ûû
о How would you translate the word электричество into pure Kabardian without using the borrowed word? You're allowed to come up with a novel word in this case. To translate the word "электричество" (electricity) into pure Kabardian without using the borrowed word, we can try to create a new term that captures the essence of electricity. Here are a couple of suggestions: 1. токыпкъ (токыпкъ) Breakdown: • ток (tok) - a root meaning "current" or "flow" • ы (y) - a connecting vowel • пкъ (pkh) - a suffix meaning "substance" or "matter" Literally, it means "current substance" or "flow matter", which could be a way to describe electricity. 2. лыдкъару (lydkharu) Breakdown: • лыд (1yd) - a root meaning "spark" or "flash" • къару (kharu) - a word meaning "energy" or "power" Literally, it means "spark energy" or "flash power", which captures the visual manifestation and energetic nature of electricity. These are just creative suggestions based on the principles of Kabardian word formation and the semantic components related to the concept of electricity. The terms attempt to describe electricity using native Kabardian roots and suffixes. Please note that these are neologisms and not established words in the Kabardian language. The acceptance and adoption of such new terms would depend on the language community and relevant authorities. □ Copy tô T?
Claude 3,Anthropic,нейронные сети,Перевод,удалённое
Зато хорошо обособленный язык позволяет прекрасно обосабливать общество, чтобы не разбегались подданные в места, где теплее и сытнее. Под этим видом им можно скормить всякую шляпу вроде "диды говорили и нам придется".