a
b
c
d
FindNews.ru - новости, последние события, хроники.
Labor Economics: Ученые США и ФРГ выяснили, что автоматизация производства может повредить психическому здоровью рабочих
Сегодня, 17:40
Еще одна страна может выйти из ЕС в ближайшее время - СМИ
Сегодня, 17:19
Следственный комитет РФ сообщил о двух пропавших без вести во время обстрела Белгорода
Сегодня, 17:09
Штайнмайер выступил против принуждения Украины к переговорам с РФ
Сегодня, 17:05
?esk? televize: Словакия готова передать Украине танки, но просит держать это в тайне
Сегодня, 17:05
В Пакистане при падении автобуса в овраг погибли 19 человек
Сегодня, 17:05
Жириновский предсказал события в Узбекистане незадолго до смерти
Сегодня, 16:40
В Ивановской области женщина прослужила 10 лет в полиции с поддельным дипломом
Сегодня, 16:18
В Роспотребнадзоре заявили, что приняли исчерпывающие меры для снижения риска завоза оспы обезьян
Сегодня, 16:17
Президент Чехии ратует за дальнейшие поставки оружия Украине
Сегодня, 16:14

«Яндекс» опубликовал YaLM 100B — сейчас это самая большая GPT-подобная нейросеть в открытом доступе

«Яндекс» выложил в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках. Это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь ее могут использовать разработчики и исследователи со всего мира. Об этом CNews сообщили представители «Яндекса».

YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.

Команда «Яндекса» использует нейросети YaLM более чем в 20 проектах, в том числе в «Поиске» и голосовом помощнике «Алисе». Языковые модели помогают сотрудникам службы поддержки отвечать на обращения, генерируют рекламные объявления и описания сайтов (сниппеты). Нейросети YaLM широко используются также при подготовке быстрых ответов в Поиске.

«Для обучения такой большой языковой модели требуются огромные ресурсы, опытные специалисты и годы работы. А нам важно, чтобы доступ к современным технологиям был не только у крупнейших ИТ-компаний, а у всего сообщества исследователей и разработчиков. Выкладывая YaLM 100B в открытый доступ, мы рассчитываем, что это даст толчок развитию генеративных нейросетей», — сказал Петр Попов, генеральный директор «Яндекс технологий».

Импортозамещение, Азия или «серый» импорт: где брать серверное оборудование Импортозамещение

Модель обучали на суперкомпьютерах «Яндекса», которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Поделиться Подписаться на новости Короткая ссылка

Наука и высокие технологии - другие новости