Локация

Senior NLP Engineer (GigaChat Pretrain)

СБЕР
  • до 22 440 руб.
Москва Постоянная занятость Полный день
Поделиться

Обязанности

Мы команда GigaChat - создаём и развиваем core-технологию генеративной языковой модели. Она может писать тексты, создавать изображения и даже код на Python. Она умеет отвечать на вопросы, вести диалог, сочинять стихи и рассказы, придумывать идеи для бизнеса, писать письма и многое другое. Наша команда осенью выпустила сильную русскоязычную модель GigaChat MAX уровня GPT-4 (метрики в статье), а этой зимой выложили в открытый доступ одну из наших MoE-моделей. Мы ведем набор на 4 направления: 1. Разработку фреймворка распределенного обучения GigaFSDP, исследование обучений в FP8 2. Развитие метрик качества GigaChat-a, например, через оценку способности решать задачи олимпиад международного уровня 3. Команду инфраструктуры обучений, 5-D параллелизм, в том числе ускорение обучений мультимодальных моделей 4. Разработку низкоуровневых оптимизаций операций на аппаратном уровне На эти роли мы ищем талантливого NLP Engineer, с которым мы будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых. Обязанности Довести качество до ChatGPT на русском и дальше обогнать его; Помогать решать бизнес-задачи с помощью нашей технологии сначала для внутренних клиентов в Сбере, а потом и внешним; Придумывать и внедрять новые применения для LLM; Помогать выводить в прод все, что мы обучим; Постоянно держаться up-to-date со свежими статьями. Требования Уверенное владение Python, Pytorch; Знание базовых алгоритмов и математики; Знания в DL, опыт обучения просто моделей и больших моделей; Опыт обучения моделей для продакшен; Понимание текущего состояния эволюции больших LLM's; C++ CUDA; Будет плюсом наличие публикаций. Условия Гибридный график работы на Кутузовском проспекте 32; Годовой бонус; Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
12 дней назад Источник: trudvsem.ru
Рекомендуемые вакансии
до 22 440 руб.
  • СБЕР
  • Москва
Обязанности Мы команда GigaChat - создаём и развиваем core-технологию ... талантливого NLP Enginner, с которым мы будем вместе усовершенствовать и развивать GigaChat ...
09.04.2025
до 22 440 руб.
до 22 440 руб.
  • СБЕР
  • Москва
... которой является обучение семейства моделей GigaChat под новые продакшн данные. Обязанности ... обучать модели семейства GigaChat для обеспечения их полезности как ... (SFT) и Preference Tuning обучать GigaChat новым навыкам, таким как работа ...
09.04.2025
до 22 440 руб.
до 22 440 руб.
  • СБЕР
  • Москва
... которой является обучение семейства моделей GigaChat под новые продакшн данные. Обязанности ... обучать модели семейства GigaChat для обеспечения их полезности как ... (SFT) и Preference Tuning обучать GigaChat новым навыкам, таким как работа ...
09.04.2025
до 22 440 руб.