Локация

Junior/Middle NLP/DS инженер

СБЕР
Москва Опыт работы от 1 года Постоянная занятость Полный день
Поделиться

Описание

Кто мы?

Мы RND команда проекта GigaLegal в СБЕР - создаем инновационные решения в правовом домене на основе LLM для автоматизации юридических процессов.

Наша цель трансформировать работу юристов, бизнеса и государственных структур через:

- Автоматизацию анализа договоров и юридических документов

- Интеллектуальную генерацию правовых документов

- Разработку специализированных юридических чат-ботов

- Создание автономных юридических ИИ-агентов

Обязанности

Чем предстоит заниматься?

Исследования и эксперименты с LLM:

- Разработка и оптимизация промптов для задач классификации, NER и генерации юридических текстов

- Оценка эффективности различных подходов и моделей для юридических задач

- Написание агентских пайплайнов с использованием LLM

- Подготовка тестовых и обучающих данных для LLM

Инженерия данных:

- Разработка пайплайнов обработки юридических документов в различных форматах (конвертация в структурированный текст, сегментация)

- Организация процессов разметки данных и создания специализированных датасетов

- Подготовка обучающих данных для ML моделей (классические модели, BERT, T5)

ML/NLP разработка:

- Применение классических моделей (TF-IDF, CRF) и трансформеров (BERT, T5) для:

- Классификации юридических документов

- Извлечения именованных сущностей

- Реализации семантического поиска

- Интеграция с внешними API

- Работа с поисковыми технологиями - ElasticSearch, векторный поиск, матчинг, ранжирование

Внедрение в продакшен:

- Подготовка документации и API для передачи в production

- Поддержка на этапе интеграции разработок

- Участие в A/B-тестировании и анализе результатов

Требования

Для этого необходимо уметь?

- уверенная работа с python: pandas, numpy, sklearn, PyTorch

- базовые знания SQL и NoSQL баз данных

- знание классического NLP, опыт с NLP-библиотеками (spaCy, NLTK)

- уверенные знания современных LLM-архитектур и понимание техник обучения LLM хотя бы в теории (претрейн, SFT, RLHF)

- навыки промптинга: знание стратегий промптинга и умение оптимизировать промпты для решения бизнес-задач

- практический опыт построения RAG-систем

- git, Linux, docker

Условия

Мы готовы предложить:

  • комфортный современный офис
  • возможность выбрать удобный график офис/гибрид
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
21 день назад Источник: rabota.ru
Рекомендуемые вакансии
до 22 440 руб.
  • СБЕР
  • Москва
... (классические модели, BERT, T5) ML/NLP разработка: - Применение классических моделей (TF ... баз данных - знание классического NLP, опыт с NLP-библиотеками (spaCy, NLTK) - уверенные ...
11.04.2025
до 22 440 руб.
до 22 440 руб.
  • СБЕР
  • Москва
... (классические модели, BERT, T5) ML/NLP разработка: - Применение классических моделей (TF ... баз данных - знание классического NLP, опыт с NLP-библиотеками (spaCy, NLTK) - уверенные ...
11.04.2025
до 22 440 руб.
60 000 - 120 000 руб.
  • Enclave Interactive
  • Москва
Описание 2D Художник (Junior/Middle/Senior) в Enclave ... амбициозных художников всех уровней Junior, Middle и Senior . Если ... . Ищем того, кто: Junior/Middle/Senior : Уровень определяется вашим ... пакетов будет плюсом (для Middle/Senior приветствуется). Почему ...
21.04.2025
60 000 - 120 000 руб.