Сортировать:
- по релевантности
- по дате
- по зарплате
до
22 440 руб.
... LLM в бизнес-процессы и п Обязанности Сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.); Улучшение пайплайнов предобработки данных для разметки и обучения; Работа в плотной ...
21.03.2025