Преобразование сырых текстовых данных в инструкционный датасет для дообучения модели-генератора. предназначенной для работы в системе RAG
Язык статьиРусский
Аннотация
В статье описан метод построения инструкционного датасета для дообучения большой языковой модели (LLM), предназначенной для выполнения роли генератора в системе RAG. Также представлена практическая реализация предложенного метода на примере построения датасета для дообучения модели-генератора для работы в системе RAG корпоративного интеллектуального ассистента.
Ключевые слова
УДК004.853
Номер
№ 27,
Страницы77-92
Файл
eliseevmaksimovabondarenko.pdf
(526.81 КБ)