Преобразование сырых текстовых данных в инструкционный датасет для дообучения модели-генератора. предназначенной для работы в системе RAG

Преобразование сырых текстовых данных в инструкционный датасет для дообучения модели-генератора. предназначенной для работы в системе RAG
Язык статьиРусский
Аннотация
В статье описан метод построения инструкционного датасета для дообучения большой языковой модели (LLM), предназначенной для выполнения роли генератора в системе RAG. Также представлена практическая реализация предложенного метода на примере построения датасета для дообучения модели-генератора для работы в системе RAG корпоративного интеллектуального ассистента.
УДК004.853
Номер № 27,
Страницы77-92
Файл eliseevmaksimovabondarenko.pdf (526.81 КБ)