ЮMoney представила ИИ-ассистента Юджин для работы с документацией

Компания ЮMoney представила внутренний ИИ-ассистент Юджин, созданный для эффективного поиска по корпоративной документации. Решение построено на технологии RAG и позволяет сотрудникам быстро находить нужную информацию без ручного просмотра Wiki. Разработка велась собственными силами из-за требований к безопасности и масштабируемости, что делает его уникальным для российского рынка.

Компания ЮMoney внедрила ИИ-ассистента Юджин для работы с внутренней документацией, включая Wiki, регламенты и бизнес-процессы. Система основана на технологии Retrieval-Augmented Generation (RAG), что позволяет избежать дорогостоящего дообучения моделей и обеспечивает актуальность данных. В отличие от традиционных поисковых систем, Юджин понимает семантику запросов, а не просто ищет ключевые слова, что значительно повышает точность ответов. Ассистент может обрабатывать документы до 5 МБ, предоставляя краткое содержание или отвечая на сложные вопросы по их содержимому, что особенно важно для крупных компаний с постоянно обновляемой документацией.

Юджин отличается от большинства рыночных решений полной автономностью и безопасностью, так как работает исключительно на внутренней инфраструктуре. Это критично для российских компаний, которым необходимо соблюдать строгие требования к защите данных. Система автоматически индексирует данные из Wiki, Bitbucket и других корпоративных источников, обрабатывая до 1024 токенов на фрагмент с перекрытием в 200 токенов для сохранения контекста. Для поиска используются два параллельных метода: полнотекстовый через OpenSearch и векторный через модель FRIDA, что обеспечивает высокую точность даже при разных формулировках запросов. Такая комбинация методов делает Юджина более эффективным по сравнению с зарубежными аналогами, которые часто ограничиваются только векторным поиском.

Техническая реализация включает сложную архитектуру с этапами сбора данных, чанкирования, векторизации и хранения. Документы разбиваются на фрагменты с учётом их типа — OpenAPI, Markdown, AsciiDoc, PlantUML или HTML, что улучшает качество поиска. Для векторного поиска применяется модель FRIDA на базе FRED-T5, а эмбеддинги хранятся в Milvus с использованием индекса HNSW для быстрого поиска ближайших соседей. Это позволяет системе эффективно обрабатывать запросы в реальном времени, что особенно важно для динамичных бизнес-процессов. Подобные технические решения редко встречаются в коммерческих продуктах, что делает Юджина уникальным для российского рынка.

Разработка Юджина стала ответом на растущие сложности с поиском информации в корпоративной Wiki, где сотрудники тратили значительное время на ручной анализ. Готовые решения на рынке не подходили из-за требований к ручной загрузке данных и ограничений по безопасности. Собственная платформа дала ЮMoney полный контроль над обновлением базы знаний, выбором моделей и интеграцией с внутренними системами, что критично для крупной компании с динамично меняющейся документацией. Опыт ЮMoney может стать ориентиром для других российских компаний, которые сталкиваются с аналогичными проблемами, но не имеют ресурсов для разработки собственных решений.

Для российского рынка подобные разработки представляют особый интерес, так как локальные компании часто сталкиваются с необходимостью обработки документов на русском языке и соблюдения строгих требований к безопасности данных. Юджин демонстрирует, что российские технологии могут конкурировать с зарубежными аналогами, предлагая более адаптированные решения. Однако ключевыми вопросами остаются масштабируемость системы и её адаптация под различные типы документов, что потребует дальнейшего развития платформы. Эти вызовы особенно актуальны для компаний с распределённой структурой и большим объёмом разнородных данных.

Перспективы Юджина включают расширение функционала для работы с новыми форматами данных и интеграцию с дополнительными корпоративными сервисами. Компания также рассматривает возможность открытия части наработок для сообщества, что могло бы ускорить развитие подобных решений в России. Однако основной фокус пока остаётся на внутренних улучшениях, включая оптимизацию скорости обработки запросов и повышение точности поиска за счёт доработки алгоритмов чанкирования и векторизации. Успех этих инициатив может определить, станет ли Юджин стандартом для корпоративных ИИ-решений в России или останется внутренним инструментом одной компании.

ИИ Вестник

ЮMoney разработала корпоративного ИИ-ассистента на базе RAG для работы с внутренней документацией

Читайте также

ИИ в разработке: почему инструменты не заменяют специалистов

Hermes Agent: персональный ИИ-ассистент для Telegram с открытым исходным кодом

Практические подходы к оценке языковых моделей в условиях ограниченного времени: вызовы и решения для российского рынка

OpenAI представила прототип ИИ-устройства на базе модели Codex