Заказчик:
Космос — сеть отелей по РФ
Запрос:
Нормализация названий задач для отчета
Клиент ежемесячно выгружает перечень задач сотрудников из программы helpdesk в виде excel таблицы для отчета. Объем таблицы каждый месяц разный, в среднем это 4000 строк и 10 столбцов.
Далее такую таблицу необходимо нормализовать по определенным правилам. Например, в итоговых названиях задач не должно быть ФИО, названий контрагентов, названий отелей, служебных пометок.
Еще часть задач должна быть с пометкой на удаление, если они содержат "отпуск", "командировка", "собеседование".
Ручная обработка такой таблицы занимает неделю работы специалиста и клиент обратился к нам с запросом автоматизировать этот процесс с помощью искусственного интеллекта.
Как реализовывалось решение с помощью агрегатора нейросетей VisGPT
Нами было предложено создание ИИ-агента на базе Gemini Flash 2.5. Эта нейросеть имеет контекстное окно в 1 млн токенов, что позволяет работать с большими объемами данных и быстро обрабатывать информацию.
Для AI-агента были заданы определенные инструкции и порядок действий, по которым он должен выполнять задачу. Конструктор ИИ-агентов в сервисе VisGPT позволяет создавать AI бизнес-процессы для каждого этапа работы со своими инструкциями и нейросетями.
![]()
Нормализация таблицы происходит за 4 шага:
ШАГ 1: Подготовка таблицы
В загруженную исходную таблицу нейросеть добавляет два новых столбца — “нормализованное название” и “признак удаления”.
ШАГ 2: Нормализация формулировки задачи
Нейросеть переписывает исходные названия задач в едином виде по заданным правилам. Убирает ФИО и названия, убирает служебные отметки, меняет формулировки, например «не работает», «ошибка» → анализ ошибок,
«не проводится» → анализ алгоритма проведения. Новые названия добавляются в соответствующий столбец новой таблицы.
ШАГ 3: Простановка признака удаления
Если в исходном тексте колонки "Задача" встречается слово "отпуск", "командировка", "собеседование", нейросеть добавляет значение “удалить” в новый столбец.
ФИНАЛЬНЫЙ ШАГ 4: Вывод результата
После обработки всей таблицы, ИИ-агент генерирует итоговую новую таблицу с дополнительными столбцами и правильными формулировками.
![]()
Какие сложности возникли и как были решены
Даже с контекстным окном в миллион токенов, обработать такую большую таблицу у нейросети нет возможности. Когда количество сообщений превышает лимит контекстного окна, самые ранние сообщения начинают "забываться" моделью. ИИ-агент распознает только часть таблицы и обрабатывает неполные данные.
Контекстное окно — это объем информации, который нейросеть может проанализировать за один запрос. Измеряется в токенах – это базовые единицы обработки текста для нейросетей, представляющие части слов, целые слова или знаки пунктуации. В русском языке один токен соответствует примерно 0,7-0,8 слова (или ~4-6 символам). Так, текст из 1000 слов может содержать около 1300-1400 токенов
Опытным путем мы определили оптимальный объем таблицы, который нейросеть “видит” полностью. Исходную таблицу необходимо разделить на несколько частей по 750 строк и оставить 2 столбца, по которым нужно провести нормализацию. После обработки каждой части нейросетью, их можно объединить в единую новую таблицу вручную и предоставить для отчета.
Результат внедрения ИИ в процесс подготовки отчета
Нейросеть не заменила специалиста. Сейчас работа человека по-прежнему нужна, но она заключается в подготовке данных для нейросети, управлении процессами ИИ-агента и проверкой полученного результата.
Ранее ручная обработка такой таблицы требовала недели работы специалиста. Теперь весь процесс занимает один рабочий день.