Решение команды «Искры Интеллекта» для хакатона ЛЦТ 2025: автоматический анализ тысяч отзывов от парсинга до дашбордов
Банки получают тысячи отзывов на агрегаторах (banki.ru, sravni.ru, Яндекс). Провести полноценный анализ вручную крайне затратно:
Результат: упущенные проблемы, недовольные клиенты, потеря денег.
Сервис, который автоматически превращает неструктурированные отзывы в понятные инсайты:
| Шаг | Что происходит | Пример / Визуал |
|---|---|---|
| 1. Парсинг | Сбор отзывов с banki.ru, sravni.ru, Яндекс за период. Очистка, нормализация дат | Собрано: 5000+ отзывов |
| 2. Фрагментация | LLM разбивает каждый отзыв на смысловые аспекты. Один отзыв → несколько тем | "Приложение удобное, но кэшбэк маленький" → 2 фрагмента |
| 3. Кластеризация | K-Means, DBSCAN, BERTopic для поиска устойчивых групп. LLM генерирует названия тем |
Пример кластеризации |
| 4. Классификация | Адаптивный классификатор на базе LLM (Yandex Cloud API). Новые темы создаются автоматически | Финальный список: 11 тем + "Прочее" |
| 5. Тональность | Для каждого фрагмента: положительно / нейтрально / отрицательно | F1-score: 0.88 (weighted) |
| 6. API | FastAPI в Docker. POST /analyze обрабатывает до 250 отзывов | Скорость: ~2.5 минуты на 250 отзывов |
| 7. Дашборды | Интерактивная визуализация с фильтрацией по дате, продукту, источнику | См. раздел ниже ↓ |
| Метрика | Значение |
|---|---|
| F1-score (классификация, weighted) | 0.88 |
| Accuracy (тональность) | 0.94 |
| Скорость API | 250 отзывов за ~2.5 минуты |
💡 Почему weighted F1? Классы были неравномерны: по малочисленным категориям точность доходила до 1.0, по массовым — около 0.8. Weighted average учитывает размер каждого класса, поэтому даёт более честную картину.
Фильтрация по дате, продукту, источнику. Видно, как меняется количество положительных, нейтральных и отрицательных отзывов
Размер круга — количество отзывов. Положение — соотношение частоты упоминаний и уровня негатива
Вклад каждого аспекта в общую удовлетворённость. Показывает, о чём чаще всего говорят
| Направление | Что добавить |
|---|---|
| Расширенная аналитика | Поиск топ-трендов внутри категорий (например, "скрытые комиссии", "не работает UnionPay") |
| Определение трендов | Автоматическое выявление растущих проблем (резкий рост жалоб за неделю) |
| Новые источники | Подключение дополнительных агрегаторов, соцсетей, отзовиков |
| Автоматические алерты | Уведомления менеджерам при превышении порога негатива по категории |
| Сравнение с конкурентами | Парсинг отзывов о других банках, бенчмаркинг |
| Интеграция с CRM | Автоматическое создание тикетов при выявлении критических проблем |
Хакатон Газпромбанка (ЛЦТ 2025)
🥉 Призовое место
Команда "Искры Интеллекта"
Хотите внедрить подобное решение? Напишите мне — обсудим адаптацию под ваш бизнес.