Кейс: интеллектуальный поиск и структурирование резюме для B2B Cloud1. КлиентB2B Cloud – HR-платформа, работающая с сотнями тысяч резюме, получаемых из разных внешних и внутренних источников (работные сайты, кадровые агентства, e-mail-рассылки и т.д.).
2. Бизнес-задача- Сократить время подбора кандидатов для рекрутеров.
- Упростить поиск по неоднородным резюме (DOC, PDF, сканы) без ручной разметки.
- Дать возможность формулировать запросы на естественном языке:
- «Нужен Python-разработчик с опытом > 2 лет и знанием AWS».
3. РешениеЭтап
| Что сделали
| Польза для HR
|
Сбор данных | Интеграции с источниками резюме (API, e-mail парсинг, drag-and-drop). | Единый поток данных без лишних ручных операций. |
Единое хранилище | Все резюме конвертируются в унифицированный JSON-профиль кандидата. | Снятие «барьера форматов» – поиск работает одинаково по любым файлам. |
AI-парсинг | Большая языковая модель (LLM) выполняет рекурсивный обход документа, извлекая: навыки, опыт, образование, контакты, ключевые слова. | Точность извлечения ↑, пропуск важных данных ↓. |
NL-поиск | Пользователь вводит запрос на естественном языке; система интерпретирует его и мгновенно ранжирует релевантные профили. | Поиск «в два клика» вместо долгих Boolean-строк. |
Скорость ответа | Индексация > 300 тыс. резюме; время отклика < 3 с. | Рекрутеры получают shortlist почти моментально. |
4. Технологии- LLM + Structured Output – архитекторный шаблон, позволяющий модели возвращать строгий JSON.
- Recursive Document Traversal – делим резюме на логические блоки (заголовок, опыт, навыки) и питаем модель контекстом частями, чтобы избежать ограничений на длину prompt.
- Vector-index и semantic search (FAISS).
- Microservices (Go + Python) — импорт, парсинг, поиск, авторизация.
- PostgreSQL + Elasticsearch — хранение структурированных профилей и быстрый faceted search для фильтрации.
5. Результаты- Скорость подбора: time-to-shortlist сократилось с 45 минут до 2–3 минут.
- Качество: точность релевантной выдачи в пилотных A/B-тестах выросла с 72 % до 91 %.
- User-friendly: рекрутеры формулируют запросы «как разговаривают», без обучения Boolean-синтаксису.
- Масштабирование: архитектура безболезненно обрабатывает рост базы резюме до миллиона записей.
6. Пример пользовательского сценария- Рекрутер вводит:
- «Senior Python developer, 2+ года опыта, Django или FastAPI, европейская тайм-зона»
- Система:
- парсит критерии → навыки=Python/Django/FastAPI, опыт ≥ 2 года, локация=EU ± 2 часа;
- за 2,1 с возвращает 138 релевантных кандидатов, отсортированных по совпадению навыков и свежести резюме.