AI‑поиск по сотням тысяч резюме на естественном языке

Интеллектуальный поиск и структурирование резюме

Кейс: интеллектуальный поиск и структурирование резюме для B2B Cloud

1. Клиент

B2B Cloud – HR-платформа, работающая с сотнями тысяч резюме, получаемых из разных внешних и внутренних источников (работные сайты, кадровые агентства, e-mail-рассылки и т.д.).

2. Бизнес-задача

Сократить время подбора кандидатов для рекрутеров.
Упростить поиск по неоднородным резюме (DOC, PDF, сканы) без ручной разметки.
Дать возможность формулировать запросы на естественном языке:
«Нужен Python-разработчик с опытом > 2 лет и знанием AWS».

3. Решение

Этап	Что сделали	Польза для HR
Сбор данных	Интеграции с источниками резюме (API, e-mail парсинг, drag-and-drop).	Единый поток данных без лишних ручных операций.
Единое хранилище	Все резюме конвертируются в унифицированный JSON-профиль кандидата.	Снятие «барьера форматов» – поиск работает одинаково по любым файлам.
AI-парсинг	Большая языковая модель (LLM) выполняет рекурсивный обход документа, извлекая: навыки, опыт, образование, контакты, ключевые слова.	Точность извлечения ↑, пропуск важных данных ↓.
NL-поиск	Пользователь вводит запрос на естественном языке; система интерпретирует его и мгновенно ранжирует релевантные профили.	Поиск «в два клика» вместо долгих Boolean-строк.
Скорость ответа	Индексация > 300 тыс. резюме; время отклика < 3 с.	Рекрутеры получают shortlist почти моментально.

4. Технологии

LLM + Structured Output – архитекторный шаблон, позволяющий модели возвращать строгий JSON.
Recursive Document Traversal – делим резюме на логические блоки (заголовок, опыт, навыки) и питаем модель контекстом частями, чтобы избежать ограничений на длину prompt.
Vector-index и semantic search (FAISS).
Microservices (Go + Python) — импорт, парсинг, поиск, авторизация.
PostgreSQL + Elasticsearch — хранение структурированных профилей и быстрый faceted search для фильтрации.

5. Результаты

Скорость подбора: time-to-shortlist сократилось с 45 минут до 2–3 минут.
Качество: точность релевантной выдачи в пилотных A/B-тестах выросла с 72 % до 91 %.
User-friendly: рекрутеры формулируют запросы «как разговаривают», без обучения Boolean-синтаксису.
Масштабирование: архитектура безболезненно обрабатывает рост базы резюме до миллиона записей.

6. Пример пользовательского сценария

Рекрутер вводит:
«Senior Python developer, 2+ года опыта, Django или FastAPI, европейская тайм-зона»
Система:

парсит критерии → навыки=Python/Django/FastAPI, опыт ≥ 2 года, локация=EU ± 2 часа;
за 2,1 с возвращает 138 релевантных кандидатов, отсортированных по совпадению навыков и свежести резюме.