AI‑поиск по сотням тысяч резюме на естественном языке

Интеллектуальный поиск и структурирование резюме


Кейс: интеллектуальный поиск и структурирование резюме для B2B Cloud

1. Клиент


B2B Cloud – HR-платформа, работающая с сотнями тысяч резюме, получаемых из разных внешних и внутренних источников (работные сайты, кадровые агентства, e-mail-рассылки и т.д.).


2. Бизнес-задача

  • Сократить время подбора кандидатов для рекрутеров.
  • Упростить поиск по неоднородным резюме (DOC, PDF, сканы) без ручной разметки.
  • Дать возможность формулировать запросы на естественном языке:
  • «Нужен Python-разработчик с опытом > 2 лет и знанием AWS».

3. Решение

Этап


Что сделали


Польза для HR


Сбор данных

Интеграции с источниками резюме (API, e-mail парсинг, drag-and-drop).

Единый поток данных без лишних ручных операций.

Единое хранилище

Все резюме конвертируются в унифицированный JSON-профиль кандидата.

Снятие «барьера форматов» – поиск работает одинаково по любым файлам.

AI-парсинг

Большая языковая модель (LLM) выполняет рекурсивный обход документа, извлекая: навыки, опыт, образование, контакты, ключевые слова.

Точность извлечения ↑, пропуск важных данных ↓.

NL-поиск

Пользователь вводит запрос на естественном языке; система интерпретирует его и мгновенно ранжирует релевантные профили.

Поиск «в два клика» вместо долгих Boolean-строк.

Скорость ответа

Индексация > 300 тыс. резюме; время отклика < 3 с.

Рекрутеры получают shortlist почти моментально.



4. Технологии


  • LLM + Structured Output – архитекторный шаблон, позволяющий модели возвращать строгий JSON.
  • Recursive Document Traversal – делим резюме на логические блоки (заголовок, опыт, навыки) и питаем модель контекстом частями, чтобы избежать ограничений на длину prompt.
  • Vector-index и semantic search (FAISS).
  • Microservices (Go + Python) — импорт, парсинг, поиск, авторизация.
  • PostgreSQL + Elasticsearch — хранение структурированных профилей и быстрый faceted search для фильтрации.



5. Результаты


  • Скорость подбора: time-to-shortlist сократилось с 45 минут до 2–3 минут.
  • Качество: точность релевантной выдачи в пилотных A/B-тестах выросла с 72 % до 91 %.
  • User-friendly: рекрутеры формулируют запросы «как разговаривают», без обучения Boolean-синтаксису.
  • Масштабирование: архитектура безболезненно обрабатывает рост базы резюме до миллиона записей.



6. Пример пользовательского сценария


  1. Рекрутер вводит:
  2. «Senior Python developer, 2+ года опыта, Django или FastAPI, европейская тайм-зона»
  3. Система:
  • парсит критерии → навыки=Python/Django/FastAPI, опыт ≥ 2 года, локация=EU ± 2 часа;
  • за 2,1 с возвращает 138 релевантных кандидатов, отсортированных по совпадению навыков и свежести резюме.