Мне всегда очень не нравились ситуации, при которых приходилось не управлять процессом, а становиться – если можно так выразиться – его заложником. Вот точно так получается в работе рекрутингового агентства или отдела по подбору персонала, когда количество резюме в базе достигает некоего критического уровня. Классический случай «чемодана без ручки».
С изрядной долей раздражения начинаешь тогда задумываться о том, что
“А где же все достижения человеческой мысли, программистского гения, etc., в области подбора персонала?”
И меня в первую очередь интересуют не системы, которые рассчитаны на большую компанию с выделенным штатом рекрутеров, а те варианты, которыми может эффективно воспользоваться небольшая компания по подбору персонала.
В качестве примера «хорошей, полезной для крупной компании, но НЕ подходящей в конкретном случае» можно привести систему E-Staff. Там эта проблема решается самым прямолинейным способом: каждый из файлов резюме надо импортировать в базу системы. Однако при импорте резюме как раз и случаются всякие затруднения, сводящие автоматизацию «на нет».
Или, например, возьмем другое ПО по автоматизации работы отдела подбора персонала – cleverstaff.net – в ней есть опция парсинга резюме и – казалось бы – задача решена! Но не все так просто: как правило, системы парсинга резюме неплохо справляются с задачей выделения наиболее популярных полей (например, поля «имя», «возраст», «город», «контактные данные», «должность», «желаемая зарплата», и некоторые другие). Эти поля будут выделены и после анализа резюме в этих полях появится то содержимое, которое автор резюме «вложил» туда.
И тут появляется принципиальная проблема: «уборщица» или «менеджер по клинингу»? «няня» или «бебиситтер»? А еще сплошь и рядом встречающиеся сложности, связанные с анафорами (т.е. в тексте уже встречалось понятие, оно далее заменяется местоимением или же синонимом) Или эллипсис (намеренный пропуск несущественных слов в предложении)… Или омонимия.
По сути, даже обучение системы не гарантирует того, что доблестный представитель искусственного интеллекта справится с задачей без помощи человека: к тому же фантазия соискателей, старающихся витиевато назвать свою роль, бывает безгранична.
Также следует учесть, что системы автоматизации организуют парсинг преимущественно непосредственно с сайтов, если вам нужно обрабатывать уже имеющиеся файлы – разработчики могут предложить сделать плагин для этих целей.
Понятно, что если бы рекрутинговое агентство на протяжении N лет инвестировало в создание базы резюме силы и средства (т.е. сидел специально обученный сотрудник и заводил в базу кандидатов) – то вопросов нет. Но – если эта база представляет собою собранные за некоторый период отдельные файлы – и их категоризация (выполненная, например, путем раскладки по отдельным папкам-рубрикам) меня сейчас не устраивает, а в ней надо что-то найти?
Конечно, можно воспользоваться контекстным поиском – но у многих людей само название программ, которые вменяемо производят такой поиск (например, Total Commander), вызывает раздражение. Ну и, кроме того, это не очень эффективно – таким образом мы заведомо закладываем принцип тех самых многозарядных граблей – ведь каждый раз приходится все начинать с нуля, очередной поиск не улучшает ситуацию.
Наверное, в данном случае есть два варианта: все-таки приобрести систему со всеми «наворотами» либо организовать производство работ самостоятельно; при этом очень важным элементом будет правильное составление категорий (кстати, в первом варианте этот вопрос вас тоже не обойдет), а также планирование и организация работ по назначению меток, которые могут присваиваться непосредственно в документе MS Word (по принципу «чем проще – тем лучше»).
Наверное, разумнее будет совмещать поиск по конкретным позициям с обработкой файлов, попадающих в поле зрения.
При организации поиска желательно
– сделать индексацию папки / папок с файлами
– Либо как отдельную задачу, либо при проведении любого поиска можно выделять несколько найденных файлов (причем можно это сделать непосредственно в Результатах поиска), а затем для всех выделенных файлов назначить Категории и/или Теги – те метки, которые будут соответствовать категориям Вашего рубрикатора.
На Рисунке 1 приведена иллюстрация того, как делать это с отдельно взятым документом.
А если выделяем несколько документов – тогда так… (Рис.2 и Рис.3)
Теги и Категории будут назначены ВСЕМ выделенным файлам.
То же самое можно произвести и с другими офисными файлами (например, MS Excel).
Ну и поиск, соответственно, поиск теперь можем проводить вот так (понятно, что будут найдены все файлы со словом «руководители», но специальные поля – теги и категории – имеют в выдаче приоритет) (Рис.4):
Как видите задача не имеет простого решения. Хотя для работы кадрового агентства или отдела по подбору персонала она имеет очень важное значение. На сегодняшний день это все равно костыли, можно лишь попытать подобрать поудобнее под себя, но любое решение будет неидеальным и все равно будет “хромать”.