🤯 최신 AI가 보여준 적나라한 편견
여기, 한 채용 AI의 이력서 평가1)에 대한 요약서가 있는데요.
아래 5가지 특징이 뚜렷하게 나타났습니다.
⚠️ 남성 이름을 52% 선호했습니다. (여성 이름은 11% 가량)
⚠️ 흑인 남성 이름으로 인식되는 이름을 백인 남성 이름보다 선호한 적은 한 번도 없었습니다.
⚠️ 흑인 여성 이름은 67%의 확률로 선호한 반면, 흑인 남성 이름은 15%에 그쳤습니다.
⚠️ 사실상 ‘흑인’ + ‘남성’을 매우 비선호하는 경향을 뚜렷하게 보였습니다.
위 특징들은
① 세일즈포스, 미스트랄 AI, 컨텍슈털 AI 등 최신 LLM 기반 채용 AI 3종을 사용해,
② 실제 채용 공고에 지원한 500개 이상의 이력서를 평가한 후,
③ 인구통계학적 집단별 편향 정도를 통계적으로 분석한 연구 결과입니다.
세계적인 기업의 채용 AI가 인종·성별에 편향된 평가를 내린 것은 미국만의 특수한 사례가 아닙니다. 이력서 스크리닝 도구가 ‘단어(키워드)’ 중심으로 설계되면, 동일한 역량이라도 편향된 결과가 발생한다는 것에 주목해야 하는데요. 즉, 형식적 요소에 따라 평가 결과가 좌우되는 구조에서는 특정 단어나 직무명, 경력 길이가 실제 역량보다 과하게 영향을 미칠 수 있다는 것입니다. 우리 기업의 채용 AI도 충분히 편향될 수 있는 것이죠. 이 같은 문제 해결을 위해 문맥과 의미, 맥락을 이해하는 구조가 필요한데요. 그 구조가 바로 온톨로지(Ontology)입니다.
🤔 온톨로지적 채용 AI는 어떻게 다를까?
온톨로지는 쉽게 말해 ‘채용 세계를 설명하는 지도’를 뜻합니다. 직무·기술·역할·성과·경력 간의 관계를 구조적으로 연결한 지식망인데요. 지원자의 어떠한 경험에 대해 온톨로지는 “이 경험은 문제 해결 능력에 더 가깝다.”라고 HR 판단을 체계화합니다.
[온톨로지 구조 해설]
| 순서 | 상세 | 예시 |
|---|---|---|
| 텍스트를 의미 단위로 분해 ➡️ |
온톨로지 기반 자연어 처리(NLP)는 텍스트를 문장으로 그대로 읽지 않고, 행동 단위(Behavior unit), 과업 단위(Task unit), 성과 단위(Impact unit) 등 의미를 가진 최소 단위로 분해합니다. |
“고객 온보딩 프로세스를 재설계해 CS 문의량을 30% 줄였습니다.” ⇒ 🍎분해🧃 • Task : 온보딩 프로세스 재설계 • Behavior : 고객 여정 분석, 프로세스 개선안 도출 • Impact : CS 문의량 30% 감소 |
| 의미 단위를 노드(개념)와 연결 ➡️ |
추출된 의미 단위를 가장 관련성 높은 개념 노드에 매핑(mapping)하는 것이 핵심입니다. |
온보딩 프로세스 재설계 ⇒ 워크플로 최적화 노드 고객 여정 분석 ⇒ 고객 이해/문제 진단 노드 CS 문의량 30% 감소 ⇒ 성과 달성/효율성 향상 노드 |
| 노드들 사이의 관계 구조를 따라 의미 확장 ➡️ |
온톨로지는 단순히 분류하지 않고, 개념 간 연결 관계를 따라 새로운 의미를 확장합니다. |
온보딩 프로세스 재설계 → 문제 해결 역량 → 주도성(Proactiveness)으로 확장 고객 여정 분석 → 고객 중심적 사고로 확장 성과 창출 → 실행력 및 개선 영향력으로 확장 |
온톨로리적 평가 방식은 “고객 온보딩 프로세스를 재설계해 CS 문의량을 30% 줄였다”라는 문장에서 지원자의 경험을 구조적으로 해석하여 ⁕문제 해결 능력 ⁕선제적 대응 능력 ⁕고객 중심 사고 ⁕주도적 실행 능력 이라는 역량을 도출하는 방식을 지향하는 것입니다.
온톨로지적 해석 방식을 적용한 채용 AI는 기업과 지원자, 채용팀 모두에게 새로운 가치를 선사합니다. 먼저 지원자는 자신의 경험을 있는 그대로 작성하는 것만으로도, 그 경험 속에 담긴 행동과 과업, 성과가 어떤 역량을 의미하는지 AI로부터 정확히 해석받을 수 있습니다. 단순 키워드가 아니라 경험의 맥락을 기반으로 역량을 추출하기 때문에, 지원자의 진가가 명확히 드러나죠. 지원자는 또한 공정한 평가를 받게 됩니다. 온톨로지는 의미 구조를 읽는 방식으로 작동하기 때문에, 단어 몇 개에 평가가 흔들리지 않습니다. 지원자는 보다 공정하고 맥락 기반의 평가를 받게 되는 것이죠.
채용팀은 지원자에 대한 판단 근거를 빠르게 확보할 수 있습니다. 온톨로지적 접근을 반영한 AI는 경험을 구조적으로 정리해 보여주고, 최종 판단은 사람이 하도록 설계되어 있는데요. 채용팀은 모든 이력서를 처음부터 끝까지 읽지 않아도 핵심 역량과 직무 적합성을 빠르게 파악할 수 있어서 의사결정에 더 많은 시간을 투자할 수 있습니다.
마지막으로 기업은 채용 실패 가능성을 줄이고, 조직에 꼭 필요한 인재를 더 정확하게 데려올 수 있습니다. 키워드 나열로 AI를 속이는 방식은 통하지 않기 때문에 실제 역량이 검증된 인재를 선별하는 것입니다. 라운드HR의 라운드AI는 온톨로지의 원리를 참고해 ‘경험의 의미’를 구조적으로 해석하는 방향으로 발전하고 있습니다.
👤 실무 사례 : 개발자 선발의 난제
요즘 개발자의 이력서는 말 그대로 ‘스택 나열 문서’가 됐습니다.
왜 그럴까요? 그 해답은 한 설문 결과에서 찾을 수 있습니다. 소프트웨어 엔지니어 591명을 대상으로 한 최근 조사2)에서 응답자의 82%는 “이력서에 최신 유행하는 기술스택을 나열하는 것이 유리하다”고 믿고 있었습니다. 실제로 깊이 있게 다뤄보지 않은 기술도 이력서에 적는 경우가 많고, 그 기술로 실제 문제를 어떻게 해결했는지를 설명하는 것은 생략하기 일쑤인데요. 그 결과, 실제 문제 해결 능력이나 성과는 가려지고 이력서의 키워드가 실력을 대리하는 왜곡이 발생합니다. 좋은 개발자를 뽑고 싶어도 이력서에 사용된 단어(키워드)만으로는 어떤 개발자가 어떤 역량을 갖고 있는지 분별해 낼 수조차 없을 수 있다는 것입니다.
채용팀은 일단 이력서상 스택이 풍부한 지원자에게 눈길이 갈 수밖에 없습니다. 스택이 많은 개발자가 더 많은 문제를 해결할 수 있을 것처럼 보이기 때문입니다. 단어 중심으로 작동하는 AI 역시 똑같은 함정에 빠지게 됩니다. 기업은 스택 좋은 사람을 뽑았는데 입사 후 실무와 맞지 않은 사람임을 뒤늦게 확인하게 돼죠.
가장 중요한 역량인 ⁕문제 해결 능력 ⁕협업 스킬 ⁕코드 품질 등은 스택으로 드러나지 않습니다. 이제 선택의 질문만이 남습니다. 스택 나열에 의존해 평가하는 AI와, 경험의 의미를 해석하려는 온톨로지적 접근의 AI 중 어떤 방식이 더 바람직한 채용 방향일까요? 우리 기업의 채용 환경에 더 어울리는 방식은 무엇일까요?
[함께 읽어볼만한 콘텐츠 LIST]
📌HR용 AI의 품질을 가르는 결정적 차이 : 온톨로지
📌라운드HR의 채용AI는 "왜?" (Feat. 라운드HR 고객사 현황 재중)
📌인재 채용에 '판단 AI' 말고 '지원 AI'가 필요한 이유
출처
1. University of Washington, AI tools show biases in ranking job applicants’ names according to perceived race and gender, 2024
2. Resumé‑driven Development: The Dangers of Overemphasizing Resume Stacks, 2023

