우리가 성과관리라고 부르는 것들은 사실 결과평가에 가깝다. 성과를 만들기 위한 과정 관리라기 보다는 연초에 설정한 목표를 달성했는지 여부를 평가하는 결과평가에 치중되어 있다.
성과관리의 시초인 성과평가가 1차 세계대전 당시 미군에서 수행이 저조한 병사를 골라내기 위한 용도로 개발된 것을 고려하면 이해되지 않는 것도 아니다. 하지만 조직의 요구에 따라 성과평가가 성과관리로 진화된 마당에 아직도 왜 등급을 매기는 것 위주의 평가에 집중하고 있는지 의문이 든다.
모든 기법들이 그러하듯이 성과관리 또한 나름의 목적을 가지고 진화해왔을 것이다. 성과관리 기법의 굵직한 변화를 중심으로 각 방법론의 목적과 한계가 무엇이었는지 살펴보자.
성과평가 기법의 변천사
초기의 성과관리 기법은 개인의 수행을 평정하는 것에 집중하였으며, 주로 평가 양식을 정교화하는 방향으로 발전되었다.
도식평정척도
최초의 평정척도(rating scale)는 도식평정척도(Graphic rating scale)로 항목에 대해 ‘탁월(5)’, ‘보통(3)’, ‘불량(1)’ 등 문자나 숫자로 평가하는 체계였다.
이러한 평가 방법은 평가 항목 및 척도의 정의 부족으로 인해 많은 부분을 평가자의 주관에 의존한다는 한계가 있었다. 예를 들면, 부하직원의 직무지식을 평가할 때 ‘무엇을 직무지식으로 보느냐’에서부터 ‘높음’으로 평가될 수 있는 ‘직무지식의 수준은 무엇인가’에까지 개인마다 판단 기준이 제각각이었다는 것이다.
행동기술척도
1964년 제정된 미국의 고용차별방지법은 보다 엄격한 평가 체계로 이끌었다. 기업들이 소송을 피하기 위해서는 평가 항목이 직무와 관련되고, 직원의 수행을 정확하게 평가하고 있음을 입증해야 했다. 이러한 분위기 속에서 행동기술척도(BARS, Behaviorally Anchored Rating Scale)가 인기를 끌었다.
행동기술척도는 척도에 구체적인 행동을 기술해 놓았기 때문에 평가자가 자의적인 판단없이 보다 정확하게 조직원의 성과를 평가할 수 있을 것이라 기대되었다. 하지만 안타깝게도 행동기술척도를 이용한 평가법 또한 효과면에서 다른 기법과 큰 차이를 보이지 않았다. 즉, 평가의 정확성이나 평가자의 편향을 줄여주지 못한 것이다.
관리자들이 팀원에 대한 등급을 미리 정한 후 그에 맞게 세부 점수를 배정하는 관행을 비추어보면 왜 편향이 줄어들지 않았을지 추측해 볼 수 있을 것이다.
강제배분법
1970년대부터 제기된 차별과 법적 이슈에 대한 높은 우려는 평가 프로세스를 더욱 구조화시키는 계기가 되었다. 피터 드러커의 MBO가 널리 확산되기 시작하였고, GE가 도입한 강제배분법이 인기를 얻었다.
강제배분법은 아직도 많은 조직에서 적용하고 있는 상대평가 기법이다. 강제배분법은 조직원의 수행이 정규분포를 따른다는 가정을 바탕으로 평가자로 하여금 피평가자를 정해진 백분율대로 강제로 배분시키게 한다.
강제배분법은 정해진 비율에 맞게 피평가자를 배분해야 하기 때문에 평가가 한쪽으로 치우치는 것을 방지한다. 하지만 강제배분법의 근간인 정규분포 가정은 조직에 적용되지 않는 경우가 많다.
예를 들어, 각 부서의 핵심인재만 모아 새로운 팀을 신설했다고 해보자(X팀). 강제배분법을 적용한 평가 방식에서는 모두 우수해도 하위 평점자가 나올 수 밖에 없는 구조이다. 그 반대의 경우도 생각해 볼 수 있다. 저성과자만 모여있는 팀이더라도 그 중에 상위 평점자가 나온다는 것이다(Y팀). X팀의 S등급자와 Y팀의 S등급자가 동일한 수준의 수행을 했다고 평가할 수 있을까?
강제배분법 또한 평가의 타당성, 효과성에 대한 도전을 피할 수 없었고, 2010년부터 인기가 사그라들기 시작했다. 애초 이 방식을 도입한 GE 또한 2015년 상대평가제를 폐기한 것은 상징적이다.
강제선택법
2000년대에 도입된 문항반응이론(IRT, item response theory)을 적용한 강제선택법은 향상된 신뢰도, 타당도, 정확도를 보여주었다. 강제선택법은 평가자로 하여금 매력도가 비슷한 행동 기술문(문항)을 보여주고 선택하게 만들기 때문에 평가자가 자의대로 왜곡하는 것이 어려웠다.
아마 대부분은 강제선택법이 생소하게 느껴질 것이다. 겅제선택법을 도입한 기업들은 많지 않기 때문이다. 평가의 신뢰도, 타당도, 정확성이 높은 강제선택법은 왜 대중화되지 못했을까? 그 이유는 크게 세 가지로 요약된다.
첫 번째, 평가 기법에 사용된 문항반응이론의 개념을 이해하기 어려웠다. 두 번째, 강제선택법은 다른 기법에 비해 더 많은 문항(행동기술문)을 필요로 한다. 따라서 이 기법을 사용하기 위해서는 시간, 노력 등 더 많은 비용이 치러야 했다. 세 번째, 사용자에게 환영받지 못했다. 평가자들은 각 문항이 어떤 의미를 갖는지 알 수 없었기 때문에 자신이 원하는 대로 평가를 조작할 수 없었고, 아이러니하게도 그런 이유로 관리자들에게 잘 받아들여지지 않았다.
* 문항반응이론을 포함하여 각 기법의 이론, 개념을 알 필요는 없다. 왜 이런 기법들이 등장하고, 한계가 무엇이었는지를 중심으로 이해하면 된다.
1부: 성과관리는 어디로 가야 하는가?
3부: 성과관리의 어려움
4부: 성과관리를 둘러싼 새로운 흐름