|
계명대·KAIST 공동 연구팀, 세계 최고 권위 HCI 학술대회 ACM CHI 2026서 수상
|
|
- 생성형 AI 편향 탐지 위한 ‘참여형 레드티밍’ 연구 주목
- AI 윤리와 참여자 심리 보호 간 ‘윤리적 균형’ 필요성 제시
|

계명대학교 교육학과 조수현 교수(디지털상담연구실) 연구팀과 KAIST 산업디자인학과 홍화정 교수(DxD) 연구팀이 공동 수행한 연구가 인간-컴퓨터 상호작용(HCI) 분야 최고 권위 국제학술대회인 ACM CHI 2026에서 지난 4월 Honorable Mention Award(우수논문상)를 수상했다.
ACM CHI는 HCI 분야의 세계적 권위 학술대회로, 올해는 역대 최다인 6,730편의 논문이 접수됐으며 이 중 1,705편(약 25%)만 게재됐다. Honorable Mention Award는 게재 논문 가운데 상위 5% 이내에만 수여되는 상이다.
수상 논문은 “Dark and Bright Side of Participatory Red-Teaming with Targets of Stereotyping for Eliciting Harmful Behaviors from Large Language Models”로, 생성형 인공지능(AI)의 고정관념 편향을 탐지하기 위해 고정관념의 당사자가 직접 참여하는 '참여형 레드티밍'의 가능성과 과제를 분석한 연구다.
연구에는 KAIST 산업디자인학과 김시은 석사과정생(주저자), 계명대 교육학과 박사수료생이자 대구선원초등학교 교사 조예은, KAIST 산업디자인학과 나성민 연구원, 임현승 박사과정생, 이은채 석사과정생, 최유민 학부생 인턴이 참여했다.
연구팀은 한국 사회의 학벌주의 맥락에서 '지방대' 고정관념을 경험한 20명을 대상으로 참여형 레드티밍 실험을 진행했다. 참여자들은 생성형 AI와 대화하며 학벌 관련 고정관념이나 차별적 응답을 유도하고 평가했다. 분석 결과, 고정관념 당사자는 자신이 경험한 차별과 사회적 맥락을 바탕으로 AI의 미묘한 편향을 효과적으로 포착하는 것으로 나타났다. 당사자의 경험이 AI 안전성 평가에서 중요한 전문적 자원이 될 수 있음을 보여준 것이다.
연구는 참여형 레드티밍의 양면성도 밝혔다. 참여자들은 자신의 정체성을 겨냥한 차별적 응답을 마주하며 심리적 부담을 경험했다. 동시에 AI의 위험을 드러내고 유사한 집단을 보호하는 데 기여한다는 성취감과 주체성도 경험했다. 연구팀은 이를 참여형 레드티밍의 '어두운 면과 밝은 면'으로 설명했다.
조수현 교수는 “안전하고 윤리적인 AI를 위한 품질 평가 과정에서 평가 실무자인 크라우드 워커(Crowd Worker)의 정신건강이 오히려 악화되는 윤리적 아이러니가 발생할 수 있다”며 “이번 연구는 당사자의 불쾌한 경험을 AI 안전성 평가의 전문성으로 활용하는 가능성을 제시하는 동시에, 참여자의 심리적 안전을 보장하는 윤리적 설계가 반드시 병행돼야 함을 실증적으로 보여줬다는 데 의의가 있다”고 말했다.
|
537/ 2026_05_19 촬영/ 편집/ 대외홍보팀
|
|