기사 메일전송
서울대 공대 윤성로 교수 연구팀, 한글을 더 바르게 구사하는 ‘인공지능 학습용 데이터셋’ 발표
  • 조기환
  • 등록 2021-10-08 11:12:02

기사수정


▲ [사진제공 = 서울대학교 공과대학]

서울대학교 공과대학(학장 이병호)은 윤성로 전기정보공학부 교수팀이 한글날을 맞아 9일(토) 한국어 언어 모델의 사회적 편향(social bias) 진단을 위한 데이터셋 K-StereoSet를 공개한다고 8일 밝혔다.


인공지능의 사회적 편향은 미래 인공지능 연구에서 전 세계적으로 중요한 키워드로 대두되고 있다.


국내의 경우 올 초 인공지능 기반 한국어 챗봇인 ‘이루다’로부터 성소수자, 인종, 장애인 등에 대한 차별 및 혐오성 표현이 발견돼 화제가 된 바 있다(하단 그림 참조). 이런 문맥에서 최근 대통령직속 4차산업혁명위원회와 과학기술정보통신부가 인간성(humanity)을 위한 인공지능(artificial intelligence, AI)의 3대 원칙 중 하나로 ‘인간의 존엄성 원칙’을, 10대 핵심 요건 중 하나로 ‘다양성 존중’을 제시했을 만큼 윤리적인 인공지능에 대한 중요성이 커지고 있다.


그럼에도 최근까지도 자연어 처리(natural language processing) 분야의 근간이 되는 인공지능 기반 한국어 언어 모델에 대한 연구가 활발히 이뤄지고 있으나, 이들의 사회적 편향을 진단할 수 있는 수단은 여전히 부족한 상황이다.


이런 문제의식 하에 윤성로 교수팀이 이번에 공개하는 K-StereoSet는 영어 언어 모델의 사회적 편향을 진단하기 위해 MIT에서 공개한 ‘StereoSet’의 개발셋(development set)을 기반으로 한국적 현실에 맞춰 보완 개발한 것으로, 앞으로 지속적으로 확장될 예정이다. 약 4000개의 샘플로 구성된 원본 데이터셋은 먼저 네이버 파파고 API를 통해 1차적으로 번역한 후 다수 연구원이 독립적으로 번역 내용을 검수했다. 원래의 샘플 양식과 취지를 보존하도록 후처리(post-processing)를 진행해 구축됐다.


데이터 내 사회적 편향의 분야는 성별, 종교, 직업, 인종 총 네 가지 항목으로 구성돼 있으며, 편향성 진단을 위한 샘플 양식은 두 개의 카테고리로 분류돼 있다.


첫 번째는 문장 내 편향 진단 테스트를 위한 ‘intrasentence’ 양식이다. 빈칸 처리된 문장이 주어졌을 때 빈칸에 채워질 내용으로서 세 개의 보기 중 어느 것에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어, 위의 왼쪽 예시처럼 한 문장 안에서 ‘심리학자’라는 직업의 사람이 ‘독선적’이라는 편향을 가졌는지를 확인할 수 있다.


두 번째는 문장 간 편향 진단 테스트를 위한 ‘intersentence’ 양식이다. 앞 문장(context)이 주어졌을 때 다음 문장으로서 세 개의 선택지가 주어지며 이들 중 어떤 문장에 높은 점수를 부여하는지를 이용해 진단한다. 예를 들어, 위의 오른쪽 예시처럼 사람이 ‘히스패닉’이라는 문맥이 주어졌을 때, 다음 문장에서 그 사람이 ‘불법적인 시민’이라는 편향을 가졌는지 확인할 수 있다.


연구를 주도한 송종윤 연구원은 “문장 내 편향 진단 샘플 중 unrelated 라벨에 해당하는 문장은 문맥과 전혀 관계없는 단어가 빈칸에 들어가기 때문에 자동 번역 시 원문 의미를 벗어나기 쉽다. 또한 문장 간 편향 진단 샘플의 보기 문장들은 context 문장을 고려하지 않는 경우가 발생하는 등의 특수한 상황들에 유의하며 변환을 진행했다”고 말했다.


연구 책임자인 윤성로 교수는 “인공지능 기반의 한국어 언어 모델이 고도화되고 사업화될수록 윤리성 확보 및 편향성 제거를 위한 노력이 핵심적이며, 한글날을 맞아 보다 바른 한글을 구사하는 인공지능 기술 개발을 위해 K-StereoSet가 작지만 의미 있는 첫걸음이 되기를 기대한다”고 밝혔다.

0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
많이 본 뉴스더보기
  1. 울산교육청, 나눔과 대화로 수업 성장 해법 찾는다 [뉴스21일간=이준수 기자]  울산광역시교육청(교육감 천창수)은 12일 다산홀에서 중고등학교 교원과 교육전문직을 대상으로 ‘2025 수업 성장 나눔 대화의 날’을 열었다.      이 행사는 2022 개정 교육과정 안착과 학생 참여 중심 수업 문화를 확산하고자 마련한 실천적 장으로, 현장 교원들이 수업 사례와 고민을 나누며 함께 ...
  2. 울산 화평교회, 울산동구종합사회복지관에 추석맞아 이웃사랑 나눔 실천 100만원 후원 [뉴스21일간=임정훈 ]울산 화평교회(담임목사 장지훈)는 9월 12일 금요일 10시에 울산동구종합사회복지관(관장 한영섭)을 방문하여 추석 명절을 맞아 지역 내 취약계층 지원을 위한 후원금 100만원을 전달했다.    이번 후원은 홀몸어르신, 저소득가정 등 지역 내 복지 사각지대에 놓인 이웃들에게 사랑 나눔을 실천하고 더불어 살아가...
  3. 인공지능·디지털 연수로 학교 행정 효율 높인다 [뉴스21일간=이준수 기자]  울산광역시교육청(교육감 천창수)은 9일부터 12일까지 남구 종하이노베이션센터에서 교육행정직과 교육공무직을 대상으로 ‘인공지능(AI)·디지털 역량강화 연수’를 진행했다.      이번 연수는 인공지능과 디지털 도구를 활용한 실무 연수로 학교 행정 업무의 효율성을 높이고, 현장 행정 서비스의...
  4. 울산시, 하절기 이야기(스토리) 야시장 성료 [뉴스21일간=김태인 ]  지난 7월 18일부터 지난 9월 13일까지 약 두 달간 이어진 하절기 ‘울산의 밤, 이야기(스토리) 야시장’이 성황리에 막을 내렸다.  울산시가 주최하고 울산문화관광재단이 주관한 이번 야시장은 하루 평균 7,690명, 총 누적 14만 6,100명의 관람객이 방문해 울산의 여름밤을 환하게 밝혔다.  이번 하절기 이야기(스...
  5. 신천지의 두 얼굴 울산 청년 크루 페스티벌의 진실 [뉴스21일간=김태인 ]자료사진 "청년"의 이름 뒤에 숨은 검은 그림자, 울산 청년 크루 페스티벌의 진실2025년 9월, 울산에서 열리는 '제3회 청년 크루 페스티벌'을 둘러싼 의혹이 증폭되고 있습니다. 겉보기에는 청년 문화를 위한 축제로 보이지만, 그 이면에는 특정 사이비 종교 단체의 교묘한 포교 전략과 정치권과의 불편한 유착 가능...
  6. 울주군치매안심센터, 국제피플투피플 춘해보건대챕터 치매극복 선도단체 지정 (뉴스21일간/최원영기자)=울주군치매안심센터가 12일 국제피플투피플 춘해보건대챕터(춘해보건대 대학생 봉사단체)를 ‘치매극복 선도단체’로 지정하고 업무 협약식을 가졌다.이번 협약은 청년 봉사자의 적극적인 참여를 통해 지역사회 내 치매 네트워크를 확장하고, 돌봄 사각지대에 놓인 치매 어르신께 실질적인 도움을 제공하기 위해 .
  7. 울산교육연수원, 청렴하고 신뢰받는 조직문화 조성 [뉴스21일간=이준수 ]  울산교육연수원은 9일 제17대 한현숙 원장 취임 이후 첫 청렴대책 추진단 회의를 열었다.  ‘참여와 소통으로 청렴한 울산교육’을 실현하고자 구성된 이번 추진단은 한현숙 원장을 단장으로 각 부서장과 팀장들이 참여했다.        이날 회의에서는 주요 청렴 추진 과제 점검, 소통의 직장문화 조...
사랑더하기
sunjin
대우조선해양건설
행복이 있는
오션벨리리조트
창해에탄올
더낙원
모바일 버전 바로가기