인공지능, AI의 경쟁력은 글과 그림, 영상을 직접 학습하는 이른바 '머신러닝'에 달려있다.
이 학습을 위해서는 방대한 양의 그림과 영상 데이터가 필요한데, 개인정보가 드러나지 않게 '가명' 처리하는 과정이 필요하다.
더 똑똑한 AI를 만들기 위해선 학습을 위한 데이터를 더 많이 확보하는게 관건이고, 전세계 데이터 가운데 90%는 글, 그림, 영상 같은 이른바 '비정형 데이터'다.
이 때문에 정부는 비정형 데이터에서 개인 정보가 드러나지 않게 가명 처리 기준을 제시했다.
우선, AI 학습에 꼭 필요한 정보라면 남기되, 그 외 정보는 가명 처리 수준을 높여야 하며, 사진이나 영상을 복원했을 때, 누군지 알아볼 위험성이 있어서도 안된다.