정부는 올해도 디지털 전환과 코로나19로 인한 경제위기 극복을 위해 ‘디지털 뉴딜’에 힘을 싣는다는 목표다. 특히 올해는 디지털 전환의 열쇠로 불리는 ‘데이터 댐’ 관련 사업을 중점적으로 추진한다는 목표다./ 그래픽=박설민 기자

시사위크=박설민 기자  정부가 지난 2020년 7월 발표한 범정부 프로젝트 ‘디지털 뉴딜’이 올해로 3년차를 맞았다. 디지털 뉴딜은 코로나19 경제위기 극복과 경제‧사회 전반의 디지털 대전환을 촉진하기 위해 정부가 추진하고 있는 국가 단위 디지털 사업 프로젝트다.

올해도 정부는 디지털 전환의 속도를 더욱 높이고, 핵심 프로젝트의 성과를 전 산업 분야와 전 지역으로 확산하기 위한 투자를 이어간다는 계획이다. 특히 IT산업계에서는 올해 디지털 뉴딜 프로젝트의 핵심이 ‘데이터 댐’을 활용한 사업들이 될 것이라는 예상이 나오고 있다.

◇ ‘데이터 댐’ 사업 가속화하는 정부… 올해 AI학습용 데이터 구축에 5,797억원 투입

데이터 댐이 디지털 전환의 ‘열쇠’로 꼽히는 이유는 국가 데이터 경제의 가속화를 가져올 수 있다는 기대감에서다. 데이터 댐은 물을 모아 활용·방류하는 댐처럼 데이터를 수집·가공·보관 등이 가능하다. 때문에 AI, 자율주행 디지털 헬스케어 등 첨단 IT기술간 융합을 확산시킬 수 있을 것으로 예상된다.

우리나라 정부 역시 3일 과학기술정보통신부(이하 과기정통부)를 비롯한 관계부처 합동으로 진행한 ‘2022년도 디지털 뉴딜 사업 설명회’에서도 ‘데이터 댐’의 중요성을 강조하며 올해 관련 사업 분야의 적극적 투자를 약속했다.

이날 사업 설명회에서 과기정통부와 중소기업벤처부는 △인공지능(AI) 학습용 데이터 구축·개방 △데이터 바우처 지원 등을 중심으로 디지털 뉴딜의 핵심 프로젝트인 ‘데이터 댐’ 사업 계획 발표를 진행했다.

데이터 댐은 물을 모아 활용·방류하는 댐처럼 데이터를 수집·가공·보관 등이 가능하다. 때문에 AI, 자율주행 디지털 헬스케어 등 첨단 IT기술간 융합을 확산시킬 수 있을 것으로 예상된다. 사진은 과기정통부에서 제공한 데이터 댐 개념도./ 과학기술정보통신부

먼저 과기정통부는 올해 디지털 뉴딜 데이터댐의 핵심 ‘인공지능 학습용 데이터 구축 및 개방’에 총 5,797억원의 예산을 올해 12월 31일까지 지원할 예정이다. 이를 토대로 컴퓨터 비전, 헬스케어, 자율주행·교통 분야 등에서 총 310종의 AI학습용 데이터를 대규모로 구축해 미래 혁신 성장 기반을 마련한다는 방침이다.

두 번째 ‘데이처 바우처 지원’ 사업에는 1,241억원의 예산이 지원되며, 이를 기반으로  2,680건의 바우처를 지원한다는 목표다. 데이터 바우처 지원 사업은 데이터 활용에 어려움을 겪는 중소·벤처기업, 소상공인 및 1인 창조기업을 대상으로 정부에서 데이터구매, 가공비용을 무료로 지원해주는 지원사업이다. 

이밖에도 과기정통부와 중소벤처기업부는 △5G융합서비스 발굴 및 공공선도 적용 과제 (384억원, 8개 과제) △취약계층 비대면 라이프 케어 플랫폼 구축 (33억9,600만원) △제조데이터 공동활용 플랫폼 기술개발 (총 사업비 229억4,200만원 ) 등의 과제를 통해 올해 데이터 댐 관련 사업 분야의 성장을 도모한다는 방침이다.

과기정통부 박윤규 정보통신정책실장은 “디지털 전환의 거대한 파고 속에서 우리가 추진할 향후 5년간의 디지털 혁신이 대한민국 경제의 50년을 좌우하게 될 것”이라며 “정부와 민간의 긴밀한 소통과 협력 속에서, 디지털 뉴딜을 더욱 발전시켜 국민이 그 성과를 체감할 수 있도록 범정부 차원에서 정책적 역량을 집중하겠다”고 밝혔다

디지털 전환 시대의 핵심 기술로 데이터 댐이 꼽히지만 얼굴 정보나 건강정보 등 민감한 개인 정보 등에 대한 수집 및 개방을 어디까지 허용해야 하느냐는 IT산업계에서 끊임없이 제기되고 있는 문제다./ 그래픽=박설민 기자

◇ 데이터 댐의 핵심 ‘개인정보’ 이용… 전문가들 “민감한 정보는 법률 근거 하에 이용돼야”

이처럼 디지털 전환 시대의 코어가 될 것으로 예상되는 데이터 댐의 경우에도 고려해야 할 문제가 하나 있다. 바로 공공데이터를 수집하거나 활용할 경우, 민감한 개인 정보 등에 대한 수집 및 개방을 어디까지 허용해야 하느냐는 것이다. 

실제로 앞서 설명한 디지털 뉴딜 사업 설명회에서 발표를 진행한 오현목 한국지능정보사회진흥원 팀장 역시 “AI학습용 데이터 구축 및 개방을 위해선 필히 수행해야 하는 조치들이 있는데, 개인정보보호 조치가 그 중 하나”라며 “AI허브를 통해 데이터가 개방되는데 이 데이터를 활용하기 위해선 필히 개인정보보호조치를 수행해야 한다”고 강조했다.

이 같은 문제에 대해서 디지털 뉴딜 프로젝트의 데이터 댐 구축 사업 부문을 주도하는 과기정통부 역시 AI 학습용 데이터 구축 사업이 민감한 개인정보와 관련한 대응책을 마련하고 있다는 입장이다.

개인정보보호위원회(이하 개인정보위)는 지난해 AI학습용 데이터 구축 단계에서 인터넷진흥원을 통해 데이터 표본 63종을 검토하고, 과기정통부에 일부 인물 등 식별 가능한 이미지 영상 데이터와 일부 문자 데이터에 대해서 비식별 조치를 추가적으로 보완을 요청한 것으로 알려졌다.

이를 토대로 현재 과기정통부와 한국지능정보사회진흥원(NIA)은 비식별 조치 전문기업과 함께 개인정보가 포함돼 있을 가능성이 있는 65종 1억8,000여건의 AI학습용 데이터를 최종 점검하고 가명처리를 추가 진행한 것으로 알려졌다.

이번에 정부가 공개한 디지털 뉴딜 사업 계획안만 살펴보더라도 민감한 정보가 데이터 댐에 반영될 가능성이 있다는 지적도 나온다. AI학습용 데이터 구축 및 개방 사업에 포함되는 ‘헬스케어’ 부문의 경우 개개인의 진료 기록이나 병원 입원 기록 등 민감한 개인정보를 AI가 학습할 수 있다는 것이다.

아울러 IT분야 전문가들도 개인정보 이용 기준에 대한 명확한 설정이 앞으로 데이터 댐 구축 사업의 핵심 요소가 될 것으로 보고 있다. 이에 따라 법률과 기술 발전의 균형을 맞춰 정확한 허용 범위에 맞춰 데이터 댐의 개인정보 이용 허용범위를 설정할 필요가 있다고 조언한다.

IAAE 국제인공지능&윤리협회 전창배 이사장은 <시사위크>와의 통화에서 “AI 제품과 서비스개발을 위한 AI 학습을 위해 데이터 수집과 활용은 필수인데, 이때 가장 유용한 데이터가 개인정보와 개인데이터”라며 “여기서 개인정보를 수집하거나 제공할 때 반드시 먼저 어떤 목적으로 어디에 어떻게 활용하는지에 대한 명확한 고지를 해주고 이에 대한 동의를 받아야 한다”고 지적했다.

이어 “데이터 댐의 구축을 위한 개인정보의 수집도 마찬가지인데, 반드시 개인정보 수집과 관련한 동의 과정이 필요하다”며 “개인정보의 침해는 인격권과 행복추구권 침해에 직결되는 문제이기 때문에 반드시 이러한 적법한 프로세스를 거쳐야 할 것”이라고 말했다.

그러면서 “다만 익명화, 비식별화 조치를 한 개인정보의 활용에 대해서는 조금 완화된 기준을 적용할 수는 있을 것”이라며 “물론 이러한 경우에도 사회적 합의가 필수이고, 반드시 법률의 근거 하에 활용할 수 있도록 해야 할 것”이라고 조언했다.

관련기사

저작권자 © 시사위크 무단전재 및 재배포 금지
이 기사를 공유합니다