주 컨텐츠로 이동

데이터의 미래... 선의의 데이터

2024년 1월 18일

 

데이터가 있는 데이터와 없는 데이터 간의 격차를 줄이는 방법

사회적 공익을 위해 데이터를 활용하는 두 명의 전문가가 성공 사례를 공유하고 모두가 데이터 과학의 혜택을 누릴 수 있도록 인재 파이프라인을 확장하는 방법에 대해 논의합니다.

비키 하이먼

커뮤니케이션 담당 이사, 마스터카드

인도에서는 소규모 농부들이 디지털 재고 관리를 위해 실시간으로 농산물의 유통기한을 추적하는 모바일 앱과 연결된 저온 저장고를 사용하여 수확 손실은 줄이고 판매 가격은 높이고 있습니다.

모잠비크에서는 많은 노동자들이 나무에 못을 박은 널빤지에 전화번호를 그려 구인 광고를 합니다. 이제 직원들은 휴대폰으로 직접 노동 시장 인사이트를 전달받고 마케팅 및 비즈니스 관리 기술을 향상시킬 수 있는 도구를 이용할 수 있습니다.

콜롬비아, 멕시코, 인도 은행의 대출 기록을 감사한 결과, 연구원들은 향후 여성 지원자에 대한 편견이 발생할 위험이 높다는 사실을 발견했습니다. 기존 데이터에서 여성의 비율이 낮았기 때문에 신용도가 높은 지원자를 찾아내는 데 사용되는 알고리즘이 왜곡되었습니다. 그래서 그들은 성 평등에 맞는 새로운 것을 만들었습니다.

10년 전에는 이 모든 것이 불가능했을 것입니다. 그러나 연결된 디바이스의 증가와 생성되는 데이터의 기하급수적인 증가, 그리고 인공지능과 머신러닝의 급속한 발전이 결합되면서 데이터 과학의 잠재력이 드러나고 있습니다. 그러나 최근까지 정부, 비영리 단체, 시민 단체는 데이터 과학을 최대한 활용하여 더 많은 사람들을 도울 수 있는 예산, 인력, 역량이 부족했습니다.

2020년 마스터카드 포용적 성장 센터와  록펠러 재단이 설립한 데이터닷오알지(data.org) 데이터 과학을 활용하여 사회의 가장 시급한 문제를 해결하기 위해 전 세계에서 파트너십을 구축함으로써 데이터의 민주화를 실현하고 있습니다. 위의 세 가지를 포함해 사회적 공익을 위한 획기적인 데이터에 자금을 지원하는 ' 포용적 성장 및 회복 챌린지'와 2032년까지 20개국 이상의 거점을 통해 100만 명의 데이터 전문가를 양성하는 것을 목표로 하는 ' 역량 액셀러레이터 네트워크 '가 그 이니셔티브 중 하나입니다. 마스터카드는 대규모 데이터 과학을 통해 영향력을 가속화하는 data.org를 지속적으로 지원하고 있습니다.

포용적 성장 센터의 설립자이자 대표인 샤미나 싱은 "데이터는 가진 자와 가지지 못한 자 사이의 격차를 해소할 수 있는 잠재력을 가지고 있습니다."라고 말합니다. "우리는 사회적 영향력을 위한 데이터 과학이 포용적 성장을 창출할 수 있도록 필요한 작업을 계속해야 합니다."

마스터카드 뉴스룸은 싱과 데이터닷오알지의 전무이사 다닐 미하일로프(Danil Mikhailov)와 함께 사회적 영향력을 위한 초기 데이터 분야가 직면한 과제 해결, 인재 파이프라인 개발에 있어 다양성이 중요한 이유, 성공 사례에 대해 이야기를 나눴습니다.

샤미나, 센터에서 하는 일은 경제적 불평등을 줄이고 그 불평등을 지속시키는 디지털 격차를 줄이는 것이 목표입니다. 정보 불평등도 존재합니다. '데이터 격차'란 무엇이며, 센터가 활동하는 커뮤니티에서 어떻게 나타나나요?

Singh: 데이터는 힘이며, 지금 우리가 보고 있는 AI를 둘러싼 엄청난 경쟁이 그 증거입니다. 우리가 가장 염두에 두어야 할 것은 경쟁에서 지고 있는 사람들이 데이터 액세스의 혜택을 가장 많이 받을 수 있는 사람들이라는 점입니다. 정보 불평등이란 정보는 믿을 수 없을 정도로 강력하고 유용하며, 정보에 접근할 수 있는 사람은 성장을 가속화할 수 있는 반면, 접근 권한이나 능력이 없는 사람은 뒤처질 수 있다는 생각입니다. 이는 디지털 경제에 더 많은 사람들이 진입할수록 더 많은 사람들이 뒤처지는 것을 목격했던 금융 포용성 분야와 궤를 같이합니다.

Facebook은 데이터 기반 이니셔티브와 포용성을 최우선으로 하는 새로운 기술의 의도적인 구현을 통해 이러한 격차를 해소하기 위해 노력하고 있습니다. 센터에서 하고 있는 일은 소셜 부문이 자체 데이터의 힘을 깨닫고 이를 사회적 이익을 위해 활용할 수 있는 역량을 키우는 것입니다. 새로운 기술과 새로운 데이터 리소스를 사용하여 새로운 기관, 새로운 방식으로 업무를 수행하는 새로운 기관을 실제로 만드는 것이 이 파트너십과 data.org 설립의 기초입니다.

1년 전 데이터닷오알지는 소셜 임팩트를 위한 데이터 분야가 성숙해짐에 따라 주요 트렌드와 긴장에 대한 보고서를 발표했습니다. 조직이 여전히 직면하고 있는 과제는 무엇인가요? 진전이 있었나요? 작년에 제너레이티브 AI가 도입된 이후 새롭게 등장한 것이 있나요?

미하일로프 샤미나, 정보 불평등에 대한 프레임워크, 즉 데이터가 있는 데이터와 없는 데이터의 프레임워크가 마음에 듭니다. 이는 여전히 현실입니다. 그 격차는 줄어들지 않고 있습니다. 그 격차가 점점 커지고 있습니다. 저희는 격차가 커지는 속도를 줄이기 위해 노력하고 있습니다. 우리는 수십 년, 수백 년 동안 다양한 분야에서 데이터를 사용해 왔습니다. 세대 AI를 포함한 현 세대의 데이터 과학 기술은 매우 새롭고 빠르게 변화하고 있어 매우 세분화된 분야로 이어집니다. 모두가 스타트업을 시작하거나 새로운 도구와 접근 방식을 도입하고 있기 때문에 공통의 과제를 중심으로 현장을 하나로 모으는 것이 어렵습니다. 그리고 소셜 임팩트 데이터 또는 임팩트 AI가 무엇인지에 대한 정의는 새로운 용어이며, 아직 이 분야에서는 그 의미에 대한 합의가 이루어지지 않았습니다. 데이터닷오알지가 하는 일은 소셜 임팩트 조직, 기술 기업 및 스타트업, 학술 기관 등 이 분야의 많은 주체들을 한데 모아 우리가 의미하는 바를 공유하는 것입니다.

예를 들어 설명해 주시겠어요?

미하일로프: 데이터 에코시스템 디자이너라는 이 분야에서 누락되었다고 생각되는 역할을 정의하기 위해 많은 노력을 기울였습니다. 근본적으로 데이터 생태계를 훨씬 더 건강하게 만들기 위해 필요한 것은 조직을 특정 원칙을 중심으로 하나로 모으는 데 집중할 사람들을 찾는 것이라고 생각합니다. 공공 공간과 사적 공간, 건축물의 균형이 잘 잡힌 건강한 도시를 건설하는 도시 계획과 마찬가지로, 책임자가 필요합니다. 그래서 저희는 윤리적 데이터 생태계 설계라는 개념을 중심으로 다른 조직들과 협력해 왔습니다. 그런 다음 자금 문제를 해결해야 합니다. 이를 위해 많은 작업이 필요하며, 마스터카드는 이러한 종류의 작업을 위해 지속 가능한 자금 흐름을 구축해 왔습니다. 기술은 비용이 많이 듭니다. 피할 수 있는 방법은 없습니다. 데이터 과학 기술을 구축하면 전 세계의 다른 빅 테크 기업들과 경쟁하게 됩니다. 그래서 저희가 하고 있는 일은 이러한 상황을 뒤집어 거대 기술 기업과의 파트너십을 통해 소셜 임팩트 부문과 연결하고, 해당 부문을 도울 수 있는 채널을 제공하며, 이들이 자신의 역량을 다른 사람들을 돕는 데 사용할 수 있도록 하는 것입니다.

포용적 성장을 위한 마스터카드 센터의 지원으로 data.org의 미국 금융 포용성 액셀러레이터는 역사적으로 흑인 대학, 히스패닉 지원 기관 및 커뮤니티 칼리지가 포함된 컨소시엄을 통해 사회적 영향력을 위한 데이터 커리큘럼을 발전시킵니다. 

저희는 제너레이티브 AI와 같은 새로운 기술이 개발 초기 단계부터 포함될 수 있도록 하고자 합니다. 이러한 포용성은 처음부터 우선순위가 정해져 있습니다.

Shamina Singh

이를 위해 저희는 이러한 솔루션이 지원하고자 하는 사람들을 위한 것이 아니라 그들과 함께 구축할 수 있도록 HBCU 네트워크 및 히스패닉 지원 기관 등의 참여를 통해 데이터 과학에 대한 교육을 제공하고 다양성을 구축하기 위해 노력하고 있습니다. 이는 일반적으로 데이터나 기술을 가진 사람들이 먼저 접근한 다음 나머지 사람들에게 기술이 전달되고, 그들은 반드시 그들을 염두에 두고 구축되지 않은 무언가를 사용해야 하는 일반적인 상황과는 다른 모습입니다. 저희는 제너레이티브 AI와 같은 새로운 기술이 개발 초기 단계부터 포함될 수 있도록 하고자 합니다. 이러한 포용성은 처음부터 우선순위가 정해져 있습니다.

데이터닷오알지를 통해 지원한 이니셔티브에 대해 생각해 보세요, 데이터의 선한 영향력을 가장 잘 보여주는 사례는 무엇이라고 생각하시나요?

미하일로프 속임수를 써서 두 개로 할게요. 따라서 한 가지 예는 정말 고급스럽고 글로벌한 예이고 다른 한 가지 예는 훨씬 더 로컬한 예입니다. 따라서 고급 규모에서는 모두가 다음 공중 보건 위기에 대비할 수 있도록 데이터 분석 생태계를 개발하는 글로벌 협업 조직인 Epiverse가 있습니다. 공중 보건 분석가, 데이터 과학자, 역학자와 같은 커뮤니티를 위한 오픈 소스 도구 세트를 만드는 것입니다. 팬데믹으로 인해 전 세계적으로 행동해야 하고 인사이트를 신속하게 공유할 수 있어야 합니다. 현재 6개국에서 사용 중이며, 향후 몇 년 내에 10~20개국으로 확대될 예정입니다. 그 다음으로는 포용적 성장 및 회복 챌린지를 꼽을 수 있는데, 전 세계에서 9개의 훌륭한 프로젝트를 지원했는데, 각 프로젝트는 매우 구체적인 지역 환경에서 지역 사회가 주도하고 지속적인 영향을 미쳤습니다. 예를 들어, 미국의 지역사회가 도시의 재개발 부지에 대한 데이터를 사용하여 해당 부지를 재생하는 데 도움을 줄 수 있습니다.

Singh: 제가 더 자세히 설명해드리겠습니다. 포용적 성장과 회복 챌린지의 중요성은 비교적 새로운 개념인 소셜 임팩트를 위한 데이터 과학에 대한 수요와 공급을 창출하고자 했다는 점입니다. 저희의 의도는 선정된 수상자에게 재정적 지원을 제공하여 그들이 확장하고 추가 투자를 이끌어내어 그들의 미션과 저희의 미션을 동시에 성장시키는 것입니다. 성공 여부를 알 수 있는 방법은 그 상금이 더 많은 투자로 이어진다면 알 수 있습니다. 특히 챌린지 우승자들이 실제로 3천만 달러에 달하는 추가 투자를 유치하는 등 이러한 노력이 결실을 맺게 되어 매우 기뻤습니다. 다른 사람들이 역량 강화에 투자하게 되면 변화가 일어나고 있다는 것을 알 수 있습니다.

 

배너 사진: 모잠비크에서는 비공식 노동자들이 비스케이트 비즈니스 플랫폼에 등록하여 고객과 연결할 수 있습니다. 데이터닷오알지 포용적 성장 및 회복 챌린지를 통해 일부 자금을 지원받은 데이터 이니셔티브는 이러한 종류의 시장 데이터를 사용하여 비즈니스 구축에 도움이 되는 인사이트를 제공합니다.

이 보고서는 특히 데이터 과학자의 업무가 큰 영향을 미칠 수 있지만 데이터 과학자를 양성할 수 있는 교육 인프라가 없는 개발도상국에서 더 많은 데이터 과학자가 필요하다는 점도 지적했습니다. 이 문제를 해결하기 위해 무엇을 하고 있나요?

미하일로프 더 많은 데이터 과학자가 필요합니다. 달라져야 합니다. 다양한 곳에서 필요합니다. 우선 숫자입니다. 소셜 임팩트 부문은 말할 것도 없고 민간 부문에서도 새로운 경제를 위한 데이터 과학자를 충분히 양성하지 못하고 있습니다. 따라서 대학에 대한 더 많은 투자, 더 많은 비공식 교육, 이미 직업을 가진 사람들이 재교육을 받고 기존 기술에 원하는 기술을 추가할 수 있도록 더 많은 전문 교육이 필요합니다. 하지만 그런 사람들도 달라져야 합니다. 따라서 우리는 더 많은 여성 데이터 과학자, 특히 글로벌 남부에서 현재 소외된 다양한 배경을 가진 데이터 과학자가 더 많이 배출될 수 있도록 더 많은 투자를 해야 합니다. 또한 차별화할 수 있는 기술이 필요합니다. 따라서 현재로서는 데이터 과학을 수학, 코딩 등 매우 중요한 기술 분야로만 가르치고 있습니다. 하지만 문제를 해결하고 사회적 영향력을 창출하려면 주제를 이해해야 하는 경우가 많습니다. 예를 들어 기후나 건강 또는 경제적 불평등에 대해 이야기할 때 이러한 문제의 원인이 무엇인지 이해해야 합니다. 기술적인 능력만 있다면 솔루션을 만들려고 할 때 득보다 실이 많은 경우가 많습니다. 따라서 데이터 과학자가 기술 지식과 주제에 대한 이해를 모두 갖춘 학제 간 기술을 갖출 수 있도록 교육하는 것은 역량 액셀러레이터 네트워크에서 중점을 두고 있는 부분입니다.

Singh: 마스터카드는 항상 고객이 혁신의 중심이라고 말하지만, 사실 코딩을 하거나 기술이나 솔루션을 개발할 때는 여러분이 알고 있는 것, 여러분이 누구인지, 여러분의 삶의 경험을 바탕으로 해야 합니다. 역량 액셀러레이터 네트워크를 통해 의도적으로 시도한 것은 개발 단계에서 기술 인재 풀을 확장하여 우리가 활동하는 커뮤니티, 국가 및 지역의 다양성을 대표할 수 있도록 하는 것이었습니다.