Skip to main content

Будущее... данных во благо

18 января 2024 года

 

Как сополнить разрыв между имеющимися данными и теми, кто не имеет данных

Два эксперта по использованию данных для социального блага делятся историями успеха и обсуждают, как расширить резерв талантов, чтобы каждый мог получить выгоду от науки о данных.

В Мозамбике неформальные работники могут зарегистрироваться через бизнес-платформу Biscate, которая связывает их с клиентами. Инициатива в области данных, частично финансируемая через data.org Inclusive Growth and Recovery Challenge, использует такие рыночные данные для предоставления аналитических данных для развития бизнеса.

Vicki Hyman

Director,

Global Communications,

Mastercard

В Индии мелкие фермеры сокращают потери урожая и повышают цены на продажу с помощью холодного хранилища, которое подключено к мобильному приложению, отслеживающему срок хранения продукции в реальном времени для цифрового управления запасами.

В Мозамбике многие рабочие рекламируют объявления, рисуя свои номера телефонов на досках, прибитых к деревьям. Теперь они получают информацию о рынке труда прямо на телефоны и получают инструменты для улучшения навыков маркетинга и управления бизнесом.

При аудите кредитных записей банков Колумбии, Мексики и Индии исследователи обнаружили высокий риск будущей предвзятости в отношении женщин-заявителей. Низкое представительство женщин в существующих данных искажало алгоритмы, используемые для выявления кредитоспособных кандидатов. Поэтому они построили новый, который справедлив по гендеру.

Ничего из этого не было бы возможно десять лет назад. Но рост числа подключённых устройств и экспоненциальный рост производимых данных, в сочетании с быстрыми достижениями в области искусственного интеллекта и машинного обучения, раскрыли потенциал науки о данных. Однако до недавнего времени у правительств, некоммерческих организаций и общественных организаций не хватало бюджетов, персонала и возможностей, чтобы полностью использовать Data Science для помощи большему числу людей.

Основана Центром инклюзивного роста Mastercard и Фондом Рокфеллера в 2020 году, data.org Демократизирует данные, создавая партнёрства по всему миру для использования науки о данных для решения самых насущных проблем общества. Среди инициатив — Вызов инклюзивного роста и восстановления, который профинансировал прорывные данные для концепций социального блага, включая три вышеуказанные, и сеть Capacity Accelerator Network, цель которой — обучить миллион специалистов по данным к 2032 году через центры более чем в 20 странах и их число растёт. Mastercard продолжает поддерживать data.org, ускоряя воздействие с помощью науки о данных в масштабах.

«Данные имеют потенциал увеличить разрыв между обладающими и теми, у кого нет», — говорит Шамина Сингх, основатель и президент Центра инклюзивного роста. «Нам нужно продолжать выполнять необходимую работу, чтобы наука о данных для социального воздействия создавала инклюзивный рост.»

Редакция Mastercard Newsroom побеседовала с Сингхом и Данилом Михайловым, исполнительным директором data.org, о решении проблем, стоящих перед зарождающейся областью использования данных для достижения социальных результатов, о том, почему разнообразие имеет решающее значение для формирования кадрового резерва, и о том, в чем они видят успехи.

Шамина, ваша работа в Центре направлена на сокращение экономического неравенства и уменьшение цифрового разрыва, который увековечивает это неравенство. Существует также информационное неравенство. Что такое «информационный разрыв» и как он проявляется в сообществах, в которых работает Центр?

Сингх: Данные — это сила, и огромная гонка вокруг искусственного интеллекта, которую мы сейчас наблюдаем, — тому доказательство. Нам нужно помнить, что те, кто проигрывает гонку, — это также те, кто может получить наибольшую выгоду от доступа к данным. Информационное неравенство — это идея, что информация невероятно мощна, невероятно полезна, и те, кто имеет к ней доступ, действительно могут ускорить свой рост, в то время как те, у кого нет доступа или возможностей, могут остаться позади. Это совпадает с тем, что мы видели в сфере финансовой инклюзии, где по мере того, как всё больше людей входило в цифровую экономику, всё больше людей остаётся позади.

Мы пытаемся устранить эти пробелы, которые формируются через инициативы, основанные на данных, и целенаправленное внедрение новых технологий с включением инклюзии на передний план. То, что мы делаем в Центре, — это создание возможностей для социального сектора, чтобы они могли реализовать силу собственных данных для использования на благо. Это основа этого партнёрства и создания data.org — создать новый институт, новый способ ведения этой работы с использованием новых технологий и новых ресурсов данных.

Год назад Данил из data.org опубликовал отчет о ключевых тенденциях и противоречиях по мере развития области использования данных для достижения социальных результатов. С какими проблемами организации по-прежнему сталкиваются? Есть ли какой-либо прогресс? Появилось ли что-нибудь новое с тех пор, как генеративный искусственный интеллект получил широкое распространение за последний год?

Михайлов: Шамина, мне очень нравится ваше представление о неравенстве информации: данные имеют и не имеют. Это всё ещё реальность. Разрыв не уменьшается. Разрыв увеличивается. Мы добиваемся прогресса в попытке сократить темпы роста разрыва. Мы использовали данные из разных областей уже десятилетиями, веками. Современное поколение технологий науки о данных, включая генерационный ИИ, настолько новое и быстро меняется, что приводит к тому, что область становится очень фрагментированной. Все запускают свои стартапы или новые инструменты и подходы, поэтому сложно объединить всю сферу вокруг некоторых общих вызовов. А определение того, что такое данные для социального воздействия, или impact AI — это новые термины, и эта область ещё не сформировалась вокруг того, что мы имеем в виду. То, что data.org делает, — объединяет многих участников этой сферы — организации социального воздействия, технологические компании и стартапы, академические учреждения и т.д. — вокруг того, что мы имеем в виду под ними.

Можете привести пример?

Михайлов: Мы проделали много работы над определением роли, которой, по нашему мнению, не хватает в этой области — проектировщика экосистемы данных. Мы считаем, что для создания гораздо более здоровых экосистем данных нам нужно найти людей, которые будут сосредоточены на объединении организаций вокруг определённых принципов. Как и в градостроительстве — построении здорового города с хорошими общественными и частными пространствами, хорошим балансом архитектуры — нужен кто-то, кто отвечает. Поэтому мы работаем с другими организациями, чтобы объединиться вокруг концепции этичного проектирования экосистемы данных. Тогда нужно наладить финансирование. В этом предстоит много работы, и Mastercard строит устойчивые источники финансирования для такого рода работ. Технологии дорогие. Избежать этого невозможно. Когда вы создаёте методы Data Science, вы конкурируете с другими крупными технологическими компаниями мира. Поэтому мы фактически переворачиваем ситуацию с ног на голову, сотрудничая с крупными технологическими гигантами, чтобы связать их с сектором социального воздействия, предоставляя канал для помощи сектору и для использования своих сил для поддержки других.

При поддержке Центра инклюзивного роста Mastercard, data.org Американская программа ускорения финансовой инклюзии (US Financial Inclusion Accelerator) продвигает учебные программы по использованию данных для достижения социального эффекта посредством консорциума, в который входят исторически сложившиеся колледжи и университеты для чернокожих, учебные заведения, обслуживающие испаноязычное население, и колледжи общинного типа. 

Для достижения этого мы работаем над тем, чтобы предоставлять обучение и развивать разнообразие в области науки о данных через взаимодействие с такими организациями, как HBCU и учреждения, обслуживающие латиноамериканцев, чтобы убедиться, что мы работаем не только с теми, кого эти решения должны поддерживать. Это отклонение от нормы, когда доступ к данным или технологиям обычно получают сначала те, кто ими обладает, а затем технологии доходят до остального населения, и им приходится взаимодействовать с чем-то, что не обязательно было разработано с учетом их потребностей. Мы хотим, чтобы новые технологии, такие как генеративный ИИ, были частью их развития с самого начала. Это включение приоритетно с самого начала.

 

Когда вы думаете об инициативах, которые вы поддержали через data.org, Какой пример, на ваш взгляд, наиболее ярко демонстрирует силу данных во благо?

Михайлов: Я схитрю и поставлю на два очка. Так, один пример — это действительно высококлассный, глобальный продукт, а другой — гораздо более локальный. Таким образом, в высокотехнологичном сегменте это Epiverse — глобальное объединение, разрабатывающее экосистему анализа данных, которая может помочь каждому предотвратить следующий кризис в области общественного здравоохранения. Речь идёт о создании набора инструментов с открытым исходным кодом для аналитиков в области общественного здравоохранения, специалистов по обработке данных, эпидемиологов и тому подобного сообщества. Очевидно, что это вдохновлено пандемией; нам нужно действовать глобально и иметь возможность быстро обмениваться информацией. В настоящее время он представлен в полудюжине стран, и в ближайшие несколько лет планируется расширить его присутствие еще на 10-20 стран. Затем я бы перешла к нашей программе «Вызов инклюзивного роста и восстановления», в рамках которой мы поддержали девять замечательных проектов по всему миру, каждый из которых осуществлялся в очень специфических местных условиях, реализовывался местными сообществами и оказывал долгосрочное воздействие. Например, оказание помощи местным сообществам в США в использовании данных о заброшенных промышленных территориях в их городах для содействия восстановлению этих земель.

Сингх: Позвольте развить это. Важность вызова инклюзивного роста и восстановления заключалась в том, что мы хотели создать спрос и предложение на науку о данных для социального воздействия — относительно новая концепция. Наша цель — использовать финансовую поддержку выбранных победителей, чтобы помочь им масштабироваться и привлекать дополнительные инвестиции, одновременно развивая их миссию и нашу миссию. Вы понимаете, что это успешно, если эта награда принесёт ещё больше инвестиций. И мы были в восторге, когда победители конкурсов действительно привлекли около 30 миллионов долларов дополнительных инвестиций. Когда другие начинают вкладываться в развитие потенциала, именно тогда вы понимаете, что происходят перемены.

В отчёте также отмечается необходимость большего числа специалистов по данным, особенно в развивающихся странах, где работа может иметь большое влияние, но где, возможно, нет образовательной инфраструктуры для подготовки специалистов по данным. Что вы делаете, чтобы решить эту проблему?

Михайлов: Нам нужно больше специалистов по данным. Нам нужно, чтобы они были другими. Нам нужны они в разных местах. Прежде всего, цифры. Мы не готовим достаточно специалистов по данным для новой экономики, не говоря уже о секторе социального воздействия. Поэтому нам нужно больше инвестиций в университеты, больше неформального обучения, больше профессиональной подготовки для тех, кто уже имеет работу, чтобы переподготовить и добавить нужные навыки к существующим навыкам. Но нам также нужно, чтобы эти люди были другими. Поэтому нам нужно больше инвестировать в то, чтобы было больше женщин-дата-сайентистов, и чтобы их было больше из разных, ныне обездоленных, слоёв, особенно в странах Глобального Юга. Нам также нужны навыки, чтобы отличаться. Сейчас мы преподаём Data Science как техническую дисциплину — математику, программирование, которые чрезвычайно важны. Но часто, чтобы решать проблемы и создавать социальное воздействие, нужно понимать предмет. Поэтому нужно понимать, например, когда речь идёт о климате, здоровье или финансовом неравенстве, каковы причины этих проблем? Если у вас есть только технические навыки, часто вы можете принести больше вреда, чем пользы, когда пытаетесь создавать решения. Поэтому обучение Data Scientist междисциплинарным навыкам как технических знаний, так и понимания предмета — это то, на чём мы сосредоточены в нашей сети Capacity Accelerator Network.

Сингх: В Mastercard мы всегда говорили, что клиент находится в центре наших инноваций, но правда в том, что если вы пишете код или создаёте технологии или решения, вы делаете это, исходя из того, что знаете, кто вы и что имеете жизненный опыт. То, что мы намеренно попытались сделать с помощью сети Capacity Accelerator Network — это расширить пул технологических специалистов на этапе развития, чтобы обеспечить разнообразие сообществ, стран и регионов, в которых мы работаем.