Skip to main content

Tương lai của ... dữ liệu cho mục đích tốt

Ngày 18 tháng 1 năm 2024

 

Làm thế nào để thu hẹp khoảng cách giữa dữ liệu có và dữ liệu không có

Hai chuyên gia khai thác dữ liệu vì lợi ích xã hội chia sẻ những câu chuyện thành công và thảo luận về cách mở rộng đường ống tài năng để đảm bảo mọi người đều có thể hưởng lợi từ khoa học dữ liệu.

Vicki Hyman

Giám đốc Truyền thông, Mastercard

Tại Ấn Độ, các hộ nông dân nhỏ đang giảm thiểu tổn thất thu hoạch và tăng giá bán thông qua việc sử dụng kho lạnh, được kết nối với ứng dụng di động theo dõi thời hạn sử dụng của sản phẩm theo thời gian thực để quản lý hàng tồn kho kỹ thuật số.

Ở Mozambique, nhiều lao động quảng cáo việc làm bằng cách vẽ số điện thoại của họ lên những tấm ván đóng đinh vào cây. Giờ đây, họ đang nhận được thông tin chi tiết về thị trường lao động được chuyển trực tiếp đến điện thoại của họ và truy cập vào các công cụ để cải thiện kỹ năng tiếp thị và quản lý kinh doanh của họ.

Và khi kiểm tra hồ sơ cho vay từ các ngân hàng ở Colombia, Mexico và Ấn Độ, các nhà nghiên cứu phát hiện ra nguy cơ thiên vị cao trong tương lai đối với các ứng viên nữ. Tỷ lệ phụ nữ thấp trong dữ liệu hiện có đã làm sai lệch các thuật toán được sử dụng để tìm ra những ứng viên có uy tín. Vì vậy, họ đã xây dựng một cái mới công bằng về giới tính.

Không có điều gì trong số này có thể xảy ra cách đây một thập kỷ. Nhưng sự gia tăng của các thiết bị được kết nối và tăng trưởng theo cấp số nhân trong dữ liệu được tạo ra, kết hợp với những tiến bộ nhanh chóng trong trí tuệ nhân tạo và học máy, đã giải phóng tiềm năng của khoa học dữ liệu. Tuy nhiên, cho đến gần đây, các chính phủ, tổ chức phi lợi nhuận và tổ chức dân sự vẫn thiếu ngân sách, nhân viên và năng lực để tận dụng tối đa khoa học dữ liệu nhằm giúp đỡ nhiều người hơn.

Được thành lập bởi Trung  tâm Tăng trưởng Bao gồm Mastercard và Qu ỹ Rockefeller vào năm 2020, data.org Dân chủ hóa dữ liệu bằng cách xây dựng quan hệ đối tác trên toàn thế giới để khai thác khoa học dữ liệu để giải quyết các vấn đề cấp bách nhất của xã hội. Trong số các sáng kiến của nó: Thách thức tăng trưởng và phục hồi toàn diện, tài trợ cho dữ liệu đột phá cho các khái niệm lợi ích xã hội, bao gồm ba khái niệm trên, và M ạng tăng tốc năng lực, nhằm đào tạo một triệu chuyên gia dữ liệu vào năm 2032 thông qua các trung tâm ở hơn 20 quốc gia và ngày càng tăng. Mastercard tiếp tục hỗ trợ data.org khi tổ chức này đẩy nhanh tác động thông qua khoa học dữ liệu ở quy mô lớn.

Shamina Singh, người sáng lập và chủ tịch của Trung tâm Tăng trưởng Bao gồm cho biết: “Dữ liệu có tiềm năng mở rộng khoảng cách giữa những người có và những người không có. “Chúng ta cần tiếp tục thực hiện công việc cần thiết để đảm bảo rằng khoa học dữ liệu cho tác động xã hội tạo ra sự tăng trưởng toàn diện.”

Phòng tin tức Mastercard đã trao đổi với SinghDanil Mikhailov, giám đốc điều hành của data.org, về việc giải quyết những thách thức mà lĩnh vực dữ liệu mới ra đời hướng đến tác động xã hội, lý do tại sao tính đa dạng lại rất quan trọng trong việc phát triển nguồn nhân tài và nơi họ đang chứng kiến thành công.

Shamina, công việc của bạn tại Trung tâm nhằm mục đích giảm bất bình đẳng kinh tế và thu hẹp khoảng cách kỹ thuật số kéo dài sự bất bình đẳng đó. Ngoài ra còn có sự bất bình đẳng về thông tin. “Sự phân chia dữ liệu” là gì và điều đó thể hiện như thế nào trong các cộng đồng nơi Trung tâm hoạt động?

Singh: Dữ liệu là sức mạnh, và cuộc đua khổng lồ mà chúng ta đang thấy xung quanh AI ngay bây giờ là bằng chứng cho điều đó. Điều chúng ta cần lưu ý là những người thua cuộc đua cũng là những người có thể hưởng lợi nhiều nhất từ việc truy cập dữ liệu. Bất bình đẳng thông tin là ý tưởng rằng thông tin cực kỳ mạnh mẽ, vô cùng hữu ích và những người có quyền truy cập vào nó thực sự có thể đẩy nhanh tốc độ tăng trưởng của họ, trong khi những người không có quyền truy cập hoặc năng lực có thể bị bỏ lại phía sau. Điều này theo dõi những gì chúng ta đã thấy trong không gian hòa nhập tài chính, nơi khi nhiều người tham gia vào nền kinh tế kỹ thuật số, chúng ta thấy nhiều người bị bỏ lại phía sau.

Chúng tôi đang cố gắng giải quyết những lỗ hổng này đang hình thành thông qua các sáng kiến dựa trên dữ liệu và việc thực hiện có chủ ý các công nghệ mới với sự bao gồm ở vị trí hàng đầu. Những gì chúng tôi đang làm tại Trung tâm là tạo ra năng lực cho khu vực xã hội nhận ra sức mạnh của dữ liệu của chính họ để sử dụng nó cho lợi ích xã hội. Đó là cơ sở của mối quan hệ đối tác này và việc tạo ra data.org - để thực sự tạo ra một tổ chức mới, một cách thức mới để thực hiện công việc này bằng cách sử dụng công nghệ mới và tài nguyên dữ liệu mới.

Danil, một năm trước, data.org đã công bố một báo cáo về các xu hướng chính và căng thẳng khi lĩnh vực dữ liệu về tác động xã hội trưởng thành. Một số thách thức mà các tổ chức vẫn phải đối mặt là gì? Có tiến bộ nào chưa? Có điều gì mới xuất hiện kể từ khi AI tổng hợp được áp dụng trong năm ngoái không?

Mikhailov: Shamina, tôi thích cách bạn đóng khung về bất bình đẳng thông tin: dữ liệu có và dữ liệu không có. Đó vẫn là một thực tế. Khoảng cách không thu hẹp. Khoảng cách ngày càng tăng. Chúng tôi đang đạt được tiến bộ để cố gắng giảm tốc độ mà khoảng cách đang gia tăng. Chúng tôi đã sử dụng dữ liệu trong các lĩnh vực khác nhau trong nhiều thập kỷ, nhiều thế kỷ. Thế hệ công nghệ khoa học dữ liệu hiện tại, bao gồm cả thế hệ AI, rất mới và đang thay đổi rất nhanh, dẫn đến một lĩnh vực rất phân mảnh. Mọi người đều khởi động các công ty khởi nghiệp hoặc các công cụ và cách tiếp cận mới của họ, điều đó có nghĩa là rất khó để kết hợp lĩnh vực này lại với nhau xung quanh một số thách thức chung. Và định nghĩa về dữ liệu cho tác động xã hội là gì, hay AI tác động - chúng là những thuật ngữ mới và lĩnh vực này vẫn chưa kết hợp với ý của chúng tôi. Những gì data.org đang làm là tập hợp nhiều tác nhân trong không gian - các tổ chức tác động xã hội, các công ty công nghệ và công ty khởi nghiệp, các tổ chức học thuật, v.v., xung quanh những gì chúng tôi muốn nói về chúng.

Bạn có thể cho tôi một ví dụ?

Mikhailov: Chúng tôi đã nỗ lực rất nhiều để xác định một vai trò mà chúng tôi cho là còn thiếu trong lĩnh vực này — nhà thiết kế hệ sinh thái dữ liệu. Về cơ bản, chúng tôi nghĩ rằng những gì chúng tôi cần để tạo ra các hệ sinh thái dữ liệu lành mạnh hơn là tìm những người sẽ tập trung vào việc đưa các tổ chức lại với nhau xung quanh các nguyên tắc nhất định. Cũng giống như trong quy hoạch đô thị - xây dựng một thành phố lành mạnh có không gian công cộng tốt và không gian riêng tư, sự cân bằng tốt về kiến trúc - bạn cần một người phụ trách. Vì vậy, chúng tôi đã làm việc với các tổ chức khác để đoàn kết xung quanh khái niệm thiết kế hệ sinh thái dữ liệu đạo đức này. Sau đó, chúng ta cần phải sửa chữa tài trợ. Có rất nhiều công việc cần phải thực hiện và Mastercard đã và đang xây dựng các luồng tài trợ bền vững cho loại công việc này. Công nghệ đắt tiền. Không có cách nào để tránh được điều đó. Khi bạn xây dựng các kỹ thuật khoa học dữ liệu, bạn đang cạnh tranh với các công ty công nghệ lớn khác trên thế giới. Vì vậy, những gì chúng tôi đang làm thực sự là lật ngược điều này bằng cách hợp tác với những gã khổng lồ công nghệ lớn, để kết nối họ với lĩnh vực tác động xã hội, cung cấp một kênh để giúp đỡ ngành và để họ sử dụng cơ bắp của mình để giúp nâng đỡ những người khác.

Với sự hỗ trợ từ Trung tâm Mastercard về Tăng trưởng Toàn diện, data.org Bộ tăng tốc hòa nhập tài chính Hoa Kỳ nâng cao chương trình giảng dạy về dữ liệu về tác động xã hội thông qua một tập đoàn bao gồm các trường cao đẳng và đại học Da đen trong lịch sử, các tổ chức phục vụ người gốc Tây Ban Nha và các trường cao đẳng cộng đồng. 

Chúng tôi muốn đảm bảo công nghệ mới nổi, những thứ như trí tuệ nhân tạo, là một phần của sự phát triển ngay từ đầu. Sự bao gồm đó được ưu tiên ngay từ đầu.

Shamina Singh

Để thực hiện được điều này, chúng tôi đang nỗ lực đảm bảo cung cấp đào tạo và xây dựng sự đa dạng trong khoa học dữ liệu thông qua các hoạt động hợp tác với các mạng lưới HBCU và các tổ chức phục vụ người gốc Tây Ban Nha để đảm bảo rằng chúng tôi đang xây dựng cùng với — chứ không chỉ dành cho — những người mà các giải pháp này hướng đến để hỗ trợ. Đây là một sự khác biệt so với tiêu chuẩn mà dữ liệu hoặc công nghệ sở hữu thường có quyền truy cập đầu tiên và sau đó công nghệ đi đến phần còn lại của dân số và họ phải tham gia vào một cái gì đó không nhất thiết phải được xây dựng với họ trong tâm trí. Chúng tôi muốn đảm bảo công nghệ mới nổi, những thứ như trí tuệ nhân tạo, là một phần của sự phát triển ngay từ đầu. Sự bao gồm đó được ưu tiên ngay từ đầu.

Khi bạn nghĩ về các sáng kiến bạn đã hỗ trợ thông qua data.org, cái gì mà bạn cảm thấy là hình ảnh thu nhỏ sức mạnh của dữ liệu cho tốt đẹp?

Mikhailov: Tôi sẽ gian lận và đi hai người. Vì vậy, một ví dụ thực sự là loại cao cấp, toàn cầu và một ví dụ là địa phương hơn nhiều. Vì vậy, ở quy mô cao cấp, đó là Epiverse, một hợp tác toàn cầu phát triển một hệ sinh thái phân tích dữ liệu có thể giúp mọi người vượt qua cuộc khủng hoảng sức khỏe cộng đồng tiếp theo. Đó là về việc tạo ra một bộ công cụ mã nguồn mở cho các nhà phân tích y tế công cộng và các nhà khoa học dữ liệu, nhà dịch tễ học, loại cộng đồng đó. Rõ ràng nó được truyền cảm hứng từ đại dịch; chúng ta cần hành động trên toàn cầu và chúng ta cần có khả năng chia sẻ những hiểu biết nhanh chóng. Nó hiện đang ở nửa tá quốc gia, và trong vài năm tới, nó được dự kiến sẽ mở rộng sang 10 đến 20 quốc gia khác. Sau đó, tôi sẽ tham gia Thử thách Tăng trưởng và Phục hồi Hòa nhập của chúng tôi, nơi chúng tôi hỗ trợ chín dự án tuyệt vời trên khắp thế giới, mỗi dự án trong một môi trường địa phương rất cụ thể, được thúc đẩy bởi cộng đồng địa phương và có tác động lâu dài. Ví dụ, giúp các cộng đồng ở Hoa Kỳ sử dụng dữ liệu về các địa điểm bị cháy ở thành phố của họ để giúp cộng đồng tái tạo vùng đất đó.

Singh: Hãy để tôi xây dựng dựa trên điều đó. Tầm quan trọng của Thử thách Tăng trưởng và Phục hồi Toàn diện là chúng tôi muốn tạo ra nhu cầu và nguồn cung cho khoa học dữ liệu để tác động xã hội, một khái niệm tương đối mới. Mục đích của chúng tôi là sử dụng sự hỗ trợ tài chính cho những người chiến thắng được chọn để giúp họ mở rộng quy mô và mang lại lợi ích đầu tư hơn nữa, đồng thời phát triển sứ mệnh của họ và sứ mệnh của chúng tôi. Cách bạn biết nó thành công là nếu giải thưởng đó mang lại nhiều khoản đầu tư hơn nữa. Và chúng tôi rất vui mừng khi thấy điều này thành hiện thực, trong đó đáng chú ý là những người chiến thắng thử thách đã thực sự tạo ra khoản đầu tư bổ sung khoảng 30 triệu đô la. Khi những người khác đầu tư vào việc xây dựng năng lực, đó là khi bạn biết sự thay đổi đang xảy ra.

 

Ảnh biểu ngữ: Ở Mozambique, những người lao động không chính thức có thể đăng ký với nền tảng kinh doanh Biscate, kết nối họ với khách hàng. Một sáng kiến dữ liệu được tài trợ một phần thông qua Thử thách Tăng trưởng và Phục hồi Bao gồm data.org sử dụng loại dữ liệu thị trường này để cung cấp thông tin chi tiết nhằm giúp xây dựng doanh nghiệp của họ.

Báo cáo cũng nhấn mạnh sự cần thiết của nhiều nhà khoa học dữ liệu hơn, đặc biệt là ở các nước đang phát triển, nơi công việc có thể có tác động lớn nhưng cũng là nơi có lẽ không có cơ sở hạ tầng giáo dục để đào tạo các nhà khoa học dữ liệu. Bạn đang làm gì để giải quyết vấn đề này?

Mikhailov: Chúng ta cần nhiều nhà khoa học dữ liệu hơn. Chúng ta cần chúng khác biệt. Chúng ta cần chúng ở những nơi khác nhau. Trước hết, các con số. Chúng tôi không đào tạo đủ các nhà khoa học dữ liệu cho nền kinh tế mới, không phải trong khu vực tư nhân chứ đừng nói đến lĩnh vực tác động xã hội. Vì vậy, chúng ta cần đầu tư nhiều hơn vào các trường đại học, đào tạo không chính thức hơn, đào tạo chuyên nghiệp hơn cho những người đã có công việc để đào tạo lại và bổ sung các kỹ năng mong muốn vào bộ kỹ năng hiện có của họ. Nhưng chúng ta cũng cần những người đó khác biệt. Vì vậy, chúng ta cần đầu tư nhiều hơn để đảm bảo rằng có nhiều nữ nhà khoa học dữ liệu hơn, và có nhiều nhà khoa học dữ liệu từ các nền tảng khác nhau, hiện đang bị tước quyền, đặc biệt là ở miền Nam toàn cầu. Chúng ta cũng cần các kỹ năng khác nhau. Vì vậy, hiện tại, chúng tôi đang dạy khoa học dữ liệu giống như một ngành kỹ thuật - toán học, mã hóa, những thứ cực kỳ quan trọng. Nhưng thông thường, để giải quyết vấn đề và tạo ra tác động xã hội, bạn cần hiểu chủ đề. Vì vậy, bạn cần hiểu, ví dụ, khi bạn nói về khí hậu hoặc sức khỏe hoặc bất bình đẳng tài chính, nguyên nhân đằng sau những vấn đề đó là gì? Nếu bạn chỉ có kỹ năng kỹ thuật, bạn thường có thể gây hại nhiều hơn là có lợi khi cố gắng tìm ra giải pháp. Vì vậy, dạy các nhà khoa học dữ liệu có các kỹ năng liên ngành về cả kiến thức công nghệ và hiểu biết về chủ đề là điều mà chúng tôi tập trung vào trong Mạng lưới tăng tốc năng lực của chúng tôi.

Singh: Tại Mastercard, chúng tôi luôn nói rằng khách hàng là trung tâm của sự đổi mới của chúng tôi, nhưng sự thật là nếu bạn đang viết mã hoặc tạo ra các công nghệ hoặc giải pháp, bạn sẽ làm như vậy dựa trên những gì bạn biết, bạn là ai và kinh nghiệm sống của bạn. Những gì chúng tôi cố tình làm với Mạng tăng tốc năng lực là mở rộng nhóm tài năng công nghệ trong giai đoạn phát triển để đảm bảo rằng đầu vào đại diện cho sự đa dạng của cộng đồng, quốc gia và khu vực mà chúng tôi đang hoạt động.