[:en]GIZ | ‘Looking for what makes the difference’[:de]GIZ | „Die Suche danach, was den Unterschied ausmacht“[:]

[:en]

The GIZ Data Lab analyses statistical outliers in data sets to find innovative solutions – a model that promises to provide insight into the COVID-19 pandemic too.

Can you measure the impact of a project using mobile communications data? Or use satellite images to record data? And can you harness artificial intelligence to advise smallholder farmers? The Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ) GmbH is examining these and other similar questions in its Data Lab, which was set up in 2019. The lab is now using the data-powered positive deviance approach to test a procedure that turns current methods on their head.Data Lab coordinator Catherine Vogel and advisor Andreas Glücker explain how, instead of excluding statistical outliers in data sets as researchers normally do, they specifically look for them. This is based on the conviction that these ‘positive deviants’ can provide considerable added value for development cooperation – and also in the context of the current COVID-19 crisis.

What is the thinking behind the positive deviance approach and why is GIZ looking at it?

Catherine Vogel: Data sets are usually used to determine average values for the behaviour of groups or individuals. Any statistical outliers are often ignored. Yet unusual, positive deviants in the data show that there are individuals or groups that achieve better results than others, even though the conditions and challenges are similar. We might be looking at villages whose rice harvest is higher than in other places with similar farming conditions, city districts with comparatively little crime, or hospitals that still manage to provide adequate care even during pandemics. Our pilot projects are designed to help us understand what types of behaviour make these unusual achievements possible and whether they can be transferred. The aim is to find unusual and innovative solutions to foster this kind of deviance. The positive deviance approach was established back in the 1990s; our project is now harnessing the opportunities provided by big data to identify positive deviants.

What are the challenges here?

Catherine Vogel: The biggest obstacle in analysing positive deviance is the availability of data. We need current, comprehensive data in order to draw reliable conclusions about positive deviants. Digital sources such as satellite images and mobile communications data offer great potential but are not always accessible. This is where we cooperate with international partners. The next big task involves confirming that outliers found in the data actually exist in practice and then looking for what makes the difference. If we manage to do that, we will have made great progress in harnessing local creativity much more effectively.

How has the technique been put into practice?

Andreas Glücker: We are currently using the positive deviance approach in seven different countries and cooperating closely with the projects there. In Ecuador, we are looking for farmers who have been working within the Amazon region for many years and, in contrast to widespread practice, do not clear the land. In Somaliland, we are trying to find positive types of behaviour that enable cattle herders to cope with periods of drought without suffering major losses to their herds. In all these projects, considerable added value is created by combining digital, quantitative data with extensive expertise on local conditions, which comes mostly from the GIZ projects involved.

How could this method be used to help understand the spread of coronavirus better?

Catherine Vogel: During the coronavirus crisis, we have been looking for the districts in Germany that have managed to reduce the rate at which COVID-19 is spreading much faster than we would normally expect. And we have in fact managed to identify districts that have fared better than others even after all the known positive factors have been taken into account. These developments are extremely interesting and provide new insight into particular types of behaviour during a pandemic.

How do you go about doing that? Are any results available yet?

Andreas Glücker: The first step is to ensure that results are comparable to make sure that we are not comparing the proverbial apples and oranges. So we grouped districts according to factors such as population density. Then we used mobility patterns based on mobile communications and weather data to train an artificial intelligence model. Once the model was ready, we used it to predict the spread of the virus in each case. If the actual values reported by the Robert Koch Institute for a particular district are considerably better than the value we predicted, that suggests that there are factors or patterns of behaviour that have not yet been identified. These then obviously have to be examined in more detail. We used this approach in a sustainability hackathon organised by Siemens and won the Sustainability Impact prize.

And where do you go from here?

Catherine Vogel: The results of the COVID-19 pilots are promising, and we will be taking a closer look at the districts that have been identified. And our other approaches also have great potential for development cooperation in that they provide a method that begins by looking for existing solutions before trying to reinvent the wheel.

GIZ Data Lab

More information

Source: Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ), 22 July 2020

[:de]

Das Data Lab der GIZ analysiert statistische Ausreißer in Datensätzen, um innovative Lösungen zu entdecken. Ein Modell, das auch Rückschlüsse zur Corona-Pandemie verspricht.

Mit Mobilfunkdaten die Wirkung eines Vorhabens messen? Satellitenbilder für eine Datenerfassung verwenden? Künstliche Intelligenz für die Beratung von Kleinbauern nutzen? Mit diesen und ähnlichen Fragen beschäftigt sich die Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ) GmbH in ihrem 2019 gegründeten Data Lab. Mit dem „Data Powered Positive Deviance“ Ansatz testet das Lab nun ein Vorgehen, das bisherige Methoden auf den Kopf stellt.Im Interview berichten Data Lab Koordinatorin Catherine Vogel und Berater Andreas Glücker, wie sie in ihrem Projekt statistische Ausreißer in Datensätzen nicht wie sonst üblich „abschneiden“, sondern sie im Gegenteil gezielt suchen. Dahinter steckt die Überzeugung, dass diese „Positive Deviants“ einen großen Mehrwert für die Entwicklungszusammenarbeit liefern können – auch im Kontext der aktuellen COVID-19-Krise.

Was steckt hinter dem Positive Deviance Ansatz und warum beschäftigt sich die GIZ überhaupt damit?

Catherine Vogel: Datensätze werden meist dazu genutzt, um durchschnittliche Werte für das Verhalten von Gruppen oder Einzelpersonen zu gewinnen – statistische Ausreißer dagegen häufig verworfen. Ungewöhnliche positive Abweichungen in den Daten zeigen aber, dass es trotz ähnlicher Bedingungen und Herausforderungen Personen oder Gruppen gibt, die besser abschneiden als ihre Vergleichsgruppen. Dies können zum Beispiel Dörfer sein, deren Reisernte höher ausfällt als andere Orte mit ähnlichen Anbaubedingungen; Stadtteile, die im Vergleich wenig Kriminalität erleben; oder Krankenhäuser, die es trotz Pandemien meistern, ihre Versorgung aufrecht zu erhalten. Durch unsere Pilotprojekte möchten wir verstehen, welche Verhaltensweisen diese ungewöhnlichen Leistungen ermöglichen und ob sie übertragbar sind. Das Ziel dahinter ist es, ungewöhnliche und innovative Lösungen zu finden, die diese Abweichung möglich machen. Der Positive Deviance Ansatz besteht schon seit den 90er Jahren; unser Projekt nutzt nun die Möglichkeiten von Big Data, um die positiven Abweichler zu identifizieren.

Was sind die Herausforderungen dabei?

Catherine Vogel: Die größte Hürde für die Analyse von Positive Deviance ist die Verfügbarkeit von Daten. Wir benötigen aktuelle und umfassende Daten, um verlässliche Rückschlüsse zu positiven Abweichungen ableiten zu können. Digitale Quellen wie Satellitenbilder oder Mobilfunkdaten bieten großes Potenzial, sind aber nicht immer zugänglich. Hier arbeiten wir mit internationalen Partnern zusammen. Die Bestätigung, dass sich in den Daten gefundene Ausreißer auch in der Praxis wiederfinden und die Suche danach, was den Unterschied ausmacht, ist dann die nächste große Aufgabe. Wenn uns das gelingt, haben wir einen großen Schritt getan, die lokale Kreativität viel stärker in Wert zu setzen.

Welche Praxiserfahrungen gibt es bisher?

Andreas Glücker: Aktuell nutzen wir den Positive Deviance Ansatz in sieben verschiedenen Ländern und arbeiten eng mit den Projekten vor Ort zusammen. In Ecuador suchen wir nach Farmern, die innerhalb des Amazonasgebietes seit vielen Jahren Landwirtschaft betreiben und entgegen der verbreiteten Praxis nicht abholzen. In Somaliland versuchen wir positive Verhaltensweisen zu finden, die es Viehhirten ermöglicht, ihre Herden ohne große Verluste durch Dürreperioden zu bringen. Für all diese Projekte entsteht ein großer Mehrwert durch die Kombination digitaler, quantitativer Daten mit der umfassenden Expertise zu lokalen Begebenheiten, die wir vor allem durch die involvierten GIZ Projekte sicherstellen können.

Welchen Nutzen könnte diese Methode nun haben, um die Ausbreitung des Coronavirus besser zu verstehen?

Catherine Vogel: In der COVID-19 Krise haben wir in Deutschland diejenigen Landkreise gesucht, die es geschafft haben, die Ausbreitungsrate von COVID-19 deutlich schneller zu verringern, als zu erwarten wäre. Dabei konnten wir tatsächlich Landkreise identifizieren, die sich hier positiv abheben, obwohl alle bekannten positiven Einflussfaktoren schon berücksichtigt wurden. Das sind spannende Entwicklungen, die neue Erkenntnisse hinsichtlich besonderer Verhaltensweisen während einer Pandemie liefern können.

Wie ist das Vorgehen dabei? Gibt es schon erste Ergebnisse?

Andreas Glücker: Im ersten Schritt ist es wichtig, Vergleichbarkeit herzustellen, um nicht die berühmten Äpfel mit Birnen zu vergleichen. Wir haben Landkreise also nach Faktoren wie Bevölkerungsdichte gruppiert. Dann haben wir mit Hilfe von Mobilitätsmustern, auf Basis von Mobilfunk- sowie Wetterdaten, ein Modell künstlicher Intelligenz trainiert. Durch dieses Modell haben wir anschließend die jeweilige Ausbreitung vorhergesagt. Wenn die tatsächlichen Werte des Robert Koch-Instituts bei einem Landkreis deutlich besser sind als unser vorhergesagter Wert, haben wir Hinweise auf noch unentdeckte Faktoren oder Verhaltensmuster. Dies gilt es dann natürlich genauer zu untersuchen. Diesen Ansatz haben wir unter anderem in einem Nachhaltigkeits-Hackathon von Siemens eingebracht und dabei den Preis in der Kategorie „Sustainability Impact“ gewonnen.

Und wie geht es weiter?

Catherine Vogel: Die Ergebnisse aus dem COVID-19 Piloten sind vielversprechend und wir werden die identifizierten Landkreise genauer unter die Lupe nehmen. Aber auch unsere anderen Ansätze haben großes Potenzial, die Entwicklungszusammenarbeit um eine Methode zu ergänzen, die sich erst auf die Suche nach existierenden Lösungen macht, bevor man möglicherweise das Rad neu erfindet.

GIZ Data Lab

Weitere Informationen

Quelle: Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ), 22.07.2020

[:]