Das Institut für Sozialforschung der Universität von Michigan entwickelt eine neue Datenplattform

GettyImages 1377064482

[ad_1]

Konnten Sie an der Remodel 2022 nicht teilnehmen? Sehen Sie sich jetzt alle Summit-Periods in unserer On-Demand-Bibliothek an! Schau hier.


Stellen Sie sich eine Datenplattform vor, die dazu beitragen kann, die Widerstandsfähigkeit der Gemeinschaft gegenüber Naturkatastrophen zu verbessern, potenzielle Unterbrechungen der Lieferkette zu vermeiden und den Ausbruch von Infektionskrankheiten genau vorherzusagen.

Dies sind einige der Ziele einer neuen Datenplattform, die vom Institute for Social Analysis (ISR) der College of Michigan entwickelt wird und Anfang dieses Jahres von der Nationwide Science Basis (NSF) mit einer Investition von 38 Millionen US-Greenback ausgezeichnet wurde.

Die neue Datenplattform wird es Forschern in mehreren Bereichen ermöglichen, wichtige Informationen für ihre Studien effektiver zu sammeln, zu speichern und zu sichern. In der Vergangenheit waren viele Forscher mit Hindernissen wie inkompatiblen Datenstandards, fehlenden oder fehlerhaften Informationen und technischen Schwierigkeiten bei der Verwaltung großer Datensätze konfrontiert.

Die Investition der NSF in Höhe von 38 Millionen US-Greenback ermöglicht es dem Institut für Sozialforschung, das Forschungsdaten-Ökosystem aufzubauen: Eine nationale Ressource für reproduzierbare, robuste und transparente sozialwissenschaftliche Forschung im 21st Jahrhundert. ISR wird die Erstellung neuer Datenarchive und Software program beaufsichtigen, die Forscher verwenden können, um auf Daten zuzugreifen, sie zu organisieren, zu analysieren und beizutragen.

„Das Analysis Knowledge Ecosystem (RDE) ist ein fünfjähriges Projekt und soll bis Ende 2026 abgeschlossen sein“, erklärte Jeannette Jackson, Geschäftsführerin des RDE.

Die Arbeiten an RDE begannen am 17. Januar 2022 und befinden sich jetzt in der frühen Bauphase.

„Die ersten Produkte werden 2024 erhältlich sein“, bemerkte Jackson. „Das Endergebnis wird ein flexibles Datenmanagementsystem mit einer benutzerfreundlichen Oberfläche sein, das es Forschern ermöglicht, ihre Daten in einer sicheren Umgebung zu hinterlegen, zu suchen, die Cloud zu nutzen, um mit ihnen zu arbeiten und ihre Daten zu verbreiten. Das ultimative Ziel ist es, es Forschern zu erleichtern, Daten zu finden und neues Wissen zu schaffen.“

Ein dringender Bedarf an Forschungsdaten von besserer Qualität

Das Forschungsdaten-Ökosystem-Infrastrukturprojekt wurde initiiert, weil ISR die Notwendigkeit erkannt hat, Forschern, die sich mit modernsten Sozialwissenschaften beschäftigen, bessere Datenverwaltungs- und Analyseunterstützung zu bieten, sagte Jackson. ISR ist die größte akademische sozialwissenschaftliche Erhebungs- und Forschungsorganisation der Welt. Die RDE-Arbeit ist innerhalb des ISR beim Interuniversitären Konsortium für Politik- und Sozialforschung (ICPSR) angesiedelt, dem weltweit größten sozialwissenschaftlichen Archiv, das sich auf kuratierte Daten spezialisiert hat.

„RDE ist ein transformatives Infrastrukturprojekt, das die ICPSR-Softwareplattform modernisieren und eine integrierte Suite von Softwaretools entwickeln wird, um die Forschung in den Sozial- und Verhaltenswissenschaften mit Schwerpunkt auf der Demokratisierung von Daten voranzutreiben“, so Margaret „Maggie“ Levenstein, Direktorin von ICPSR und Hauptprüfer für den RDE.

Laut Levenstein wird die RDE Folgendes ermöglichen:

  • Interoperabilität: Ein integriertes System für den gesamten Forschungsdatenlebenszyklus, damit die Arbeit, die früh im Datenlebenszyklus geleistet wird, in späteren Phasen nützlich ist und es ermöglicht, Daten aus verschiedenen Quellen zu integrieren.
  • Reproduzierbarkeit: Vereinfachte Reproduktion und Weiterentwicklung früherer Forschungsergebnisse durch die Möglichkeit, Daten und Code zu finden und wiederzuverwenden.
  • Transparenz: Bereitstellung von Informationen zur Provenienz, einschließlich Quelle, Code und Erhebungsverfahren für Forschungsdaten.
  • Effizienz des Datenaustauschs: Verringerung der Belastung für Datenproduzenten beim Teilen von Daten und Sicherstellen, dass gemeinsam genutzte Daten FAIR sind (auffindbar, zugänglich, interoperabel, wiederverwendbar).
  • Vertraulichkeitsschutz: Schutz der Vertraulichkeit bei gleichzeitiger Verbesserung des Forschungszugangs.

Um diese Ziele zu erreichen, wird das Projekt das Analysis Knowledge Description Framework zur Beschreibung verschiedener Lebenszyklusereignisse von Forschungsdaten entwickeln. Dies ist eine Metadatenspezifikation ähnlich dem Useful resource Description Framework, sagte Levenstein.

„RDE wird eigenständige funktionale Komponenten für jede Part des Forschungslebenszyklus umfassen, die untereinander und mit der wichtigsten bestehenden globalen Forschungsinfrastruktur interoperabel sein werden“, sagte Levenstein. „Die Plattform wird sozial- und verhaltenswissenschaftliche Forscher unterstützen, die traditionelle (z. B. Umfragen und experimentelle) und neuartige (z. B. digitale Spuren, Bildgebung) Arten von Daten über den gesamten Forschungslebenszyklus hinweg verwenden, von der Datenerfassung über die Analyse und gemeinsame Nutzung bis hin zur Wiederentdeckung und Wiederentdeckung. Analyse.”

Diese Infrastruktur wird die Qualität, Integrität und Sicherheit von Daten verbessern. Es wird auch die Zugänglichkeit zu Daten und die Zusammenarbeit zwischen Benutzern aus sozialwissenschaftlichen und verhaltenswissenschaftlichen Disziplinen verbessern. Dies wird mit einer Benutzeroberfläche geschehen, die darauf ausgelegt ist, Daten allgemein zugänglicher zu machen, sagte Levenstein.

Verwandeln Sie Berge von Daten in Nuggets von Erkenntnissen

Die neue RDE-Plattform versucht im Grunde, ein Drawback zu lösen, das in praktisch allen Branchen auftritt – Organisationen, die Berge von Daten sammeln, die nicht immer miteinander kommunizieren, und es schwierig machen, aussagekräftige Erkenntnisse daraus zu gewinnen.

„ICPSR begann in den 1960er Jahren mit dem Aufbau digitaler Archive für sozialwissenschaftliche Daten, um die neuartigen Daten, die ISR-Forscher erstellten, zu bewahren und zu verbreiten“, sagte Jackson. „Damals wurde jeder Datensatz mit seinem eigenen maßgeschneiderten Rahmen, Berechtigungen, Metadaten usw. erstellt.“

Seitdem haben Fortschritte in der Fähigkeit des IST, Daten zu sammeln, zu einem massiven Zufluss von unterschiedlichen Datentypen und -größen geführt. Sobald die ICPSR-Softwareplattform modernisiert ist, können diese Datensätze verknüpft werden, um die Forschung in den Sozialwissenschaften zu informieren.

„Die Verwendung maßgeschneiderter Umgebungen ist sowohl für Forscher als auch für Datenanbieter extrem zeit- und kostenintensiv“, sagte Jackson. „Die resultierenden Daten sind nicht interoperabel mit anderen Teilen des Forschungsökosystems. Dies erhöht die Belastung eines Forschers und verringert die Qualität, Transparenz und Reproduzierbarkeit der Forschung. RDE wird diese effizient, in großem Umfang und auf eine Weise bewerkstelligen, die die wissenschaftlichen Requirements der sozialwissenschaftlichen Forschung verbessert.“

Die RDE-Plattform wird auf einer neuen Infrastruktur (OpenShift/Kubernetes) mit aktualisierten Cloud-nativen Technologien aufgebaut. Die Plattform besteht aus einer Reihe gemeinsam genutzter Dienste, die Funktionen wie Aufnahme, Kuration, Suche, Verbreitung, Aufbewahrung, Authentifizierung und Autorisierung abdecken.

„Die Plattform wird die Qualität der datengetriebenen sozial- und verhaltenswissenschaftlichen Forschung über den gesamten Datenlebenszyklus hinweg verbessern“, sagte Levenstein. „In Kombination mit einer auf den Menschen ausgerichteten Designschnittstelle wird dies Forschern aller Disziplinen ermöglichen, ihre Arbeit effizienter durchzuführen und Daten auf eine Weise zu erstellen, zu organisieren, zu archivieren, darauf zuzugreifen und sie zu analysieren, wie dies mit der bestehenden Infrastruktur nicht möglich ist. Die neue Infrastruktur wird auch Interaktionen zwischen anderen Teilen des Forschungsökosystems durch ein System von APIs erleichtern.“

Die breiteren Ziele der Sozialforschung

Die NSF hat in die neue Datenplattform investiert, um die sozialwissenschaftlichen Forschungskapazitäten voranzutreiben, von denen alle Bürger profitieren sollen.

„Die Forschung in den Sozial-, Verhaltens- und Wirtschaftswissenschaften zielt darauf ab, das Verständnis des menschlichen Verhaltens zu verbessern: wie wir die natürliche und soziale Welt erschaffen, darauf reagieren und von ihr geformt werden“, sagte Jackson. „Fortschritte in den Sozialwissenschaften ermöglichen eine effektive und qualitativ hochwertige Entscheidungsfindung – von Einzelpersonen, Eltern und Familien, zivilgesellschaftlichen Akteuren und Organisationen der Zivilgesellschaft, Unternehmen und evidenzbasierten politischen Entscheidungsträgern.“

Eine empirische Renaissance in den Sozialwissenschaften – in der Wissenschaftler neue Computermethoden, neue experimentelle Ansätze und neue Datenquellen verwenden – hat unser Verständnis der menschlichen Gesellschaft verändert, von den Determinanten der Ungleichheit bis hin zum Lesenlernen von Kindern, betonte Jackson.

„Diese Wissensinnovationen wurden von Forschern ermöglicht, die Zugang zu großen, neuartigen Daten – digitalen Spuren menschlicher Aktivitäten – erhielten, die sie für neue Erkenntnisse ausloteten. NSF hat erkannt, dass der Überfluss an Daten enorme Möglichkeiten schafft: Die Nutzbarmachung der Datenrevolution ist eine ihrer Prioritäten“, sagte Jackson.

NSF hat im Laufe seiner Geschichte beträchtliche Investitionen in ICPSR getätigt, einschließlich der Erleichterung des Wechsels von Bandlaufwerken zum Web.

„Wir glauben, dass NSF neben der Stärkung der bereits getätigten Investitionen in die sozialwissenschaftlichen Archive des ICPSR jetzt die Notwendigkeit erkennt, in die Fähigkeit zu investieren, mit größeren, stärker vernetzten Daten in der Cloud zu arbeiten“, sagte Jackson.

Um die Bedeutung der Investition zu verstehen, teilte Jackson ein Beispiel mit.

„Stellen Sie sich vor, Sie möchten eine bestimmte Postleitzahl untersuchen, von der bekannt ist, dass sie bestimmte gesundheitliche Probleme aufweist. Sie könnten zu ICPSR kommen und alle Arten von Studien und Daten aus dieser Postleitzahl (EEG-Daten, Umfragedaten, Videodaten, Geodaten, Strafjustizdaten, Bildungsdaten usw.) sicher und sicher identifizieren“, sagte sie. „Dann könnte man in der Cloud auf eine Weise forschen, die vorher nie möglich conflict. RDE, einmal gebaut, und in Verbindung mit der am ICPSR geleisteten Arbeit zur Kuratierung von Daten, wird es der Forschungsgemeinschaft auf allen Ebenen ermöglichen, genau das zu tun.“

Die Mission von VentureBeat soll ein digitaler Marktplatz für technische Entscheidungsträger sein, um sich Wissen über transformative Unternehmenstechnologie anzueignen und Transaktionen durchzuführen. Erfahre mehr über die Mitgliedschaft.

[ad_2]

admin

Leave a Reply

Your email address will not be published.