Wenn man versucht, Informationen aus Daten zu gewinnen, besteht der erste und wohl wichtigste Schritt darin, einen Blick darauf zu werfen, woher die Daten stammen. Im Allgemeinen kann man zwischen Primär- und Sekundärdaten unterscheiden. Primärdaten sind die Daten, die wir selbst generiert haben (wir haben Interviews geführt, wir haben etwas gemessen,...) und Sekundärdaten sind Daten, die wir irgendwo anders gefunden haben und die wir verwenden können. Diese Sekundärdaten wiederum können intern oder extern sein, je nachdem, woher wir sie haben.

Bei der Analyse von Primärdaten ist es sehr wichtig zu berücksichtigen, woher wir sie erhalten haben und ob unsere Vorgehensweise zu unerwünschten Verzerrungen führen könnte. Dies ist umso wichtiger, wenn es um Sekundärdaten geht, insbesondere um externe Daten.

  1. Datenquellen für die Datenwissenschaft umfassen die verschiedenen Quellen, aus denen Datenwissenschaftler Daten für die Analyse und Modellierung sammeln und erhalten. Diese Quellen lassen sich grob in zwei Kategorien einteilen: interne und externe.
    1. Interne Datenquellen beziehen sich auf die Daten, die innerhalb einer Organisation erzeugt und gespeichert werden.
    2. Bei externen Datenquellen handelt es sich hingegen um Daten, die von außerhalb des Unternehmens bezogen werden. Zu diesen Quellen können öffentliche Datensätze gehören, die von Regierungsbehörden, Forschungsorganisationen und Open-Data-Initiativen zur Verfügung gestellt werden.
  2. Die Datenwissenschaft für Nachhaltigkeit stützt sich auf verschiedene Datenquellen, um Umweltprobleme zu analysieren und zu lösen. Hier sind einige wichtige Datenquellen, die in der Datenwissenschaft für Nachhaltigkeit verwendet werden:
    1. Umweltüberwachungsdaten: Daten, die von Überwachungssystemen wie Luftqualitätssensoren, Wasserqualitätssensoren und Klimaüberwachungsstationen erfasst werden, liefern Informationen zu Umweltparametern, die für die Bewertung von Nachhaltigkeitsbemühungen entscheidend sind.
    2. Energieverbrauchsdaten: Daten zu Energienutzungsmustern, Stromnetzen und erneuerbaren Energiequellen helfen bei der Optimierung des Energiemanagements, der Ermittlung von Verbesserungsmöglichkeiten und der Förderung nachhaltiger Energiepraktiken.
    3. Satelliten- und Fernerkundungsdaten: Satellitenbilder und Fernerkundungsdaten bieten wertvolle Einblicke in die Landnutzung, die Entwaldung, das städtische Wachstum und die Veränderungen in den Ökosystemen und unterstützen die Bemühungen um den Naturschutz und die nachhaltige Landbewirtschaftung.
    4. Soziale Medien und Online-Plattformen: Daten von Social-Media-Plattformen und Online-Quellen können analysiert werden, um die öffentliche Stimmung, das Verbraucherverhalten und die Einstellung zur Nachhaltigkeit zu verstehen. Dies hilft bei der Gestaltung nachhaltiger Botschaften und Kampagnen zur Verhaltensänderung.
    5. Daten zur Lieferkette: Informationen über Lieferketten, einschließlich Produktlebenszyklen, Materialbeschaffung, Transportwege und Abfallmanagement, bieten Möglichkeiten zur Optimierung der Ressourcennutzung, zur Reduzierung von Abfall und zur Förderung nachhaltiger Praktiken.
    6. Geografische Daten: Geografische Daten, Karten und räumliche Datensätze tragen zur Nachhaltigkeitsanalyse bei, indem sie die Stadtplanung, den Bodenschutz, Hotspots der biologischen Vielfalt und die Auswirkungen von Infrastrukturprojekten auf die Umwelt bewerten.
    7. Öffentliche und offene Daten: Öffentlich verfügbare Daten von Regierungsbehörden und Open-Data-Initiativen bieten wertvolle Einblicke in Demografie, Umweltpolitik, Emissionsdaten und andere nachhaltigkeitsbezogene Informationen.
    8. Forschungsstudien und Berichte: Wissenschaftliche Studien, Forschungsarbeiten und Berichte liefern Daten und Erkenntnisse zu bestimmten Nachhaltigkeitsthemen und ermöglichen es Datenwissenschaftlern, auf vorhandenem Wissen aufzubauen und zu nachhaltigen Lösungen beizutragen.
(Freiwillige) Lektüre: 
https://www.analyticsvidhya.com/blog/2022/03/an-overview-of-data-collection-data-sources-and-data-mining/


Last modified: Monday, 3 July 2023, 4:41 PM