.. SPDX-FileCopyrightText: 2020 cusy GmbH .. SPDX-FileCopyrightText: 2021 cusy GmbH .. .. SPDX-License-Identifier: BSD-3-Clause Offene Daten ============ Themenbezogener Überblick über öffentliche Repositories mit Forschungsdaten. Agrarwissenschaften ------------------- `AQUASTAT Dissemination System `_ Globales Informationssystem der *Food and Agriculture Organization of the United Nations* (FAO) zu Wasserressourcen und landwirtschaftlicher Wasserbewirtschaftung `Data Commons Agriculture `_ Data Commons führt öffentliche Daten aus vielen Teilen der Welt zusammen, darunter auch Umfragen `FoodData Central `_ Daten zur Lebensmittelzusammensetzung des US Ministerium für Landwirtschaft (USDA) `Hyperspectral benchmark dataset on soil moisture `_ Hyperspektral- und Bodenfeuchtedaten aus einer Lysimeter-Feldkampagne auf der Grundlage einer Bodenprobe. Karlsruhe (Deutschland), 2017 `Index DataBase `_ Vegetationsindizes des Instituts für Nutzpflanzenwissenschaften und Ressourcenschutz (INRES) `PLANTS Database `_ Standardisierte Informationen über Gefäßpflanzen, Moose und Flechten in den USA Bildverarbeitung ---------------- `10k US Adult Faces Database `_ Über zehntausend natürliche Gesichtsfotos sowie verschiedene Messwerte für 2.222 dieser Gesichter, darunter Einprägsamkeitswerte, psychologische Merkmale Merkmale sowie Anmerkungen zu Orientierungspunkten `Action Similarity Labeling (ASLAN) Challenge `_ Videodatenbank mit Handlungen und einem umfassenden Testprotokoll zur Untersuchung der Ähnlichkeit von Handlungen `Affective Image Classification `_ Affektive Bildklassifizierung unter Verwendung von Merkmalen, die von der Psychologie und der Kunsttheorie inspiriert sind `AI Detector Arena Benchmark Dataset `_ Datensatz zur Bewertung von KI-Bilderkennungswerkzeugen `Airborne Object Tracking Dataset (AOT) `_ Datensatz zur Verfolgung von Flugobjekten `All-Age-Faces (AAF) Database `_ Der All-Age-Faces (AAF)-Datensatz enthält 13.322 Gesichtsbilder überwiegend asiatischer Personen aus allen Altersgruppen `animals with attributes `_ Ein Datensatz für die attributbasierte Klassifizierung `Arabic Font Classification `_ Klassifizierung arabischer Schriftarten, :abbr:`s. a. (siehe auch)` `Arabic Font Classification `__ `Biometrically Filtered Famous Figure (B3FD) Dataset `_ Datensatz mit Gesichtsbildern zur Altersschätzung `CADDY Underwater Stereo-Vision Dataset `_ Human-Robot Interaction (HRI) für Taucher und autonomes Unterwasserfahrzeuge `Caltech Vision Lab Datasets `_ Siehe auch `caltechvisionlab.github.io `_ `Cat Dataset `_ Über 9.000 Bilder von Katzen mit beschrifteten Gesichtsmerkmalen `CCAgT `_ Bilder von Gebärmutterhalszellen, gefärbt mit der AgNOR-Methode `Chars74K dataset `_ Zeichenerkennung in natürlichen Bildern `Cube++ `_ 4890 Bilder verschiedener Szenen unter unterschiedlichen Bedingungen `Danbooru2021 `_ Umfangreiche Anime-Bilddatenbank mit über 4,9 Millionen Bildern und über 162 Millionen Tags `Densely Annotated Video Driving Data Set `_ 28 im CARLA-Simulator aufgezeichnete Fahrsequenzen mit insgesamt 10.767 Einzelbildern `ETH Entomological Collection (ETHEC) Dataset `_ Daten für die hierarchische Bildklassifizierung unter Verwendung von Entailment-Cone-Einbettungen `Face Image Project `_ Ungefilterte Gesichter zur Geschlechts- und Altersklassifizierung `Face Recognition Databases `_ Datensätze zum Benchmarking von Gesichtserkennungsalgorithmen `FlickrLogos `_ Firmenlogos von Flickr in verschiedenen Situationen `Fluorescent Neuronal Cells v2 `_ Sammlung von Fluoreszenzmikroskopiebildern und den dazugehörigen Referenz-Annotationen `HumanEva Dataset `_ Sieben kalibrierte Videosequenzen, die mit 3D-Körperhaltungen synchronisiert sind `IEEE DataPort: Image Processing `_ IEEE-Datensätze zur Bildverarbeitung `ImageNet `_ Bilddatenbank, die nach der `WordNet `_-Hierarchie gegliedert ist `Indoor Scene Recognition `_ Bilder für die Erkennung von Innenräumen `Iranis Dataset `_ Umfangreicher Datensatz mit mehr als 83.000 Bildern von persischen Zahlen und Buchstaben, die aus realen Kfz-Kennzeichen stammen `KITTI Vision Benchmark Suite `_ Computer-Vision-Benchmarks für reale Umgebungen mit den Schwerpunkten Stereo, optischer Fluss, visuelle Odometrie, 3D-Objekterkennung und 3D-Tracking `Labeled Information Library of Alexandria: Biology and Conservation (LILA BC) `_ Repository für Datensätze aus den Bereichen Biologie und Naturschutz `Labelled Faces in the Wild (LFW) Dataset `_ Datenbank mit Gesichtsfotos, die zur Untersuchung des Problems der uneingeschränkten Gesichtserkennung `LLVIP: A Visible-infrared Paired Dataset for Low-light Vision `_ Gepaarte Sichtlicht-Infrarot-Datensätze für die Bildverarbeitung bei schlechten Lichtverhältnissen `Multi-View Region of Interest Prediction Dataset for Autonomous Driving `_ Im CARLA-Simulator aufgenommene Multi-View-Bilder mit Markierungen für Bereiche von Interesse `Newspaper Navigator `_ Experimentelle Anwendung zum Auffinden historischer Zeitungsbilder anhand visueller Ähnlichkeit `Open Images Dataset V6 `_ 1.743.042 Trainingsbilder mit Begrenzungsrahmen, Objektsegmentierungen, visuelle Beziehungen und lokalisierten Beschreibungen `Oxford-IIIT Pet Dataset `_ Datensatz mit 37 Kategorien zu Haustieren `Roboflow Computer Vision Datasets `_ Öffentliche Datensätze für Computer Vision `Stanford Dogs Dataset `_ Bilder von 120 Hunderassen aus aller Welt mit Annotationen aus ImageNet `SUN database project `_ Sammlung annotierter Bilder mit einer großen Vielfalt an Umgebungsszenen, Orten und den darin befindlichen Objekten `SVIRO Dataset and Benchmark `_ Synthetic dataset for Vehicle Interior Rear seat Occupancy (SVIRO) ist ein synthetischer Datensatz zur Erkennung und Klassifizierung der Belegung der Rücksitze im Fahrzeuginnenraum `TikTok dataset `_ Auf der CVPR 2021 veröffentlichter Datensatz, der in der Arbeit „Learning High Fidelity Depths of Dressed Humans by Watching Social Media Dance Videos“ vorgestellt wurde `Violent-Flows Database `_ Datenbank und Benchmark für Gewalt in Menschenmengen und Gewaltfreiheit `Visual Genome `_ Datensatz und Wissensdatenbank, um strukturierte Bildkonzepte mit Sprache zu verknüpfen `X-ray images `_ Die in GDXray+ enthaltenen Röntgenbilder dürfen ausschließlich für Forschungs- und Bildungszwecke verwendet werden `YouTube-BoundingBoxes Dataset `_ Umfangreicher Datensatz aus Video-URLs mit dicht gestreuten, hochwertigen Annotationen von Begrenzungsrahmen für einzelne Objekte `YouTube-8M Segments `_ Von Menschen verifizierte Labels für etwa 237.000 Segmente in 1.000 Klassen Biologie -------- `American-Gut `_ Open-Access-Code und IPython-Notebooks des `American Gut `_-Projekts `ArrayExpress - Functional Genomics Data `_ Daten aus Experimenten der funktionellen Genomik `Catalogue of Life (COL) `_ Integrierte Liste aller weltweit bekannten Arten `Cell Image Library (CIL) `_ Über 12.000 Datensätze des *Center for Research in Biological Systems* (CRBS) `CytoImageNet `_ Umfangreicher Datensatz für das Vortraining mit Mikroskopiebildern `Electron Microscopy Data Bank (EMDB) `_ Daten aus der Kryo-Elektronenmikroskopie (Kryo-EM) sowie für repräsentative Tomogramme von makromolekularen Komplexen und subzellulären Strukturen `EMBL-EBI `_ Datenquellen und Analysewerkzeuge des Europäischen Bioinformatik-Instituts des Europäischen Laboratoriums für Molekularbiologie (EMBL) `ENCODE portal `_ Das :abbr:`ENCODE (Encyclopedia of DNA Elements)`-Konsortium ist ein fortlaufendes internationales Kooperationsprojekt von Forschungsgruppen, das vom `National Human Genome Research Institute (NHGRI) `_ finanziert wird `EnsemblGenomes `_ Genomdaten für wirbellose Arten sowie Werkzeuge zur Bearbeitung, Analyse und Visualisierung dieser Daten `FireBrowse portal `_ FireBrowse bietet Zugriff auf eine Vielzahl von Daten zur Krebsgenomik, darunter klinische Anmerkungen, DNA-Kopienzahl, miR, miRseq, mRNA und mRNAseq `Gene Expression Omnibus `_ Funktionelle Genomikdaten, das die Einreichung von `MIAME `_-konformen Daten unterstützt `Gene Ontology `_ Gene Ontology (GO)-Wissensdatenbank zu den Funktionen von Genen `Genomic Data Commons Data Portal `_ Daten aus genomischen Krebsstudien `Global Biotic Interactions (GloBI) `_ Daten über Arteninteraktionen, :abbr:`z. B. (zum Beispiel)` Raubtier-Beute, Bestäuber-Pflanze, Erreger-Wirt, Parasit-Wirt `ICOS PSP benchmarks `_ Sammlung praxisnaher Benchmarks, die sich zum Testen der Skalierbarkeit von Klassifizierungs- und Regressionsmethoden der :abbr:`ICOS (Interdisciplinary Computing and Complex BioSystems)`-Forschungsgruppe `IGSR: The International Genome Sample Resource `_ Im Rahmen des »1000-Genome«-Projekts wurde ein Katalog häufiger genetischer Variationen beim Menschen erstellt `Journal of Cell Biology `_ Eine Sammlung von Bilddaten zu Artikeln, die im »Journal of Cell Biology« eröffentlicht wurden. `KEGG: Kyoto Encyclopedia of Genes and Genomes `_ Datenbank zu übergeordneten Funktionen und Zusammenhängen biologischer Systeme wie Zellen, Organismen, Ökosysteme und der Biosphäre anhand von Informationen auf molekularer Ebene `NIH Human Microbiome Project Catalog `_ Metadaten zu allen Referenzgenomen von Isolaten mit Bezug zum Menschen sowie zu Proben des Metagenoms gesunder Menschen `National Center for Biotechnology Information `_ Datenbanken, :abbr:`u. a. (unter anderem)` zu Chemikalien und Bioassays, DNA und RNA, Homologie `openSNP `_ Repository für genetische und phänotypische Daten `palmerpenguins `_ Datensatz für die Datenexploration und -visualisierung als Alternative zu Iris `Pathguide `_ Ressourcen zu biologischen Signalwegen und molekularen Interaktionen `RCSB Protein Data Bank (RCSB PDB) `_ Daten zu experimentell ermittelte 3D-Strukturen, integrativen 3D-Strukturen und computergenerierten Strukturmodellen (CSM) `Personal Genome Project `_ Öffentlich zugängliche Daten zu Genom, Gesundheit und Merkmalen `PGC Data Access Portals `_ Portale dienen der Abfrage von Daten auf individueller Ebene bzw. mit eingeschränktem Zugriff `Rfam `_ Sammlung von RNA-Familien, die jeweils durch Multiple sequence alignment (MSA), Konsensus-RNA-Strukturen und Kovarianzmodelle dargestellt werden `SSBD:database `_ Offene Ressourcen zur Analyse von Mikroskopbildern und quantitativen Daten biologischer Objekte, wie Einzelmoleküle, Zellen, Gewebe, Individuen :abbr:`usw. (und so weiter)` `UniGene `_ NCBI-Datenbank zum Transkriptom und somit nicht in erster Linie eine Datenbank für Gene `UniProt `_ Frei zugängliche Quelle für Proteinsequenzen und funktionelle Informationen `UCSC Genome Browser `_ Sequenz- und Annotationsdaten für die im UCSC Genome Browser dargestellten Génomsequenzen Chemie ------ `Ionic Liquids Database - ILThermo `_ Online-Recherchetool für thermodynamische und Transporteigenschaften von ionischen Flüssigkeiten sowie von binären und ternären Gemischen, die ionische Flüssigkeiten enthalten `PubChem `_ Sammlung frei zugänglicher chemischer Informationen des «National Center for Biotechnology Information» Computernetzwerke ----------------- `CAIDA Data `_ Internet-Topologie der Anordnung und Vernetzung von Geräten innerhalb autonomer Systeme (AS) des Internets `Click Dataset `_ Rund 53,5 Milliarden HTTP-Anfragen von Nutzer*innen der Indiana University `ClueWeb09 Dataset `_ Etwa 1 Milliarde Webseiten in zehn Sprachen, die im Januar und Februar 2009 gesammelt wurden `ClueWeb12 Dataset `_ 733.019.372 englischsprachige Webseiten, die zwischen dem 10. Februar 2012 und dem 10. Mai 2012 erfasst wurden `Common Crawl `_ Freies, offenes Repository mit Web-Crawling-Daten `Criteo 1TB Click Logs Dataset `_ Merkmalswerte und Klickdaten für Millionen von Display-Anzeigen um Algorithmen zur Vorhersage der Klickrate (CTR) zu bewerten `Merklemap DNS records database `_ Datenbank für :abbr:`DNS (Domain Name System)`-Einträge mit mehr als 4 Milliarden Einträgen `MIRAGE Project `_ Reproduzierbare Architektur zur Erfassung des Datenverkehrs mobiler Apps und zur Erstellung von Referenzdaten `MobiPerf `_ MobiPerf ist eine Open-Source-Anwendung zur Messung der Netzwerkleistung (Durchsatz, Latenz :abbr:`etc. (et cetera)`) auf mobilen Plattformen `Shopper Intent Prediction from Clickstream E‑Commerce Data `_ Vorhersage der Kaufabsicht anhand von E-Commerce-Clickstream-Daten `Stanford Internet Research Data Repository `_ Öffentliches Archiv mit Forschungsdatensätzen, die Hosts, Dienste und Websites im Internet beschreiben `Open Observatory of Network Interference (OONI) `_ Gemeinnütziges freies Software-Projekt, dessen Ziel es ist, dezentrale Initiativen zur Dokumentation von Internetzensur weltweit zu unterstützen `Project Sonar `_ SSL-, DNS-, HTTP- und UDP-Verbindungen öffentlicher Netzwerke `UCSD Network Telescope `_ Passives System zur Verkehrsüberwachung, das auf einem weltweit verteilten, aber nur gering ausgelasteten /9- und /10-Netzwerk basiert. Energiesektor ------------- `Almanac of Minutely Power dataset (AMPds) `_ Messdaten zu Strom, Wasser und Erdgas im Minutentakt aus zwei Jahren `Commercial Building Energy Dataset (COMBED) `_ Energiebezogener Datensatz aus einem Geschäftsgebäude, bei dem die Daten mehr als einmal pro Minute erfasst wurden `Direct Borohydride Fuel Cell (DBFC) Dataset `_ Impedanz- und Polarisationsmessung an der Anode mit Pd/C-, Pt/C- und Pd-beschichteten Ni–Co/rGO-Katalysatoren `Domestic Electrical Load Survey (DELS) Secure Data 1994–2014 `_ Der „DELS Secure Data“-Datensatz enthält anonymisierte Umfrageantworten `ECO data set (Electricity Consumption & Occupancy) `_ Nicht-intrusive Lastüberwachung und Anwesenheitserkennung im Zeitraum von acht Monaten in sechs Schweizer Haushalten `EIA-923 `_ Der Fragebogen EIA-923 erfasst detaillierte Stromdaten zu Stromerzeugung, Brennstoffverbrauch, Vorräten an fossilen Brennstoffen sowie Wareneingängen auf Ebene der Kraftwerke und der Antriebsmaschinen `Global Power Plant Database `_ Weltweite Open-Source-Datenbank für Kraftwerke `Household Electricity Study - EV0702 `_ Daten zum Stromverbrauch in Haushalten von April 2010 bis April 2011 von Haushaltsgeräten in insgesamt 251 Eigenheimbewohnerhaushalten in ganz England `High Frequency EMI Data Set (HFED) `_ Datensatz zu hochfrequenten elektromagnetischen Störungen (EMI) mit Messkurven, die von einem Signalanalysator und einem Universal Software Radio Peripheral (USRP) stammen `Moroccan buildings’ electricity consumption dataset (MORED) `_ Daten zum Stromverbrauch verschiedener städtischer Gebäude in marokkanischen Städten `Marktstammdatenregister (MaStR) `_ Stammdaten des Strom- und Gasmarktes `Proton Exchange Membrane (PEM) Fuel Cell Dataset `_ Standardtests an Nafion-112-Membranen sowie MEA-Aktivierungstests einer PEM-Brennstoffzelle unter verschiedenen Betriebsbedingungen `Plug Load Appliance Identification Dataset (PLAID) `_ Spannungs- und Strommessungen mit einer Abtastrate von 30 kHz an 11 verschiedenen Gerätetypen in mehr als 60 Haushalten in Pittsburgh, Pennsylvania `Public Utility Data Liberation Project (PUDL) `_ Open-Source-Datenverarbeitungs-Pipeline, die den Zugriff auf US-Energiedaten sowie deren programmgesteuerte Nutzung erleichtert `Smart Meter Data Listing `_ Liste mit Datensätzen zu Smart Meter `SynD `_ Synthetic energy dataset for non-intrusive load monitoring in households (SynD) liefert einen synthetischen Energiedatensatz mit Schwerpunkt auf Wohngebäude `tracebase data set `_ Sammlung von Stromverbrauchsdaten für Forschungszwecke im Bereich der Energieanalyse `UK Domestic Appliance-Level Electricity (UK-DALE) dataset `_ Strombedarf von fünf Häusern und einzelner Geräte alle sechs Sekunden `Indian Dataset for Ambient Water and Energy `_ Energieüberwachung und Energieverbrauch eines Hauses in Indien für 73 Tage Finanzsektor ------------ `BIS Data Portal `_ Die Bank für internationalen Zahlungsverkehr *Bank for International Settlements* (BIS) stellt Statistiken in Zusammenarbeit mit Zentralbanken und anderen nationalen Behörden `Cboe Futures Exchange Market Data `_ Tägliche Marktstatistiken und Abschlusskurse, Kursübersicht und weitere Marktdaten-Services `EDGAR `_ Electronic Data Gathering, Analysis, and Retrieval (EDGAR) ist das zentrale System für Unternehmen, die Unterlagen gemäß Securities Act, Securities Exchange Act, Trust Indenture Act und Investment Company Act einreichen `FAANG- Complete Stock Data `_ Daten zu den Aktien der FAANG (Facebook, Amazon, Apple, Netflix und Google)-Unternehmen seit Beginn ihrer Börsennotierung `Federal Reserve Economic Data (FRED) `_ Online-Datenbank, die Hunderttausende von Zeitreihen mit Wirtschaftsdaten aus zahlreichen nationalen, internationalen, öffentlichen und privaten Quellen umfasst `Google Finance `_ Suche nach Aktien, ETFs :abbr:`etc. (et cetera)` `Nasdaq Data Link `_ Plattform für Finanz- und alternative Daten, die Finanzfachleuten nützliche Informationen und Tools für die Erfassung, Verwaltung und Analyse von Daten bietet `NYSE Exchange Proprietary Market Data `_ Echtzeit-Marktdaten mit geringer Latenz decken die verschiedenen Anlageklassen und Märkte der NYSE Group ab `Yahoo Finance `_ Finanznachrichten, Daten und Kommentare, darunter Aktienkurse, Pressemitteilungen, Finanzberichte und eigene Inhalte .. _geodata-repositories: Geo- und Umweltwissenschaften ----------------------------- `AODN Portal `_ Daten des *Australian Ocean Data Network* (AODN) und des *Integrated Marine Observing System* (IMOS) `Alabama's Real-Time Coastal Observing System (ARCOS) `_ Umweltüberwachungsdaten in und um die Mobile Bay `BODC Database `_ Sammlung von Meeresdatensätzen des British Oceanographic Data Centre (BODC) `Common Metadata Repository (CMR) `_ Such-API für die Metadaten der NASA zu fernerkundeten Geowissenschaften `Earth Models `_ Modellierungswerkzeuge und Datensätze zur Erde `Earthdata Data Catalog `_ Das „Earth Science Data Systems“ (ESDS) Programm bietet freien Zugang zum Archiv der NASA mit geowissenschaftlichen Daten `Earthquake Catalog `_ Aktuelle oder vergangene Erdbeben, Erdbebenressourcen nach Bundesstaaten und Webdienste `Global Volcanism Program `_ Katalog der Vulkane des Holozäns und Pleistozäns sowie ihrer Ausbrüche aus den letzten 12.000 Jahren `Global Wind Atlas `_ Webbasierte Anwendung für um Entscheidungsträger, Planer und Investoren, um Gebiete mit starken Winden für die Windenergieerzeugung zu identifizieren `Meteoritical Bulletin Database `_ Internationale Datenbank offiziell anerkannter Meteoriten und ihrer Fundorte `National Data Buoy Center `_ Meteorologische und ozeanografische Messungen für die Meeresumwelt `National Estuarine Research Reserve System `_ Kurzfristige Schwankungen und langfristige Veränderungen in der Integrität und Biodiversität der Flussmündungsökosysteme und Küstengewässer `Norwegian Polar Data Centre: Datasets `_ Antarktis, Arktischer Ozean und Spitzbergen `PANGAEA Publisher for Earth & Environmental Science `_ Georeferenzierte Daten zu Chemie, Lithosphäre und Atmosphäre, Biologie und Paläontologie, Ozeanen und Landflächen, Fischerei und Landwirtschaft :abbr:`etc. (et cetera)` `Radiance – Global Light Pollution Visualization & Analysis `_ Für Astrofotografie, Astrophysik und den Schutz des Nachthimmels `UC Irvine Machine Learning Repository `_ Datensätze zum maschinellen Lernen mit Daten zur Luftqualität, zur Erkennung von Ozonwerten, zur Konzentration von Treibhausgasen, zur aquatischen Toxizität und mehr `UK National Data Repository (NDR) for offshore petroleum-related licence information `_ In Zukunft sollen auch Aufzeichnungen zu Lizenzen für die Erkundung und Speicherung von Kohlendioxid gespeichert werden `WHPA Prediction `_ Datensatz im Rahmen der Studie *A new framework for experimental design using Bayesian Evidential Learning* .. seealso:: `List of GIS data sources `_ Gesundheitswesen ---------------- `covid-19-lake `_ AWS S3 Explorer `COVID-19 Case Surveillance Public Use Data `_ COVID-19-Fallüberwachung bis zum 1. Juli 2024 `Health Inspection Scores (2024-Present) `_ Ergebnisse der Gesundheitsinspektionen, die vom Gesundheitsamt San Francisco von 2024 bis heute durchgeführt wurden `Novel Coronavirus (COVID-19) Cases, provided by JHU CSSE `_ COVID-19-Datenbank des Center for Systems Science and Engineering (CSSE) an der Johns Hopkins University (archiviert am 10. März 2023) `NYT Coronavirus (Covid-19) Data in the United States `_ Eine Datenbank mit Daten zu Coronavirus-Fällen und Todesfällen in den USA `HealthData.gov `_ Daten, Tools und Ressourcen aus dem Bereich Gesundheit und Soziales `The COVID Tracking Project `_ Gemeldete Daten in unterschiedlichen Einheiten und nach unterschiedlichen Definitionen der US-Bundesstaaten und Territorien `Vitalnet Data Scenarios `_ Ein „Datenszenario“ von Vitalnet ist eine vollständige Datenanalysesituation `Genomic Data Commons (GDC) `_ Repository und Rechenplattform für Krebsforscher, die sich mit Krebs, seinem klinischen Verlauf und dem Ansprechen auf Therapien befasst `Gapminder `_ Vollständige Datensätze mit Hunderten von Indikatoren `Medical Subject Headings `_ Der Thesaurus „Medical Subject Headings“ (MeSH) ist ein kontrolliertes und hierarchisch gegliedertes Vokabular, das von der National Library of Medicine erstellt wurde `MeDAL dataset `_ Medical Abbreviation Disambiguation Dataset for Natural Language Understanding Pretraining (MeDAL) `Medicare Coverage Database (MCD) `_ Verfahren und Zeitpläne zur Feststellung des Versicherungsschutzes `data.cms.gov `_ Daten des Centers for Medicare & Medicaid Services Data (CMS) `Nightingale Open Science `_ Datensätze zu Herzinfarkt, Krebsmetastasen, Herzstillstand, Knochenalterung, Covid-19 `Ebola Cases and Deaths in Affected Countries `_ Gesamtzahl der wahrscheinlichen, bestätigten und vermuteten Ebola-Fälle und Todesfälle in Guinea, Liberia, Sierra Leone, Nigeria, Senegal, Mali, Spanien, den USA, Großbritannien und Italien `Organisation Data Service (ODS) `_ Datenservice des National Health Service (NHS) in England `OpenPaymentsData.CMS.gov `_ Zahlungen an Krankenhäuser und Gesundheitsdienstleister von medizinischen Unternehmen `PhysioNet `_ Datenbanken von PhysioNet `Spanish Flu Dataset `_ Sterblichkeit infolge der Grippepandemie von 1918, Chicago, USA `Cancer Imaging Archive `_ Das Cancer Imaging Archive (TCIA) ist ein Dienst, der ein umfangreiches Archiv medizinischer Krebsbilder anonymisiert und bereitstellt `US Water Quality Data by ZIP Code `_ Tägliche Daten zur Wasserqualität in den USA nach Postleitzahl – Verstöße gegen EPA-Vorschriften, Bleigehalte, Sicherheitsbewertungen `The Global Health Observatory `_ Das GHO-Datenarchiv ist das Portal der WHO für gesundheitsbezogene Statistiken ihrer 194 Mitgliedstaaten `Informatics for Integrating Biology & the Bedside (i2b2) `_ NLP-Forschungsdatensätze Klima und Wetter ---------------- `38-Cloud: A Cloud Segmentation Dataset `_ 38 Landsat-8-Bilder sowie die manuell extrahierten Referenzwerte auf Pixelebene für die Wolkenerkennung `Aviation Weather Center `_ Warnungen, Vorhersagen und Analysen zu gefährlichen Wetterlagen für die Luftfahrt `Actuaries Climate Index `_ Monatliche und saisonale Daten nach Region und Komponente `Average city temperatures `_ Tägliche Daten zu den durchschnittlichen Lufttemperaturen in Großstädten weltweit `Canadian Weather Information `_ Historische Daten nach Stationsname, Provinz, Territorium oder nach Entfernung `Caravan `_ Globaler Datensatz für die Hydrologie mit großen Stichproben `CDC – Climate Data Center `_ Klimadaten des Deutschen Wetterdienstes (DWD) `Climate Data Online (CDO) `_ Statistiken, aktuelle Wetterbeobachtungen und Klimadaten aus dem Australian Data Archive for Meteorology (ADAM) `Climatic Research Unit `_ Von der CRU des National Centre for Atmospheric Science (NCAS) bereitgestellte Daten `Copernicus Climate Change Service (C3S) `_ Einer der sechs thematischen Dienste, die im Rahmen des Copernicus-Programms der Europäischen Union bereitgestellt werden `European Climate Assessment & Dataset (ECA&D) `_ Datensätze über Veränderungen bei Wetter- und Klimaextremen `GDELT Project: Four Massive Datasets Charting The Global Climate Change News Narrative 2009-2020 `_ Vier umfangreiche Datensätze zur Darstellung der Berichterstattung über den globalen Klimawandel 2009–2020 `NOAA Global Radiation and Aerosols (GRAD) Data `_ Langzeitmessungen der Strahlung, meteorologischer Parameter und Aerosole an verschiedenen abgelegenen Standorten weltweit sowie an Standorten auf dem amerikanischen Kontinent `NOAA Local Climatological Data (LCD) `_ Zusammenfassungen der klimatologischen Bedingungen von Flughäfen und anderen bedeutenden Wetterstationen `Open-Meteo `_ Offene Daten mit einer hohen Auflösung von 1 bis 11 Kilometern `WorldClim `_ Karten, Grafiken, Tabellen und Daten zum globalen Klima Komplexes Netzwerk ------------------ `Archive-IT `_ Archivierte Websites und Webseiten `CRAWDAD `_ „Community Resource for Archiving Wireless Data at Dartmouth“ (CRAWDAD) `DIMACS `_ Benchmarks für Generatoren synthetischer und realer Eingaben, Kurzstreckenberechner und Skripte zur Erstellung von Benchmark-Leistungsberichten sowie eine ausführliche Dokumentation `DOI URLs `_ DOIs von knapp 50 Millionen Zeitschriftenartikeln vom :abbr:`OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)`-Server `Internet Archive Dataset Collection `_ Umfangreiche Datenarchive sowohl von Institutionen als auch von Einzelpersonen `KONECT `_ Netzwerkdatensätze aus der Koblenz Network Collection `Laboratory for Web Algorithmics `_ Daten für das `WebGraph `_-Framework `Mark Newman: Network data `_ Links zu Netzwerkdatensätzen im GML-Format `Microsoft Research Tools: code, datasets, & models `_ Verzeichnis von Datensätzen, SDKs, APIs und Open-Source-Tools, die von Microsoft-Forschern entwickelt wurden `NBER U.S. Patent Citations Data File `_ Erkenntnisse, Einsichten und methodische Instrumente `Network Repository `_ Interaktives Daten- und Netzwerkdaten-Repository mit visueller Echtzeit-Analyse mit Tausenden von Datensätzen aus über 30 Fachgebieten von biologischen bis hin zu sozialen Netzwerkdaten `NIST Complex Network Resources `_ Standarddatensätze, anhand dessen Algorithmen und Behauptungen verglichen und überprüft werden können `The R Datasets Package `_ Das R-Paket ``datasets`` `PyPi/Maven dependency data `_ Drei LZMA-komprimierte Dateien: mvn-deps.csv.lzma, mvn-minimal-deps.csv.lzma und pypi-deps.csv.lzma `Scopus `_ Datenbank für Abstracts und Zitate `Stack Overflow Annual Developer Survey `_ Jährliche Entwicklerumfrage von Stack Overflow `Stanford GraphBase `_ `Literate Programming `_ mit mehr als 30 Beispielen `Stanford Large Network Dataset Collection `_ Sammlung des Stanford Network Analysis Project, :abbr:`u.a. (unter anderem)` zu sozialen Netzwerken, Zitations- und Kooperationsnetzwerke, Straßennetze und Wikipedia-Netzwerke `SuiteSparse Matrix Collection `_ Sammlung dünnbesetzter Matrizen `UCI Network Data Repository `_ Datensätze des UCI Network Data Repository, :abbr:`u.a. (unter anderem)` Sammlungen klassischer Netzwerkdatensätze und von Forschungsgruppen oder Organisationen kuratierte Datensätze Medizin ------- `BCNB `_ WSI-Datensatz zur Kernnadelbiopsie bei Brustkrebs im Frühstadium `Broad Bioimage Benchmark Collection `_ Die Broad Bioimage Benchmark Collection (BBBC) ist eine Sammlung von Mikroskopiebildersätzen. Neben Bildern enthält jeder Satz eine Beschreibung der biologischen Anwendung sowie erwartete Ergebnisse `Catalogue Of Semantic Mutations In Cancer (COSMIC) `_ Daten von COSMIC, Cell Lines Project, Actionability und Cancer Mutation Census (CMC) `CCLE Cancer Cell Line Encyclopedia `_ Krebszelllinien-Modelle zur Erforschung der Krebsbiologie, zur Validierung von Krebs-Targets und zur Bestimmung der Wirksamkeit von Medikamenten `Genomics of Drug Sensitivity in Cancer datasets `_ Datensätze und Merkmale zur Genomik der Arzneimittelempfindlichkeit bei Krebserkrankungen `Grand Challenge `_ Plattform für maschinelles Lernen in der medizinischen Bildgebung `HMS LINCS Project `_ Das :abbr:`LINCS (Library of Integrated Network-based Cellular Signatures)`-Projekt sammelt und verbreitet Daten und Analysewerkzeuge, um zu verstehen, wie menschliche Zellen auf Störungen durch Medikamente, die Umwelt und Mutationen reagieren. `Serratus `_ Kollaboratives Open-Science-Projekt zur Erkennung von Viren `Stowers Original Data Repository `_ Die den wissenschaftlichen Publikationen zugrunde liegenden Daten des Stowers Institute for Medical Research Natürliche Sprache ------------------ `Automatic Keyphrase Extraction `_ Datensätze für die automatische Extraktion von Schlüsselbegriffen `The Big Bad NLP database `_ Mehr als 400 gut strukturierten NLP-Datensätzen für gängige NLP-Aufgaben und -Anforderungen, wie Dokumentenklassifizierung, automatische Bildbeschriftung, Dialoge, Clustering, Intent-Klassifizierung, Sprachmodellierung, maschinelle Übersetzung, Textkorpora und vieles mehr `Blizzard Challenge 2018 `_ Ca. 6,5 Stunden Sprachdaten in britischem Englisch von einer einzigen Sprecherin `The Blog Authorship Corpus `_ Beiträge von 19.320 Bloggern, die im August 2004 von blogger.com gesammelt wurden `CLiPS Stylometry Investigation (CSI) Corpus `_ Jährlich erweiterter Korpus von studentischen Aufsätzen und Rezensionen `DBpedia `_ Aktuelle Veröffentlichungen der Kerndaten von en.wikipedia.org `List of Dirty, Naughty, Obscene, and Otherwise Bad Words `_ Filter für Shutterstocks Autovervollständigungsserver und Empfehlungsmaschine `European Parliament Proceedings Parallel Corpus 1996-2011 `_ Ein Parallelkorpus für die statistische maschinelle Übersetzung `Explanation Bank `_ Inferenzalgorithmen, die komplexe Fragen beantworten und für Menschen verständliche Erklärungen liefern `German Political Speeches Corpus and Visualization `_ Politische Reden deutscher Spitzenpolitiker, die überwiegend ab 1990 gehalten wurden `Google Books Ngram Viewer Datasets `_ Der Google Books Ngram Viewer ist für die schnelle Abfrage der Verwendung kleinerer Wortgruppen optimiert `Gutenberg Offline Catalogs `_ eBooks von Project Gutenberg `The LJ Speech Dataset `_ Gemeinfreier Sprachdatensatz, der aus 13.100 kurzen Audioclips besteht `Making Sense of Microposts (#Microposts2016) `_ Tweets des Redites-Projekt, die zahlreiche bemerkenswerte Ereignisse aus den Jahren 2011 und 2013 abdecken `MC-AFP `_ Datensatz zu *Machine Comprehension* auf der Grundlage des Gigaword-Datensatzes `Machine Comprehension Test (MCTest) `_ Sammlung von 660 Geschichten und dazugehörigen Fragen `MS MARCO `_ Datensätze zur Generierung natürlicher Sprache, zur Rangfolge von Textpassagen, zur Extraktion von Schlüsselbegriffen, zur dialogorientierten Suche und einen Crawling-Datensatz `Multi-Domain Sentiment Dataset `_ Produktbewertungen von Amazon.com aus vielen verschiedenen Produktkategorien (Domänen) `No Language Left Behind (NLLB - 200vo) `_ Datensatz auf der Grundlage von Metadaten für von Meta AI veröffentlichten, extrahierte Bitexten `Noisy speech database for training speech enhancement algorithms and TTS models `_ Datenbank mit klarer und verrauschter Parallelsprache `Personae Corpus `_ Das „Personae“-Korpus wurde für Experimente zur Urheberschaftszuschreibung und Persönlichkeitsvorhersage zusammengestellt `SMS Spam Collection `_ Der Korpus wurde aus freien oder für Forschungszwecke frei zugänglichen Quellen im Internet zusammengestellt `SQuAD2.0 – The Stanford Question Answering Dataset `_ SQuAD 2.0 testet die Fähigkeit eines Systems, nicht nur Fragen zum Leseverständnis zu beantworten, sondern auch keine Antwort zu geben, wenn eine Frage nicht beantwortet werden kann `Universal Dependencies `_ Framework für die konsistente Annotation von Grammatik (Wortarten, morphologische Merkmale und syntaktische Abhängigkeiten) in verschiedenen menschlichen Sprachen `USENET corpus `_ Sammlung öffentlicher USENET-Beiträge zwischen Oktober 2005 und Januar 2011 `Web 1T 5-gram Version 1 `_ Die N-Gram-Häufigkeiten wurden aus Texten generiert, die von öffentlich zugänglichen Webseiten stammen `Wikidata `_ Wikidata Datenbank-Dumps `Wordbank `_ Eine offene Datenbank zur Wortschatzentwicklung von Kindern `WordNet – A Lexical Database for English wndb(5WN) `_ Umfangreiche lexikalische Datenbank der englischen Sprache. Substantive, Verben, Adjektive und Adverbien sind in Gruppen kognitiver Synonyme (Synsets) zusammengefasst Neurowissenschaften ------------------- `Allen Institute Brain Knowledge Platform `_ Datenkatalog der Brain Knowledge Platform bietet Zugang zu einer Vielzahl von Projekten und Datensammlungen `BrainOmics Neuroimaging Genetics `_ Zusammenhänge zwischen Neuroimaging, Genetik und kognitiven Daten `codeneuro neurofinder `_ Jeder Datensatz ist als ZIP-Datei verfügbar und enthält Bilder, Referenz-Neuronregionen, Metadaten sowie Code zum Laden der Daten `CRCNS - Collaborative Research in Computational Neuroscience `_ Daten aus der ersten Runde der Datenaustauschprojekte bereitgestellt, die im Rahmen des CRCNS-Förderprogramms unterstützt wurden `Child Mind Institute `_ International Neuroimaging Data-Sharing Initiative (INDI) `Human Connectome Project (HCP) Young Adult `_ Studiendaten des HCP Young Adult (HCP-YA)-Projekts `National Database for Autism Research (NDAR) `_ Daten zu Autismus-Spektrum-Störungen auf allen Ebenen der biologischen und verhaltensbezogenen Organisation `NIMH Data Archive `_ Datenarchiv des National Institute of Mental Health (NDA) `NeuroElectro `_ Elektrophysiologische Eigenschaften, :abbr:`z. B. (zum Beispiel)` Ruhemembranpotenziale und Membranzeitkonstanten, verschiedener Neuronentypen `NeuroMorpho.Org `_ Sammlung digital rekonstruierter Neuronen und Gliazellen `Open Access Series of Imaging Studies (OASIS) `_ Datensätze aus der Neurobildgebung des Gehirns `Open NeuroData Registry `_ Zahlreiche Neuroimaging-Datensätze (als vorab berechnete Neuroglancer-Volumen) aus verschiedenen Modalitäten und Maßstäben `OpenfMRI `_ Archiv für Bildgebungsdaten des menschlichen Gehirns, die mittels MRT- und EEG-Verfahren erhoben wurden `OpenNeuro `_ Plattform zur Validierung und zum Austausch von :abbr:`BIDS (Brain Imaging Data Structure)`-konformen MRT-, PET-, MEG-, EEG- und iEEG-Daten `StudyForrest `_ Daten zur Gehirnstruktur, zur Gehirnfunktion und zu den Eigenschaften der Filmstimuli `GigaDB `_ 2669 auffindbare, nachverfolgbare und zitierfähige Datensätze Physik ------ `CERN Open Data portal `_ Archivierte Ergebnisse verschiedener Forschungsaktivitäten und dazugehörige Software sowie Dokumentation `IceCube Neutrino Observatory `_ IceCube-Neutrino-Punktquellendaten in Richtung von TXS 0506+056 `Gravitational Wave Open Science Center (GWOSC) `_ Daten von Gravitationswellenobservatorien `NASA Exoplanet Archive `_ Planetenparameter für bestätigte Planeten `Entry Points to NASA Science Data `_ Themenbezogene Archive über Sterne, Planeten und andere Himmelskörper, die Sonne, unsere Erde und Zellen `Quantum simulations of an electron in a two dimensional potential well `_ Numerische Simulation eines Elektrons in einem zweidimensionalen Einschlusspotential `Sloan Digital Sky Survey (SDSS) `_ Kartierung des nahen und fernen Universums, um die physikalischen Prozesse zu ergründen, die unser Universum bestimmen Regierungsinformationen ----------------------- `Datos Argentina `_ Datenrepository der Argentinischen Nation `Australian Bureu of Statistics `_ Australiens nationales Statistikamt `Data.gov.au `_ Offene Regierungsdaten in Australien `data.gv.at `_ Zentraler Katalog mit Metadaten der dezentralen Datenkataloge österreichischer Verwaltungen `Data.Gov.be `_ Das belgische Datenportal `dados.gov.br `_ Brasilianisches Open Data Portal `GovData `_ Datenportal für Deutschland mit Gesetzestexten, Studien und Leitfäden zu „Open Government" `open.canada.ca `_ „Open Government“ der kanadischen Regierung `datos.gob.cl `_ Datensätze öffentlicher Institutionen in Chile `EU Open Data Portal `_ Das offizielle Portal für europäische Daten `Metadaten Verbund (MetaVer) `_ Gemeinsames Portal der Bundesländer Brandenburg, Bremen, Hamburg, Hessen, Mecklenburg-Vorpommern, Saarland, Sachsen und Sachsen-Anhalt `National Bureau of Statistics of China (NBS) `_ Offene Daten des chinesischen Statistikamtes `Debt to the Penny `_ Informationen des US-Finanzministeriums über die gesamte ausstehende Staatsverschuldung `National Archives `_ Die National Archives and Records Administration (NARA) archiviert Dokumente und Materialien, die im Rahmen der Tätigkeit der US-Bundesregierung entstehen `Eurostat `_ Statistiken und Daten zu Europa `EveryPolitician `_ Weltweite Datenbank von `OpenSanctions `_ mit politischen Amtsträgern `StatsPolicy|gov `_ Dezentrales Netzwerk des US-Bundesstatistiksystem `Finnish open data `_ Finnisches Open-Data-Portal `data.gouv `_ Plattform für französische offene Daten `GENESIS-Online `_ Datenbank des deutschen Statistischen Bundesamtes `data.gov.gr `_ Griechisches Register für offene Daten des öffentlichen Sektors `Open Government Data (OGD) Platform India `_ Portal für offene Regierungsdaten des National Informatics Centre (NIC) der indischen Regierung `data.go.id `_ Dateninformationen und öffentliche offizielle Informationen der indonesischen Regierung `data.gov.ie `_ Irlands Open-Data-Portal `data.gov.il `_ Datenbanken aller israelischen Ministerien `dati.gov.it `_ Offene Daten der italienischen öffentlichen Verwaltung `e-Stat Portal Site of Official Statistics of Japan `_ Portal für japanische Regierungsstatistiken `data.public.lu `_ Luxemburgische Open-Data-Plattform `data.gov.my `_ Malaysias offizielles Open-Data-Portal `datos.gob.mx `_ Nationale mexikanische Plattform für offene Daten `date.gov.md `_ Datenportal der moldavischen Regierung `data.overheid.nl `_ Datenregister der niederländischen Regierung `stats.govt.nz `_ Statistiken der offiziellen Statistikbehörde Neuseelands Stats NZ (Tatauranga Aotearoa) `OECD Data `_ Daten der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung `Open Data Hub `_ Open-Data-Katalog mit Schwerpunkt auf Mobilität und Tourismus `pordata.pt `_ PORDATA wurde von der Francisco-Manuel-dos-Santos-Stiftung organisiert und entwickelt `data.gov.ro `_ Offene Datensätze Rumäniens, die von Behörden und Institutionen bereitgestellt werden `data.gov.ru `_ Offenes Datenregister Russlands `Singapore’s open data portal `_ Singapurs Open-Data-Portal `stats sa `_ Statistiken der Republik Südafrika `opendata.swiss `_ Schweizer Open Government Data `data.gov.tw `_ Taiwanesische Open Government Data `Tunisia Data Portal `_ Datenportal Tunesiens `data.gov.uk directory `_ Daten, der Zentralregierung, den Kommunalbehörden und öffentlichen Einrichtungen des Vereinigten Königreichs `Geographic Data Service `_ UK Research and Innovation (UKRI) Smart Data Research (SDR UK) `Healthy and Sustainable Places (HASP) Data Service `_ Smarte Daten für ein besseres Verständnis der Lebensqualität und Nachhaltigkeit von Orten `United States Census Bureau `_ Daten des statistischen Amtes der Vereinigten Staaten `National Center for Health Statistics (CDC) `_ Daten- und Analysewerkzeuge des Nationalen Zentrums für Gesundheitsstatistik `U.S. Department of Housing and Urban Development’s Office of Policy Development and Research (PD&R) `_ Forschungsergebnisse, Publikationen und Datensätze zu den Themen Wohnungswesen, Gemeindeentwicklung und weiteren Bereichen der Vereinigten Staaten `data.gov `_ Daten, Tools und Ressourcen der US-Regierung `OpenFDA `_ Daten der Food and Drug Administration (FDA) des US-Gesundheitsministeriums `National Center for Education Statistics (NCES) `_ Daten der Lage des Bildungswesens in den Vereinigten Staaten `United States Patent and Trademark Office (USPTO) `_ die Datenplattform des USPTO `Congressional Research Service `_ Berichte des Thinktanks des Kongresses `Uganda Bureau of Statistics `_ Datenportale des statistischen Amtes von Uganda `data.gov.ua `_ Datenportal der Ukraine `catalogodatos.gub.uy `_ Offene Daten Uruguays `IATI Country Development Finance Data `_ Daten zu Entwicklungs- und humanitären Aktivitäten, nach Land, berichtender Organisation und Sektor `UNdata `_ Ressourcen vom Statistiksystem der Vereinten Nationen (UN) und anderen internationalen Organisationen `UNESCO Datahub `_ Daten aus Initiativen der UNESCO in den Bereichen Bildung, Wissenschaft, Kultur und Kommunikation `UNICEF Data and Analytics `_ Daten zur Situation von Kindern und Frauen weltweit `World Bank Open Data `_ Open-Data-Plattform der Weltbank Suchmaschinen ------------- `Academic Torrents `_ Skalierbare BitTorrent-Infrastruktur `Data Basis `_ Nichtregierungsorganisation, die die größte öffentliche Datenplattform Brasiliens betreibt `Data Commons `_ Data Commons ist eine Initiative von Google, um mit einem einheitlichen Knowledge Graph vielfältige, standardisierte Daten erkunden zu können `DataHub Collections `_ Kuratierte Datensätze `Domains Project `_ World’s Single Largest Internet Domains Dataset `ERIC - Education Resources Information Center `_ Internetbasierte Datenbank mit Literaturangaben und Volltexten aus dem Bereich der Bildungsforschung und -information `Galaxy Europe `_ Tausende von Tools, Kontingente sowie Recheninfrastruktur im Rahmen von „Training Infrastructure as a Service“ (TIaaS) `Google Dataset Search `_ Name, Beschreibung, Urheber und Veröffentlichungsformate von Datensätzen `Harvard Dataverse `_ Repository für Forschungsdaten und Code `ICPSR `_ Bibliografie, Variablensuche und thematische Sammlung des Inter-university Consortium for Political and Social Research (ICPSR) `Kaggle Datasets `_ Kaggle unterstützt eine Vielzahl von Formaten für die Veröffentlichung von Datensätzen `National Technical Reports Library (NTRL) `_ Sammlung von technischen Berichten, die von der US-Regierung gefördert wurden `NFDI4DS Portal `_ Forschungsdaten des NFDI4DataScience (NFDI4DS)-Konsortiums `ODI Certified Datasets `_ Vom Open Data Institute (ODI) zertifizierte Datensätze `Open Data Inception `_ Open-Data-Portale weltweit `PaN-Finder `_ Aufbauend auf dem :abbr:`PaNOSC (Photon and Neutron Open Science Cloud)`-Projekt werden Datenkataloge großer Forschungseinrichtungen miteinander vernetzt. `Registry of research data repositories (re3data) `_ Weltweites Verzeichnis von Forschungsdatenarchiven aller Forschungsdisziplinen `Statista `_ Portal für Marktdaten, Marktforschung und Marktstudien `Zenodo `_ Repository für von der EU-Kommission finanzierte Forschungsergebnisse des OpenAIRE-Projekts Sozialwissenschaften -------------------- `ACLED `_ :abbr:`ACLED (Armed Conflict Location & Event Data)` ist eine unabhängige, unparteiische Konfliktbeobachtungsstelle, die Echtzeitdaten und Analysen zu gewalttätigen Konflikten und Protesten in allen Ländern und Gebieten weltweit bereitstellt `ARED `_ :abbr:`ARED (Authoritarian Ruling Elites Database)` ist eine Sammlung biografischer und beruflicher Informationen über Personen, die die oberste Elite autoritärer Regime bilden `CanLII `_ Kanadisches Institut für Rechtsinformationen `CEWS `_ Statistische Daten zu Geschlechterverhältnissen in der Wissenschaft `COW `_ :abbr:`COW (Correlates of War)` fördert die Erhebung, Verbreitung und Nutzung präziser und zuverlässiger quantitativer Daten im Bereich internationaler Beziehungen `Cryptome `_ Cryptome veröffentlicht offene, geheime und als geheim eingestufte Dokumente `data.police.uk `_ Informationen zu Straftaten, Ermittlungsergebnissen sowie Personenkontrollen und Durchsuchungen auf Straßenebene, aufgeschlüsselt nach Polizeibezirken `Employment Research Data Center `_ Daten aus zahlreichen Forschungs- und Evaluierungsprojekten des Upjohn Institute, die vom US-Arbeitsministerium gefördert werden `ESS Data Portal `_ :abbr:`ESS (European Social Survey)` ist eine wissenschaftlich orientierte länderübergreifende Erhebung `FBI Hate Crimes Report 2013 `_ Aggregierte Daten aus allen US-Bundesstaaten `Fragile States Index `_ Der Fund for Peace (FFP) erstellt den *Fragile States Index*, eine Rangliste von 178 Ländern, die anhand von 12 Indikatoren die Risiken und Anfälligkeiten der einzelnen Staaten bewertet `GDELT Project `_ Der Global Knowledge Graph verbindet Menschen, Organisationen, Orte, Themen, Zahlen, Bilder und Emotionen zu einem einzigen Netzwerk über den gesamten Planeten `Global Religious Futures Project `_ Religiöser Wandel und dessen Auswirkungen auf Gesellschaften weltweit `GSS `_ Die Daten der :abbr:`GDD (General Social Survey)` enthalten Haustiere, Kreditgeschichte, sozialen Netzwerke, Bedeutung kultureller Werte sowie Merkmale und Beobachtungen der Interviewer `Gun Violence Data `_ Datenbank, die Aufzeichnungen zu über 260.000 Vorfällen von Waffengewalt in den USA von Januar 2013 bis März 2018 enthält `Humanitarian Data Exchange `_ :abbr:`HDX (Humanitarian Data Exchange)` ist eine offene Plattform für den Datenaustausch zwischen verschiedenen Krisen und Organisationen `IDB Open Data `_ Daten zur wirtschaftlichen und sozialen Entwicklung in Lateinamerika und der Karibik der :abbr:`IDB (Inter-American Development Bank)` `INED surveys and data `_ Online-Katalog der Erhebungen und Daten des französischen Instituts für demografische Studien (INED) `INFORM Severity Index `_ INFORM ist eine Zusammenarbeit zwischen der Referenzgruppe für Risiken, Frühwarnung und Vorsorge des Ständigen Interinstitutionellen Ausschusses und der Europäischen Kommission `INSCR `_ :abbr:`INSCR (Integrated Network for Societal Conflict Research)` wurde gegründet, um die vom `Center for Systemic Peace `_ erstellten und genutzten Informationsressourcen zu koordinieren und zu bündeln `Integrated Civil Society Organizations System `_ Das :abbr:`iCSO (integrated Civil Society Organizations)`-System erleichtert die Zusammenarbeit zwischen zivilgesellschaftlichen Organisationen und der :abbr:`DESA (Department of Economic and Social Affairs)` `International Networks Archive (INA) `_ Das :abbr:`INA (International Networks Archive)` sammelt umfangreiche aktuelle und historische Daten, :abbr:`u. a. (unter anderem)` zu Waffen, Büchern, Kapitalströmen `International Social Survey Programme `_ Das :abbr:`ISSP (International Social Survey Programme)` ist ein länderübergreifendes Kooperationsprogramm, das jährlich Umfragen zu verschiedenen sozialwissenschaftlich relevanten Themen durchführt `IPUMS `_ IPUMS stellt Volkszählungs- und Erhebungsdaten aus aller Welt bereit, die zeitlich und räumlich miteinander verknüpft sind `Mass Mobilization Protest Data `_ Proteste gegen Regierungen in allen Ländern, 1990–2020 `Microsoft Academic Graph `_ Der Microsoft Academic Graph ist ein heterogener Graph, der Datensätze zu wissenschaftlichen Publikationen, Zitationsbeziehungen zwischen diesen Publikationen sowie Autoren, Institutionen, Zeitschriften, Konferenzen und Fachgebiete umfasst `ND-GAIN `_ Der :abbr:`ND-GAIN (Notre Dame Global Adaptation Initiative)` ist ein Messinstrument, das Regierungen, Unternehmen und Gemeinden dabei unterstützt, durch den Klimawandel verschärfte Risiken wie Überbevölkerung, Ernährungsunsicherheit, unzureichende Infrastruktur und zivile Konflikte zu untersuchen `OpenSanctions `__ OpenSanctions ist eine internationale Datenbank mit Personen und Unternehmen, die von politischem, strafrechtlichem oder wirtschaftlichem Interesse sind `Our World in Data `_ „Our World in Data“ konzentriert sich auf große und beängstigende Probleme der Welt: Armut, Krankheit, Hunger, Klimawandel, Krieg, existenzielle Risiken und Ungleichheit `Oxford Research Encyclopedia of International Studies `_ Die „Encyclopedia of International Studies“ ist nun zusammen mit neuen und überarbeiteten Artikeln als „Oxford Research Encyclopedia (ORE) of International Studies“ verfügbar `Reality Commons `_ Möglichkeiten von Smartphones menschliche Interaktionen über die traditionellen, auf Umfragen oder Simulationen basierenden Methoden hinaus zu erforschen `Stack Exchange Data Explorer `_ Open-Source-Tool zur Durchführung beliebiger Abfragen auf öffentliche Daten aus dem Stack Exchange-Netzwerk `Titanic Dataset `_ Datensatz zu Vorhersagen über Überlebende der Titanic `UC DATA `_ Archiv der UC Berkeley für digitalisierte sozialwissenschaftliche Daten und Statistiken `UCLA Social Science Data Archive `_ Das „Social Science Data Archive“ ist seit 1961 an der UCLA tätig `Uppsala Conflict Data Program `_ :abbr:`UCDP (Uppsala Conflict Data Program)` des Department of Peace and Conflict Research bietet Daten zu organisierter Gewalt `World Inequality Database `_ Die World Inequality Database (WID) bietet eine Datenbank über die historische Entwicklung der weltweiten Einkommens- und Vermögensverteilung sowohl innerhalb einzelner Länder als auch zwischen Ländern `WorldPop `_ Bevölkerungsdaten auf lokaler Ebene einschließlich der Erfassung der Fortschritte bei der Erreichung der Ziele für nachhaltige Entwicklung `Joshua Project `_ Daten für einen bestimmten Kontinent, eine Region, ein Land, eine Religion, einen Affinitätsblock, eine Bevölkerungsgruppe Transport und Verkehr --------------------- `Autobahn App API `_ API für aktuelle Verwaltungsdaten zu Baustellen, Staus und Ladestationen `Aviation accident database `_ Alle Unfälle in der zivilen und gewerblichen Luftfahrt mit Passagierflugzeugen im Linien- und Nichtlinienverkehr weltweit `BASt Datensammlungen `_ Daten zu Brücken- und Ingenieurbau, Straßenbau, Verhalten und Sicherheit und Verkehrstechnik der Bundesanstalt für Straßen- und Verkehrswesen (BASt) `Bike Share Data Systems `_ Datenportale für Fahrradverleihsysteme `BIXI Open data `_ Mitglieder vs. Gelegenheitsnutzer, Reiseverlauf und Stationsstatus `Chicago Metropolitan Agency for Planning: Transportation Data `_ Verkehrsprognosen der :abbr:`CMAP (Chicago Metropolitan Agency for Planning)`, gestützt auf ein umfangreiches regionales Modellierungssystem `Czech National Traffic Information Registry `_ Überblick über Verkehrsinformationsquellen und deren Anbieter, einschließlich einer technischen Beschreibung der Formate und Protokolle `Darmstadt Mobilität `_ Mobilitätsdaten von Darmstadt `Data Expo 2009: Airline on time data `_ Ankunfts- und Abflugdetails für kommerzielle Flüge innerhalb der USA von Oktober 1987 bis April 2008 `data.europa.eu: Transport `_ Transportdatensätze der EU `DB AG APIs und Datenströme `_ OpenAPI, AsyncAPI, RIS-API und :abbr:`GTFS (General Transit Feed Specification)`, :abbr:`GTFS-RT (GTFS Realtime)`, RiFahrt `Datastore.brussels: Transport `_ Verkehrsdatensätze aus Brüssel `Düsseldorf Verkehrsmeldungen – Mobilitätsdaten `_ Verkehrsmeldungen und Geodaten der Stadt Düsseldorf `England National Highways `_ Aktuelle Verkehrsinformationen des National Traffic Information Service `Fatality Analysis Reporting System (FARS) `_ FARS-Meldungen von tödlichen Unfällen `Finish Transport Infrastructure Agency `_ Offene Daten der finnischen Verkehrsbehörde `Fintraffic Data sources `_ Verkehrsinformationen aus den Verkehrsmanagementsystemen von ITM Finland Ltd. `Freight Analysis Framework Data `_ Güterverkehrsanalyse des :abbr:`BTS (Bureau of Transportation Statistics)` und der :abbr:`FHWA (Federal Highway Administration)` `gencat.cat `_ Mobilitäts- und Verkehrsdaten Katalaniens `GeoLife GPS Trajectories `_ GPS-Bewegungsdaten im Rahmen des Geolife-Projekts (Microsoft Research Asia) von 182 Nutzern von April 2007 bis August 2012 `Jena Open Data: Mobilität `_ Parken, Verkehrsbehinderungen, touristische Radwege, Straßenbaumaßnahmen :abbr:`etc. (et cetera)` `Köln: Transport und Verkehr `_ Transport- und Verkehrsaten der Stadt Köln `Transport for London `_ Liste der verfügbaren :abbr:`TfL (Transport for London)`-Datenfeeds `MobiData BW `_ Mobilitätsdaten der Nahverkehrsgesellschaft Baden-Württemberg `Mobilithek `_ Plattform zum Austausch digitaler Informationen von Mobilitätsanbietern, Infrastrukturbetreibern und Verkehrsbehörden sowie Informationsanbietern `NDW Open Data `_ Niederländische Mobilitätsdaten `Open Data im Tourismus `_ Knowledge Graphen zu den Domains Sehenswürdigkeiten, Veranstaltungen, Touren, Beherbergungsbetriebe und Restaurants `Open.NRW: Verkehr `_ Verkehrsdatensätze des Landes Nordrhein-Westfalen `OpenFlights Airports Database `_ Die Basisdaten zu den Flughäfen stammen aus DAFIF und `OurAirports `_ `OpenStation `_ Zentrale Datenquelle von `DB InfraGO `_ für offene Daten zur Infrastruktur von Personenbahnhöfen in Deutschland `Paris Data Comptage routier `_ Straßenzählung – Verkehrsdaten von permanenten Sensoren `Pedestrian Counting System `_ Stündliche Fußgängerzahlen seit 2009, die von Fußgängersensoren in Melbourne erfasst wurden `renfe Data `_ Daten der spanischen Eisenbahnen `Schweizer Bundesamt für Strassen ASTRA `_ Verkehrsdaten des ASTRA `Traffic Scotland Data Hub `_ Verkehrs- und Reiseinformationen von Traffic Scotland `SF Bay Area Bike Share `_ Das Unternehmen *Bay Area Bike Share* veröffentlicht regelmäßig offene Daten `Tark Tee Smart Road DATEX II data gateway `_ Verkehrs- und straßenbezogene Informationen der estnischen Verkehrsbehörde in `DATEX II `_-Format `TLC Trip Record Data `_ Fahrtenaufzeichnungen für gelbe und grüne Taxis der New York City Taxi and Limousine Commission (TLC) `Toronto’s Open Data: Transportation `_ Transportdatensätze von Toronto `Uber TLC FOIL Response `_ Uber-Fahrdaten, die im Rahmen eines Antrags auf Informationsfreiheit bei der New Yorker Taxi & Limousine Commission angefordert wurden `UK National Highways `_ Daten der Highways Agency zu Fahrzeiten und Verkehrsfluss im Straßennetz `US Bureau of Transportation Statistics `_ Datenbanken des :abbr:`BTS (Bureau of Transportation Statistics)` `US domestic flights from 1990 to 2009 `_ US-Inlandsflüge von 1990 bis 2009 `US Traffic Volume Trends `_ Monatlicher Bericht, der auf stündlichen Verkehrszähldaten basiert, die von den US-Bundesstaaten gemeldet werden `Vlaams Verkeerscentrum `_ Daten des flämischen Verkehrszentrum Verkehrsnachfrage und eine groß angelegte Verkehrserhebung