KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht (openHPI)

KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht (openHPI)

Ohne Daten gibt es keine Künstliche Intelligenz. Maschinelles Lernen benutzt große Datenmengen, um KI-Modelle zu trainieren. Eine der größten Herausforderungen beim Einsatz von gesellschaftlich verträglicher KI ist die Bereitstellung ausreichender, besonders aber qualitativ hochwertiger Trainingsdaten. In dem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz.

Künstliche Intelligenz beruht auf Verfahren des maschinellen Lernens, die mit großen Datenmengen trainiert werden. Viele der KI-Methoden, die seit Ende der 1950er Jahre erforscht werden, basieren vor allem auf manuell entwickelten Modellen und Regeln. Neuronale Netze jedoch, die seit 2006/07 technisch und seit 2011/12 auch in der breiten Anwendung zum jüngsten Durchbruch von KI und maschinellem Lernen geführt haben, sind auf große Mengen passender Trainingsdaten zwingend angewiesen. Auch die Bundesregierung betont in ihrer nationalen Strategie für Künstliche Intelligenz die große Bedeutung von Trainingsdaten.
Wie kommt man an gute, also qualitativ hochwertige Trainingsdaten? Das ist die große Frage, die wir uns stellen müssen, wenn wir gesellschaftlich verträgliche KI entwickeln wollen.
Dabei ist “Qualität” in einem weiten Sinn zu verstehen und umfasst sowohl informatische als auch juristische, ethische, normungstechnische und regulatorische Aspekte. Ziele wie “Diskriminierungsfreiheit”, „Diversität“ oder “Arbeitnehmerdatenschutz”, die für KI-Anwendungen angestrebt werden, wirken auch auf die Daten und Prozesse zurück, mit denen KI-Systeme zuvor trainiert wurden. Umgekehrt führen unvollständige, fehlerbehaftete, unpassende oder asymmetrische Trainingsdaten zu unsicheren Modellen und können so letztlich zu Fehlentscheidungen führen. Auch die rechtlichen Vorgaben für KI-Test-, Validierungs- und Trainingsdaten sowie deren Umsetzung in Normen und Standards sind noch weitgehend ungeklärt und damit Gegenstand von Wissenschaft und Forschung. In unserem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz. Die Dozenten dieses Kurses forschen gemeinsam im Rahmen des KITQAR Projekts an dem Thema KI und Datenqualität.
Der Kurs richtet sich an die interessierte Öffentlichkeit, sowie an Praktiker und Praktikerinnen, die bei der Entwicklung und beim Einsatz von KI-Systemen nicht nur hohe Ergebnisqualität erzielen wollen, sondern auch Wert auf ethische und rechtliche Aspekte legen. Zur Teilnahme bestehen keine besonderen technischen Voraussetzungen – die relevanten KI-Grundlagen werden einführend erläutert.
Kursdauer: 2 Wochen + Prüfung
Zeitaufwand: 3 - 5 Stunden pro Kurswoche

Go to Class
MOOC List is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Related Courses

Machine Learning for Data Analysis (Coursera) Coursera
Wesleyan University

Machine Learning for Data Analysis (Coursera)

Are you interested in predicting future outcomes using your data? This course helps you do just that! Machine learning is the process of developing, testing, and applying predictive algorithms to achieve this goal. Make sure to familiarize yourself with course 3 of this specialization before diving into these machine learning concepts. Building on Course 3, which introduces students to integral supervised machine learning concepts, this course will provide an overview of many additional concepts, techniques, and algorithms in machine learning, from basic classification to decision trees and clustering.

Jun 15th 2026
4 Weeks
The Data Scientist's Toolbox (Coursera) Coursera
Johns Hopkins University

The Data Scientist's Toolbox (Coursera)

In this course you will get an introduction to the main tools and ideas in the data scientist's toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, GitHub, R, and RStudio.

Jun 15th 2026
4 Weeks
Praktische Einführung in Deep Learning für Computer Vision (openHPI) OpenHPI
Hasso-Plattner-Institut

Praktische Einführung in Deep Learning für Computer Vision (openHPI)

Über “Neuronale Netze”, “Artificial Intelligence” und “Deep Learning” reden heute alle. Jeder möchte künstliche Intelligenz nutzen, doch wie fange ich am besten damit an? In diesem Kurs werden wir künstliche neuronale Netze, die Grundlage künstlicher Intelligenz, sowohl theoretisch als auch praktisch einführen. Dabei wollen wir genauer untersuchen, wie solche Netze funktionieren und wie man sie entwickeln und einsetzen kann. Der Kurs beinhaltet theoretische Grundlagen, praktische Übungen und weiterführende Exkurse, unter anderem in die Algorithmen, welche zum Trainieren von neuronalen Netzen verwendet werden. Anschließend werden wir lernen, wie ein Netz für verschiedene Einsatzzwecke optimiert werden kann und wie wir auch mit wenig Trainingsdaten Erfolge erzielen können. Am Ende zeigen wir, wie ihr selbst ein gutes Netz für ein eigenes Problem trainieren könnt. Ziel des Kurses ist es, ein Verständnis von künstlichen neuronalen Netzen und deren Einsatz- und Optimierungsmöglichkeiten zu schaffen.

Self Paced
Self-Paced
Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel (openHPI) OpenHPI
Hasso-Plattner-Institut

Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel (openHPI)

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

Self Paced
Self-Paced
Preparing for the Google Cloud Professional Data Engineer Exam (Coursera) Coursera
Google Cloud

Preparing for the Google Cloud Professional Data Engineer Exam (Coursera)

From the course: "The best way to prepare for the exam is to be competent in the skills required of the job." This course uses a top-down approach to recognize knowledge and skills already known, and to surface information and skill areas for additional preparation. You can use this course to help create your own custom preparation plan. It helps you distinguish what you know from what you don't know. And it helps you develop and practice skills required of practitioners who perform this job.

Jun 20th 2026
5-12 Weeks
Generative AI for Everyone (Coursera) Coursera
DeepLearning.AI

Generative AI for Everyone (Coursera)

Instructed by AI pioneer Andrew Ng, Generative AI for Everyone offers his unique perspective on empowering you and your work with generative AI. Andrew will guide you through how generative AI works and what it can (and can’t) do. It includes hands-on exercises where you'll learn to use generative AI to help in day-to-day work and receive tips on effective prompt engineering, as well as learning how to go beyond prompting for more advanced uses of AI.

Jun 16th 2026
3 Weeks
Machine Learning: Regression (Coursera) Coursera
University of Washington

Machine Learning: Regression (Coursera)

Case Study - Predicting Housing Prices. In our first case study, predicting house prices, you will create models that predict a continuous value (price) from input features (square footage, number of bedrooms and bathrooms,...). This is just one of the many places where regression can be applied. Other applications range from predicting health outcomes in medicine, stock prices in finance, and power usage in high-performance computing, to analyzing which regulators are important for gene expression.

Jun 15th 2026
5-12 Weeks
Generative AI Essentials: Overview and Impact (Coursera) Coursera
University of Michigan

Generative AI Essentials: Overview and Impact (Coursera)

With the rise of generative artificial intelligence, there has been a growing demand to explore how to use these powerful tools not only in our work but also in our day-to-day lives. Generative AI Essentials: Overview and Impact introduces learners to large language models and generative AI tools, like ChatGPT. In this course, you’ll explore generative AI essentials, how to ethically use artificial intelligence, its implications for authorship, and what regulations for generative AI could look like.

Jun 19th 2026
1 Week
An Introduction to Probabilistic Machine Learning (openHPI) OpenHPI
Hasso-Plattner-Institut

An Introduction to Probabilistic Machine Learning (openHPI)

Probabilistic machine learning has gained a lot of practical relevance over the past 15 years as it is highly data-efficient, allows practitioners to easily incorporate domain expertise and, due to the recent advances in efficient approximate inference, is highly scalable. Moreover, it has close relations to causal inference which is one of the key methods for measuring cause-effect relationship of machine learning models and explainable artificial intelligence. This openHPI course will introduce all recent developments in probabilistic modeling and inference. It will cover both the theoretical as well as practical and computational aspects of probabilistic machine learning.

Jun 14th 2023
2 Weeks
The Structured Query Language (SQL) (Coursera) Coursera
University of Colorado Boulder

The Structured Query Language (SQL) (Coursera)

In this course you will learn all about the Structured Query Language ("SQL".) We will review the origins of the language and its conceptual foundations. But primarily, we will focus on learning all the standard SQL commands, their syntax, and how to use these commands to conduct analysis of the data within a relational database. Our scope includes not only the SELECT statement for retrieving data and creating analytical reports, but also includes the DDL ("Data Definition Language") and DML ("Data Manipulation Language") commands necessary to create and maintain database objects.

Jun 16th 2026
5-12 Weeks