Evaluation

Glossar Studiengangs- & Lehrevaluation

Arithmetisches Mittel | Das A.M. ist ein Mittelwert (Lagemaß) und wird häufig verwendet, um den Durchschnitt aller für ein Item erhobenen Werte darzustellen. Nach üblicher Definition wird es berechnet, in dem die Summe aus allen beobachteten Werten gebildet und durch die Anzahl der Werte dividiert wird. Die Vorzüge des A.M. liegen in seinem weit verbreiteten Gebrauch – wenn vom Mittelwert die Rede ist, so ist meist das A.M. gemeint. Seine Nachteile ergeben sich daraus, dass alle erhobenen Werte in gleichem Maße in das Ergebnis eingehen. Werte, die stark von den üblichen Antworten abweichen (Ausreißerwerte) können dadurch insbesondere bei kleinen Stichproben – wie sie z.B. bei der Auswertung auf Ebene der Studienfächer vorliegen – das Ergebnis erheblich verzerren. In der Auswertung der Studierendenbefragung wird das A.M. deshalb nur in einigen Fällen ausgewiesen und steht dann stets neben einem Lagemaß, das robuster gegenüber Ausreißerwerten ist (siehe Median).

Beteiligungsquote (Response, Ausschöpfungsquote) | Grundsätzlich sind alle Evaluationsbefragungen an der Fakultät für Sozialwissenschaften und Philosophie als Vollerhebungen konzipiert. Es sollen/können theoretisch also alle Studierenden eines Studiengangs, einer Lehrveranstaltung oder eines Moduls an der Befragung teilnehmen. In der Praxis tut dies aus – verschiedenen Gründen (Interesse der Studierenden, geringe Anwesenheit in evaluierten Lehrveranstaltungen) – jedoch nur ein Teil der Studierenden. Für jede Befragung im Rahmen des Evaluationsprogramms der Fakultät wird daher eine Beteiligungsquote (in Prozent) errechnet und in der Ergebnisauswertung angegeben. Gemeinsam mit dem Stichprobenumfang ist die Beteiligungsquote ein wichtiges Kriterium für die Verallgemeinerbarkeit der jeweiligen Ergebnisse. Als hinreichend für die Aussagekraft von Evaluationsergebnissen kann eine Beteiligungsquote von ≥10% bei einem gleichzeitigen Stichprobenumfang von n ≥10 angenommen werden. Bei der Evaluation von Lehrveranstaltungen mit kleinen Gruppengrößen (<25) kann auch ein <10 noch ausreichend sein. Nach den Erfahrungen im Evaluationsprogramm der Fakultät sind die üblichen Beteiligungsquoten:

  • Studierendenbefragungen: online 35-45%
  • Modulevaluation: online 20-30% | Paper-Pencil: 50-60%
  • Lehrveranstaltungsevaluation: online 15-25% | Paper-Pencil: 40-50%

Häufigkeitsverteilung | Siehe auch Häufigkeitsverteilung, mehrgipflige | Die H. gibt zu jedem in einer Fragestellung angegebenen/angebbaren Wert an, wie häufig dieser Wert in den Antworten vorkommt. Angegeben werden kann die H. absolut (Anzahl der Nennungen pro Wert) oder relativ (Verhältnis der Nennungen pro Wert zur Anzahl aller Nennungen). In den Ergebnisauswertungen wird die H. grundsätzlich relativ, in Prozent angegeben, da sich die Bedeutung einer H. anhand absoluter Zahlen meist nicht sinnvoll interpretieren lässt. Für die Betrachtung von relativen H. ist jedoch immer die Anzahl der einbezogenen Antworten (n=) der jeweiligen Frage zu beachten. Zum einen, weil bei einem geringem n einzelne Nennungen als hohe Anteile erscheinen können. Zum anderen, weil die relativen Häufigkeiten von Fragen deren n stark von dem der Gesamtstichprobe abweicht nicht in Bezug auf die Gesamtstichprobe interpretiert werden können. Zu beachten ist, dass die relative H. der Nennungen einer Frage in der Summe nicht zwangsläufig 100 Prozent (+/- geringer Abweichungen durch Rundung) ergeben muss. Bei Fragen, die eine Angabe mehrerer Antwortoptionen zulassen, kann die Summe der relativen Häufigkeiten weit über 100 hinaus gehen. In den Ergebnisauswertungen werden diese Items jedoch gesondert gekennzeichnet (siehe Mehrfachnennung).

Häufigkeitsverteilung, mehrgipflige | Siehe auch Häufigkeitsverteilung |Häufigkeitsverteilungen, insbesondere bei Fragen mit ordinalen Zustimmungsskalen (trifft zu … trifft nicht zu), sollen idealerweise eine Normalverteilung (Gauß-Verteilung) zeigen. In der Evaluationspraxis ist das jedoch eher selten der Fall. Meist zeigt die Häufigkeitsverteilung einer solchen Frage/Skala ihren Gipfel rechts- oder linksschief – die Mehrzahl der Antworten liegen also auf den positiven bzw. negativen Antwortstufen der Skala. Darüber hinaus kann die Häufigkeitsverteilung sogar mehrere Gipfel – bspw. jeweils einen am Anfang und Ende der Skala – haben. Interpretiert werden kann eine solche mehrgipfligen Verteilung so, dass es unter den BefragungsteilnehmerInnen hinsichtlich ein und derselben Fragestellung mehrere Gruppen gibt (im Beispiel sind es zwei), deren Einschätzung sich jeweils deutlich unterscheiden. Zu überlegen wäre in einem solchen Falle, welcher Faktor möglicherweise zu den divergierenden Urteilen führt.

Kategorisierung, nachträgliche | Mit dieser Anmerkung versehene Fragestellungen wurden in offener Form abgefragt. Die Studierenden konnten in diesen Fragen über ein Textfeld freie Antworten formulieren. Um die Antworten in systematisierter und anonymisierter Form auswerten zu können, wird in vielen Fällen eine Kategorisierung vorgenommen. Dazu werden die freien Antworten zuvor festgelegten Kategorien zugeordnet. Für die Festlegung der Kategorien wurde zum Teil auf bereits bewährte Kategorialsets zurückgegriffen. Für einige der offene Fragestellungen wurden die Kategorien aber auch anhand einer vorherigen Sichtung bzw. Typisierung der freien Antworten bestimmt. Einen Sonderfall stellt die Auswertung der offenen Fragestellungen in der Modulevaluation dar: Die Antworten werden hier nicht standardisierten Kategorien zugeordnet sondern einzeln paraphrasiert (die sachliche Bedeutung der Nennungen in verkürzter Form wiedergegeben). Dabei werden nur solche Nennungen verarbeitet, die relevant im Kontext der Modulgestaltung sind.

Median (Zentralwert) | Der M. ist ähnlich wie das Arithmetische Mittel ein Mittelwert (Lagemaß). Mit ihm wird die zentrale Tendenz aller für ein Item erhobenen Werte dargestellt. Definiert ist der M. als Grenze zwischen den zwei Hälften (obere und untere 50 Prozent) eines nach Größe geordneten Datenbündels. Einfacher ausgedrückt ist der M. derjenige Wert, über- und unterhalb dessen jeweils die Hälfte aller Datenwerte liegt. Der Vorteil des Median gegenüber anderen Lagemaßen besteht darin, dass er insbesondere bei kleinen Stichproben – wie sie bspw. bei der Auswertung auf Ebene der einzelnen Studiengänge, Lehrveranstaltungen oder Module vorliegen – robuster gegenüber Werten ist, die stark von den üblichen Antworten abweichen (Ausreißerwerte). In den Ergebnisauswertungen der Studierendenbefragungen und Lehrevaluationen wird bei Angabe des „Mittelwertes“ stets der M. ausgewiesen. In einigen Fällen wird zusätzlich das Arithmetische Mittel angegeben.

Mehrfachnennung | Die Anmerkung „Mehrfachnennung möglich“ oder „Mehrfachangabe möglich“ weist auf Fragestellungen hin, bei denen unter den vorgegebenen Antwortmöglichkeiten mehrere angekreuzt werden konnten bzw. bei offenen Fragestellungen mehrere freie Antworten abgegeben werden konnten.

n – Stichprobenumfang, Anzahl einbezogene Antworten | n= steht für die Größe/den Umfang der jeweiligen Stichprobe. Es ist zu unterscheiden vom großen N=, welches den Umfang der Grundgesamtheit angibt. In den Auswertungen der Studierendenbefragungen sowie der Modul- und Lehrveranstaltungsevaluation gibt n die jeweilige Anzahl der verwertbaren (gültigen) Antworten an, die für die Auswertung der jeweiligen Fragestellung einbezogen werden konnten. Durch Filterführungen im Fragebogen und zum Teil selektives Antwortverhalten der Befragungsteilnehmenden schwankt das n zwischen den einzelnen Fragestellungen mitunter erheblich. Fälle, in denen das jeweilige n Zehn unterschreitet, werden in den Ergebnisdiagrammen mit einem „!“ gekennzeichnet. In den Auswertungen der Modul- und Lehrveranstaltungsevaluation wird zusätzlich bei jeder/m Frage/Item mit E= die Anzahl der Antwortenthaltungen angegeben

Offene Abfrage | Siehe Kategorisierung, nachträgliche

Standardabweichung – s | Die S. ist ein Streuungsmaß. Vereinfacht formuliert, zeigt sie an, wie stark die erhobenen Werte eines Items im Durchschnitt vom Mittelwert (Arithmetisches Mittel) abweichen. In der Auswertung der Studierendenbefragung wird die S. ausschließlich bei den Ergebnissen zu den Fragestellungen ausgewiesen, die mit Hilfe mehrstufiger Einschätzungsskalen abgefragt wurden. (Dort teilweise auch graphisch als Spannbreite.) Eine hohe S. deutet darauf hin, dass die Antworten der Studierenden breit über die vorhandenen Antwortmöglichkeiten verstreut liegen.

Letzte Änderung: 19. Dezember 2016