Neben der `quantile()`-Funktion eignet sich auch die `summary()`-Funktion, um die Quantile eines Datensatzes zu bestimmen. Sie ist ein nützliches Werkzeug für das Zusammenfassen von Daten in einer übersichtlichen und leicht verständlichen Art. Die Funktion kann auf verschiedene Datentypen angewendet werden. Wird der `summary()`-Befehl auf einen Vektor bestehend aus Zeichenketten angewendet, zählt die Funktion die Anzahl der Zeichenketten. Interessanter wird es, wenn die `summary()`-Funktion auf einen numerischen Vektor trifft. Dann berechnet sie die statistischen Maße Minimum, 1. Quartil, Median, arithmetisches Mittelwert, 3. Quartil und Maximum. Dabei entsprechen das 1. Quartil dem 25%-Quantil, der Median dem 50 %-Quantil und das 3. Quartil dem 75%-Quantil. Außerdem wird die Anzahl fehlender Merkmalsausprägungen notiert. Die `summary()`-Funktion kann auch auf Dataframes angewendet werden. In diesem Fall wird für jede Spalte im Dataframe eine separate Zusammenfassung generiert. Die Funktion berechnet dann für jede Spalte die gleichen statistischen Maße. Auch hier kann zwischen neun verschiedenen Typen gewählt werden, die sich in ihren Berechnungsvorschriften der Quantile unterscheiden. Im Gegensatz zur `quantile()`-Funktion, bei der beispielsweise der Typ 2 mit dem Argument `type = 2` gewählt wird, wird bei der `summary()`-Funktion der Typ mit dem Argument `quantile.type = 2` definiert.
Ein weiteres Maß für die Verteilung von Daten ist der Interquartilsabstand, der durch die Funktion `IQR()` berechnet wird. Der Interquartilsabstand gibt an, wie weit die mittleren 50 % der Daten um den Median verteilt sind, indem er den Abstand zwischen dem 1. und dem 3. Quartil einer Verteilung misst. Der Interquartilsabstand ist robust gegenüber Ausreißern und daher eine nützliche Kenngröße für Datensätze mit verzerrten Daten. Für eine konsistente Analyse sollte für die `IQR()`-Funktion der gleiche Typ wie für die `quantile()`-Funktion gesetzt werden. Dies geschieht hier mit dem Argument `type = 2`.
Ein weiteres Maß für die Verteilung von Daten ist der Interquartilsabstand, der durch die Funktion `IQR()` berechnet wird. Der Interquartilsabstand gibt an, wie weit die mittleren 50 % der Daten um den Median verteilt sind, indem er den Abstand zwischen dem 1. und dem 3. Quartil einer Verteilung misst. Der Interquartilsabstand ist robust gegenüber Ausreißern und daher eine nützliche Kenngröße für Datensätze bei denen ungewöhnlich große oder kleine Werte auftreten. Für eine konsistente Analyse sollte für die `IQR()`-Funktion der gleiche Typ wie für die `quantile()`-Funktion gesetzt werden. Dies geschieht hier mit dem Argument `type = 2`.
Mittels der vorgestellten Funktionen lassen sich weitere Analysen an dem Datensatz vornehmen. Nutzen Sie die Funktionen, um die folgenden Aufgabenstellungen zu lösen.