Generizität
in Java und C#
Riad Djemili (djemili@inf.fu-berlin.de)
Seminar Objektorientierte Programmiersprachen
Prof. Dr.-Ing. Klaus-Peter Löhr
FU-Berlin WS 03/04
Übersicht
1.
Motivation
Polymorphie
2. Probleme
1.
2.
Generizität
Grundlagen (Eiffel, C++)
2. Java
3. C#
1.
Motivation
Polymorphie
Polymorphie
Eigenschaft von Variablen, Objekte unterschiedlichen Typs
speichern zu können. Variablen können Objekte zugewiesen
werden, die vom gleichen Typen wie diese Variable oder von einem
abgeleiteten Typen sind.
List list = new LinkedList();
Statischer Typ
In der Variablendeklaration festgelegter Datentyp.
Dynamischer Typ
Beim Erzeugen des Objekts festgelegter Typ.
Probleme
Mächtiges Paradigma, aber nicht perfekt!
Statischer Datentyp ist fest und kann für eigene
Anwendungen nicht leicht angepasst werden.
Klassische Lösung:
Nutzung
des niedrigsten gemeinsamen Typen der
Klassenhiarchie.
Spezialiserte Implementationen mit unterschiedlichen
Typen.
Ansatz 1:
Nutzung von Vaterobjekten
Beispiel Java: Liste
•
class MyList {
boolean add(Object o) {..}
Object get(int index) {..}
}
Unsichere Konvention,
statt expliziter
Sprachunterstützung.
•
TypwandlungsLaufzeitfehler, statt
Übersetzungsfehler.
•
Teure Typwandlungen zu
Basisklasse und zurück.
•
Nicht alle
Programmiersprachen
kennen gemeinsame
Vaterobjekte.
..
//associates Integer-Objects
MyList ints = new MyList();
ints.add(new Integer(4));
Integer foo = (String)ints.get(0);
Ansatz 2:
Spezialisierte Implementationen
Beispiel Java: Math-Methoden
public
public
public
public
static
static
static
static
double
float
int
long
abs(double a)
abs(float a)
abs(int a)
abs(long a)
{..}
{..}
{..}
{..}
Methodenüberladen (gleiche Methodennamen mit
unterschiedlichen Signaturen), um verschiedene
Datentypen zu unterstützen.
Effizient, aber aufgeblähter und unübersichtlicher Code!
Lösung: Generizität (I)
Polymorphie
Universelle
Polymorphie
InklusionsPolymorphie
(überschreiben)
Ad hoc –
Polymorphie
(überladen)
Parametrische
Polymorphie
(Generizität)
Möglichkeit nicht nur dynamischen Typ,
sondern auch statischen Typ zu variieren.
Lösung: Generizität (II)
Ziele
Höhere
Typsicherheit, durch Vermeidung von
unsicheren Typumwandlungs-Laufzeitfehlern.
Wiederverwendbarer Code.
Bessere Lesbarkeit, durch expliziter Syntax,
statt impliziter Konvention.
Effizienz, da keine unnötigen Typwandlungen.
Klassische Generizität
in Eiffel und C++
Klassen Generizität
•Klassen werden mit formalen Typparametern deklariert.
•Tatsächliche Datentypen werden als Parameter übergeben.
Ungenerischer Stack in Eiffel
Generischer Stack in Eiffel
class STACK
..
feature
push ( elem: INTEGER ) is
do .. end
top: INTEGER is
do .. end
end
class STACK [T]
..
feature
push ( elem: T ) is
do .. end
top: T is
do .. end
end
Anwendung:
Anwendung:
intstack : STACK;
intstack.push(3);
intstack : STACK[INTEGER];
intstack.push(3);
Mehrere Parametertypen
Ausserdem mehrere generische
Parametertypen möglich.
Beispiel:
Ein generisches Paar in Eiffel
class PAIR[T, U]
feature {NONE} // private
first : T;
second : U;
end
Anwendung:
birthdate : PAIR[STRING,DATE];
Methoden Generizität
Generische Typen existieren auch für Funktionen!
Beispiel: Vertausche-Operation in C++
template<class T>
void swap(T& x, T& y) {
T temp = x;
x = y;
y = temp;
}
Anwendung
int
char
i,j;
i,j;
swap<int> (i,j); //a swap for int
swap<char>(i,j); //a swap for char
Methoden Generizität (II)
Im Gegensatz zu generischen Klassen können
Typparameter bei Methoden implizit aus
Argumenten abgeleitet werden!
Beispiel in C++:
int
float
i,j;
i,j;
swap(i,j); // a swap for int
swap(i,j); // a swap for float
Ohne explizite
Datentypangabe.
Eingeschränkte Generizität
Typeinschränkungen mittels klassischer Polymorphie:
bool pos(Comparable foo) {return foo.compareTo(x);}
Problem: Wie können wir ähnlich sichere Annahmen für generische Typen
machen?
Lösung: Constrained Genericty.
class SORTED_LIST [T->COMPARABLE]
..
end
Erzwingt in Eiffel, dass T Unterklasse von Comparable sein muss, ansonsten
Übersetzungsfehler.
Java
Übersicht
Seit 1995 von Sun Microsystems entwickelt.
Stark
objektorientiert.
Umfangreiche Klassenbibliothek.
Automatische Speicherverwaltung.
Plattformunabhängig.
Aus „Generic Java“ entwickelt und offiziell ab Java
1.5 (Sommer 2004, Codename: Tiger) unterstützt.
Ziele der Java-Implementation
Vollständige Ersetzung der aktuellen Java
API durch generische Version.
„Retrofitting“
alten Codes.
Vollständige Rückwärtskompabilität.
Alter
Code soll ohne Änderung ausführbar
bleiben.
Parametertypen
Erlaubte Typarten:
Klassen sind als Parametertypen erlaubt.
Primitive Typen sind nicht erlaubt. Unteranderem da für sie kein
einheitliches Typsystem existiert.
Sie müssen jeweils (uneffizient) in ihre Wrapper-Klassen
gekapselt werden.
z.B. int → Integer, boolean → Boolean
Übrigens automatisches „Casting“ (Autoboxing) auch ab Java 1.5.
Ausserdem mehrere Typparameter erlaubt.
Klassen Generizität
Beispiel: Die neue java.util.Stack Klasse
class Stack<E> extends Vector<E> {
public E push(E item) {..}
public synchronized E pop() {..}
public synchronized E peek() {..}
public boolean empty() {..}
public synchronized int search(Object o) {..}
}
Anwendung:
Stack<String> foo = new Stack<String>();
Methoden Generizität
Methoden-Generics unterstützt.
Typangabe (unintuitiverweise) vor Methodenname! Begründung ist
leichteres Parsing.
Beispiel: Eine vertausche-Operation
static <Elem> void swap(Elem[] array, int x, int y) {
Elem temp = array[x];
array[x]
= array[y];
array[y]
= temp;
}
Aufrufe auch mit impliziter Typangabe.
swap(ints, 1, 3)
sort(strings)
<Integer>swap(ints, 1, 3)
<String>sort(strings)
Bounds
Einschränkung (bounding) der Typen durch
maximal
eine Oberklasse und/oder
beliebiger Anzahl von Interfaces.
Beispiel: Sortierte Liste
class SortedList<T
extends Entry
implements Comparable> {..}
Übersetzung (I)
Java
Implementierung von
Generizitäts-Erweiterungen
auf Ebene der Übersetzung.
Übersetzung
(Bytecode)
Ausführung
(JVM)
Linux
Windows
..
Plattformen
Mobile
Übersetzung (II)
Oberster Grundsatz:
Die Java Virtual Machine wird nicht verändert!
Homogener Vorgang (für jeden generischen Typen wird
einmalig neuer Code generiert)
1.
Generische Datentypen werden durch untere Grenze ersetzt
(Erasures).
2.
Casting geschieht bei Attributzugriffen und
Methodenrückgaben.
3.
Einsetzung von Bückenmethoden bei kovarianter Vererbung.
(siehe später)
Vorgang fast analog zum „manuellen“ Vorgang bisher.
Übersetzung (III)
Übersetzung in JVM – konformen Code.
class Cell<A> {
A value;
A getValue();
}
class Cell {
Object value;
Object getValue();
}
..
..
String f(Cell<String> cell){
return cell.value;
}
String f(Cell cell){
return (String)cell.value;
}
Klasse Cell wird nur einmal generiert
und kann für alle Parametertypen
wiederverwendet werden.
Legacy-Code (I)
Java API soll mit generischen Typen aktualisiert werden.
Stack s = new Stack();
geht aber immernoch (sogenannte „Raw Classes“)! Ohne Angabe
eines Typparameters wird implizit niedrigste Typschranke
angenommen. Hier also:
Stack<Object> s = new Stack<Object>();
Ermöglicht „Rückwärts-Kompabilität“, dh. alter Code kann ohne
Änderung weiter mit „retrofitted“ API Klassen arbeiten.
Evtl. auch „Vorwärts-Kompabilität“ denkbar.
Legacy-Code (II)
Zuweisungen
Erlaubt
Stack s = new Stack<Integer>();
Übersetzer-Warnungen, bei
Methodenaufrufem mit veränderten Argumenttypen.
Attributzugriffe mit veränderten Typen.
s.push(new Integer(5)); //compile-warning
Erlaubt, aber „deprecation“-Warnung, da unsicher.
Stack<Integer> s = new Stack();
Kovarianz (I)
Bisher: Invariante Rückgabetypen
Jetzt: Kovariante Rückgabetypen
Rückgabetyp einer Methode muss identisch sein mit der
überschriebenen Methode.
Rückgabetyp einer Methode muss Untertyp sein für alle
Methoden, die sie überschreibt.
Kovarianz wird durch Brückenmethoden realisiert.
Kovarianz (II)
class A<T> {
T something() { .. }
}
class B<T implements Comparable> extends A<T> {
T something() { .. }
}
class A {
Object something() { .. }
}
class B extends A {
Comparable something() { .. }
Object something/*2*/() { return something() }
}
JVM unterstützt intern auch Methoden mit Signaturen, die
sich nur im Rückgabetypen unterscheiden.
Vererbung (I)
Unintuitive Typbeziehung
LinkedList<String>
ist Untertyp von
List<String>.
List<String> ist aber nicht Untertyp von
List<Object>.
Vererbung (II)
Naive generische Implementation von Interface Collection:
interface Collection<E> {
boolean addAll(Collection<E> c);
boolean containsAll(Collection<E> c);
}
Nachteil:
Aufgrund von fehlerender Typbeziehung kann die generische
Methode nur eigenen Typen aufnehmen.
Collection<Number> = new Collection<Number>
col;
Collection<Integer> = new Collection<Integer> ints;
col.addAll(ints);
Typfehler!
Vererbung (III)
Bessere generische Implementation erlaubt kovariante
Argumente:
interface Collection<E> {
<T extends E> boolean addAll(Collection<T> c);
<T> boolean containsAll(Collection<T> c);
}
Auch wenn aktueller Typparameter bei Methodenaufruf implizit
übergeben werden kann:
Unleserliche und umständliche Notation für häufiges
Programmierziel.
Vererbung (IV)
Vorangetrieben durch „Variant Generic Java” WildCard-Syntax.
1.
Ermöglicht bessere Lesbarkeit durch anonyme Typparameter.
interface Collection<E> {
boolean addAll(Collection<? extends E> c);
boolean containsAll(Collection<?> c);
}
2.
Ermöglicht auch Kontravarianz.
interface Collection<E> {
boolean addAll(Collection<? super E> c);
boolean containsAll(Collection<?> c);
}
Aber, was trotzdem nicht geht:
List<? extends Number> = new List<Integer>;
Exceptions
Nicht vollständig unterstützt.
Generics
dürfen nicht von
java.lang.Throwable ableiten.
Typvariablen
sind
erlaubt in throws – Anweisung.
nicht erlaubt in catch – Anweisung.
Instanziieren von Parametertypen
Aufgrund von Erasures ist es nicht möglich
Parametertypen zu instanziieren.
class Singleton<T> {
private T instance;
public T getInstance() {
if (instance == null)
instance = new T();
return instance;
}
}
Nicht erlaubt!
Reflection
Generische Klassen als Typen bekannt, allerdings keine
Kenntnis über aktuelle Typparameter zur Laufzeit, da
diese beim Übersetzen entfernt werden (erasures).
class SortedSet<T extends Comparable<T>> {
public SortedSet() {
if (T.class == Date.class) {
..
} else if (T.class == Integer.class) {
..
}
}
}
Kann nicht
funktionieren, da
T.class hier immer
vom Typ
Comparable ist.
Schwächen von Erasures
Unerwartete Fehler aufgrund von gleichen Erasures
class Tool {
public void do(Collection<Integer>) {..}
public void do(Collection<String>) {..}
}
class C<A> {
A id(A x) {..}
}
interface I<A> {
A id(A x);
}
class D extends C<String> implements I<Integer> {
String id(String x) {..}
Integer id(Integer x) {..}
}
Zusammenfassung
Vorteil
Leichter Übergang zwischen generischem und ungenerischem
Code.
Keine neue konkurrierende Java API.
Anonyme Typparameter (Wildcards).
Nachteil
Keine primitiven Datentypen erlaubt.
Uneffizient, da up/down - casting intern immernoch nötig.
Kein Wissen über aktuelle generische Typparameter.
Typparameter können nicht instanziiert werden.
Verschiedene Restriktionen im Zusammenhang mit Erasures
C#
Übersicht
Seit Februar 2001 von Microsoft
entwickelt.
Stark
objektorientiert.
Umfangreiche Klassenbibliothek.
Automatische Speicherverwaltung.
Teil des .NET Frameworks
Bald (Mitte/Ende 2004!?) auch Generics.
Ziel der .Net Implementation
Saubere vollständige Implementation von
Generics.
Einführung
neuer Intermediate Language Typen.
Einführung neuer generischer Klassen in das
.NET Framework.
Aktuelles
erhalten.
nicht-generisches .NET Framework bleibt
Parametertypen
Typarten:
Klassen
sind als Parametertypen erlaubt.
Primitive Typen sind erlaubt, da alle Typen
(Referenz- und Datentypen) einen
gemeinsamen Obertypen haben.
Auch mehrere generische Typen erlaubt.
Klassen Generizität
Beispiel: Eine sortierte Liste
class SortedList<EntryType> where
EntryType : IComparable{
public void insert(EntryType item) {..}
public void remove(EntryType item) {..}
public bool contains(EntryType item) {..}
public bool empty() {..}
}
Anwendung:
SortedList<int> ss = new SortedList<int>();
Ausserdem Unterstützung für Structs und Delegates.
Methoden Generizität
Methoden-Generics unterstützt. Typangabe intuitiverweise hinter
Methodenname!
Beispiel: swap
static void swap<Elem>(Elem[] array, int x, int y) {
}
Elem temp = array[x];
array[x]
= array[y];
array[y]
= temp;
Aufrufe auch mit impliziter Typangabe.
swap(ints, 1, 3)
sort(strings)
swap<int>(ints, 1, 3)
sort<string>(strings)
Constraining
Einschränkung (analog zu Java) der Typen durch
maximal eine Oberklasse und/oder
beliebiger Anzahl von Interfaces.
Beispiel: Zwei eingeschränkte Typparameter.
pulic class MyList<K,T> where K : Icomparable<K>, IEnumerable
where T : Customer {
..
}
Notation umständlicher als bei Java!?
Übersetzung (I)
Sprachen
VB .NET
..
C#
Java#
Übersetzung
(MIL)
Implementierung von
Generizitäts-Erweiterungen
auf Ebene der Ausführung.
Ausführung
(CLR)
(Linux)
Windows
..
Plattformen
Mobile
Übersetzung (II)
Typabhängige Übersetzung:
Für
ReferenceTypes (Klassen)
wird einmal generierter gemeinsamer Code
wiederverwendet (homogener Vorgang).
Für
ValueTypes (primitive Typen)
wird bei jeder ersten Benutzung spezieller Code
generiert (heterogener Vorgang).
Legacy-Code (I)
.NET API erhält zusätzliche generische Klassen.
Ausmass
abgesehen von Collections Namespace
noch unbekannt.
„Rückwärts-Kompabilität“ wird durch
Beibehaltung der alten Klassen gewährleistet.
Mischung von generischem und ungenerischem
Code nur schwer.
Legacy-Code (II)
System.Collections
System.Collections.Generics
Comparer
Comparer<T>
HashTable
Dictionary<K,T>
ArrayList
List<T>
Queue
Queue<T>
SortedList
SortedDictionary<K,T>
Stack
Stack<T>
ICollection
ICollection<T>
System.Comparable
IComparable<T>
IComparer
IComparer<T>
Idictionary
IDictionary<K,T>
Ienumerable
IEnumerable<T>
IEnumerator
IEnumerator<T>
IKeyComparer
IKeyComparer<T>
IList
IList<T>
Typenvarianz
Nur
Invariante Rückgabetypen
Rückgabetyp
einer Methode muss identisch
sein mit der überschriebenen Methode.
Keine
Wildcard-Syntax.
Keine
Kontravarianz.
Exceptions
Vollständige Unterstützung.
Generics
dürfen von System.Exception
ableiten.
Typvariablen sind
erlaubt in throws – Anweisung.
erlaubt in catch – Anweisung, wenn sie vom Typ
System.Exception ableiten.
Instanziieren von Parametertypen
Parametertypen können instanziiert werden, wenn sie einen
Konstruktor ohne Argumente bieten.
Garantie muss als zusätzliches Constraint „new()“ angegeben werden.
Beispiel:
class Singleton<T> where T : new() {
private T instance;
public T getInstance() {
if (instance == null)
instance = new T();
}
}
return instance;
Reflection
Volle Reflectionunterstützung von generischen Typen.
Type type = typeof(List<int>);
Type-Klasse wird erweitert mit speziellen Eigenschaften von
generischen Typen:
int
bool
bool
bool
bool
virtual Type
virtual Type[]
virtual Type
GenericParameterPosition{virtual get;}
HasGenericParameters{get;}
HasUnboundGenericParameters{virtual get;}
IsGenericParameter{virtual get;}
IsGenericTypeDefinition{virtual get;}
BindGenericParameters(Type[] typeArgs);
GetGenericParameters();
GetGenericTypeDefinition();
Erlaubt auch Zugriff auf aktuelle Typparameter.
Zusammenfassung
Vorteil
Intuitive und vollständige Umsetzung von generischen Typen.
Effizienz.
Vollständige Typkenntnis zur Laufzeit (Reflection).
Nachteil
Absolute Trennung zwischen generischen und nicht
generischem Code.
API kann nicht rückwärtskompatibel umgeschrieben werden.
Keine Kontravarianz.
Umständlichere Notation.
Konklusion
Fazit
Generizität
Sinnvoll und allgemein anerkannt.
Birgt aber auch zusätzliche Komplexität.
Nicht immer
klar, wann angebracht.
Implementationen
Java
Rückwärts-Kompabilität positiv, allerdings grosse
Einschränkungen bei Nutzung von generischen Typen.
C#
Gute Unterstützung für generische Typen, aber unklare
Konsequenz für .NET Framework.
Referenzen
Adding Generics to the Java Programming
Language: Public Draft Specification, Version
2.0
Bracha, Cohen, Kemper, Odersky, Stoutamire, Thorup, Wadler
Variant Generic Types
Sun Microsystems
Design an Implementation of Generics for
the .NET Common Language Runtime
Andrew Kennedy, Don Syme
MSDN Article: Introduction to C# Generics
Juval Lowy