| C | |
|---|---|
| Paradigmen: | imperativ, strukturiert |
| Erscheinungsjahr: | 1972 |
| Entwickler: | Dennis Ritchie & Bell Labs |
| wichtige Implementierungen: | GCC, MSVC, Borland C, Portland Group, Intel |
| Einflüsse: | B (BCPL, CPL), ALGOL 68, Assembler |
| Beeinflusste: | awk, C++, C#, Objective-C, D, Java, JavaScript, Perl, Python, PHP, Vala, Go |
C ist eine imperative Programmiersprache, die der Informatiker Dennis Ritchie[1] in den frühen 1970er Jahren an den Bell Laboratories für die Systemprogrammierung des Betriebssystems Unix entwickelte. Seitdem ist sie auf vielen Computersystemen verbreitet.
Die Anwendungsbereiche von C sind sehr verschieden. Es wird zur System- und Anwendungsprogrammierung eingesetzt. Die grundlegenden Programme aller Unix-Systeme und die Systemkerne vieler Betriebssysteme sind in C programmiert. Zahlreiche Sprachen, wie C++, Objective-C, C#, Java, PHP, Vala oder Perl orientieren sich an der Syntax und anderen Eigenschaften von C.
C ist eine Programmiersprache, die auf fast allen Computersystemen zur Verfügung steht. Sie zählt zu den sogenannten prozeduralen Programmiersprachen. Um den Wildwuchs zahlreicher Dialekte einzudämmen, wurde C mehrfach standardisiert (C89, C95, C99, ISO-C). Abgesehen vom Mikrocontrollerbereich, wo eigene Dialekte existieren, sind die meisten aktuellen PC-/Server-Implementierungen eng an den Standard angelehnt; eine vollständige Implementierung aktueller Standards ist aber selten. In den meisten C-Systemen mit Laufzeitumgebung steht auch die genormte Standard C Library zur Verfügung. Dadurch können C-Programme, die keine sehr hardware-nahe Programmierung enthalten, in der Regel gut auf andere Zielsysteme portiert werden. Konzeptionell ist C auf einfache Kompilierbarkeit ausgelegt. Die Compiler erzeugen in der Regel aber auch nur wenig Code zur Gewährleistung der Sicherheit zur Laufzeit der Programme.
Die Verbreitung von C ist groß, und viele Programmierschnittstellen für Anwendungsprogramme und Betriebssystem-APIs werden in Form von C-Schnittstellen implementiert, z. B. Win32 [2].
C wurde 1969–1973 von Dennis Ritchie[1] in den Bell Laboratories für die Programmierung des damals neuen UNIX-Betriebssystems entwickelt. Er stützte sich dabei auf die Programmiersprache B, die Ken Thompson und Dennis Ritchie in den Jahren 1969/70 geschrieben hatten. B wiederum geht auf die von Martin Richards Mitte der 1960er-Jahre entwickelte Programmiersprache BCPL zurück[3]. Ritchie schrieb auch den ersten Compiler für C. 1973 war die Sprache so weit ausgereift, dass man nun den Unix-Kernel für den PDP-11 neu in C schreiben konnte.
1978 veröffentlichten Brian W. Kernighan und Dennis Ritchie die erste Auflage von The C Programming Language (deutsch: Programmieren in C). Die darin beschriebene Fassung von C, die nach den Buchautoren „K&R C“ genannt wird, erweiterte die ursprüngliche Sprache um neue Schlüsselwörter wie long int oder unsigned int und führte erstmals die I/O-Standardbibliothek ein. Bis zur Standardisierung der Sprache diente die von Kernighan und Ritchie geschriebene Spezifikation als informelle Referenz für das Programmieren in C.
→ Hauptartikel: Varianten der Programmiersprache C
C verbreitete sich rasch und wurde laufend weiterentwickelt. Das führte dazu, dass das von Kernighan und Ritchie beschriebene C nicht mehr dem C entsprach, das von den Compilern unterstützt wurde. Um eine Normierung der Sprache zu erreichen, setzte das American National Standards Institute (ANSI) 1983 ein Komitee namens X3J11 ein, das 1989 schließlich die Norm ANSI X3.159-1989 Programming Language C verabschiedete. Ein Jahr später übernahm die ISO diese Norm (mit kleinen Änderungen) als C90. 1995 veröffentlichte die ISO eine Ergänzung zur Norm (C95). 1999 wurde der Standard ISO/IEC 9899 verabschiedet. Mit diesem Standard, der als C99 bekannt ist, flossen auch aus C++ bekannte Erweiterungen zurück in die Sprache C. Danach arbeitete das Normierungskommitee WG14 an der nächsten Erweiterung der Programmiersprache unter dem Arbeitstitel C1X , die am 8. Dezember 2011 als C11 veröffentlicht wurde.[4][5]
Das Haupteinsatzgebiet von C liegt in der Systemprogrammierung einschließlich der Erstellung von Betriebssystemen und der Programmierung von eingebetteten Systemen. Der Grund liegt in der Kombination von erwünschten Charakteristiken wie Portabilität und Effizienz mit der Möglichkeit, Hardware direkt anzusprechen und dabei niedrige Anforderungen an die Laufzeitumgebung zu haben.
Auch Programme für Endanwender werden oft in C erstellt.
Wegen der relativ hohen Geschwindigkeit und geringen Codegröße werden Compiler, Programmbibliotheken und Interpreter anderer höherer Programmiersprachen (wie z. B. die Java Virtual Machine) oft in C implementiert.
C wird als Zwischencode einiger Implementierungen höherer Programmiersprachen verwendet. Dabei wird diese zuerst in C-Code übersetzt, der dann kompiliert wird. Dieser Ansatz wird entweder verwendet, um die Portabilität zu erhöhen (C-Compiler existieren für nahezu jede Plattform), oder aus Bequemlichkeit, da kein maschinenspezifischer Codegenerator entwickelt werden muss. Einige Compiler, die C auf diese Art benutzen, sind EiffelStudio, Esterel, Gambit, der Glasgow Haskell Compiler, einige LISP-Compiler, Lush, PyPy, Sather, Squeak und Vala.
C wurde als Programmiersprache und nicht als Zielsprache für Compiler entworfen. Als Zwischensprache ist es daher eher schlecht geeignet. Das führte zu C-basierten Zwischensprachen wie C--.
C wird oft für die Erstellung von Anbindungen genutzt (zum Beispiel Java Native Interface). Diese Anbindungen erlauben es Programmen, die in einer anderen Hochsprache geschrieben sind, Funktionen aufzurufen, die in C implementiert wurden. Der umgekehrte Weg ist oft ebenfalls möglich und kann verwendet werden, um in C geschriebene Programme mit einer anderen Sprache zu erweitern (z. B. mod perl).
Die Programmiersprache C wurde mit dem Ziel entwickelt, eine echte Sprachabstraktion zur Assemblersprache zu implementieren. Es sollte eine direkte Zuordnung zu wenigen Maschineninstruktionen geben, um die Abhängigkeit von einer Laufzeitumgebung zu minimieren. Als Resultat dieses Designs ist es möglich, C-Code auf einer sehr hardwarenahen Ebene zu schreiben, analog zu Assemblerbefehlen. Die Portierung eines C-Compilers auf eine neue Prozessorplattform ist, verglichen mit anderen Sprachen, wenig aufwändig. Bspw. ist der freie GNU-C-Compiler (gcc) für eine Vielzahl unterschiedlicher Prozessoren und Betriebssysteme verfügbar. Für den Entwickler bedeutet das, dass unabhängig von der Zielplattform fast immer auch ein C-Compiler existiert. C unterstützt damit wesentlich die Portierbarkeit von Programmen, sofern der Programmierer auf Assemblerteile im Quelltext und/oder hardwarespezifische C-Konstrukte verzichten kann. Bei der Mikrocontroller-Programmierung ist C die mit Abstand am häufigsten verwendete Hochsprache.
Jeder Ausdruck und jeder Bezeichner in C hat einen bestimmten Datentyp. C unterscheidet zwischen:
Außerdem wird zwischen Basisdatentypen (basic types) und abgeleiteten Typen (derived types) unterschieden.
C verfügt über 19 Basisdatentypen (eng. basic types). Diese werden in Datentypen für Ganzzahl- und Gleitkommazahlen aufgeteilt. Die verschiedenen Typen ermöglichen bei unterschiedlichem Speicherbedarf das Speichern von Daten aus einem unterschiedlich großen maximalen Wertebereich.
Die Standard C Library ergänzt diese Datentypen über die plattformunabhängige Header-Datei stdint.h in der ein Set von Ganzzahltypen mit fester Länge definiert ist.
Zusätzlich existieren seit C99 noch drei Gleitkomma-Datentypen für komplexe Zahlen, welche aus den drei Gleitkommatypen abgeleitet sind: float _Complex, double _Complex und long double _Complex. Ebenfalls in C99 eingeführt wurden Gleitkomma-Datentypen für rein imaginäre Zahlen: float _Imaginary, double _Imaginary und long double _Imaginary.
In einer hosted-Umgebung müssen die _Complex-Datentypen vorhanden sein; die _Imaginary-Typen sind optional. In einer freestanding-Umgebung sind alle diese sechs Datentypen optional.[12]
Aus den Basisdatentypen und bereits deklarierten abgeleiteten Typen lassen sich beliebig viele weitere Typen ableiten. Abgeleitete Typen werden wie folgt aufgeteilt:
Es ist möglich und üblich, von abgeleiteten Typen weitere Ableitungen zu definieren:
int array[10][20]; // Array mit 10 Elementen, wobei jedes Element ein Array von 20 »int« ist. int *p [10]; // Array mit 10 Elementen, wobei jedes Element ein »int*« (=Zeiger auf »int«) ist. int (*q)[10]; // Zeiger auf ein Array mit 10 »int«-Elementen. int (*f)(int*); // Zeiger auf eine Funktion, die einen »int*«-Parameter hat und ein »int« zurückgibt
Dies kann schnell zu zu komplexen und unübersichtlichen Deklarationen führen. Über eine typedef-Deklaration ist es möglich, für einen (möglicherweise zu komplexen) Datentyp einen einfachen Namen zu vergeben:
void* (*get_cb(int))(void*); // Unübersichtlich! // Besser: typedef void* (*callback)(void*); // Typedef: »callback« ist ein Zeiger auf eine Funktion, // die einen »void*«-Parameter hat und ein »void*« zurückgibt callback* get_cb(int); // Übersichtlicher: »get_cb« hat einen »int«-Parameter und gibt einen // »callback«-Funktionszeiger zurück
Bevor Variablen, Typen und Funktionen in C verwendet werden können, müssen sie deklariert werden (sog. Statische Typisierung). Eine so deklarierte Variable, Typ oder Funktion erhält einen Namen (Bezeichner, engl. identifier). Die Vergabe von Bezeichnern ist an bestimmte Regeln gebunden:
Seit C95 sind auch Zeichen aus dem Universal Character Set in Bezeichnern erlaubt, sofern die Implementierung es unterstützt. Die erlaubten Zeichen sind in Anhang D des ISO-C-Standards aufgelistet. Vereinfacht gesagt, sind es all jene Zeichen, die in irgendeiner Sprache als Buchstabe oder buchstabenähnliches Zeichen Verwendung finden. Im Quelltext lassen sich diese Zeichen plattformunabhängig über eine Escape-Sequenz wie folgt ersetzen:
Das folgende Beispiel in der Programmiersprache C deklariert und definiert die Namen variable_1 und variable_2 als Variablen vom Typ Integer:
void beispiel1() { int variable_1, variable_2; }
Bestimmte Bezeichner sind außerdem für die Implementierung reserviert:
Erweiterungen am Sprachkern, die neue Schlüsselwörter erfordern, verwenden dafür ebenfalls Namen aus diesem reservierten Bereich, um zu vermeiden, dass sie mit Bezeichnern in existierenden C-Programmen kollidieren, z. B. __attribute__, _Complex, _Generic, _Thread_local.
Das globale Sprachdesign sieht vor, dass ein Programm aus mehreren Modulen bestehen kann. Für jedes Modul existiert eine Quellcode-Datei (mit der Endung .c) und eine Header-Datei (mit der Endung .h). Die Quellcode-Datei enthält im Wesentlichen die Implementierung, die Header-Datei das Interface nach außen. Beide Dateien konsistent zu halten, ist bei C (wie auch bei C++) Aufgabe des Programmierers.
Module, die Funktionen aus anderen Modulen benutzen, inkludieren deren Header-Dateien und geben dem Compiler damit die notwendigen Informationen über die vorhandenen Funktionen, Aufrufkonventionen, Typen und Konstanten.
Jedes Modul kann für sich übersetzt werden und erzeugt eine Object-Datei. Mehrere Object-Dateien können zu einer Bibliothek zusammengefasst werden oder einzeln verwendet werden.
Mehrere Object-Dateien sowie Bibliotheken (die auch nur eine Sammlung von Objekt-Dateien sind) können mittels Linker (deutsch: Binder) zu einem ausführbaren Programm gebunden werden.
Der folgende Quelltext stellt ein einfaches C-Programm dar, das die Textzeile Hallo Welt!, gefolgt von einem Zeilenumbruch, ausgibt. Dieses Beispiel folgt den Vorgaben des ANSI-C-Standards; andere Versionen dieses Programms sind im Artikel Liste von Hallo-Welt-Programmen/Programmiersprachen beschrieben.
#include <stdio.h> #include <stdlib.h> int main(void) { printf("Hallo Welt!\n"); return EXIT_SUCCESS; } /* end main() */
In der ersten Zeile ermöglicht die Präprozessordirektive #include <stdio.h> die spätere Verwendung von Funktionen aus der Ein-/Ausgabe-Bibliothek stdio (auch „standard-input/output“ genannt). Diese include-Anweisung veranlasst den C-Präprozessor, vor der Übersetzung die Headerdatei stdio.h in den Quelltext zu kopieren, die unter anderem eine Deklaration der weiter unten verwendeten Ausgabefunktion printf enthält. In der zweiten Zeile wird die Headerdatei stdlib.h eingebunden, die die symbolische Konstante EXIT_SUCCESS definiert, damit die erfolgreiche Programmausführung dem Aufrufer plattformunabhängig signalisiert werden kann (siehe Zeile 7 des Programms). Include-Anweisungen können zwar an jeder Stelle im Quelltext eingefügt werden, meist werden sie jedoch an den Anfang eines Programmtextes gestellt, um die Übersichtlichkeit zu erhöhen.
In der vierten Zeile beginnt das eigentliche Programm mit der Definition der Funktion main. Sie ist die Einstiegsfunktion eines C-Programms. main wird automatisch als erste Funktion aufgerufen. Anfang und Ende der Funktion main werden durch die beiden geschweiften Klammern markiert.
Die erste Anweisung innerhalb der Funktion main ruft die Funktion printf auf. Die zweite Anweisung ist die Sprunganweisung return EXIT_SUCCESS;. Diese legt den Rückgabewert von main fest. Damit wird der „Erfolgsstatus“ des ausgeführten Programms zum Ausdruck gebracht. Der Wert EXIT_SUCCESS bedeutet hier fehlerfreie Ausführung.
In der letzten Zeile folgt auf die schließende geschweifte Klammer ein Kommentar, eingeschlossen durch die Zeichenfolgen /* und */. Kommentare werden bei der Übersetzung ignoriert; sie sind in erster Linie für den menschlichen Leser gedacht, können aber auch von automatischen Software-Dokumentationswerkzeugen ausgewertet werden.
Die C-Standardbibliothek ist integraler Bestandteil einer gehosteten (engl. hosted) C-Implementation. Sie enthält unter anderem Makros und Funktionen, die mittels der Standard-Header-Datei verfügbar gemacht werden. Auf freistehenden (engl. freestanding) Implementationen dagegen kann der Umfang der Standardbibliothek eingeschränkt sein.
Die Standardbibliothek ist aufgeteilt in mehrere Standard-Header-Dateien, die hinzugelinkte Bibliothek ist jedoch oft eine einzige große Datei.
Dieser Artikel basiert auf dem Artikel C_(Programmiersprache) aus der freien Enzyklopädie Wikipedia und ist unter der Lizenz Creative Commons Attribution/Share Alike verfügbar. Zusätzliche Bedingungen können anwendbar sein. In der Wikipedia ist eine Liste der Autoren verfügbar. |