dateiformat
Ein Dateiformat oder Dateityp bestimmt die Form von Computerdaten. Computerdaten müssen zwischen verschiedenen Programmen austauschbar sein. Beispiele sind Programme verschiedener Hersteller in einer Arbeitskette, verschiedene Programmversionen des selben Herstellers, das selbe Programm auf verschiedenen Computern, das selbe Programm erneut gestartet (evntuell gleichzeitig laufend) und somit an einer anderen Position im Ram. Deshalb werden sie zeitweise in ein kompaktes, besonders flexibles Format gewandelt.Komplexere - insbesondere hierarchische - Datenstrukturen werden durch das Dateisystem des Betriebssystem ermöglicht. Wegen der Inkompatibilität vieler Betriebssysteme enthalten viele Dateiformate aber ein internes proprietäres Dateisystem, welches die Inkompatibilität weiter steigert. Häufig sind diese Dateisysteme so primitiv, dass zum auffinden einer Datei immer das ganze System durchsucht werden muss.
Heutzutage setzt sich XML durch, bei dem die Daten erst in ein Text-basiertes, speicherhungriges Format gewandelt werden, um es dann wieder zu komprimieren.
Ein Arrays von Bits bekommt üblicher Weise seine Größe vorangestellt. Solche Arrays werden für Bitmaps, raw-Audio oder Video und Datenbanken verwendet.
Grafik bestehen meist aus mehreren Objekten, z.B. Linien, Kreisen, Text und Bitmaps. Jedes Objekt (Programmierung) muss einen Zeiger auf die Klasse besitzen von dem es abgeleitet ist. Ein solcher Zeiger kann nur auf eine Position im Ram zeigen. Häufig befindet sich die Klassendefinition aber woanders. In diesem Fall wird das Ende des Dateinamens oder der Anfang der Datei als Schlüssel verwendet, die dann benutzt wird, um den richtigen Code ins Ram zu laden und einen Zeiger darauf zu setzen.
Ein Dateiformat oder Dateityp bestimmt auch die Form der Abspeicherung von Computerdaten. Die Notwendigkeit hierfür entspringt aus der Tatsache, dass für ein Betriebssystem Dateien gewöhnlich nur eindimensionale Aneinanderreihungen von Bytes sind. Solche beschränkten, linearen Strukturen können aber viele Arten von real anfallenden Daten nicht in einer offensichtlichen Weise beschreiben, sodass Konventionen ihre Interpretation als Repräsentanten von komplexeren Daten bestimmen. Eine Gesamtheit solcher Konventionen für eine „Art“ von Dateien wird als Dateiformat bezeichnet.
In der Anfangszeit der PCs waren komplexe und komprimierte so genannte proprietäre Binärformate Standard, da Plattenspeicher teuer war und kommerzielle Softwareanbieter die Formatierung als Betriebsgeheimnisse hüteten. Auch stand der Datenaustausch mit anderen Programmen gleicher Funktion, aber unterschiedlicher Herkunft, nicht im Vordergrund. Zu den ersten Bestrebungen in Richtung austauschbarer Binärdaten gehörten die RIF-Formate der 80er Jahre, zu denen z.B. das WAV-Format für Audiodaten gehört.
Seit einigen Jahren verbreitet sich mit XML ein Verfahren, das eine programm- und herstellerunabhängige Datenspeicherung ermöglicht. Voraussetzung dafür sind jedoch herstellerübergreifende Standards für die Verwendung dieser Technologie. Für sehr viele Anwendungsgebiete (z.B. Darstellung von Vektorgrafiken oder mathematischer Formeln) haben sich diese bereits etabliert. In anderen Bereichen sind die Entwicklungen noch im Gange. Das freie OpenOffice.org benutzt beispielsweise Open Document XML für seine Dateien. Aus Gründen der Platzersparnis werden XML-Daten oft komprimiert und liegen dann binär vor (z.B. im ZIP-Dateiformat). Die Entwicklungen hin zu herstellerunabhängigen und offen dokumentierten Dateiformaten sind auch für die elektronische Archivierung von größter Bedeutung. Damit archivierte digitale Daten über potenziell unbeschränkt lange Zeiträume hinweg lesbar sind, muss das Dateiformat, in dem sie abgespeichert sind, verständlich bleiben.
Üblicherweise lässt sich das Format einer Datei aus der Dateinamenserweiterung ablesen, wobei aber vor allem Unix-ähnliche Betriebssysteme Dateiformate auch unabhängig von ihrer Endung erkennen können. Organisationen des Archivwesens arbeiten seit einigen Jahren an der Erstellung von Dateiformat-Verzeichnissen (file format registries), welche die automatisierte Erkennung von Formaten ermöglichen und Informationen zu deren Benutzung bereitstellen.
Vor der Erfindung von RAM-Disk, Datenströmen, Netzwerken oder Multitasking war dieses Formatwandeln fest mit dem Kopieren von Daten vom Ram auf einen Festspeicher verbunden.