Textdateien bearbeiten mit dem UNIX-Tool awk

awk-Befehle haben eine einfache Struktur, sie bestehen aus:

  • einem Muster, üblicherweise einem Regulären Ausdruck, der verwendet wird, um die zu verarbeitenden Daten auszuwählen, und/oder einer Aktion, mit der die ausgewählten Daten verarbeitet werden – mindestens eins von beiden muss angegeben werden;
  • geschweiften Klammern {}, in denen die Aktion beschrieben wird.

Wenn nur ein Muster angegeben ist, ist die Default-Aktion print. Wenn nur eine Aktion angegeben ist, wird jede Zeile bearbeitet. Werden beide verwendet, wird die Aktion auf jede Zeile angewandt, für die das Muster zutrifft. Eine Aktion kann aus mehreren Anweisungen bestehen, die durch Semikolons getrennt sind.

Die Zeilenauswahl verwendet entweder kein, ein oder zwei Auswahlkriterien. Wenn mehrere Kriterien angegeben sind, werden sie durch Kommata getrennt. Das Muster kann ein Regulärer Ausdruck oder ein Boolscher Ausdruck sein. Wie bereits erwähnt, wird die Aktion für jede Eingabezeile ausgeführt, sofern kein Muster angegeben ist. Ist ein Muster angegeben, wird der Befehl nur für die Zeilen ausgeführt, auf die das Auswahlkriterium zutrifft. Werden zwei Muster verwendet, beginnen die zu verarbeitenden Daten mit der ersten Zeile, auf die die erste Bedingung zutrifft, und enden mit der Zeile, auf die die zweite Bedingung passt. Alle dazwischen liegenden Zeilen werden bearbeitet. Jedes Muster wird auf jede Zeile der Eingabedaten angewandt, solange nicht bei einer früheren Aktion ein next-Ausdruck angewandt wurde.

Die Verarbeitung fängt mit BEGIN-Blöcken an. BEGIN ist ein reserviertes Wort in awk, es muss vollständig groß geschrieben werden. Als nächstes werden die Variablen von der Kommandozeile zugewiesen. Dann wird jede Zeile der Eingabe gelesen und fest eingebauten Variablen zugewiesen. Zu jedem Befehl wird das zugehörige Muster ausgewertet und der Befehl ausgeführt, wenn das Muster passt. Zum Schluss werden die END-Blöcke ausgeführt.

awk verfügt über mehrere eingebaute Datentypen:

  • Strings (in Anführungszeichen)
  • Zahlen (sowohl Ganzzahlen als auch Fließkommazahlen) in Dezimalschreibweise, Nicht-Ganzzahlen werden durch einen Punkt gekennzeichnet
  • Reguläre Ausdrücke verwenden den Schrägstrich (/) als Begrenzungszeichen

Variablen müssen nicht deklariert werden und können beliebige Datentypen enthalten, die sich auch im Verlauf des Programms ändern dürfen. Variablen-Namen müssen mit einem Buchstaben beginnen und bestehen aus weiteren Buchstaben, Ziffern oder Unterstrichen, wie Listing A zeigt.

awk verwendet für eingebaute Variablen nur Großbuchstaben, dieses Format sollte man also bei eigenen Variablen vermeiden. Die gebräuchlichsten eingebauten Variablen sind NR, NF und FS. NR ist die Nummer der aktuellen Zeile, NF ist die Anzahl der Felder in der aktuellen Zeile, und FS ist das Trennzeichen für Eingabefelder. Jeder einzelne Datensatz wird in Felder mit den Namen $1, $2 etc. geteilt, wobei $0 den kompletten Datensatz enthält. Auf Felder kann man zugreifen, indem man entweder $n oder $var benutzt, wobei var ein Wert zwischen 0 und NF ist.

Page: 1 2 3 4

ZDNet.de Redaktion

Recent Posts

Chips bescheren Samsung deutlichen Gewinnzuwachs

Das operative Ergebnis wächst um fast 6 Billionen Won auf 6,64 Billionen Won. Die Gewinne…

3 Tagen ago

Chrome: Google verschiebt das Aus für Drittanbietercookies

Ab Werk blockiert Chrome Cookies von Dritten nun frühestens ab Anfang 2025. Unter anderem gibt…

3 Tagen ago

BAUMLINK: Wir sind Partner und Aussteller bei der Frankfurt Tech Show 2024

Die Vorfreude steigt, denn BAUMLINK wird als Partner und Aussteller bei der Tech Show 2024…

3 Tagen ago

Business GPT: Generative KI für den Unternehmenseinsatz

Nutzung einer unternehmenseigenen GPT-Umgebung für sicheren und datenschutzkonformen Zugriff.

4 Tagen ago

Alphabet übertrifft die Erwartungen im ersten Quartal

Der Umsatz steigt um 15 Prozent, der Nettogewinn um 57 Prozent. Im nachbörslichen Handel kassiert…

7 Tagen ago

Microsoft steigert Umsatz und Gewinn im dritten Fiskalquartal

Aus 61,9 Milliarden Dollar generiert das Unternehmen einen Nettoprofit von 21,9 Milliarden Dollar. Das größte…

7 Tagen ago