awk-Befehle haben eine einfache Struktur, sie bestehen aus:
Wenn nur ein Muster angegeben ist, ist die Default-Aktion print. Wenn nur eine Aktion angegeben ist, wird jede Zeile bearbeitet. Werden beide verwendet, wird die Aktion auf jede Zeile angewandt, für die das Muster zutrifft. Eine Aktion kann aus mehreren Anweisungen bestehen, die durch Semikolons getrennt sind.
Die Zeilenauswahl verwendet entweder kein, ein oder zwei Auswahlkriterien. Wenn mehrere Kriterien angegeben sind, werden sie durch Kommata getrennt. Das Muster kann ein Regulärer Ausdruck oder ein Boolscher Ausdruck sein. Wie bereits erwähnt, wird die Aktion für jede Eingabezeile ausgeführt, sofern kein Muster angegeben ist. Ist ein Muster angegeben, wird der Befehl nur für die Zeilen ausgeführt, auf die das Auswahlkriterium zutrifft. Werden zwei Muster verwendet, beginnen die zu verarbeitenden Daten mit der ersten Zeile, auf die die erste Bedingung zutrifft, und enden mit der Zeile, auf die die zweite Bedingung passt. Alle dazwischen liegenden Zeilen werden bearbeitet. Jedes Muster wird auf jede Zeile der Eingabedaten angewandt, solange nicht bei einer früheren Aktion ein next-Ausdruck angewandt wurde.
Die Verarbeitung fängt mit BEGIN-Blöcken an. BEGIN ist ein reserviertes Wort in awk, es muss vollständig groß geschrieben werden. Als nächstes werden die Variablen von der Kommandozeile zugewiesen. Dann wird jede Zeile der Eingabe gelesen und fest eingebauten Variablen zugewiesen. Zu jedem Befehl wird das zugehörige Muster ausgewertet und der Befehl ausgeführt, wenn das Muster passt. Zum Schluss werden die END-Blöcke ausgeführt.
awk verfügt über mehrere eingebaute Datentypen:
Variablen müssen nicht deklariert werden und können beliebige Datentypen enthalten, die sich auch im Verlauf des Programms ändern dürfen. Variablen-Namen müssen mit einem Buchstaben beginnen und bestehen aus weiteren Buchstaben, Ziffern oder Unterstrichen, wie Listing A zeigt.
awk verwendet für eingebaute Variablen nur Großbuchstaben, dieses Format sollte man also bei eigenen Variablen vermeiden. Die gebräuchlichsten eingebauten Variablen sind NR, NF und FS. NR ist die Nummer der aktuellen Zeile, NF ist die Anzahl der Felder in der aktuellen Zeile, und FS ist das Trennzeichen für Eingabefelder. Jeder einzelne Datensatz wird in Felder mit den Namen $1, $2 etc. geteilt, wobei $0 den kompletten Datensatz enthält. Auf Felder kann man zugreifen, indem man entweder $n oder $var benutzt, wobei var ein Wert zwischen 0 und NF ist.
Das operative Ergebnis wächst um fast 6 Billionen Won auf 6,64 Billionen Won. Die Gewinne…
Ab Werk blockiert Chrome Cookies von Dritten nun frühestens ab Anfang 2025. Unter anderem gibt…
Die Vorfreude steigt, denn BAUMLINK wird als Partner und Aussteller bei der Tech Show 2024…
Nutzung einer unternehmenseigenen GPT-Umgebung für sicheren und datenschutzkonformen Zugriff.
Der Umsatz steigt um 15 Prozent, der Nettogewinn um 57 Prozent. Im nachbörslichen Handel kassiert…
Aus 61,9 Milliarden Dollar generiert das Unternehmen einen Nettoprofit von 21,9 Milliarden Dollar. Das größte…