RSS richtig ausreizen

Neu im offiziellen Standard RSS 1.0 war vor allem die Gliederung der RSS-Datei in drei Abschnitte. Der Kopf (Head) weist die Datei als XML-Dokument aus. Das <?xml … ?> Tag sollte zwingend in der ersten Spalte der ersten Zeile beginnen. Eine Leerzeile oder Kommentare dürfen die Datei nicht eröffnen, da verschiedene XML-Parser das Format sonst schon gar nicht mehr bearbeiten. So versagt etwa der bordeigene Parser von Mozilla den Dienst, findet er das XML-Tag nicht gleich am Anfang des Dokumentes, während Microsofts Internet Explorer führende Leerzeichen oder Kommentare generös übersieht und das an sich nicht standard-konforme XML trotzdem parst.

Mit dem W3C-Standard wurde RSS außerdem international. Während RSS 0.9x Dateien in der Regel ANSII-Codiert waren, sieht RSS 1.0 das Encoding im UTF-8 Format vor. Somit lassen sich in RSS nun auch Sonderzeiten und Umlaute verwenden. Nur spezielle Zeichen, die im Rahmen des RSS-Standards oder als XML vom Parser interpretiert werden wie die eckigen Klammern, Anführungszeichen oder „&“ sind bei Verwendung innerhalb eines Tags zu markieren – das „&“ etwa als „&amp;“.

Zeile 2 weist die Datei schließlich als RDF-konforme RSS-Datei aus. Hier wird auf die im XML-Dokument verwendeten Name Spaces (xmlns) Bezug genommen. Der Name Space spezifiziert die verwendeten Tags und schreibt jedem definierten Tag eine eindeutige Syntax vor, an die sich der Autor der XML-Datei halten sollte. Für eine RSS 1.0 konforme Datei sieht der Kopf damit wie folgt aus:

Nach dem Kopf folgt die Channel-Beschreibung. Hier finden sich generelle Informationen über den RSS-Feed und dessen Publisher. Das Channel-Tag ist in RSS 1.0 bindend und muss ein rdf:about Attribut ausweisen, das den Channel über eine URI (Uniform Resource Identifier) eindeutig identifiziert. In der Regel setzt man hier die URL, unter welcher der RSS-Feed veröffentlich ist.

Die Channel-Beschreibung setzt sich mit einem Titel (<TITLE>), einem Link zum Publisher (<LINK>) eine Beschreibung des Channels (<DESCRIPTION>) sowie einer Aufzählung der aktuell enthaltenen News-Items (<ITEMS>-Block) fort. Diese Elemente müssen im Channel auftauchen. Hier ein Beispiel:

Das <IMAGE>-Tag ist optional und kann einen Link auf ein Logo oder eine Grafik für den Channel enthalten. Die Grafik wird über das Attribute rdf:ressource als URL eingebettet, unter der es abgerufen werden kann. Ebenfalls optional ist der Tag <TEXTINPUT>. Hierüber kann eine Texteingabe etwa für eine Suche ebenfalls über das Attribut rdf:ressource in die RSS-Datei eingebettet werden.

Über das Tag <ITEMS> muss eine komplette Auflistung der im abschließenden About-Block der RSS-Datei enthaltenen News folgen. Diese ist als Aufzählung (RDF-Sequenz) mit dem Tag <RDF:SEQ> zu beginnen und zu schließen. Dazwischen sind die Listenelemente der RDF-Aufzählung als <RDF:LI> mit dem ressource-Attribut aufzuführen, wobei als Attribut die Links auf die im Folgenden näher spezifizierten Web-Seiten zu definieren sind. Das Tag </CHANNEL> schließt den zweiten Block der XML-Datei ab.

Page: 1 2 3 4 5

ZDNet.de Redaktion

Recent Posts

MDM-Spezialist Semarchy stellt Data-Intelligence-Lösung vor

Als Erweiterung von Master-Data-Management ermöglicht es die Lösung, den Werdegang von Daten verstehen und sie…

4 Tagen ago

Apple stopft 15 Sicherheitslöcher in iOS und iPadOS

Sie erlauben unter anderem das Einschleusen von Schadcode. In älteren iPhones und iPads mit OS-Version…

4 Tagen ago

Hochleistungs-NAS-Speicher für KI-Daten

Neuer Speicher für KI von Huawei mit integrierter Ransomware-Erkennungs-Engine und deutlich geringerem Energiekonsum.

5 Tagen ago

Abo für Facebook: Verbraucherzentrale NRW klagt erneut gegen Meta

Diesmal geht es um das neue Abomodell für Facebook und Instagram. Die Verbraucherschützer klagen auf…

5 Tagen ago

Jedes zweite Gerät mit Redline-Infostealer infiziert

Infostealer-Infektionen haben laut Kaspersky-Studie zwischen 2020 und 2023 um mehr als das sechsfache zugenommen.

5 Tagen ago

Kaspersky warnt vor kritischen Sicherheitslücken in Cinterion-Modems

Betroffen sind Millionen IoT- und M2M-Geräte Geräte weltweit. Unter anderem können Angreifer per SMS Schadcode…

5 Tagen ago