Regular Expressions: Syntax enträtselt

Ein letztes wichtiges Konzept bei der Verwendung von Regular Expressions sind die reservierten Zeichen (auch Spezialzeichen genannt). Wenn man z.B. nach den Zeichenfolgen „ne*rd“ und „ni*rd“ suchen will, wird das Suchmuster „n[ei]*rd“ Variationen von „neeeeerd“ und „nieieierd“ erkennen, nicht aber die gewünschten Zeichenfolgen. Da ‚*‘ (der Kleene-Stern) ein reserviertes Zeichen ist, muss man eine Escape-Sequenz mit einem Backslash () im Muster verwenden: „n[ei]*rd“. Zu den weiteren reservierten Zeichen gehören:

  • ^ (Caret)
  • . (Punkt)
  • [ (linke eckige Klammer)
  • $ (Dollar-Zeichen)
  • ( (linke Klammer)
  • ) (rechte Klammer)
  • | (senkrechter Strich)
  • * (Sternchen)
  • + (Plus-Zeichen)
  • ? (Fragezeichen)
  • { (linke geschwungene Klammer)
  • (Backslash)

Wenn man erst einmal anfängt, diese Zeichen in Suchstrings einzufügen, wundert man sich nicht mehr, dass Regular Expressions schwieriger zu lesen als zu schreiben sind. Schauen Sie sich einmal den folgenden Code-Abschnitt an, der die eregi-Funktion in PHP aufruft, um zu prüfen, ob eine E-Mail-Adresse das korrekte Format hat:
eregi(„^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9-]+(.[a-z0-9-]+)*$“,$sendto)

Oder wie wär’s mit dieser vi-Substitution, um eine globale URI durch den lokalen Dateinahmen zu ersetzen:
s/http://www.somedomain.com/somedir/index.html/../somedir/index.html/

Wie man sieht, kann es schwierig werden, zu erkennen, was da eigentlich passiert. Aber wenn man für die Spezialzeichen keine Escape-Sequenzen benutzt, würde das die Bedeutung des Musters dramatisch ändern.

Zusammenfassung

In diesem Artikel habe ich versucht, das Geheimnis der Regular Expressions etwas zu lüften und eine Übersicht über die gebräuchlichsten Konstruktionen aus dem ERE-Standard zu geben. Wer sich für die vollständige Beschreibung der Open Group-Richtlinien interessiert, findet die Spezifikation online unter: Regular Expressions.

Page: 1 2 3 4

ZDNet.de Redaktion

Recent Posts

So günstig & effizient war Content Produktion noch nie: Neues Content System erobert deutschen Markt

Kontinuierliche Content Produktion und Markenaufbau sind essentieller Pfeiler von langfristigen Unternehmenserfolg. Das ist mittlerweile auch…

5 Tagen ago

Lenovo übertrifft die Erwartungen und hebt Prognose an

KI-Funktionen beschleunigen die Erholung des PC-Markts. Der Nettogewinn legt um 44 Prozent zu, der Umsatz…

5 Tagen ago

Bedrohungsakteure betten Malware in macOS-Flutter-Anwendungen ein

Googles App-Entwickler-Kit dient der Tarnung des schädlichen Codes. Der Sicherheitsanbieter Jamf hält die Schadsoftware für…

5 Tagen ago

CopyRhadamantys greift weltweit Unternehmen an

Ausgeklügelte Phishing-Kampagne verwendet eine weiterentwickelte Version der Rhadamanthys-Stealer-Malware.

1 Woche ago

Facebook Marketplace: EU verhängt Geldbuße von fast 800 Millionen Euro gegen Meta

Die EU-Kommission kritisiert die Verknüpfung von Facebook und dem hauseigenen Online-Kleinanzeigendienst. Sie sieht darin einen…

1 Woche ago

Umfrage: Angestellte in Deutschland unterschätzen NIS-2-Richtlinie

Fast zwei Drittel halten jedoch eine Umsetzung aller Vorgaben von NIS 2 bis Jahresende für…

1 Woche ago