Tag: regex

Regulärer Ausdruck, um URL aus einem HTML-Link zu extrahieren

Ich bin ein Anfänger in Python. Ich lerne Regexen, aber ich brauche hier Hilfe. Hier kommt die HTML-Quelle: <a href="http://www.ptop.se" target="_blank">http://www.ptop.se</a> Ich versuche, ein Tool zu codieren, das nur http://ptop.se . Kannst du mir bitte helfen?

Umkehrung eines regulären Ausdrucks in Python

Ich möchte einen regelmäßigen Ausdruck umkehren. Dh, der einen regelmäßigen Ausdruck gegeben hat, möchte ich jede Zeichenkette produzieren, die mit diesem Regex übereinstimmt. Ich weiß, wie man das aus einem theoretischen Informatik-Hintergrund mit einer Finite-State-Maschine zu tun, aber ich möchte nur wissen, ob jemand bereits eine Bibliothek geschrieben hat, um dies zu tun. 🙂 Ich […]

Split-String auf Whitespace in Python

Ich suche das Python-Äquivalent von String str = "many fancy word \nhello \thi"; String whiteSpaceRegex = "\\s"; String[] words = str.split(whiteSpaceRegex); ["many", "fancy", "word", "hello", "hi"]

Wie geteilt, aber ignorieren Separatoren in zitierten Strings, in Python?

Ich muss eine Saite wie diese auf Semikolons aufteilen. Aber ich möchte nicht auf Semikolons, die sich in einem String ('oder "), geteilt werden. Ich bin nicht analysieren eine Datei, nur eine einfache Zeichenfolge ohne Zeilenumbrüche. part 1;"this is ; part 2;";'this is ; part 3';part 4;this "is ; part" 5 Ergebnis sollte sein: Teil […]

Python: Wie passiert man verschachtelte Klammern mit Regex?

Ich versuche, eine mathematische Ausdruck-ähnliche Zeichenfolge zusammenzubringen, die Klammern verschachtelt hat. import re p = re.compile('\(.+\)') str = '(((1+0)+1)+1)' print p.findall(s) ['(((1 + 0) +1) +1)'] Ich wollte, dass es alle eingeschlossenen Ausdrücke, wie (1 + 0), ((1 + 0) +1) … Ich kümmere mich nicht darum, ob es sich um unerwünschte wie ((1 + […]

Python und regelmäßiger Ausdruck mit Unicode

Ich muss einige Unicode-Symbole aus der Zeichenfolge 'بسم الله الرحمن الرحيم' löschen Ich weiß, dass sie hier sicher sind. Ich versuche: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ') Aber es funktioniert nicht String bleibt gleich. Ameisenvorschlag, was ich falsch mache?

Python reguläre Ausdrücke – wie man mehrere Gruppen aus einem Wildcard-Ausdruck erfassen kann?

Ich habe einen Python-regulären Ausdruck, der eine Gruppe enthält, die null oder viele Male auftreten kann – aber wenn ich die Liste der Gruppen danach abrufe, ist nur die letzte vorhanden. Beispiel: re.search("(\w)*", "abcdefg").groups () Das gibt die Liste ('g',) Ich brauche es, um zurückzukehren ('a', 'b', 'c', 'd', 'e', ​​'f', 'g',) Ist das möglich? […]

Einfachste Möglichkeit, einen String durch ein Wörterbuch von Ersatz zu ersetzen?

Erwägen.. dict = { 'Спорт':'Досуг', 'russianA':'englishA' } s = 'Спорт russianA' Ich möchte alle Dict-Schlüssel mit ihren jeweiligen Dict-Werten in s ersetzen.

Regulärer Ausdruck zur Erkennung von Semikolon beendet C ++ für & während Schleifen

In meiner Python-Anwendung muss ich einen regulären Ausdruck schreiben, der mit einer C ++ – oder while Schleife übereinstimmt, die mit einem Semikolon ( ; ) beendet wurde. Zum Beispiel sollte es mit diesem übereinstimmen: for (int i = 0; i < 10; i++); … aber nicht das: for (int i = 0; i < […]

Lohnt es sich, Pythons re.compile zu benutzen?

Gibt es einen Vorteil bei der Kompilierung für reguläre Ausdrücke in Python? h = re.compile('hello') h.match('hello world') Vs re.match('hello', 'hello world')

Python ist die beste Programmiersprache der Welt.