Tag: regex

Regelmäßiger Ausdruck, um jedes Zeichen genau genau zweimal zu entsprechen

Ich versuche zu identifizieren, ob ein gelieferter String Zeichen genau zweimal wiederholt hat. Das folgende ist der reguläre Ausdruck, den ich verwende: ([az])\1(?!\1) Allerdings, wenn sie gegen die folgenden Strings getestet werden, passen beide Strings unten dem Muster (obwohl ich verwendet habe (?! \ 1): >>> re.findall(r'.*([az])\1(?!\1)', 'abcdeefg') ['e'] >>> re.findall(r'.*([az])\1(?!\1)', 'abcdeeefg') ['e'] Nicht sicher, […]

Python-regulärer Ausdruck mit dem OR-Operator

Ich versuche, eine große Stichprobe von Textdateien mit regulären Ausdrücken (RE) zu analysieren. Ich versuche, aus diesen Dateien den Teil des Textes zu extrahieren, der 'vu' enthält und mit einer newline '\ n' endet. Patterns unterscheiden sich von einer Datei zu einer anderen, also habe ich versucht, nach Kombinationen von RE in meinen Dateien mit […]

Wie erfasse ich von whitespace + {n} zum nächsten {n} in regex

Ich habe ein Dokument aufgeräumt, um mir zu erlauben, es richtig durch Vers zu reißen. Als schwach in regex Ich kann nicht scheinen, um den richtigen Ausdruck zu finden, um diese Verse zu extrahieren. Dies ist der Ausdruck, den ich verwende: (\t?\t?{\d+}.*){ Und das tue ich in Python, obwohl ich das erwarte, dass das egal […]

Wie überprüft man, dass ein regulärer Ausdruck einen String vollständig übereinstimmt, dh – der String enthielt kein zusätzliches Zeichen?

Ich habe zwei Fragen: 1) Ich habe einen regulären Ausdruck ([AZ][az]{0,2})(\d*) und ich benutze Python's re.finditer() , um entsprechende Strings re.finditer() . Mein Problem ist, dass ich nur Strings übereinstimmen möchte, die keine zusätzlichen Zeichen enthalten, sonst möchte ich eine Ausnahme auslösen. Ich möchte ein folgendes Muster fangen: – Großbuchstabe, gefolgt von 0, 1 oder […]

Arbeit mit Chinesen in Python

Ich versuche, mit chinesischem Text und großen Daten in Python zu arbeiten. Ein Teil der Arbeit ist sauberer Text von einigen nicht benötigten Daten. Für dieses Ziel verwende ich Regexes. Allerdings habe ich einige Probleme wie in Python Regex wie in PyCharm Anwendung: 1) Die Daten werden in postgresql gespeichert und in den Spalten gut […]

Bedingter Regex-Ersatz

Mit Python können Sie überprüfen, ob eine Gruppe leer ist, bevor Sie Text ersetzen? Beispiel: [user] John Marshal –> [user]<br><strong>Jonh Marshal<strong> John Marshal –> <strong>Jonh Marshal<strong> Die Regex sollte dies verwenden, aber mit der "Bedingung", um das <br> nur einzutragen, wenn Gruppe 1 gefunden wird. title = re.sub(r'^\s*(\[.*?\])?\s*(.*)', r'\1<br><strong>\2</strong>', title)

Erweitere bestimmte Teilstrings elegant in einer größeren Saite in Python

Hallo, ich möchte den Teilstring des Typs 4-6 auf 4,5,6 in einer größeren Saite elegant erweitern s = "235:2,4,6-9,12,14-19;240:3,5-9,10;245:4,9,10-15,18" print expand(s) 235:2,4,6,7,8,9,12,14,15,16,17,18,19;240:3,5,6,7,8,9,10;245:4,9,10,11,12,13,14,15,18 Python verwenden Gibt es da etwas regexp voodoo oder ähnliches? Danke vielmals!

Nummern löschen nicht in Python (regex)

Ich weiß, wie man extra-Wort Zahlen in Python löschen , mit: s = re.sub("^\d+\s|\s\d+\s|\s\d+$", " ", s) Ich frage mich, ob es möglich wäre, die gleiche Aktion auszuführen, während sie Daten halten: s = "I want to delete numbers like 84 but not dates like 2015" In englischer Sprache könnte eine schnelle und schmutzige Regel […]

Python RE gibt nichts zurück nach / ref =

Ich versuche, den URL- und Kategoriennamen aus der Bestsellerliste von Amazon abzurufen. Aus irgendeinem Grund ist die RE, die ich benutze, aufhört, wenn es begegnet /ref= und ich sehe wirklich nicht warum? Ich benutze Python 2.7 auf einer Windows 7 Box. Ein typischer Rekord ist <li><a href="http://www.amazon.ca/Best-Sellers-Appstore-Android/zgbs/mobile-apps/ref=zg_bs_nav_0">Appstore for Android</a></li> Und mein RE ist Regex = […]

Python Reguläre Ausdrücke – Limit Ergebnisse?

Ich fühle mich irgendwie dumm, dies zu fragen, aber ich habe ein paar reguläre Ausdrücke gemacht, um bestimmte Unternehmen, Adressen und URLs in einem HTML-Dokument zu finden. Das Problem ist … Ich weiß nicht, welche (python) reguläre Ausdrucksache ich verwenden sollte. Wenn ich re.findall verwende, bekomme ich 30 bis 90 Ergebnisse. Ich möchte es auf […]

Python ist die beste Programmiersprache der Welt.