Tag: regex

Einfügen von Zeichenfolge zum Ende der Nummer

Ich habe hässliche Schnur: oldstr = "0.100% fDrg: 2%,dgdv: 29% fGd dg 0.2%, Ghh-sf 2.2 dbgh: NONE dfgdf6 gd 3 " Ich muss einfügen | Nach der letzten Ziffer der Nummer für die nächste Aufteilung durch diese eingefügt | . Es gibt auch Wert none , wo ist auch diese Trennzeichen hinzugefügt: 0.100| fdrg: 2|,dgdv: […]

Reguläre Ausdrücke Python – Plotten von Daten aus Textdatei

Ich versuche, einige Daten aus Textdatei mit folgendem Format zu erhalten: jvm: 2011-08-29 17:09:54.438864: MemoryStatistics: [290328680, 381288448] moniData: 2011-08-29 17:09:54.438864: Depth: [0] RecordsSent: [1] rdoutData: 2011-08-29 17:09:54.438864: Depth: [0] RecordsSent: [0] rdoutReq: 2011-08-29 17:09:54.438864: TotalRecordsReceived: 132 RecordsReceived: [132] BytesReceived: [8184] sender: 2011-08-29 17:09:54.438864: NumReadoutRequestsReceived: 178 NumHitsReceived: 2663 NumReadoutsSent: 1 NumHitsCached: 0 NumHitsQueued: 310 NumReadoutRequestsQueued: 0 […]

Verwenden von regEx, um Ziffern aus String zu entfernen

Ich versuche, alle Ziffern aus einer Zeichenfolge zu entfernen, die nicht mit einem Wort verbunden sind. Beispiele: "python 3" => "python" "python3" => "python3" "1something" => "1something" "2" => "" "434" => "" "python 35" => "python" "1 " => "" " 232" => "" Bis jetzt verwende ich den folgenden regulären Ausdruck: ((?<=[ ])[0-9]+(?=[ […]

Python-Objekt passend mit String

Warum kann ich das Spiel nicht finden? >>> ti = "abcd" >>> tq = "abcdef" >>> check_abcd = re.compile('^abcd') >>> if check_abcd.search(ti) is check_abcd.search(tq): … print "Matching" … else: … print "not matching" … not matching Obwohl beide Variablen ti und tq passen und dieselbe Referenz haben >>> print check_abcd.search(ti) <_sre.SRE_Match object at 0x7ffbb05559f0> >>> […]

Parse C-Style Kommentare mit Regex, vermeiden Backtracking

Ich möchte alle Block- und Multiline-Kommentare in einer JavaScript-Datei abgleichen (das sind C-Style-Kommentare). Ich habe ein Muster, das gut funktioniert. Allerdings schafft es einige Backtracking, die es deutlich verlangsamt, vor allem bei größeren Dateien. Pattern: \/\*(?:.|[\r\n])*?\*\/|(?:\/\/.*) Beispiel: https://www.regex101.com/r/pR6eH6/2 Wie kann ich das Backtracking vermeiden?

Python-Pandas zählen Anzahl der Regex-Matches in einer Zeichenfolge

Ich habe ein Dataframe mit Sätzen und ein Wörterbuch von Begriffen, die in Themen gruppiert sind, wo ich die Anzahl der Term-Matches für jedes Thema zählen möchte. import pandas as pd terms = {'animals':["fox","deer","eagle"], 'people':['John', 'Rob','Steve'], 'games':['basketball', 'football', 'hockey'] } df=pd.DataFrame({ 'Score': [4,6,2,7,8], 'Foo': ['The quick brown fox was playing basketball today','John and Rob visited […]

Splitting Liste der Namen, wo es vielleicht gemeinsamen Nachnamen für zwei erste Namen

In Python gehe ich durch eine große Liste von Namen, was so aussieht: [u' Ron Iervolino, Trish Iervolino, Russ Middleton, and Lisa Middleton ', u' Barbara Loughlin, Dr. Gerald Loughlin, and Debbie Gelston ', u' Julianne Michelle … '] Ich bin in der Lage, diese in einzelne Namen mit diesem zu teilen: re.split('(([AZ]\.?\s?)*([AZ][az]+\.?\s?)+([AZ]\.?\s?[az]*)*)', line)[1::5] Zum […]

Scrapy- Wie man alle Blog-Posts aus einer Kategorie extrahiert?

Ich benutze scrapy, um alle Beiträge meines Blogs zu extrahieren. Das Problem ist, kann ich nicht herausfinden, wie man eine Regel, die alle Beiträge in einer beliebigen Blog-Kategorie liest? Beispiel: Auf meinem Blog hat die Kategorie "Environment Setup" 17 Beiträge. Also in der schrott Code kann ich hart Code es als gegeben, aber das ist […]

Notwendigkeit, Text mit RegEx und BeautifulSoup zu finden

Ich versuche, eine Website zu analysieren, um einige Daten herauszuziehen, die im Körper wie diesem gespeichert sind: <body> <b>INFORMATION</b> Hookups: None Group Sites: No Station: No <b>Details</b> Ramp: Yes </body> Ich würde gerne BeautifulSoup4 und RegEx verwenden, um die Werte für Hookups und Group Sites und so weiter herauszuziehen, aber ich bin neu bei bs4 […]

Python: Finden Sie eine Reihe von chinesischen Zeichen in einem String und wenden Sie eine Funktion

Ich habe eine Reihe von Text, der meistens Englisch ist, aber enthält einige Phrasen mit chinesischen Zeichen. Hier sind zwei Beispiele: s1 = "You say: 你好. I say: 再見" s2 = "答案, my friend, 在風在吹" Ich versuche, jeden Block von Chinesen zu finden, eine Funktion anwenden, die den Text übersetzen wird (ich habe bereits einen […]

Python ist die beste Programmiersprache der Welt.