Tag: unicode

Erhöhtes Verständnis von Unicode in Python (2.7)

Ich beobachte das im Programm # -*- coding: utf-8 -*- words = ['artists', 'Künstler', '艺术家', 'Митець'] for word in words: print word, type(word) Es ist nicht zwingend notwendig, die Saiten als Unicode-Strings vollständig zu qualifizieren: words = ['artist', u'Künstler', u'艺术家', u'Митець'] Die verschiedenen Alphabete werden einfach ohne das 'u' Präfix behandelt. Und so scheint es, […]

Unicode \ uxxxx in String aus JSON mit Regex entfernen

Ich habe eine JSON-Datei, die Textdaten mit dem Namen stream_key.json : {"text":"RT @WBali: Ideas for easter? Digging in with Seminyak\u2019s best beachfront view? \nRSVP: b&f.wbali@whotels.com https:\/\/t.co\/fRoAanOkyC"} Wie wir sehen können, dass der Text in der Json-Datei Unicode \u2019 , möchte ich diesen Code mit Regex in Python 2.7 entfernen, das ist mein Code so weit […]

Python nicht verknüpfen String und Unicode zu verknüpfen

Wenn ich eine Unicode-Zeichenfolge an das Ende von str anhänge, kann ich nicht auf die URL klicken. Schlecht: base_url = 'https://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=' url = base_url + u"Ángel_Garasa" print url Gut: base_url = 'https://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=' url = base_url + u"Toby_Maquire" print url

Umwandlung in Emoji

Also versuche ich, diese Daten zu verwenden, die Unicode-Indikatoren verwenden und es mit emojis drucken lassen. Es ist derzeit in einem txt. Datei, aber ich werde später eine Excel-Datei schreiben. Also irgendwie bekomme ich einen Fehler Ich bin nicht sicher, was mit zu tun ist. Dies ist der Text, den ich lese: "Thanks @UglyGod \ud83d\ude4f […]

Entfernen Sie nicht ascii Zeichen aus csv-Datei mit Python

Ich versuche, nicht-ascii Zeichen aus einer Datei zu entfernen. Ich versuche eigentlich, eine Textdatei zu konvertieren, die diese Zeichen enthält (zB hallo§åå ¢ æ à ¢ à à à à à à à à à à à à à à à à à à à à à à à à à à à à à […]

Probleme mit dem Hochsymbol mit Python tkinter Leinwand

Ich versuche, canvas.create_text (…) zu verwenden, um Text zu einer Zeichnung hinzuzufügen. Ich habe mit dem Unicode auf folgende Weise etwas erfolgreich gemacht: mytext = u'U\u2076' #U^6 canvas.create_text(xPos,yPos,text = mytext, font = ("Times","30") canvas.pack() Es funktioniert, aber bei der Erhöhung der Schriftgröße, Überschriften 4,5,6,7,8,9,0 nicht in Größe zu vergrößern. Nur 1,2,3 Arbeit. Ich nehme an, […]

RPython ord () mit Nicht-Ascii-Charakter

Ich mache eine virtuelle Maschine in RPython mit PyPy. Mein Problem ist, dass ich jeden Charakter in die numerische Darstellung umwandle. Zum Beispiel, das Umwandeln des Buchstabens "a" liefert dieses Ergebnis, 97. Und dann konvertiere ich die 97 zu hex, also bekomme ich: 0x61. Also zum Beispiel versuche ich, den Buchstaben "á" in die hexadezimale […]

Wie man meinen Unicode aus der Unicode-Byte-Darstellung abruft

Ich habe eine Unicode-Zeichenfolge κανω aber wegen einer Vorverarbeitung von einer anderen Software, die ich nicht ändern kann, wird es eine literale Zeichenfolge '\u03ba\u03b1\u03bd\u03c9' anstelle von u'\u03ba\u03b1\u03bd\u03c9' . Wie könnte ich '\u03ba\u03b1\u03bd\u03c9' zurück zu u'\u03ba\u03b1\u03bd\u03c9' ? Ich habe es versucht: >>> x = '\u03ba\u03b1\u03bd\u03c9' >>> print x \u03ba\u03b1\u03bd\u03c9 >>> print x.decode('utf8') \u03ba\u03b1\u03bd\u03c9 >>> print x.encode('utf8') […]

In Python, extrahieren nicht-englischen Worten

Ich habe eine Textdatei mit englischen Zeichen und anderen Sprachzeichen. Und mit Code unten, möchte ich einige Wörter aus dieser Datei extrahieren, die nicht Englisch besonders koreanisch ist (Unicode reichen von AC00 bis D7AF in UTF-8) Gibt es eine Möglichkeit, dies einfach in diesem Code zu tun? Muss ich noch etwas anderes machen? …. text […]

Wie konvertiere ich Unicode in Unicode-Escaped Text

Ich \xe9\x87\x8b eine Datei mit einem Bündel von Unicode-Zeichen (zB \xe9\x87\x8b ). Ich möchte diese Zeichen in ihre \u91cb -Unicode-Form ( \u91cb ) in Python \u91cb . Ich habe ein paar ähnliche Fragen hier auf StackOverflow gefunden, darunter auch diese Bewertung von UTF-8 Literal Escape Sequenzen in einer Zeichenfolge in Python3 , die fast genau […]

Python ist die beste Programmiersprache der Welt.