Tag: pandas

Python: Introspektion, Wie würde ich überprüfen, dass Werte in einer Serie Strings sind?

Aufbauend auf einer vorherigen Frage wurde mir gesagt, dass pd.cut Strings produziert. Beispielsweise: agepreg_cuts = pd.cut(df['agepreg'],[0,20,25,30,pd.np.inf], right=False) agepreg_cuts[0:10] Der obige Code gibt mir die folgenden Werte 0 [30, inf) 1 [30, inf) 2 [0, 20) 3 [0, 20) 4 [0, 20) 5 [25, 30) 6 [25, 30) 7 [30, inf) 8 [25, 30) 9 [30, […]

Holen Sie sich sowohl die Top-n-Werte als auch die Namen der Spalten, in denen sie auftreten, innerhalb jeder Zeile in dataframe

Ich habe ein Dataframe wie in diesem: df = pd.DataFrame({'a':[1,2,1],'b':[4,6,0],'c':[0,4,8]}) +—+—+—+ | a | b | c | +—+—+—+ | 1 | 4 | 0 | +—+—+—+ | 2 | 6 | 4 | +—+—+—+ | 1 | 0 | 8 | +—+—+—+ Für jede Zeile brauche ich ( beide ) die 'n' (in diesem […]

Wählen Sie mit Pandas in Python die höchste Wertzeile für jede Gruppe aus

Mit Pandas, für den folgenden Datensatz author1,category1,10.00 author1,category2,15.00 author1,category3,12.00 author2,category1,5.00 author2,category2,6.00 author2,category3,4.00 author2,category4,9.00 author3,category1,7.00 author3,category2,4.00 author3,category3,7.00 Ich möchte den höchsten Wert für jeden Autor bekommen author1,category2,15.00 author2,category4,9.00 author3,category1,7.00 author3,category3,7.00 (Entschuldigungen, ich bin ein Pandas Noob.)

Python Pandas Melt Gruppen von Anfangssäulen in mehrere Zielspalten

Ich habe die Notwendigkeit, Gruppen von Anfangssäulen in mehrere Zielspalten in einem Datensatz zu schmelzen, der nicht gut normalisiert ist. Hier ist ein Beispiel (aus dieser Frage pandas dataframe Umformung / Stapelung von mehreren Wertvariablen in seperate Spalten ): des1 des2 des3 interval1 interval2 interval3 value aaa abc ##1 ##2 ##3 bbb def ##4 ##5 […]

Wie lösche man eine nicht-numerische Spalte aus einem Eingabedatensatz?

Zum Beispiel, wenn ich eine Blumenart, Anzahl der Blütenblätter, Keimungszeit und Benutzer- ID betrachten will, wird die Benutzer- ID dort einen Bindestrich haben. Also in meiner Datenanalyse möchte ich es nicht verwenden. Ich bin mir bewusst, dass ich es hart kodieren kann, aber ich möchte es so machen, wenn ich irgendwelche Datenmenge eingabe, wird es […]

Pandas: Umgestalten Sie breite Dataframe zu multi-indexed lange

Ich habe einen Datensatz von Bewertungen von Fotos, die von vielen einzelnen Ratern erzeugt wurden. Jeder Rater gibt mehrere Bilder zu bewerten, und für jedes Bild, ein Rater bietet mehrere verschiedene Bewertungen, plus eine Beschreibung. So zum Beispiel könnte ein Rater gefragt werden, um 3 verschiedene Fotos zu bewerten, und bieten separate Bewertungen auf einer […]

Exportieren von Dataframe zu Oracle: TypeError

Ich versuche immer wieder, das folgende Dataframe zu meiner Oracle-Tabelle zu exportieren: final df is: S USTAINABLE H ARVEST S ECTOR| QUOTA LISTING JUN 11 2013 Unnamed: 1 \ 2 6/4/13 130196 3 5/28/13 130158 4 6/4/13 130210 5 5/14/13 130079 6 6/4/13 130187 7 6/4/13 130208 8 6/11/13 130249 9 6/4/13 130204 10 5/28/13 […]

Str-Fehler beim Ersetzen von Werten in pandas dataframe

Mein Code kratzt Informationen von der Website und stellt sie in ein Dataframe. Aber ich bin mir nicht sicher, warum die Reihenfolge des Codes den Fehler verursacht: AttributeError: Can only use .str accessor with string values, which use np.object_ dtype in pandas Grundsätzlich haben die gescannten Daten über 20 Zeilen und 10 Spalten. Einige Werte […]

Wie kann man die Zeit auf der y-Achse in '% H:% M' Format in Matplotlib aufzeichnen?

Ich möchte die Zeiten aus einer datetime64-Serie aufzeichnen, wobei die y-Achse als '% H:% M formatiert ist und nur 00:00, 01:00, 02:00 usw. zeigt. Dies ist, was die Handlung aussieht, ohne die y-Achsen-Formatierung anzupassen. import numpy as np import pandas as pd import matplotlib.pyplot as plt from matplotlib.dates import DateFormatter from matplotlib.dates import HourLocator df […]

Lookup-String-Werte in der Lookup-Tabelle, um das zweite Dataframe zu füllen

Ich habe zwei dataframes, main_df : | header_1 0 | value_1 1 | value_2 2 | value_3 3 | value_1 Und ein Lookup Dataframe lookup_df : | header_1 | header_2 0 | value_1 | lookup_value_1 1 | value_2 | lookup_value_2 2 | value_3 | lookup_value_3 3 | value_4 | lookup_value_4 Die Werte in main_df sind […]

Python ist die beste Programmiersprache der Welt.