J'utilise des trames de données Pandas. J'ai une trame de données initiale, disons D
. J'en extrait deux trames de données comme ceci:
A = D[D.label == k]
B = D[D.label != k]
puis je change l'étiquette A
etB
A.label = 1
B.label = -1
Je veux combiner A et B afin de pouvoir les avoir comme une seule trame de données, quelque chose comme une opération d'union. L'ordre des données n'est pas important. Cependant, lorsque nous échantillonnons A et B à partir de D, ils conservent leurs index de D.
Vous pouvez également utiliser
pd.concat
, ce qui est particulièrement utile lorsque vous joignez plus de deux dataframes:la source
Pensé pour ajouter ceci ici au cas où quelqu'un le trouverait utile. @ostrokach a déjà mentionné comment fusionner les blocs de données entre les lignes, ce qui est
Pour fusionner les colonnes, vous pouvez utiliser la syntaxe suivante:
la source
Il existe une autre solution pour le cas où vous travaillez avec du Big Data et avez besoin de concaténer plusieurs ensembles de données.
concat
peut être gourmand en performances, donc si vous ne voulez pas créer un nouveau df à chaque fois, vous pouvez à la place utiliser une compréhension de liste :(comme indiqué ici dans la documentation en bas de la section):
la source
Si vous souhaitez mettre à jour / remplacer les valeurs du premier dataframe
df1
par les valeurs du second dataframedf2
. vous pouvez le faire en suivant les étapes -Étape 1: définir l'index de la première trame de données (df1)
Étape 2: définir l'index de la deuxième trame de données (df2)
et enfin mettre à jour le dataframe à l'aide de l'extrait suivant -
la source
1ère dataFrame
résultat:-
2ème dataFrame
résultat:-
Combiner
Vérifier
résultat:-
la source