Questions marquées «pandas»

12
pandasUDF et pyarrow 0.15.0

J'ai récemment commencé à obtenir un tas d'erreurs sur un certain nombre de pysparktravaux exécutés sur des clusters EMR. Les erros sont java.lang.IllegalArgumentException at java.nio.ByteBuffer.allocate(ByteBuffer.java:334) at

12
Générer des produits cartésiens binaires filtrés

Énoncé du problème Je recherche un moyen efficace de générer des produits cartésiens binaires complets (tableaux avec toutes les combinaisons de Vrai et Faux avec un certain nombre de colonnes), filtrés par certaines conditions exclusives. Par exemple, pour trois colonnes / bits, n=3nous aurions le...

11
créer une matrice NxN à partir d'une pandas de colonne

j'ai un dataframe avec chaque ligne ayant une valeur de liste. id list_of_value 0 ['a','b','c'] 1 ['d','b','c'] 2 ['a','b','c'] 3 ['a','b','c'] je dois faire un calcul d'un score avec une ligne et contre toutes les autres lignes Par exemple: Step 1: Take value of id 0: ['a','b','c'], Step 2: find...