J'essaie d'exécuter xgboost dans scikit learn. Et j'utilise uniquement des Pandas pour charger des données dans la trame de données. Comment suis-je censé utiliser pandas df avec xgboost. Je suis confus par la routine DMatrix requise pour exécuter xgboost algo.
scikit-learn
pandas
xgboost
Ghostintheshell
la source
la source
xgb.DMatrix(X_train.values, y_train.values)
je voisTypeError: can not initialize DMatrix from dict
.values
)Il y a de bonnes nouvelles, il existe une bibliothèque
pandas_ml
qui prend en charge XGBoost, cela rationalisera simplement le flux de travail.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
la source
Vous pouvez désormais utiliser Pandas DataFrames directement avec XGBoost. Fonctionne certainement avec xgboost 0.81.
Par exemple, où X_train, X_val, y_train et y_val sont des DataFrames:
la source