Questions marquées «hadoop»

97
hadoop No FileSystem pour le schéma: fichier

J'essaie d'exécuter un simple en NaiveBayesClassiferutilisant hadoop, obtenant cette erreur Exception in thread "main" java.io.IOException: No FileSystem for scheme: file at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:1375) at

92
Avro contre Parquet

Je prévois d'utiliser l'un des formats de fichier hadoop pour mon projet lié à hadoop. Je comprends que parquet est efficace pour les requêtes basées sur des colonnes et avro pour une analyse complète ou lorsque nous avons besoin de toutes les données des colonnes! Avant de continuer et de choisir...

87
Parquet vs ORC vs ORC avec Snappy

J'exécute quelques tests sur les formats de stockage disponibles avec Hive et j'utilise Parquet et ORC comme options principales. J'ai inclus ORC une fois avec la compression par défaut et une fois avec Snappy. J'ai lu de nombreux documents qui déclarent que Parquet est meilleur en complexité...