Questions marquées «hadoop»

97

hadoop No FileSystem pour le schéma: fichier

J'essaie d'exécuter un simple en NaiveBayesClassiferutilisant hadoop, obtenant cette erreur Exception in thread "main" java.io.IOException: No FileSystem for scheme: file at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:1375) at

92

Avro contre Parquet

Je prévois d'utiliser l'un des formats de fichier hadoop pour mon projet lié à hadoop. Je comprends que parquet est efficace pour les requêtes basées sur des colonnes et avro pour une analyse complète ou lorsque nous avons besoin de toutes les données des colonnes! Avant de continuer et de choisir...

hadoop avro parquet

91

Apache Spark peut-il fonctionner sans hadoop?

Y a-t-il des dépendances entre Spark et Hadoop ? Sinon, y a-t-il des fonctionnalités qui me manqueront lorsque j'exécuterai Spark sans Hadoop ?

hadoop amazon-s3 apache-spark mapreduce mesos

88

Comment connaître les versions Hive et Hadoop à partir de l'invite de commande?

Comment puis-je trouver la version de Hive que j'utilise à partir de l'invite de commande. Voici les détails- J'utilise Putty pour me connecter à la table de la ruche et accéder aux enregistrements dans les tables. Donc ce que j'ai fait c'est - j'ai ouvert Putty et dans le nom d'hôte j'ai tapé...

hadoop hive

87

Parquet vs ORC vs ORC avec Snappy

J'exécute quelques tests sur les formats de stockage disponibles avec Hive et j'utilise Parquet et ORC comme options principales. J'ai inclus ORC une fois avec la compression par défaut et une fois avec Snappy. J'ai lu de nombreux documents qui déclarent que Parquet est meilleur en complexité...

hadoop hive parquet snappy orc

84

Traitement de données à grande échelle Hbase vs Cassandra [fermé]

Dans l'état actuel des choses, cette question ne convient pas à notre format de questions-réponses. Nous nous attendons à ce que les réponses soient étayées par des faits, des références ou une expertise, mais cette question suscitera probablement un débat, des arguments, un sondage ou une...

nosql hadoop cassandra hbase data-processing