D'après ce que j'ai lu, il semble que vous devez utiliser Solr pour indexer et renvoyer les pièces jointes PDF et Word dans une recherche. J'ai Solr qui travaille avec Drupal mais je pense que j'ai besoin que Tika travaille sur Solr pour faire l'indexation des documents. Il y a très peu de documentation que je peux trouver pour Tika. Quelqu'un sait-il où se trouve une bonne source? Existe-t-il un moyen meilleur / plus simple de rechercher dans les documents joints à l'index Drupal?
9
Réponses:
Pour vous aider, vous avez ce joli module Apache Solr Attachments . Si vous téléchargez le module, vous aurez un fichier README.txt qui vous donnera quelques indices pour vous aider à installer et configurer Tika.
la source
Nous avons déjà utilisé avec succès Search Files auparavant, mais je pense que la dernière fois que nous l'avons utilisé, c'était il y a deux ans. Notez qu'il existe des exigences côté serveur pour que les exécutables effectuent la recherche, et qu'il n'y a pas de version Drupal 7 disponible.
la source
J'ai découvert Search File Attachments , qui prend en charge Drupal 7/8 et une variété de types de fichiers.
la source