Quel est le moteur de recherche auto-hébergé idéal? [fermé]

11

J'ai un site interne (intranet) qui comprend plusieurs blogs et forums, des centaines de pages statiques, de nombreux fichiers PDF et plusieurs autres types de documents. Il a été collé sans serrer au cours des deux dernières années et c'est maintenant à moi de le maintenir.

Je recherche un moteur de recherche que je puisse héberger moi-même qui idéalement:

  1. Permet de rechercher directement dans les bases de données Blog / Forum si les informations de base de données et les tableaux à rechercher sont fournis.

  2. Gère la plupart des documents texte (PDF / DOC / ODF)

  3. Est open source ou permet d'accéder au code source une fois acheté

Peu importe la langue ou la plate-forme dans laquelle il est écrit. Normalement, j'utiliserais simplement la recherche de site Google, mais ce n'est pas une option pour un intranet.

Tim Post
la source

Réponses:

2

J'ai déjà utilisé Sphider et j'ai été très impressionné.

Darryl Hein
la source
2

SearchBlox qui est basé sur Lucene peut être en mesure de répondre à vos besoins. Il est gratuit et livré avec un robot.

Matt Wilkie
la source
gratuit pour 25k urls, ce qui n'est pas beaucoup pour un intranet
cweiske
@cweiske Découvrez Ambar, il est basé sur ElasticSearch et gratuit. github.com/RD17/ambar
Ilya P
0

Normalement, je n'utiliserais que la recherche de site Google, mais ce n'est pas une option pour un intranet.

Il y a en fait le système de recherche Google qui est l'équivalent de la recherche de sites Google pour les intranets. Cependant, ce n'est pas open source (la recherche sur le site Google ne l'est pas non plus, au cas où vous ne l'auriez pas remarqué.)


la source
Je l'ai regardé. Je veux vraiment quelque chose où je puisse avoir accès au code. C'est aussi un peu lourd au service du budget.
Tim Post
En plus de Google Search Appliance, il existe un produit similaire de "Thunderstone" qui est compétitif. J'ai utilisé les deux dans le passé. Bien que cela ne fonctionne peut-être pas pour vous, je pensais que je publierais pour d'autres qui trébuchent sur la question.
digit1001