Searchengine

Semager unterstützt Sie beim Aufbau Ihres eigenen Suchmaschinen-Indexes.

Ob als Consulter, für Schulungen oder als kompletter Dienstleister, wir erstellen Ihnen Ihren eigenen Index.

Die Anwendungsgebiete umfassen in der Regel Intranetsuchmaschinen oder Spezialsuchmaschinen mit bis zu 5 Millionen Webseiten. Für den Aufbau eines Indexes mit mehrere hundert Millionen Webseiten, wie er für Websuchmaschinen verwendet werden kann, müssen Sie aber enorme Ressourcen zur Verfügung stellen. Die verwendete Technologie basiert auf die Opensource Frameworks Nutch und Lucene und ist hochskalierbar. Dank der implentierten Hadoop-Clustering-Technik, welche auch von Yahoo eingesetzt wird, können Sie mehrere hundert oder auch tausend Rechner zu einem Verband kombinieren und somit extrem viele Seiten indexieren lassen. Die Technologie umfasst viele Dokumentenarten wie z.B. Powerpoint, PDF, Word, Excel, HTML, RSS und viele weitere. Ebenfalls inbegriffen ist ein PageRank (Google Trademark) ähnlicher Algorithmus, um das Ranking einer Seite rekursiv nach der Anzahl der Links zu bestimmen.

Diese Artikel könnten Sie auch interessieren:
Name (notwendig)
Email (notwendig, wird aber nicht veröffentlicht)
Website