Eigene Suchmaschine mit Google Mini

Ist das Netzwerk erst konfiguriert, kann man den Laptop ausstecken und die Suchkonfiguration mittels eines beliebigen Browsers über das Netzwerk vornehmen. Die einfachste Konfiguration besteht darin, einen Namen für die Sammlung zu bestimmen, eine URL anzugeben, bei der der Crawl beginnen soll, und ansonsten alle Voreinstellungen zu übernehmen. Wenn man so vorgeht, kann das Gerät seinen Crawl innerhalb weniger Minuten beginnen.

Freilich wird man wahrscheinlich wenigstens einige der anderen Suchoptionen nutzen wollen. Der Mini kann maximal 100.000 Dokumente indizieren, am wahrscheinlichsten will man also jene Parameter kontrollieren, die bestimmen, welche URL-Muster durchsucht werden sollen und welche nicht. So kann man dafür sorgen, dass man keines der 100.000 Dokumente verschwendet, indem man URLs durchsucht, die einem nichts nützen. Wenn die Site zum Beispiel Druckversionen aller enthaltenen Webseiten enthält, möchte man wahrscheinlich, dass der Mini diese ignoriert.

All dies wird über die browsergestützte Konsole des Mini gesteuert. Die Benutzeroberfläche ist ein wenig karg, jedoch auch größtenteils selbsterklärend. Sehr nützlich für alle, für die reguläre Ausdrücken (regular expressions) nicht zum täglich Brot gehören, ist eine Test-Taste, mit der man ausprobieren kann, ob eine bestimmte URL den zuvor eingegebenen Mustern entspricht.

Sobald der Mini den Crawl-Vorgang beendet hat, erstellt er anhand der Dokumente einen Index und kopiert diesen heraus, so dass auf diesen von einer Abfrageoberfläche aus zugegriffen werden kann. Die Abfrageoberfläche sieht natürlich der von Google.com sehr ähnlich. Wenn der Mini als Teil des Intranets eingesetzt wird, kann man es bei den grundlegenden Anpassungen belassen, etwa der Verwendung des eigenen Unternehmenslogos anstelle des Google-Logos am Seitenbeginn. Wenn man den Mini einsetzt, um eine öffentlich zugängliche Suchseite zu betreiben, sollte man den eingebauten XSLT-Editor verwenden, um das Aussehen der Seiten so anzupassen, dass sie dem Rest der Website entsprechen.

Page: 1 2 3 4

ZDNet.de Redaktion

Recent Posts

Google stopft weitere fünf Löcher in Chrome 128

Betroffen sind Chrome für Windows, macOS und Linux. Das von den Anfälligkeiten ausgehende Risiko stuft…

3 Tagen ago

Steuerstreit mit der EU: Apple muss 13 Milliarden Euro nachzahlen

Der Gerichtshof der Europäischen Union entscheidet „endgültig“ über den Rechtsstreit. Dem Urteil zufolge sind von…

4 Tagen ago

September-Patchday: Microsoft schließt kritische Zero-Day-Lücke in Windows Update

Sie betrifft ältere Versionen von Windows 10. Ein weiterer kritischer Bug steckt aber auch in…

4 Tagen ago

CloudEye für 18 Prozent aller Malware-Infektionen in Deutschland verantwortlich

Der Downloader nimmt Windows-Rechner ins Visier. RansomHub festigt seine Position als führende Ransomware-Gruppe weltweit.

4 Tagen ago

Funeral Scams: Neue perfide Online-Betrugsmasche auf Facebook

Britische Bestattungsunternehmen haben bereits reagiert und weisen darauf hin, dass ihre Beerdigungen nicht gelivestreamt werden.

5 Tagen ago

Apple stellt iPhone 16 und iPhone 16 Pro vor

Der neue Apple-Prozessor A18 basiert auf einem 3-Nanometer-Verfahren. Apple verspricht mehr Leistung und eine höhere…

5 Tagen ago