Informationsextraktion - Suchmaschinen
30 views | +0 today
Follow
Your new post is loading...
Your new post is loading...
Scooped by ideenplanet
Scoop.it!

Apache Solr vs ElasticSearch - Feature Vergleich

ideenplanet's insight:

Sehr kompakter und verständlicher Vergleich der Features von Solr und ElasticSearch. Im Bereich Content Ingestion (Einlesen und Vorverarbeiten von Dokumenten) sind allerdings beide ähnlich schwach.

more...
No comment yet.
Scooped by ideenplanet
Scoop.it!

Crashkurs Suchlogik - Boolesche Operatoren

Crashkurs Suchlogik - Boolesche Operatoren | Informationsextraktion - Suchmaschinen | Scoop.it
Wir verwenden jeden Tag boolesche Ausdrücke, ohne es zu wissen. Ein Blick hinter die Kulissen von Google & Co. verrät, was man mit der Boole-Magie alles erreichen kann, wenn man sie zu handhaben weiß.
ideenplanet's insight:

Zu viele Leute glauben, sie seien Rankingexperten und verstehen dabei noch nicht mal, wie die Abfragewörter bei Google und anderen Suchmaschinen auf ein Ergebnis abgebildet werden.


In unserem aktuellen Blog-Post erklären wir, wie Boolesche Ausdrücke funktionieren und warum sie für jede Suchmaschine wichtig sind.

more...
No comment yet.
Scooped by ideenplanet
Scoop.it!

Google-Patent: Suchergebnis-Optimierung durch TV-Sendungen - serienjunkies.de

Google-Patent: Suchergebnis-Optimierung durch TV-Sendungen - serienjunkies.de | Informationsextraktion - Suchmaschinen | Scoop.it
Google-Patent: Suchergebnis-Optimierung durch TV-Sendungen
serienjunkies.de
2011 hat der Suchmachinen-Betreiber Google das Patent auf ein System angemeldet, welches Suchergebnisse auf der Grundlage der TV-Nutzung des Users optimiert.
ideenplanet's insight:

Jedweder Nutzerkontext hilft dabei, bessere Suchergebnisse auszuliefern (siehe Produktempfehlungen). Aber wie weit wollen wir das treiben?


Auf jeden Fall kann Google so bald die GfK ablösen und Einschaltquoten erheben, die auch Mediatheken-Abrufe etc. umfassen.

more...
No comment yet.
Scooped by ideenplanet
Scoop.it!

Preventing Web Scraping: Best Practices for Keeping Your Content Safe

Preventing Web Scraping: Best Practices for Keeping Your Content Safe | Informationsextraktion - Suchmaschinen | Scoop.it
Many content producers or site owners get understandably anxious about the thought of a web scraper culling all of their data, and wonder if there's any
ideenplanet's insight:

Wie verhindere ich, dass meine Inhalte gecrawlt werden?


Als Entwickler von Intranet- und Web-Suchmaschinen beschäftigen wir uns viel mit der Durchsuchbarkeit von Webseiten.


Aber manchmal ist auch das Gegenteil nötig, bestimmte Inhalte will man nicht von Suchmaschinen indexieren lassen.


Hartley Brody zeigt ein paar Möglichkeiten, das zu erreichen.


more...
No comment yet.