Richtige Formulierung von Anfragen

Einfache Suchtermini und Phrasen

In der Suche kann man einfache, d.h. einzelne Stichwörter oder Phrasen, die aus mehreren Stichwörtern im Anführungszeichen bestehen, z.B. "Uniwersytet Mikołaja Kopernika" eingeben. Falls man sich der Anführungsstriche bedient, werden nur solche Dokumente ausgesucht, die die ganze Zeichenkette enthalten.

Die Suchtermini kann man mithilfe von logischen Operatoren miteinander verknüpfen. Man kann auch die sog. Trunkierungszeichen anwenden, die beliebige Buchstaben und Ziffern und ihre Folgen ersetzen, oder Dokumente in der unscharfen Suche, der verknüpften Suche finden wie auch Priorität gesuchter Treffer bestimmen.

Logische Operatoren

  • AND – auch als && – bedeutet, dass die mit dem Operator verknüpften Stichwörter gleichzeitig im gesuchten Dokument auftreten müssen. Z.B. die Suchanfrage Kopernik && Chopin verursacht, dass nur solche Dokumente ausgesucht werden, in denen beide Namen gleichzeitig vorkommen. Der Operator AND gilt als voreingestellte Einstellung der Suchmaschine, wenn mehr als ein Stichwort eingegeben wird; somit erhalten wir gleiches Ergebnis, wenn wir Kopernik Chopin eingeben.

  • OR – auch als || – setzt voraus, dass mindestens eines der Stichwörter im gesuchten Dokument auftritt, z.B. die Suchanfrage Kopernik || Copernicus verursacht, dass alle Dokumente ausgesucht werden, in denen der Name des Astronomen zumindest in einer der erwähnten Fassungen vorkommt.

  • NOT – alternativ !schließt aus der Ergebnisliste Dokumente aus, in denen das eingegebene Stichwort nicht vorkommt. Z.B. in der Suchanfrage "Nicolaus Copernicus" NOT university findet man Dokumente, die die Zeichenkette "Nicolaus Copernicus", aber gleichzeitig nicht university enthalten. Dieser Operator wird nicht frei angewandt, z.B. in der Suchanfrage NOT "Nicolaus Copernicus" erhält man keine Treffer.

  • + (Operator des erlaubten Treffers) – sucht Dokumente aus, die das Stichwort, das direkt nach "+" vorkommt, aber nicht unbedingt andere Stichwörter enthalten, z.B. +biblioteka uniwersytecka verursacht, dass Dokumente ausgesucht werden, die den Treffer biblioteka enthalten müssen, und den Treffer uniwersytecka enthalten können (aber nicht müssen).

  • - (Operator des verbotenen Treffers) – funktioniert ähnlich wie der Operator NOT. In der Suchanfrage "Nicolaus Copernicus" -"Nicolaus Copernicus University" findet man Dokumente, die den Namen "Nicolaus Copernicus", aber nicht "Nicolaus Copernicus University" enthalten.

Trunkierungszeichen 

  • ? - ersetzt ein beliebiges Zeichen. Z.B. die Suchanfrage Kowalsk? entspricht sowohl dem Treffer Kowalski als auch Kowalska.

  • * - ersetzt Zeichenkette, z.B. die Suchanfrage: bu*a ergibt Suchergebnisse wie buda, budda, buddysta, butonierka etc.

    Trunkierungszeichen darf man am Anfang der gesuchten Phrase nicht anwenden.

Unscharfe Suche 

Die Fuzzy-Suche wird im Falle der einfachen Stichwörter, die einander ähneln, angewandt, z.B. Copernicus, Copernikus, Kopernikus. Dokumente, die diese Treffer enthalten, kann man aussuchen mithilfe von der Tilde ~, die zum Stichwort hinzufügt wird, z.B. copernicus~.

Das Grad der gesuchten Verknüpfung kann man mithilfe von einem Faktor bestimmen, der im Bereich zwischen 0 (fehlende Verknüpfung) bis 1 (identische Termini) schwankt. Der voreingestellte Wert des Verknüpfungsfaktors beträgt 0.5. Um diesen Wert zu ändern, soll man zum gesuchten Stichwort die Tilde mit einem eindeutig festgelegten Verknüpfungsfaktor hinzufügen, z.B. kopernik~0.4.

Distanzsuche 

Man kann auch bestimmen, wie weit sich einer der gesuchten Treffer von einem anderen befinden soll (die sog. Proximity-Suche / Distanzsuche). Wenn man weiß, dass Phrasen z.B. Choral-buch und Westpreussen im Dokument in kleiner Entfernung voneinander vorkommen, kann man die folgende Suchanfrage anwenden: "Choral-buch Westpreussen"~6.

Bestimmung der Priorität 

Man kann die Priorität der gesuchten Treffer durch hinzugefügtes Zeichen ^mit einer Zahl (größer als 1) bestimmen. Z.B. die Suchanfrage stempowski^4 grydzewski ergibt Dokumente, in denen beide Namen vorkommen; allerdings werden am Anfang der Liste diese Dokumente erscheinen, in denen häufiger der Name mit der größeren Priorität vorkommt.

Voreingestellte Priorität der Suche beträgt 1.

Verknüpfungen

Phrasen in erweiterten Suchanfragen kann man mithilfe von Klammern gruppieren, was erlaubt, den erweiterten Anfragen einen eindeutigen Sinn zu geben, ähnlich wie es im Falle der arithmetischen Rechnungen vorkommt.

Zunächst werden Teilphrasen in Klammern, nachher größere Phrasen verarbeitet. Die Anfrage: "De revolutionibus orbium coelestium" AND (Copernicus OR Kopernik) führt zu Dokumenten, in denen der Titel der Werkes von Kopernikus sowie sein Name mindestens in einer der zwei Fassungen vorkommen.

Sonderzeichen

Verständlicherweise werden die Zeichen, die zur Formulierung erweiterter Suchanfragen dienen, (+ - && || ! ( ) { } [ ] ^ " ~ * ? : \) in der Suche anders als andere Zeichen betrachtet: Sie erfüllen die Rolle der Elemente beim Aufbau einer Anfrage und nicht der Teile der gesuchten Treffer. In der Suche soll ihnen der Schrägstrich \ vorangehen. Z.B. um die Phrase "(2 + 2)*2" zu finden, soll man "\( 2 \+ 2 \) \* 2" eingeben.

Quellenangabe

Vollständige Beschreibung der Formulierung von Anfragen finden Sie in der englischen Sprache auf der Webseite: Jakarta Lucene Query Parser Syntax.

This page uses 'cookies'. More information