diff --git a/app/templates/workshops/_fgho_sommerschule_2023/_aufgaben.html.j2 b/app/templates/workshops/_fgho_sommerschule_2023/_aufgaben.html.j2 index dcdee8e1..e91b1ff6 100644 --- a/app/templates/workshops/_fgho_sommerschule_2023/_aufgaben.html.j2 +++ b/app/templates/workshops/_fgho_sommerschule_2023/_aufgaben.html.j2 @@ -1,22 +1,66 @@
Hallo liebe Inga
-- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy - eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam - voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet - clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. + 1. Ich möchte alle Ergebnisse für den Begriff "jüdisch" finden. Groß- und + Kleinschreibung soll dabei nicht berücksichtigt werden. Bei der richtigen + Abfrage gibt es 5 Ergebnisse.
++ 2. Ich möchte jetzt in einer einzigen Suchabfrage alle Ergebnisse für die + Begriffe "jüdisch", aber auch "Juden" und "jüdischer" usw. finden. Bei der + richtigen Abfrage müsste es dafür 118 Ergebnisse geben. +
++ 3. Ich möchte in einer einzigen Suchabfrage alle Ergebnisse für den Begriff + "judisch" (in sämtlichen Ableitungen s.o.) im Zusammenhang mit dem Begriff + (ebenfalls sämtliche Ableitungen) "Freund" herausfiltern. Dazwischen sollen + 0 bis 10 Wörter auftauchen. Es gibt 1 Ergebnis bei der richtigen Abfrage. +
++ 4. Ich möchte zuletzt in einer einzigen Suchanfrage alle Ergebnisse für + entweder "jüdisch" oder "deutsch" (in sämtlichen Ableitungen) und "Leben" + herausfiltern. Dazwischen sollen wieder 0 bis 10 Wörter auftauchen. + Es gibt wieder ein Ergebnis. +
+-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Wörter können über den Query Builder > "Add new Token to your Query" hinzugefügt werden. Unten kann der Haken bei "Ignore Case" gesetzt werden um Groß- und Kleinschreibung zu ignorieren.
-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Über die Option Group lassen sich auch Buchstaben in der Suche definieren. So könnte als erste Option "u" und als zweite Option "ü" definiert werden. Die Suche würde dann nach beiden Varianten suchen.
+ Um beliebig viele Buchstaben zu finden, kann ein Wildcard-Charakter (".") verwendet werden, gefolgt von dem Incidence Modifier "zero or more" ("*"). Damit sind beliebig viele Buchstaben jeglicher Art möglich.
+ [word="l(o|u)r.*"];
würde z.B. nach "lora", "lura", "lurum" usw. suchen.
+
-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Um eine bestimmte Anzahl Wörter anzeigen zu lassen, die einen beliebigen
+ Inhalt haben dürfen, kann mit einem Empty Token (also einem nicht definiertem Token)
+ gerarbeitet werden. Den kann man über das Dropdown "Which kind of token are you looking for?"
+ hinzugefügt werden. Dem leeren Token kann dann ein Incidence Modifier zugewiesen werden, der
+ die Anzahl der Wörter auf 0 bis 10 begrenzt (between n and m).
+ []{0,10};
+
+ + Wenn entweder das eine oder das andere Wort auftauchen soll, kann der "OR"-Operator in der unteren Options-Leiste verwendet werden. + Dann kann ein zweiter Wert eingetragen werden. Einer von beiden muss dann auftauchen. +
[word="lorem" %c | word="ipsum" %c];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy - eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam - voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet - clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. + 1. Ich möchte in einer Suchanfrage alle Ergebnisse für Wortfolgen, in denen + das Wort "jüdisch" (mit sämtlichen Ableitungen) vorkommt. Vor dem Wort + soll ein Adjektiv auftauchen auf das 0-5 Wörter folgen sollen. Die + richtige Abfrage ergibt 36 Ergebnisse.
++ 2. Ich möchte in einer Suchanfrage alle Ergebnisse für Wortfolgen, in denen + das Wort "jüdisch" (mit sämtlichen Ableitungen) ein Adjektiv ist und direkt + von einem Nomen gefolgt wird. Die richtige Abfrage ergibt 27 Ergebnisse. +
++ 3. Ich möchte eine Suchanfrage aller Ergebnisse für Wortfolgen, in denen das + Wort "jüdisch" (mit sämtlichen Ableitungen) von dem Lemma "sein" gefolgt + wird. Dazwischen dürfen 5 beliebige Wörter vorkommen. Die richtige Abfrage + ergibt 16 Ergebnisse. +
+-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Über die Token-Suchauswahl kann "simple_pos" ausgewählt werden. Darüber
+ findet man sämtliche Werte, zum Beispiel "ADJ" für Adjektive oder "NOUN" für Nomen.
-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Dem Wort kann eine zweite Token-Eingrenzung hinzugefügt werden. Dafür nutzen wir den
+ "AND"-Operator. Dort können wir über die Token-Suchauswahl "simple_pos" auswählen und
+ dann einen Wert hinzufügen. Somit muss das gesuchte Wort
+ ebenfalls den simple_pos-Wert haben, also zum Beispiel ein Adjektiv sein.
+ [word="lorem" & simple_pos="NOUN"];
-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Ich kann ebenfalls nach der Grundform (Lemma) eines Wortes suchen. Dafür
+ muss ich in der Token-Suchauswahl "lemma" auswählen und dann den Wert - genau wie beim "word" -
+ eintragen.
+ [lemma="lorem" %c];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy - eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam - voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet - clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. + 1. Ich möchte in einer Suchanfrage alle Ergebnisse für "jüdisch" + (in sämtlichen Ableitungen) im Zusammenhang mit dem Lemma "sprechen" + (in sämtlichen Ableitungen, also auch "besprechen", "versprechen" usw.) + erhalten. Dabei möchte ich nur Ergebnisse innerhalb eines Satzes berücksichtigen. + Vor, zwischen und nach den Begriffen dürfen beliebig viele Wörter auftauchen. + Die richtige Abfrage ergibt 2 Treffer.
++ 2. Ich möchte in einer Suchanfrage alle Ergebnisse für Sätze, in denen eine + Person im Zusammenhang mit dem Lemma "helfen" (in sämtlichen Schreibweisen, + also auch "verhelfen" etc.) vorkommt. Vor, zwischen und nach den gesuchten + Werten dürfen beliebig viele Wörter vorkommen. Der als Person deklarierte + Wert darf ebenfalls beliebig lang sein. Die richtige Abfrage ergibt 6 Treffer. +
++ 3. Ich möchte in einer Suchabfrage alle Ergebnisse für Sätzen in denen der + Begriff "jüdisch" (in sämtlichen Ableitungen) im Zusammenhang mit einer + Organisation auftaucht. Vor, zwischen und nach den gesuchten Werten dürfen + beliebig viele Wörter vorkommen. Der als Person deklarierte Wert darf + ebenfalls beliebig lang sein. Die richtige Abfrage ergibt 4 Treffer. +
+-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Ich kann über den Button "Add structural attributes to your query" umschließende
+ Satz-Tags setzen. Dafür muss ich auf den Button "Sentence" klicken und nachdem ich meine Anfrage
+ erstellt habe wieder auf "End Sentence" an der gleichen Stelle.
+
+
+ Wenn ich mit Sätzen arbeite, darf ich nicht die Platzhalter-Token ("[]*
") vergessen, da sonst
+ ausschließlich Sätze mit genau den gesuchten Wörtern gefunden werden.
+
+ Wir haben bisher nur mit beliebigen Endungen eines Wortes in Form von
+ [word="lore.*"]
gearbeitet. Das gleiche funktioniert auch am
+ Anfang eines Wortes, indem ich beliebig viele Wildcard-Character an den Anfang
+ der Wortes setze: [word=".*rem"]
.
-
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
-
- -
[word="lorem"];
- Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy
- eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam
- voluptua.
+ Über den Button "Add structural attributes to your query" kann ich auch Entitäten bestimmen.
+ Für unser Beispiel arbeiten wir ausschließlich mit den german ent_types. Deren Definitionen kann ich
+ mir in den Tagset-Listen anschauen. Hier kann ich dann die gewünschte Entität auswählen. Wenn
+ der gesuchte Wert beliebig sein darf, muss ich zwischen den öffnenden und schließenden ent-tag ein
+ Platzhalter-Token setzen, das beliebig lang sein darf ("[]*
").
+ <ent_type="LOC"> []* </ent_type>