Klausuren

Antworten
Benutzeravatar
dibade
Beiträge: 16
Registriert: 21.11.2013 19:49
Geschlecht: männlich
Studienrichtung: Elektrotechnik
Matrikel: 2013
Angestrebter Abschluss: Master

Klausuren

Beitrag von dibade » 10.03.2015 14:38

Hallo,

In der Prüfung 2015 Sprachtechnologie kam folgendes dran:


1. Dynamische Programmierung

geg. zwei 2-Dimensionale Modellvektoren und ein Merkmalsvektor

a) Aufmalen Merkmalsraum
b) Aufmalen vom DP-Gitter, herausfinden, für welchen Modellvektor die Gesamtkosten geringer sind
c) Unterschied herausfinden, wenn das alternative Verfahren benutzt wird (irgendwas mit "First..." ka, hatte ich nicht gelernt)


2. Grammatiken

geg: Schachspiel, erlaubte Sätze und mögliche Wörter

a) rechtsreguläre Grammatik, die alle erlaubten Sätze abbildet (Terminalsymbole, Nichtterminalsymbole, Produktionsregeln, Startsymbol)

b) ?

c) ?


3. ?


4. Liquid State Machine

geg: Folge von Ausgabewerten, Impulsantwort eines FIR-Filters.
ges: Zugehörige Spike-Folge, die mit dem gegebenen Filter die gegebene Ausgabefolge erzeugt


5. Fujisaki

geg: nichts
ges: Beschreibung, was beim Fujisaki-Modell passiert, aufmalen eines Blockschaltbilds, aufmalen, wie eine typische Ausgabe aus dem F-Modell aussieht


6. Formantsynthese

geg: zwei Formanten in Hz, grobe Angabe zu Bandbreite (erste Bandbreite kleiner als zweite)

a) Betrags- und Phasenverlauf malen
b) Übertragungsfunktion im s-Bereich benennen und Pol-Nullstellen-Diagramm malen
c) Übertragungsfunktion im z-Bereich benennen und Pol-Nullstellen-Diagramm malen


7. ?


8. Bernoulli

geg: Bild von Luftreservoir und Vokaltrakt mit zwei Engestellen, ein paar Zahlen (Luftdichte, Querschnitte der Engstellen, statischer Druck vor Engstelle)
ges:

a) Welche Art von Lauten liegt vor
b) wie groß ist der Volumenstrom
c) Wie lange kann der Laut bei gegebenen Lungenvolumen gehalten werden?

Achtung, hier musste man die Bernoulli-Gleichung auswendig wissen!





Die Stellen die mit ? markiert sind, waren soweit ich mich erinnern kann nichts wildes. Etwa 80% von dem was wir gelernt hatten, kam nicht dran. War etwas pokern, da der Prof. nur spärliche Angaben gemacht hat, was man lernen sollte, insb. was man im Detail auswendig können sollte. Wir hatten vermutet, dass was mit HMM drankommt, aber dazu gab es keine einzige Aufgabe!

Martin28
Beiträge: 3
Registriert: 03.12.2014 12:13

Re: Klausuren

Beitrag von Martin28 » 06.03.2016 13:00

Klausur WS 15/16

Die Klausur bestand aus 6 Aufgaben:

1. Dynamische Zeitverzerrung dabei waren 3 Merkmalvektorfolgen (Referenz Start und Stop und eine Eingabefolge) gegeben und man sollte dann die Modellebene aufzeichnen, DP machen und dann kosten bestimmen und halt sagen wo es zugeordnet wird.

2. Grammatik erstellen für ein Schachspiel

3. Vektroquantisierung: dabei sollte der Algorithmus beschrieben werden und dann durchführen des Alg. Im Anschluss noch EM-Alg. erklären und mit Vektorquantisierung vergleichen.

4. Beschreibung von Target Approximatio Modell

5. Formatsynthese kurz beschreiben und PN-Plan in s und z-Bereich aufmalen bei Frequenzen 1000 Hz und 2000Hz (immer allgemeine Übergangsfkt dazuschreiben)

6. Vokaltrakt war gegeben (Lunge, Glottis, Mundraum, Lippen)
Also es gab zwei Verengungen und daraus sollte dann der Volumenstrom berechnet werden für gegebene Druckdifferenz von 900Pa (relative Anlage zum atmosphärischen Druck)
Dann sollte noch bestimmt werden wie Lange in Laut gehalten werden kann.

Aklex
Beiträge: 13
Registriert: 26.07.2012 17:21
Geschlecht: männlich
Studienrichtung: Elektrotechnik
Matrikel: 2012
Angestrebter Abschluss: Dipl-Ing.

Re: Klausuren

Beitrag von Aklex » 04.03.2017 13:49

Klausur im Wintersemester 2016/2017

1.Es waren wie in den vorangegangenen Klausuren drei 2-dimensionale Merkmalvektrofolgen gegeben, zwei davon waren die Referenzfolgen für jeweils die Kommandoworte Start und Stopp.
a) Zeichne den Merkmalvektrofolgen Verlauf der Referenzen im Merkmalraum.
b) Welches Wort erkennt der Kommandoerkenner, wenn er die 3. Merkmalvektorfolge anhand von DP-Gitter Berechnung unterscheidet und sich für das Kommando mit dem geringsten Gewicht entscheidet.
c) Wie groß sind die Pfadkosten der dritten Folge im DP-Gitter für das Wort Start, wenn die Bestensuche (greedy, best first search) angewendet wird.

2.Markov-Ketten
a) Wie kann man im allgemeinen die Erkennungsrate von Wort bzw. Wortfolgenerkennern verbessern?
b) Was sind n-Gramme?
c) Aus einer gegebenen Stichprobe, wie ist die Wahrscheinlichkeit P(q_i | q_i-1) definiert? Geben sie die Wahrscheinlichkeiten P(q_i = "R" | q_i-1 = "E"), P(q_i = "R" | q_i-1 = "O") und P(q_i = "R" | q_i-1 = "I") an.

Gegeben war ein längerer Text aus dem man nun alle R finden musste und dann rausfinden wie viele R auf E, I oder O folgen.
d) Was sind Anforderungen an eine Stichprobe? Wie kann man die Robustheit einer "schlechten" Stichprobe verbessern bzw. trotzdem garantieren?

3. Grammatik
Man soll Grammatik für einen Schach-Sprachkommando-Erkenner bauen. Dabei ist die Satzstruktur:
Figur [von] Ursprungsfeld auf/nach Zielfeld.

gegeben und welche Figuren es im Schachspiel (Bauer, Turm, etc.) und welche Positionen (a1, ... , h8) es bei einem Schachspiel gibt.

a) Entwerfe eine rechtsreguläre Grammatik. Gib dabei die Menge der Terminalsymbole, Nichtterminalsymbole, Produktionsregeln und das Startsymbol an.
b) Male den Automaten der erstellten Grammatik auf.
C)Wie verbessert die Anwendung der Viterbi-Suche die Benutzung von Grammatiken?
d) Warum sind Grammatiken im Fall für großes Vokabular nicht sinnvoll? Was wird stattdessen für großes Vokabular verwendet?

4. Vokaltrakt
a) Zeichne das 1-D Modell des Vokaltraktes. Welche Annahmen werden dabei getroffen?
b) Welche Analogien bestehen zwischen Akustischen Modell und elektrischem Modell? Zeichnen sie das Vierpolnetzwerk für einen einzelnen Rohrabschnitt auf. Für was stehen die einzelnen Elemente im Netzwerk.
c) Zeichnen sie das Modell für den kompletten Vokaltrakt auf. Wie muss des letzte Vierpolnetzwerk abeschlossen werden.

5. Formantsynthese
Es waren zwei Fomanten mit den Frequenzen 1000Hz und 2000Hz gegeben. Die Bandbreite des ersten Formanten war kleiner als die des zweiten, aber keine genaue Angabe.
a) Zeichnen sie den Betrags- und Phasenverlauf auf.
b) Bennen sie die Übertragungsfunktion im Laplace-Bereich und Zeichnen sie die Pol- und Nullstellen im Pol-/Nullstellen-Diagramm ein.
c) Bennen sie die Übertragungsfunktion im Z-Bereich und Zeichnen sie die Pol- und Nullstellen im Pol-/Nullstellen-Diagramm ein, dabei ist eine Abtastfrequenz von 8000Hz gegeben.

6. Fujisaki
Erklären sie wie das Fujisaki-Modell funktioniert und zeichnen sie zusätzlich das dazugehörige Blockschaltbild und ein typisches Resultat einer F0-Kontur mit dem Fujisaki-Modell auf.

Das wars, also alles halb so wild. Viel Spaß beim lernen.

Plattenteller
Beiträge: 5
Registriert: 17.02.2014 13:59

Re: Klausuren

Beitrag von Plattenteller » 01.03.2018 14:17

Klausur im Wintersemester 17/18 (aus Stichpunkten rekonstruiert)

Aufgabe 1
Gegeben waren die 2-dimensionale Referenz-Merkmalsvektorfolgen für das Wort "ja" (drei Vektoren) und "nein" (4 Vektoren) sowie eine dritte Folge X aus 2 Vektoren.
  1. Zeichnen Sie die drei Folgen im Merkmalvektorraum.
  2. Nutzen Sie das Verfahren der Dynamischen Programmierung, um zu bestimmen, welcher Referenzfolge die Folge X zugerodnet werden kann. Nutzen Sie als Abstandsmaß den CITY-BLOCK Abstand: D(x_r, x) = SummeÜberK(|x_rk - x_k|)
  3. Wie können die Wortauftrittswahrscheinlichkeiten bei der Erkennung berücksichtigt werden?
Die Besonderheit war hier, dass die Folge für "nein" doppelt so lang wie die Testfolge war, hier kommt nach meinem Verständnis unendlich als Gesamtgewicht heraus.

Aufgabe 2
Gegeben war ein HMM mit den Ausgabesymbolen {y1, y2, y3} und den Matrizen A (2x2), B (2x3) sowie der Anfangszustandswahrscheinlichkeit Pi = (1, 0).
  1. Zeichnen Sie den Automatengraphen.
  2. Berechnen Sie die Wahrscheinlichkeit für die Ausgabefolge y = <y2, y3>
  3. Welche Zustandsfolge ist am wahrscheinlichsten für die Ausgabefolge y = <y1, y2>?
Aufgabe 3
Gegeben waren 2D Merkmalsvektoren für die Sprechererkennung. Für Sprecher 1 gab es 7 Vektoren, für Sprecher 2 gab es 5 Vektoren.
  1. Nennen Sie textunabhängige Modelle zur Beschreibung der Sprecher mit einem Template-basierten Erkennungsverfahren.
  2. Es war eine Vektorfolge aus drei 2D-Vektoren gegeben. Nutzen Sie die CITY-BLOCK-Distanz (siehe Aufgabe 1) um zu bestimmen, von welchem der beiden Sprecher diese Fogle am Wahrscheinlichsten stammt.
  3. Führen Sie dem k-Means Algorithmus durch, um den Merkmalsvektorraum in Cluster aufzuteilen. Zwei Anfangsvektoren sind gegeben. Wie repräsentativ sind die Cluster für die beiden Sprecher?
Der k-Means Algorothmus war aufwändig durch die große Anzahl an Vektoren. Nach der ersten Neuberechnung der Modellvektoren wurden zwei Vektoren im zweiten Durchlauf anders zugerodnet. Diese beiden waren aber zum Glück beide (0, 0), sodass sich die Berechnung vereinfachte. Nach der zweiten Neuberechnung wurden alle Vektoren des einen Sprechers zu einem Modellvektor zugeordnet, alle Vektoren des anderen Sprechers wurden dem anderen Modellvektor zugeordnet. Somit ist der Algorithmus abgeschlossen, da keine Verbesserung mehr erreicht werden kann. Die Cluster sind also sehr repräsentativ.

Aufgabe 4
Erklären Sie die Funktionsweise des Target-Approximation Modells für die Erzeugung von F0-Verläufen. Es waren zwei stückweise konstante Modell-Geraden gegeben. Zeichnen Sie qualitativ den F0-Verlauf für eine kurze und eine lange Zeitkonstante.

Aufgabe 5
Es waren zwei Fomanten mit den Frequenzen 1000Hz und 2000Hz gegeben. Die Bandbreite des ersten Formanten war kleiner als die des zweiten, aber keine genaue Angabe.
  1. Zeichnen sie den Betrags- und Phasenverlauf auf.
  2. Bennen sie die Übertragungsfunktion im Laplace-Bereich und Zeichnen sie die Pol- und Nullstellen im Pol-/Nullstellen-Diagramm ein.
  3. Bennen sie die Übertragungsfunktion im Z-Bereich und Zeichnen sie die Pol- und Nullstellen im Pol-/Nullstellen-Diagramm ein, dabei ist eine Abtastfrequenz von 8000Hz gegeben.
Aufgabe 6
  1. Zeichnen Sie das 1-D Modell des Vokaltraktes. Welche grundlegenden Annahmen werden dabei getroffen?
  2. Welche Analogien bestehen zwischen akustischem Modell und elektrischem Modell? Zeichnen sie das Vierpolnetzwerk für einen einzelnen Rohrabschnitt auf. Interpretieren Sie die Elemente des Vierpolnetzwerkes.
  3. Zeichnen sie das Modell für den kompletten Sprechapperat auf. Wie muss des jeweils letzte Vierpolnetzwerk abeschlossen werden.
Aufgabe 7
Entwickeln Sie ein Modell für den zeitlichen Verlauf des glottalen Volumenstroms für die Verwendung als stimmhafte Anregung in der Formantsynthese. Welche Freiheitsgrade sind für verschiedene Anregungsarten und Stimmfarben nötig?
Zeichnen sie qualitativ den Verlauf des Volumenstromes für Strohbass, modale und behauchte Anregung.

Antworten

Zurück zu „Sprachtechnologie“