Analyse und Verarbeitung von Laserfernspracherkennungssignalen

LaserAnalyse und Verarbeitung von Fernspracherkennungssignalen
Dekodierung von Signalrauschen: Signalanalyse und -verarbeitung bei der Laserfernspracherkennung
In der faszinierenden Welt der Technologie gleicht die lasergestützte Sprachfernerkennung einer wunderschönen Symphonie, doch auch diese Symphonie birgt ihr eigenes „Rauschen“ – Signalrauschen. Wie ein unerwartet lautes Publikum bei einem Konzert ist Rauschen oft störend.Laser-SpracherkennungLaut der Quelle lässt sich das Rauschen bei der lasergestützten Fernsprachdetektion grob in drei Komponenten unterteilen: das Rauschen des Laser-Vibrationsmessgeräts selbst, das Rauschen anderer Schallquellen in der Nähe des Messobjekts und das durch Umgebungsstörungen verursachte Rauschen. Für die Fernsprachdetektion ist es entscheidend, Sprachsignale zu gewinnen, die vom menschlichen oder maschinellen Gehör erkannt werden können. Zahlreiche Störgeräusche aus der Umgebung und dem Detektionssystem beeinträchtigen die Hörbarkeit und Verständlichkeit der erfassten Sprachsignale. Die Frequenzbandverteilung dieser Störgeräusche deckt sich teilweise mit der Hauptfrequenzbandverteilung des Sprachsignals (ca. 300–3000 Hz). Eine einfache Filterung mit herkömmlichen Filtern reicht daher nicht aus; eine Weiterverarbeitung der detektierten Sprachsignale ist erforderlich. Aktuell konzentrieren sich Forscher hauptsächlich auf die Entrauschung von nichtstationärem Breitbandrauschen und Impulsrauschen.
Breitbandiges Hintergrundrauschen wird im Allgemeinen durch Kurzzeit-Spektrumschätzungsverfahren, Subspace-Verfahren und andere auf Signalverarbeitung basierende Rauschunterdrückungsalgorithmen sowie durch traditionelle maschinelle Lernverfahren, Deep-Learning-Verfahren und andere Sprachverbesserungstechnologien verarbeitet, um reine Sprachsignale vom Hintergrundrauschen zu trennen.
Impulsrauschen ist das Speckle-Rauschen, das durch den dynamischen Speckle-Effekt entstehen kann, wenn die Position des Detektionsziels durch das Detektionslicht des LDV-Detektionssystems gestört wird. Derzeit wird diese Art von Rauschen hauptsächlich dadurch entfernt, dass die Position des Signalmaximums ermittelt und durch den vorhergesagten Wert ersetzt wird.
Die laserbasierte Fernsprachdetektion bietet vielversprechende Anwendungsmöglichkeiten in zahlreichen Bereichen wie Abhören, Multimodus-Überwachung, Einbruchserkennung, Such- und Rettungsaktionen sowie Lasermikrofonen. Zukünftige Forschungstrends in diesem Bereich werden sich voraussichtlich auf folgende Schwerpunkte konzentrieren: (1) Verbesserung der Messleistung des Systems, z. B. hinsichtlich Empfindlichkeit und Signal-Rausch-Verhältnis, Optimierung des Detektionsmodus, der Komponenten und der Systemstruktur; (2) Verbesserung der Anpassungsfähigkeit von Signalverarbeitungsalgorithmen, um die laserbasierte Sprachdetektionstechnologie an unterschiedliche Messdistanzen, Umgebungsbedingungen und Vibrationsmessziele anzupassen; (3) Optimierung der Auswahl geeigneter Vibrationsmessziele und Hochfrequenzkompensation von Sprachsignalen, die an Zielen mit unterschiedlichen Frequenzgangcharakteristiken gemessen werden; (4) Verbesserung der Systemstruktur und weitere Optimierung des Detektionssystems.

Miniaturisierung, Portabilität und intelligentes Erkennungsverfahren.

Abb. 1 (a) Schematische Darstellung der Laserabfangvorrichtung; (b) Schematische Darstellung des Laser-Antiabfangsystems


Veröffentlichungsdatum: 14. Oktober 2024