LaserSignalanalyse und -verarbeitung zur Fernerkennung von Sprache
Die Dekodierung von Signalrauschen: Signalanalyse und -verarbeitung der Laser-Fernspracherkennung
In der wundersamen Arena der Technologie ist die Laser-Fernspracherkennung wie eine wunderschöne Symphonie, aber diese Symphonie hat auch ihr eigenes „Rauschen“ – Signalrauschen. Wie ein unerwartet lautes Publikum bei einem Konzert ist Lärm oft störend inLaser-Spracherkennung. Der Quelle zufolge lässt sich das Rauschen bei der Fernerkennung von Sprachsignalen per Laser grob in das Rauschen des Laser-Vibrationsmessgeräts selbst, das Rauschen anderer Schallquellen in der Nähe des Vibrationsmessobjekts und das Rauschen durch Umgebungsstörungen unterteilen. Für die Fernerkennung von Sprache müssen letztendlich Sprachsignale erfasst werden, die vom menschlichen Gehör oder von Maschinen erkannt werden können. Zahlreiche Mischgeräusche aus der Umgebung und vom Erkennungssystem verringern die Hörbarkeit und Verständlichkeit der erfassten Sprachsignale. Die Frequenzbandverteilung dieser Geräusche stimmt teilweise mit der Hauptfrequenzbandverteilung des Sprachsignals (ca. 300–3000 Hz) überein. Sie lassen sich nicht einfach mit herkömmlichen Filtern herausfiltern und müssen weiter verarbeitet werden. Derzeit untersuchen Forscher hauptsächlich die Rauschunterdrückung von instationärem Breitbandrauschen und Trittschall.
Breitband-Hintergrundgeräusche werden im Allgemeinen mithilfe von Kurzzeitspektrumschätzungsverfahren, Subspace-Verfahren und anderen auf Signalverarbeitung basierenden Rauschunterdrückungsalgorithmen sowie traditionellen Methoden des maschinellen Lernens, Deep-Learning-Methoden und anderen Technologien zur Sprachverbesserung verarbeitet, um reine Sprachsignale vom Hintergrundgeräusch zu trennen.
Impulsrauschen ist das Speckle-Rauschen, das durch den dynamischen Speckle-Effekt entstehen kann, wenn die Position des Erkennungsziels durch das Erkennungslicht des LDV-Erkennungssystems gestört wird. Derzeit wird diese Art von Rauschen hauptsächlich dadurch entfernt, dass die Stelle erkannt wird, an der das Signal eine energiereiche Spitze aufweist, und diese durch den vorhergesagten Wert ersetzt wird.
Die Laser-Fernspracherkennung bietet Anwendungsmöglichkeiten in vielen Bereichen, wie z. B. Abhören, Multimode-Überwachung, Einbruchserkennung, Suche und Rettung, Lasermikrofon usw. Es ist abzusehen, dass der zukünftige Forschungstrend zur Laser-Fernspracherkennung hauptsächlich auf folgenden Punkten basieren wird: (1) Verbesserung der Messleistung des Systems, wie Empfindlichkeit und Signal-Rausch-Verhältnis, Optimierung des Erkennungsmodus, der Komponenten und der Struktur des Erkennungssystems; (2) Verbesserung der Anpassungsfähigkeit von Signalverarbeitungsalgorithmen, sodass sich die Laser-Spracherkennungstechnologie an unterschiedliche Messentfernungen, Umgebungsbedingungen und Vibrationsmessobjekte anpassen kann; (3) sinnvollere Auswahl von Vibrationsmessobjekten und Hochfrequenzkompensation von Sprachsignalen, die an Objekten mit unterschiedlichen Frequenzgangeigenschaften gemessen wurden; (4) Verbesserung der Systemstruktur und weitere Optimierung des Erkennungssystems durch
Miniaturisierung, Portabilität und intelligente Erkennungsverfahren.
Abb. 1 (a) Schematische Darstellung der Laserabfangvorrichtung; (b) Schematische Darstellung des Laserabfangschutzsystems
Veröffentlichungszeit: 14. Oktober 2024