Humboldt-Universität zu Berlin - Lebenswissen­schaftliche Fakultät - Institut für Psychologie

Tabellarische Übersicht über Videokassette Nr. 8

"Sprachein-und -ausgabe"

Nr.

Titel

Kontakt

Inhalt

Start

Länge
[min]

1 Spoken Language Interfaces: The OM System Alexander Rudnicky
Carnegie Mellon University
School of Computer Science
Pittsburgh, PA 15213
phone: 412-268-2622
Der Office Manager (OM) stellt eine komplette, interaktive Arbeitsoberfläche (Shell) zur Entwicklung und Benutzung sprachgesteuerter Applikationen zur Verfügung. Dieses können z.B. Terminplaner, Datenbanken, Voice-Mail- oder Rechenprogramme sein. Der OM kann Steuerbefehle erkennen sowie eine reine Texterfassung vornehmen, bei der die erkannten Worte automatisch als geschriebener Text gespeichert werden. 0:00 11
2 A Human Factors Guide to Computer Speech C.K. Cowley
University of Wales
P.O. Box 901
Cardiff, CFI 3YG
Wales, U.K.
phone: (0222) 874 000
Neben Werbung für digital(tm)-Computerequipment werden Spracherkennung sowie -ausgabe behandelt und Designempfehlungen für Entwickler von sprachbasierten Systemen gegeben. Neben dem Computer wird auch der Mensch in die Guidelines miteinbezogen, so werden z.B. Vor- und Nachteile des Einsatzes digitalisierter vs. synthetisierter Sprache betrachtet. 0:11 16
3 Speech and Natural Language: A Multi-Modal Natural Dialogue Kristinn R. Thorisson
Media Laboratory
Massachusetts Institute of Technology
Cambridge,MA 02139
617-258-6579
kris@media-lab.media.mit.edu
An einem Beispiel wird erklärt, wie Computer neben Sprache auch Mimik und Gestik erfassen und auswerten. Ziel ist es, den Computer wie einen menschlichen Zuhörer agieren zu lassen. So werden z.B. Finger-, Hand-, Pupillen- und Kopfbewegung erfaßt und ausgewertet. 0:27 7
4 Wordspot-ting in Voice Editing and Audio Indexing Lynn Wilcox
Xerox PARC
333 Coyote Hill Road
Palo Alto, CA 94304
415-812-4217
wilcox.parc@xerox.com
Das vorgestellte System bietet die Möglichkeit, Sprache mittels eines Editors wie Text zu manipulieren (Cut&Paste; markieren, abspeichern und abspielen einzelner Sequenzen; Suche nach Schlagwörtern; nachträgliches Einfügen von Effekten etc. ). Wörter werden dabei nicht lexikalisch erfaßt, sondern nur "Muster" ausgewertet. 0:35 8
5 Talking to Machines Christopher Cowley
School of Psychology
University of Wales
P.O.Box 901
Cardiff CFI 3YG
Wales, U.K.
+44 222 874000
COWLEY@UK.AC.CARDIFF.TAFF
Vorgestellt wird ein Sprachverarbeitungssystem von digital(tm) (s.a. Nr.2). Betrachtet wird vor allem die theoretische Seite der Spracherkennung mit besonderem Focus auf die Mensch-Maschine-Schnittstelle. Probleme und Problemlösungsstrategien werden vorgestellt und Entwicklungsrichtlinien gegeben. 0:43 13
6 Hyperspeech Barry Arons
Speech Research Group
MIT Media Lab
20 Ames Street, E-15-353
Cambridge, MA 02139
barons@media-lab.mit.edu
Gezeigt wird der Einsatz eines reinen Sprachein-/ausgabe(dialog)systems mit angeschlossener Datenbank. Interessant gelöst sind die Navigation durch Sprache und die Benutzung von Sprache als Daten. Bemerkenswert ist die kurze Antwortzeit des Systems. 0:56 3
7 SCREAM: Screen-based Navigation in Voice Messages Norwegian Telecom Research
Lie: howcome@nta.com
Dybvik: perc@nta.com
Rygh: janrygh@nta.com
Ziel des SCREAM-Projekts ist es, die Schnittstelle zu Voice-mail Systems durch Einsatz visueller Technik zu verbessern. Auf einem Bildschirm werden dabei eingegangene Anrufe durch Icons angezeigt, die je nach Geschlecht, Alter, Emotionen und behandeltem Thema des Anrufenden variieren. 0:59 4
8 Speech Dialogue with Facial Displays Sony Computer Science Laboratory, Inc.
Akikazu Takeuchi & Katashi Nagao
In dem hier gezeigten Dialogsystem erfolgt neben der Sprachausgabe auch die Darstellung eines Gesichts inklusive seiner Mimik. Schwerpunkte des Films sind die Erstellung der Sprachausgabe und der Gesichtsdarstellung sowie die Zusammenführung dieser beiden Komponenten. 1:03 10
9 Voice Systems - An Inventors Guide C.K. Cowley
University of Wales
P.O. Box 901
Cardiff, CFI 3YG
Wales, U.K.
phone: (0222) 874 000
Ebenso wie in Video 2 und 5 wird der Einsatz von digital(tm) DECtalk vorgestellt. Augenmerk des theoretischen Teils sind hier Kriterien, um die Verstädlichkeit synthetisierter Stimmen zu bewerten und zu gestalten. Darüber hinaus werden Programme rund um das Thema Sprachverarbeitung vorgestellt sowie ein kurzes Beispiel für den zukünftigen Einsatz derartiger Systeme gegeben. 1:14 16