WO2005020211A1 - Voice-assisted text input for pre-installed applications in mobile devices - Google Patents

Voice-assisted text input for pre-installed applications in mobile devices Download PDF

Info

Publication number
WO2005020211A1
WO2005020211A1 PCT/EP2004/051753 EP2004051753W WO2005020211A1 WO 2005020211 A1 WO2005020211 A1 WO 2005020211A1 EP 2004051753 W EP2004051753 W EP 2004051753W WO 2005020211 A1 WO2005020211 A1 WO 2005020211A1
Authority
WO
WIPO (PCT)
Prior art keywords
application
operating system
input
voice
keyboard
Prior art date
Application number
PCT/EP2004/051753
Other languages
German (de)
French (fr)
Inventor
Steffen Harengel
Andreas Ralph Major
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2005020211A1 publication Critical patent/WO2005020211A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Definitions

  • PDAs Personal Digital Assistants
  • pen input via a virtual keyboard which is shown in the display
  • handwriting recognition which is mostly used as an alternative input for the virtual keyboard.
  • a miniaturized hardware keyboard is sometimes used for somewhat larger devices. The manufacturer of the device decides which input method is used.
  • the input options described here are integrated in the PDAs available on the market.
  • Web pads / SIM pads also only have a virtual keyboard and handwriting recognition. These devices differ from the PDAs only in that their screen and / or touchscreen is a lot larger.
  • the object of the invention is to provide a possibility for input, in particular text, in applications preinstalled on small mobile devices. This object is achieved by the inventions specified in the independent patent claims. Advantageous refinements result from the subclaims.
  • an application in a state in which keyboard codes can be fed to it.
  • a speech signal is entered and converted into keyboard codes by a speech recognition unit.
  • the keyboard codes are fed to the application.
  • the application preferably runs on an operating system.
  • the operating system can be a message-based operating system.
  • the keyboard codes are then sent to the application as messages by the operating system.
  • the keyboard codes are, for example, letters.
  • commands can be entered as a speech signal, recognized by the speech recognition unit and fed to the application as keyboard codes. This allows the application to continue to be controlled.
  • the method runs in particular on a mobile device with one or more preinstalled applications.
  • An arrangement that is set up to carry out one of the described methods can be, for example, by
  • a program product for a data processing system that contains code sections with which one of the described methods are carried out on the data processing system can be carried out by suitable implementation of the method in a programming language and translation into code executable by the data processing system. The code sections are saved for this purpose.
  • a program product is understood to mean the program as a tradable product. It can be in any form, for example on paper, a computer-readable data medium or distributed over a network.
  • a conventional PDA is operated using the Windows CE operating system.
  • the Windows CE operating system nowadays it is possible to start programs on the PDA using a predefined vocabulary based on automatic speech recognition.
  • the "Contacts new entry" program is started in this way in order to get to the input mask of a new contact.
  • the cursor is then automatically in the input field of the name.
  • word-based speech recognition cannot be used to create a contact, because the large vocabulary means that resource and CPU consumption make implementation on mobile devices difficult or impossible.
  • a spelling recognizer is used instead of a word-based speech recognizer, which has also been supplemented with some voice command words.
  • the window focus can be shifted from the previous input field to the next one by voice command, for example "next”. This process is now repeated for all input fields.
  • the new data record can be added to the device database, for example, using the "save" command.
  • the method described here uses the existing communication interfaces of the programs with the operating system on the device.
  • Step 1 The application currently activated in the operating system is queried. Using Windows as an example, the return value is a window handle. Next in
  • Step 2 asks which window of the active application has the input focus (cursor). Again using Windows as an example, this can be done with GetFocus. The return value is the handle to the window that contains the input cursor.
  • Step 3 Now all preparatory work has been done and the application is in idle mode. This mode monitors whether the active window or the window with the input focus changes. Pressing the PTT (Push to Talk) button starts the speech recognizer.
  • Step 4 the automatic speech recognizer is stopped again because there is a valid recognition result. Individual letters and commands can be recognized. If there is an error detection, the system jumps back to step 3.
  • Step 5 If a letter is recognized, the corresponding KeyCode is sent to the window with the input focus as with the keyboard codes of a conventional keyboard. Using Windows as an example, this works with SendMessage, for example.
  • Step ⁇ This enters the recognized command in the field with the focus.
  • Step 7 If a command is recognized in step 4, this is interpreted and the corresponding KeyCode is sent to the active application.
  • Step 8 Here the command "next" was recognized, which pushes the window focus to the next input field. Using Windows as an example, this can be achieved by sending the Tab key code. Step 9 Delete the content of the active field with the "empty" command. In Windows this can be achieved by sending the KeyCode for Backspace until the field is empty.
  • Step 10 The "back" command is carried out as described in step 9. However, the KeyCode for backspace is only sent once.
  • Step 11 The recognized command Save “save”, which is carried out in the example Windows CE by sending the OK code "Enter”, the entered data is entered into the database.
  • step 8 in addition to “next", "previous” can be recognized to go to the previous input field (KeyCode Shift + Tabulator).
  • the method can be operated in the dynamic state, i.e. while the user is moving,

Abstract

According to the invention, an interposed voice-recognition application allows letters or commands to be input into any applications running on an operating system. To achieve this, the operating system transfers said letters or commands to the applications in the form of key codes.

Description

Beschreibungdescription
Sprachunterstützte Texteingabe bei vorinstallierten Anwendungen auf mobilen GerätenVoice-supported text entry for pre-installed applications on mobile devices
Bisher können vorinstallierte Programme in mobilen Geräten nur anhand der enthaltenen Eingabegeräte bedient werden, was anhand der gegebenen Möglichkeiten zumeist umständlich, langwierig und nur in ruhendem Zustand des Bedieners möglich ist. Als Eingabegeräte fungieren dabei beispielsweise virtuelle Tastaturen oder Miniaturtasten.So far, preinstalled programs in mobile devices can only be operated using the input devices they contain, which is mostly cumbersome, lengthy and only possible when the operator is at rest due to the options available. For example, virtual keyboards or miniature keys function as input devices.
Bei mobilen Telefonen existiert zur Texteingabe in der Regel nur ein Ziffernblock, durch den unter mehrmaligem Drücken der Tasten ein entsprechender Buchstabe eingegeben und auf dem Display dargestellt wird.In mobile telephones, there is usually only a numeric keypad for entering text, by pressing the keys several times and entering a corresponding letter and showing it on the display.
Bei Personal Digital Assistants (PDAs) gibt es oft zwei unterschiedliche Eingabemöglichkeiten. Einerseits die Stifteingabe über eine virtuelle Tastatur, welche im Display eingeblendet wird, oder die Handschrifterkennung, welche meistens als alternative Eingabe für die virtuelle Tastatur verwendet wird. Bei etwas größeren Geräten findet teilweise auch eine miniaturisierte Hardwaretastatur Anwendung. Welches Eingabeverfahren verwendet wird, entscheidet der Hersteller des Gerätes. Die hier beschriebenen Eingabemöglichkeiten sind in den am Markt erhältlichen PDAs integriert.With Personal Digital Assistants (PDAs) there are often two different input options. On the one hand, pen input via a virtual keyboard, which is shown in the display, or handwriting recognition, which is mostly used as an alternative input for the virtual keyboard. A miniaturized hardware keyboard is sometimes used for somewhat larger devices. The manufacturer of the device decides which input method is used. The input options described here are integrated in the PDAs available on the market.
Bei Web-Pads/SIM-Pads existiert ebenfalls nur eine virtuelle Tastatur und eine Handschrifterkennung. Diese Geräte unterscheiden sich von den PDAs nur dadurch, dass ihr Bildschirm und/oder Touchscreen um einiges größer ist.Web pads / SIM pads also only have a virtual keyboard and handwriting recognition. These devices differ from the PDAs only in that their screen and / or touchscreen is a lot larger.
Davon ausgehend liegt der Erfindung die Aufgabe zugrunde, eine Möglichkeit zur Eingabe, insbesondere von Text, in auf kleinen mobilen Endgeräten vorinstallierte Anwendungen anzugeben. Diese Aufgabe wird durch die in den unabhängigen Patentansprüchen angegebenen Erfindungen gelöst. Vorteilhafte Ausgestaltungen ergeben sich aus den Unteransprüchen.Proceeding from this, the object of the invention is to provide a possibility for input, in particular text, in applications preinstalled on small mobile devices. This object is achieved by the inventions specified in the independent patent claims. Advantageous refinements result from the subclaims.
Dementsprechend befindet sich in einem Verfahren zur Spracherkennung eine Anwendung in einem Zustand, in dem ihr Tastatur-Codes zuführbar sind. Es wird ein Sprachsignal eingegeben und von einer Spracherkennungseinheit in Tastatur- Codes umgewandelt. Die Tastatur-Codes werden der Anwendung zugeführt.Accordingly, in a speech recognition method, an application is in a state in which keyboard codes can be fed to it. A speech signal is entered and converted into keyboard codes by a speech recognition unit. The keyboard codes are fed to the application.
Vorzugsweise läuft die Anwendung auf einem Betriebssystem ab. Bei dem Betriebssystem kann es sich um ein nachrichten- basiertes Betriebssystem handeln. Die Tastatur-Codes werden der Anwendung dann als Nachrichten durch das Betriebssystem zugeführt.The application preferably runs on an operating system. The operating system can be a message-based operating system. The keyboard codes are then sent to the application as messages by the operating system.
Die Tastatur-Codes sind beispielsweise Buchstaben.The keyboard codes are, for example, letters.
Zusätzlich zu den Buchstaben können Kommandos als Sprachsignal eingegeben, von der Spracherkennungseinheit erkannt und der Anwendung als Tastatur-Codes zugeführt werden. Dadurch lässt sich die Anwendung weiterhin steuern.In addition to the letters, commands can be entered as a speech signal, recognized by the speech recognition unit and fed to the application as keyboard codes. This allows the application to continue to be controlled.
Das Verfahren läuft insbesondere auf einem mobilen Endgerät mit einer oder mehreren vorinstallierten Anwendungen ab.The method runs in particular on a mobile device with one or more preinstalled applications.
Eine Anordnung, die eingerichtet ist, eines der geschilderten Verfahren auszuführen, lässt sich zum Beispiel durchAn arrangement that is set up to carry out one of the described methods can be, for example, by
Programmieren und Einrichten einer Datenverarbeitungsanlage mit zu den genannten Verfahrensschritten gehörigen Mitteln realisieren.Realize programming and setting up a data processing system with means belonging to the mentioned method steps.
Ein Programmprodukt für eine Datenverarbeitungsanlage, das Codeabschnitte enthält, mit denen eines der geschilderten Verfahren auf der Datenverarbeitungsanlage ausgeführt werden kann, lässt sich durch geeignete Implementierung des Verfahrens in einer Programmiersprache und Übersetzung in von der Datenverarbeitungsanlage ausführbaren Code ausführen. Die Codeabschnitte werden hierzu gespeichert. Dabei wird unter einem Programmprodukt das Programm als handelbares Produkt verstanden. Es kann in beliebiger Form vorliegen, so zum Beispiel auf Papier, einem computerlesbaren Datenträger oder über ein Netz verteilt.A program product for a data processing system that contains code sections with which one of the described methods are carried out on the data processing system can be carried out by suitable implementation of the method in a programming language and translation into code executable by the data processing system. The code sections are saved for this purpose. A program product is understood to mean the program as a tradable product. It can be in any form, for example on paper, a computer-readable data medium or distributed over a network.
Weitere Vorteile und Merkmale der Erfindung ergeben sich aus der Beschreibung eines Ausführungsbeispiels anhand der Figur, die ein Verfahren zur Spracherkennung anhand eines Ablaufdiagramms darstellt.Further advantages and features of the invention result from the description of an exemplary embodiment with reference to the figure, which represents a method for speech recognition using a flowchart.
Um das dem Verfahren grundlegende Problem darzustellen, folgt als erstes ein Ausführungsbeispiel. Im Beispiel erfolgt die Bedienung eines herkömmlichen PDAs unter dem Betriebssystem Windows CE. Heutzutage ist es möglich, Programme auf dem PDA durch ein vorgegebenes Vokabular anhand automatischer Spracherkennung zu starten. Im Beispiel wird auf diese Weise das Programm "Kontakte-Neueintrag" gestartet, um zur Eingabemaske eines neuen Kontaktes zu gelangen. Der Cursor steht dann automatisch im Eingabefeld des Namens. An diesem Punkt wird deutlich, dass für die Erstellung eines Kontaktes keine wortbasierte Spracherkennung verwendet werden kann, da aufgrund des großen Wortschatzes der Ressourcen- und CPU- Verbrauch eine Realisierung auf mobilen Geräten schwierig bzw. unmöglich macht. Um dem Benutzer dennoch die Möglichkeit zur Erstellung eines individuellen Kontaktes zu ermöglichen, wird anstatt eines wortbasierten Spracherkenners ein Buchstabier-Erkenner verwendet, welcher zusätzlich mit einigen Sprachkommandowörtern ergänzt wurde. Nun werden die vom Benutzer einzutragenden Namen/Worte buchstabiert. Nachdem die Erkennung abgeschlossen ist, kann der Fensterfocus vom bisherigen Eingabefeld zum nachfolgenden per Sprachkommando, beispielsweise "next", verschoben werden. Dieser Vorgang wiederholt sich nun für alle Eingabefelder. Nachdem vom Benutzer alle gewünschten Daten eingegeben wurden, kann der neue Datensatz beispielsweise durch das Kommando "save" der Datenbank des Geräts hinzugefügt werden.In order to illustrate the problem that is fundamental to the method, an embodiment follows first. In the example, a conventional PDA is operated using the Windows CE operating system. Nowadays it is possible to start programs on the PDA using a predefined vocabulary based on automatic speech recognition. In the example, the "Contacts new entry" program is started in this way in order to get to the input mask of a new contact. The cursor is then automatically in the input field of the name. At this point, it becomes clear that word-based speech recognition cannot be used to create a contact, because the large vocabulary means that resource and CPU consumption make implementation on mobile devices difficult or impossible. In order to enable the user to create an individual contact, a spelling recognizer is used instead of a word-based speech recognizer, which has also been supplemented with some voice command words. Now the names / words to be entered by the user are spelled out. After the recognition has been completed, the window focus can be shifted from the previous input field to the next one by voice command, for example "next". This process is now repeated for all input fields. After from If all the desired data has been entered, the new data record can be added to the device database, for example, using the "save" command.
Um dieses Verfahren auf einem Endgerät, welches ein nachrichtengesteuertes Betriebssystem wie etwa Windows, Unix, Windows CE, Epoc besitz, zu realisieren, ist lediglich eine zusätzliche, speziell ausgeprägte Spracherkennungsanwendung erforderlich. Diese Spracherkennungsanwendung läuft im Hintergrund, steuert den Spracherkenner und sendet die erkannten Buchstaben per Betriebssystem spezifischen Nachrichten zum aktiven Fensterfocus der Vordergrund- Anwendung. Dabei ist kein Wissen über die Vordergrund- Anwendung erforderlich. Dadurch ist dieses Verfahren für beliebige Anwendungen anwendbar, welche mit Texteingabe arbeiten.In order to implement this method on a terminal device that has a message-controlled operating system such as Windows, Unix, Windows CE, Epoc, all that is required is an additional, specially designed speech recognition application. This speech recognition application runs in the background, controls the speech recognizer and sends the recognized letters via operating system-specific messages to the active window focus of the foreground application. No knowledge of the foreground application is required. This method can therefore be used for any application that uses text input.
Das hier beschriebene Verfahren nutzt also die bestehenden Kommunikationsschnittstellen der Programme mit dem Betriebssystem auf dem Gerät aus.The method described here uses the existing communication interfaces of the programs with the operating system on the device.
Als nächstes wird ein Verfahren zur Spracherkennung beschrieben. Um die folgende Beschreibung besser mit der Figur vergleichen zu können, sind die einzelnen Schritte mit Bezugszeichen versehen.Next, a speech recognition method will be described. In order to better compare the following description with the figure, the individual steps are provided with reference numerals.
Schritt 1 Es wird die im Betriebssystem derzeit aktivierte Anwendung abgefragt. Am Beispiel Windows ist der Rückgabewert ein Fensterhandle. Als nächstes wird inStep 1 The application currently activated in the operating system is queried. Using Windows as an example, the return value is a window handle. Next in
Schritt 2 wird abgefragt, welches Fenster der aktiven Anwendung den Eingabefocus (Cursor) besitzt. Wiederum am Beispiel Windows kann dies mit GetFocus durchgeführt werden. Hierbei ist der Rückgabewert das Handle auf das Fenster, welches den Eingabecursor beinhaltet. Schritt 3 Nun sind alle Vorarbeiten geleistet und die Anwendung befindet sich im Idle-Modus. In diesem Modus wird überwacht, ob sich das aktive Fenster oder das Fenster mit dem Eingabefocus ändert. Durch den Druck der PTT (Push to Talk) -Taste wird der Spracherkenner gestartet.Step 2 asks which window of the active application has the input focus (cursor). Again using Windows as an example, this can be done with GetFocus. The return value is the handle to the window that contains the input cursor. Step 3 Now all preparatory work has been done and the application is in idle mode. This mode monitors whether the active window or the window with the input focus changes. Pressing the PTT (Push to Talk) button starts the speech recognizer.
Schritt 4 In diesem Schritt wird der automatische Spracherkenner wieder gestoppt, da ein gültiges Erkennungsresultat vorliegt. Es können einzelne Buchstaben und Kommandos erkannt werden. Handelt es sich um eine Fehlerkennung, wird zum Schritt 3 zurückgesprungen .Step 4 In this step, the automatic speech recognizer is stopped again because there is a valid recognition result. Individual letters and commands can be recognized. If there is an error detection, the system jumps back to step 3.
Schritt 5 Wird ein Buchstabe erkannt, wird der korrespondierende KeyCode wie bei den Tastaturcodes einer gebräuchlichen Tastatur an das Fenster mit dem Eingabefocus gesendet. Am Beispiel Windows funktioniert dies beispielsweise mit SendMessage.Step 5 If a letter is recognized, the corresponding KeyCode is sent to the window with the input focus as with the keyboard codes of a conventional keyboard. Using Windows as an example, this works with SendMessage, for example.
Schritt β Dadurch wird das erkannte Kommando in das Feld mit dem Focus eingetragen.Step β This enters the recognized command in the field with the focus.
Schritt 7 Wird innerhalb von Schritt 4 ein Kommando erkannt, wird dieses interpretiert und der entsprechende KeyCode an die aktive Anwendung geschickt.Step 7 If a command is recognized in step 4, this is interpreted and the corresponding KeyCode is sent to the active application.
Schritt 8 Hier wurde das Kommando "next" erkannt, welches den Fensterfocus zum nächsten Eingabefeld schiebt. Am Beispiel Windows kann dies durch das Senden des Tabulator-Tasten-KeyCodes erzielt werden. Schritt 9 Löschen des Inhalts des aktiven Feldes mit dem Kommando "empty". In Windows kann dies mit dem Senden des KeyCodes für Backspace erreicht werden, bis das Feld leer ist.Step 8 Here the command "next" was recognized, which pushes the window focus to the next input field. Using Windows as an example, this can be achieved by sending the Tab key code. Step 9 Delete the content of the active field with the "empty" command. In Windows this can be achieved by sending the KeyCode for Backspace until the field is empty.
Schritt 10 Das Kommando "back" wird wie unter Schritt 9 beschrieben durchgeführt. Es wird aber lediglich einmal der KeyCode für Backspace gesendet.Step 10 The "back" command is carried out as described in step 9. However, the KeyCode for backspace is only sent once.
Schritt 11 Durch das erkannte Kommando Speichern "save", was am Beispiel Windows CE durch Senden des Okay- Codes "Enter" durchgeführt wird, werden die eingetragenen Daten in die Datenbank eingetragen.Step 11 The recognized command Save "save", which is carried out in the example Windows CE by sending the OK code "Enter", the entered data is entered into the database.
Unter Schritt 8 kann neben "next" auch "previous" erkannt werden, um zum vorherigen Eingabefeld zu gelangen (KeyCode Shift + Tabulator) .In step 8, in addition to "next", "previous" can be recognized to go to the previous input field (KeyCode Shift + Tabulator).
Das Verfahren wurde anhand reiner Spracherkennung vorgestellt. Allerdings kann dieses Texteingabeverfahren auch mit anderen internen oder externen Eingabegeräten bzw. bei der Kombination von verschiedenen Eingabegeräten zum Einsatz kommen. Eine interessante Lösung für die Übertragung von Text in das mobile Gerät wäre die Verwendung eines Scanner-Stifts kombiniert mit der Spracherkennung. Mittels Scanner-Stift wird der Text übertragen und per Sprachkommandos werden die zusätzlichen Steueranweisungen gegeben, beispielsweise "next" für nächstes Feld, "save" für Abspeichern etc.The method was presented using pure speech recognition. However, this text input method can also be used with other internal or external input devices or when combining different input devices. An interesting solution for transferring text to the mobile device would be to use a scanner pen combined with speech recognition. The text is transferred using a scanner pen and the additional control instructions are given via voice commands, for example "next" for the next field, "save" for saving, etc.
Den vorgestellten Verfahren sind folgende Vorteile gemein:The methods presented have the following advantages in common:
- Sie funktionieren bei allen nachrichtengesteuerten Betriebssystemen (Windows, Unix, Windows CE, Symbian OS etc. ) , - sie ermöglichen eine schnelle und natürliche Texteingabe gegenüber herkömmlichen Eingabemöglichkeiten, - es können sämtliche Textfelder einer Anwendung via Sprache oder anderem Eingabegerät vom Benutzer ausgeführt werden,- They work with all message-driven operating systems (Windows, Unix, Windows CE, Symbian OS etc.), - They enable fast and natural text input compared to conventional input options, - All text fields of an application can be executed by the user via voice or other input device,
- durch das Buchstabieren können alle erdenklichen Worte erstellt werden, - durch andere Eingabegeräte kann Text 1 : 1 übernommen werden,- all possible words can be created by spelling, - text can be adopted 1: 1 by other input devices,
- das Verfahren kann im dynamischen Zustand, also während der Fortbewegung des Benutzers, bedient werden,the method can be operated in the dynamic state, i.e. while the user is moving,
- eine einfache Bedienung ist auch für körperlich Behinderte möglich.- Simple operation is also possible for the physically disabled.
Der Nachweis einer Verwendung des Verfahrens ist sehr einfach. Es muss lediglich ausprobiert werden, ob ein eigenhändig erstelltes Programm nach der Installation per Sprache bearbeitet werden kann. Proof of using the method is very simple. You only have to try out whether a hand-written program can be edited by voice after installation.

Claims

Patentansprüche claims
1. Verfahren zur Spracherkennung für eine Anwendung, bei dem1. A method of speech recognition for an application in which
- die Anwendung in einem Zustand ist, in dem ihr Tastatur- Codes zuführbar sind,the application is in a state in which keyboard codes can be fed,
- ein Sprachsignal eingegeben und von einem Spracherkenner in Tastatur-Codes umgewandelt wird,a speech signal is entered and converted into keyboard codes by a speech recognizer,
- die Tastatur-Codes der Anwendung zugeführt werden.- The keyboard codes of the application are fed.
2. Verfahren nach Anspruch 1,2. The method according to claim 1,
- bei dem die Anwendung auf einem Betriebssystem abläuft,- in which the application runs on an operating system,
- bei dem das Betriebssystem ein nachrichtenbasiertes Betriebssystem ist und die Tastatur-Codes der Anwendung als Nachrichten durch das Betriebssystem zugeführt werden.- in which the operating system is a message-based operating system and the keyboard codes of the application are supplied as messages by the operating system.
3. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Tastatur-Codes Buchstaben sind.3. The method according to any one of the preceding claims, wherein the keyboard codes are letters.
4. Verfahren nach Anspruch 3, bei dem zusätzlich zu den Buchstaben Kommandos eingegeben, erkannt und der Anwendung als Tastatur-Codes zugeführt werden .4. The method of claim 3, in which commands are entered in addition to the letters, recognized and supplied to the application as keyboard codes.
5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Verfahren auf einem mobilen Endgerät abläuft.5. The method according to any one of the preceding claims, wherein the method runs on a mobile terminal.
6. Anordnung, die eingerichtet ist, ein Verfahren nach einem der vorhergehenden Ansprüche auszuführen.6. Arrangement which is set up to carry out a method according to one of the preceding claims.
7. Programmprodukt, das, wenn es auf einer7. Program product that, when on a
Datenverarbeitungsanlage geladen und darauf ausgeführt wird, ein Verfahren nach einem der Ansprüche 1 bis 5 oder einer Vorrichtung nach Anspruch 6 in Kraft setzt. Data processing system loaded and executed on it, a method according to one of claims 1 to 5 or a device according to claim 6 in force.
PCT/EP2004/051753 2003-08-18 2004-08-09 Voice-assisted text input for pre-installed applications in mobile devices WO2005020211A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE2003137822 DE10337822A1 (en) 2003-08-18 2003-08-18 Voice-based text input for pre-installed applications of mobile devices e.g. mobile phones, involves voice signal input with conversion by voice recognition device into textural units
DE10337822.7 2003-08-18

Publications (1)

Publication Number Publication Date
WO2005020211A1 true WO2005020211A1 (en) 2005-03-03

Family

ID=31896395

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2004/051753 WO2005020211A1 (en) 2003-08-18 2004-08-09 Voice-assisted text input for pre-installed applications in mobile devices

Country Status (2)

Country Link
DE (1) DE10337822A1 (en)
WO (1) WO2005020211A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113630464A (en) * 2021-08-10 2021-11-09 中国电信股份有限公司 Distributed speech processing method, system, device and storage medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9116884B2 (en) 2009-12-04 2015-08-25 Intellisist, Inc. System and method for converting a message via a posting converter

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873064A (en) * 1996-11-08 1999-02-16 International Business Machines Corporation Multi-action voice macro method
US5893064A (en) * 1997-05-14 1999-04-06 K2 Interactive Llc Speech recognition method and apparatus with voice commands and associated keystrokes
US20020026312A1 (en) * 2000-07-20 2002-02-28 Tapper Paul Michael Method for entering characters
US6401065B1 (en) * 1999-06-17 2002-06-04 International Business Machines Corporation Intelligent keyboard interface with use of human language processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873064A (en) * 1996-11-08 1999-02-16 International Business Machines Corporation Multi-action voice macro method
US5893064A (en) * 1997-05-14 1999-04-06 K2 Interactive Llc Speech recognition method and apparatus with voice commands and associated keystrokes
US6401065B1 (en) * 1999-06-17 2002-06-04 International Business Machines Corporation Intelligent keyboard interface with use of human language processing
US20020026312A1 (en) * 2000-07-20 2002-02-28 Tapper Paul Michael Method for entering characters

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DOBLER S ET AL: "DESIGN AND USE OF SPEECH RECOGNITION ALGORITHMS FOR A MOBILE RADIO TELEPHONE", SPEECH COMMUNICATION, ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, NL, vol. 12, no. 3, 1 July 1993 (1993-07-01), pages 221 - 229, XP000393641, ISSN: 0167-6393 *
DOBLER S: "SPEECH RECOGNITION TECHNOLOGY FOR MOBILE PHONES", ON - ERICSSON REVIEW, ERICSSON. STOCKHOLM, SE, no. 3, 2000, pages 148 - 155, XP000966160, ISSN: 0014-0171 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113630464A (en) * 2021-08-10 2021-11-09 中国电信股份有限公司 Distributed speech processing method, system, device and storage medium
CN113630464B (en) * 2021-08-10 2022-08-02 中国电信股份有限公司 Distributed speech processing method, system, device and storage medium

Also Published As

Publication number Publication date
DE10337822A1 (en) 2004-03-25

Similar Documents

Publication Publication Date Title
DE69819690T2 (en) LANGUAGE RECOGNITION USING A COMMAND LIKE
DE10235548B4 (en) Method and device for the prediction of a text message input
DE102017122357B4 (en) CONTEXT-RELATED HUMAN-COMPUTER DIALOGUE
DE60125696T2 (en) Universal remote control suitable for receiving voice input
DE60318181T2 (en) Automatic adjustment of a keyboard input mode in response to an incoming text message
DE202017105669U1 (en) Modality learning on mobile devices
DE69722652T2 (en) SYSTEM AND METHOD FOR REMOTELY GROUPING THE CONTENT OF A HISTORICAL BASEMENT STORAGE
DE102005044084B4 (en) Random bit generator and random number generator
EP1515223A1 (en) Generation of an object editing platform between two computers using screen-joining
DE102008005852A1 (en) A power control device, portable terminal, and method of controlling a power control device
DE102005061365A1 (en) Background applications e.g. home banking system, controlling method for use over e.g. user interface, involves associating transactions and transaction parameters over universal dialog specification, and universally operating applications
DE4109785C2 (en) Process for preparing dictionary files and for creating application programs, and system for carrying out this process
EP2951663B1 (en) System-initiated help function for operating an apparatus associated with a vehicle - input of spaces
DE20320853U1 (en) Software execution apparatus for implementing hot key functions in computer system, identifies hot key in keyboard and transmits corresponding system management interrupt, according to scan code from keyboard encoder
DE10038518A1 (en) Local elevator with voice control
WO2005020211A1 (en) Voice-assisted text input for pre-installed applications in mobile devices
DE19849855C1 (en) Method for using a computer system to generate a text expression automatically while retaining meaning determines a statistical model on a number of preset pairs of word meanings and associated expressions.
EP1168302B1 (en) Speech recognition system with active standby mode
DE10331551A1 (en) System and method for controlling boot mode
DE19648721A1 (en) Expansion of hot key functions of keyboard
WO2020126217A1 (en) Method, arrangement and use for producing a response output in reply to voice input information
DE4123429C2 (en) Electronic device with automatic shutdown
DE3438333A1 (en) LANGUAGE SENSITIVE DEVICE
DE69928022T2 (en) FUNCTION KEY TO COMPUTER DATA PROCESSING
DE1303602C2 (en) CIRCUIT ARRANGEMENT FOR ADAPTING A DATA PROCESSING DEVICE TO A WRITER

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase