《具有语音识别功能的打印装置及其打印方法.pdf》由会员分享,可在线阅读,更多相关《具有语音识别功能的打印装置及其打印方法.pdf(12页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102476509 A (43)申请公布日 2012.05.30 CN 102476509 A *CN102476509A* (21)申请号 201010571485.1 (22)申请日 2010.11.24 B41J 3/00(2006.01) B41J 2/01(2006.01) B41J 29/393(2006.01) G10L 15/00(2006.01) (71)申请人 研能科技股份有限公司 地址 中国台湾新竹市科学园区研发二路 28 号 1 楼 (72)发明人 莫皓然 薛达伟 奚国元 林景松 范珅源 (74)专利代理机构 上海专利商标事务所有限公 司 31。
2、100 代理人 任永武 (54) 发明名称 具有语音识别功能的打印装置及其打印方法 (57) 摘要 本发明是关于一种打印装置, 至少包括数据 处理模块、 控制模块以及打印模块。 数据处理模块 用以接收语音信号, 以进行语音识别程序, 并输出 数据 ; 控制模块与数据处理模块连接, 用以接收 语音识别后的数据 ; 打印模块与控制模块连接, 用以接收控制模块的数据, 并依据该数据进行打 印动作, 其中打印模块至少包括马达操控模块及 喷墨控制模块, 且喷墨控制模块包括喷墨控制单 元, 用以产生控制信号, 以控制打印装置的至少一 喷墨芯片。 (51)Int.Cl. 权利要求书 1 页 说明书 5 页 。
3、附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 1 页 说明书 5 页 附图 5 页 1/1 页 2 1. 一种打印装置, 至少包括 : 一数据处理模块, 用以接收一语音信号, 以进行语音识别程序, 并输出一数据 ; 一控制模块, 与该数据处理模块连接, 用以接收语音识别后的该数据 ; 以及 一打印模块, 与该控制模块连接, 用以接收该控制模块的该数据, 并依据该数据进行一 打印动作, 其中该打印模块至少包括一马达操控模块以及一喷墨控制模块, 而该喷墨控制 模块包括一喷墨控制单元, 用以产生一控制信号, 以控制该打印装置的至少一喷墨芯片。 2. 根据权利要。
4、求 1 所述的打印装置, 其特征在于, 该数据处理模块接收该语音信号后, 先进行语音识别程序, 以输出一文字数据。 3. 根据权利要求 2 所述的打印装置, 其特征在于, 该数据处理模块再进一步将语音识 别后输出的该文字数据进行数据转换或排列, 以取得一打印格式数据, 且该控制接收该打 印格式数据, 并控制该打印模块依据该打印格式数据进行该打印动作。 4. 根据权利要求 1 所述的打印装置, 其特征在于, 该数据处理模块是一数字信号处理 器。 5. 根据权利要求 1 所述的打印装置, 其特征在于, 还具有一储存模块, 以作为程序、 文 件或影像数据的寄存及缓冲的储存空间。 6. 根据权利要求 。
5、1 所述的打印装置, 其特征在于, 该打印模块包括脉宽调制器、 输入 / 输出脚、 编码器以及解码器的至少任一者。 7. 一种利用语音识别转换成数据的打印方法, 包括步骤 : 提供一打印装置 ; 该打印装置接收一语音信号 ; 进入语音识别程序, 并取得识别后的一数据 ; 以及 该打印装置依据该数据进行一打印动作。 8. 根据权利要求 7 所述的利用语音识别转换成数据的打印方法, 其特征在于, 于进入 语音识别程序的步骤中, 是先通过语音识别程序而取得识别后的一文字数据。 9. 根据权利要求 8 所述的利用语音识别转换成数据的打印方法, 其特征在于, 当通过 语音识别程序而取得识别后的一文字数据。
6、后, 再进一步将该文字数据进行数据转换或排 列, 以取得一打印格式数据, 且该打印装置依据该打印格式数据进行该打印动作。 10. 根据权利要求 7 所述的利用语音识别转换成数据的打印方法, 其特征在于, 该打印 装置包括一数据处理模块、 一控制模块以及一打印模块, 该数据处理模块用以接收该语音 信号, 以进行语音识别程序, 并输出该数据 ; 该控制模块与该数据处理模块连接, 用以接收 语音识别后的该数据 ; 该打印模块用以接收该控制模块的该数据, 并依据该数据进行该打 印动作。 权 利 要 求 书 CN 102476509 A 2 1/5 页 3 具有语音识别功能的打印装置及其打印方法 技术领。
7、域 0001 本发明是关于一种打印装置, 尤指一种具有语音识别功能的打印装置及其打印方 法。 背景技术 0002 随着数字化时代的来临, 人类与电子产品之间的互动也随之频繁, 进而发展出各 式各样便捷的操控接口, 语音识别技术即为其中一广泛发展的操控技术。其主要特性是可 以通过用户发送一指令语音, 进而使具有语音识别系统的电子产品可将用户发送的语音指 令与电子产品中内建的语音识别模型进行比较与识别程序, 再依据识别后的结果执行该项 语音操控指令, 通过此语音识别操控让用户无需在繁忙中拨出空手对该项电子产品进行一 般的手动操控功能, 使生活以及商务使用上都增添了不少的便利性。 0003 一般来说。
8、, 语音识别技术经常被使用在计算机产品、 电话产品或是消费性电子产 品等电子产品, 其中最被广泛应用的即为手机商品的相关语音操控功能, 如图 1 所示, 例如 包含声控拨号、 语音呼叫应用程序、 语音搜寻通讯簿、 语音编写简讯等功能。 其中, 声控拨 号功能即为利用用户对手机系统发送的声音样本, 进而与手机内部的语音数据库进行比较 分析, 再解译出用户所发送的数字及指令, 并依据该数字及指令进行拨号程序。 至于语音呼 叫应用程序亦是通过将用户发送的声音样本与手机内部的语音数据库进行比较分析, 再解 译出用户所发送的音讯指令, 并依据该音讯指令开启相关的程序。 同样的, 语音编写简讯或 是语音搜。
9、寻通讯簿等功能, 亦是将用户发送的声音样本与手机内部的语音数据库进行比较 分析, 其后再根据解译后的音讯符号, 产出文字格式的显示数据, 或是比较、 搜寻出相近、 相 似的文字符号等, 进而可进行后续的简讯传送或是依据识别后的通讯簿进行拨号程序等功 能。 通过前述的语音识别技术的应用, 让用户在操控手机时更为便利, 仅需用口语发送语音 信号即可进行简易操控, 而无需再空出双手以进行相关的拨号、 搜寻或是编写简讯等作业。 如此便捷的语音识别技术不仅使得相关电子产品在操作上更为方便, 同时亦大幅增加了电 子产品的附加价值。 0004 然而, 目前语音识别技术仅应用于手机产品等小型的可携式电子装置等。
10、商品上, 并无进一步应用于打印装置上的相关产品及技术, 实为可惜, 若能进一步将语音识别技术 应用于打印相关产品上, 即可实时将用户所发送的语音信号转为文字符号, 并进行打印, 例 如可即使将用户的创作、 想法以语音输入的方式进行打印, 可实时以书面方式留存用户的 想法与创作 ; 或是可于会议进行过程中通过语音识别技术, 将多人的发言编译为相关文字 讯息, 便于整理与实时打印会议记录等, 由此可见, 若语音识别技术能与打印装置相结合, 对用户来说实具有极大的便利性及应用性, 同时更可增进打印装置的附加价值。 0005 因此, 如何发展一种具有语音识别功能的打印装置及其打印方法, 实为目前最迫 。
11、切的课题。 发明内容 说 明 书 CN 102476509 A 3 2/5 页 4 0006 本发明的主要目的在于提供一种具有语音识别功能的打印装置及其打印方法, 以 解决现有语音识别技术仅适用于手机等小型电子产品而无应用于打印装置上的缺点。 0007 本发明的另一目的在于提供一种具有语音识别功能的打印装置及其打印方法, 通 过具有语音识别功能的打印装置以接收语音信号, 并直接将语音信号转换、 输出为文件数 据, 以提供用户更便利的操控方式及更广泛的应用性。 0008 为达上述目的, 本发明的一较广实施态样为提供一种打印装置, 至少包括 : 数据处 理模块, 用以接收一语音信号, 以进行语音识。
12、别程序, 并输出一数据 ; 控制模块, 与数据处理 模块连接, 用以接收语音识别后的数据 ; 以及打印模块, 与控制模块连接, 用以接收控制模 块的数据, 并依据该数据进行一打印动作。 0009 为达上述目的, 本发明的另一较广实施态样为提供一种打印方法, 包括步骤 : 提供 一打印装置 ; 该打印装置接收一语音信号 ; 进入语音识别程序, 并取得识别后的一数据 ; 以 及该打印装置依据该数据进行一打印动作, 其中打印模块至少包括马达操控模块及喷墨控 制模块, 且喷墨控制模块包括喷墨控制单元, 用以产生控制信号, 以控制打印装置的至少一 喷墨芯片。 0010 本发明的有益技术效果是 : 本发明。
13、的具有语音识别功能的打印装置及其打印方法 主要是由该打印装置接收一语音信号, 通过其中的数据处理模块对该语音信号进行语音识 别程序以及数据转换、 排列程序, 进而获得一数据, 而可使打印模块据以进行打印工作, 藉 此以将语音信息转换并输出为文字文件, 不仅可简化及减少用户将语音信息汇整为文字信 息所需耗费的程序及时间。 同时, 用户更无需将汇整后的文字数据文件输入电子装置, 再传 输至打印装置进行打印, 其仅需通过语音信号的输入, 而可直接进行相关语音识别程序并 进行打印, 大幅提升用户于操作、 使用上的便利性, 且使其应用性更为广泛。 因而, 本发明的 具有语音识别功能的打印装置及其打印方法。
14、实为一具产业价值的发明。 附图说明 0011 图 1 是现有语音识别技术应用于手机的相关功能示意图。 0012 图 2 是本发明具有语音识别功能的打印装置接收语音信号并进行打印动作的示 意图。 0013 图 3 是本发明较佳实施例的具有语音识别功能的打印装置的架构示意图。 0014 图 4 是本发明较佳实施例的具有语音识别功能的打印装置进行语音识别程序及 利用语音识别转换成数据的打印流程图。 0015 图 5 是本发明较佳实施例的具有语音识别功能的打印装置进行语音识别的子流 程图。 0016 图 6 是本发明较佳实施例的具有语音识别功能的打印装置进行数据转换及排列 的子流程图。 具体实施方式 。
15、0017 体现本发明特征与优点的一些典型实施例将在后段的说明中详细叙述。 应理解的 是本发明能够在不同的态样上具有各种的变化, 其皆不脱离本发明的范围, 且其中的说明 及图标在本质上是当作说明之用, 而非用以限制本发明。 说 明 书 CN 102476509 A 4 3/5 页 5 0018 请参阅图 2, 其是本发明具有语音识别功能的打印装置接收语音信号并进行打印 动作的示意图。如图所示, 本发明的打印装置 3 具有语音识别功能, 因而当用户 1 直接以 语音方式下达一语音信号后, 通过打印装置 3 的语音识别功能, 则可进一步对该语音信号 进行语音识别及数据格式转换, 其后再依据转换后的数。
16、据打印出一文件。当然, 输入语音 信号的方式可有不同的实施态样, 除了前述通过用户 1 实时输入语音信号的方式之外, 亦 可通过手机 2 或其它电子装置通过录音的输入方式来对打印装置 3 发送语音信号 ; 除此之 外, 语音信号的应用上还可推及至会议实时语音、 或是拨放歌曲等不同应用方式, 其均可通 过具有语音识别功能的打印装置 3 将会议的实时语音信号转换为文字记录文件, 并加以输 出, 或是可直接将歌曲通过语音识别功能而转换为歌词文字文件, 并进行打印。藉此, 则可 通过具有语音识别功能的打印装置 3 提升生活及会议上操作的便利性, 并可实时、 直接地 获得文字输出结果, 并大幅减少人工手。
17、动输入、 转换数据的时间。 0019 请参阅图 3, 其是本发明较佳实施例的具有语音识别功能的打印装置的架构示意 图。如图所示, 本发明的打印装置 3 至少包括控制模块 31、 数据处理模块 32 以及打印模块 33, 其中控制模块 31 与数据处理模块 32 以及打印模块 33 连接, 以架构于控制数据处理模 块 32 以及打印模块 33 的运作。数据处理模块 32 主要是接收一语音信号, 以进行语音识别 程序, 并输出一数据, 且将该数据传送至控制模块 31, 控制模块 31 于接收数据处理模块 32 所传送的该数据后, 于是控制打印模块 33 依据该数据进行打印动作。 0020 于一些实。
18、施例中, 本发明的打印装置 3 的控制模块 31 可包括主处理器 311 以及 整合处理单元 312, 例如其可分别为中央处理器以及软性精简指令集处理器等, 但不以此为 限。 主处理器311主要用以协调打印装置3的各单元以及整合打印动作, 整合处理单元312 则负责整合与控制打印模块 33 内部组件的相关动作。于另一些实施例中, 打印模块 33 可 包括马达操控模块 331 以及喷墨控制模块 332, 用以分别操控马达或喷墨头的动作, 该喷墨 头包含一喷墨芯片, 但不以此为限。马达操控模块 331 还可包括脉宽调制器 (Pulse Width Modulation, PWM)、 输入 / 输出。
19、脚 (I/O pins) 以及编码器 / 解码器 (Encoder/Decoder) 等 装置, 其中脉宽调制器可用以规划及产生脉宽调制信号, 输入 / 输出脚可用以检测及控制 外围 IC 或零件, 且解码器可用以检测喷墨头的行进位置 ; 至于喷墨控制模块 332 则可包括 喷墨控制单元, 用以产生控制喷墨头所需的控制信号。 0021 数据处理模块 32 则可为但不限为数字信号处理器 (Digital Signal Processor, DSP), 负责处理及转换来源与目的的打印相关数据, 于本实施例中, 数据处理模块 32 可通 过直接或间接的方式接收一语音信号, 以进行语音识别程序, 并将。
20、该语音信号通过语音识 别而输出一文字数据, 接着, 再进一步将该文字数据进行数据转换或排列, 进而取得一打印 格式数据, 以使打印模块 33 可依据该转换后的打印格式数据进行打印动作。 0022 于另一些实施例中, 本发明的打印装置 3 亦可包括储存模块 34, 储存模块 34 可 包括闪存 (Flash Merory) 以及同步动态随机存取存储器 (Synchronous DynamicRandom Acc-ess Memory, SDRAM), 但不以此为限, 以作为程序、 文件或影像数据的寄存及缓冲的储 存空间。 0023 请参阅图 4, 其是本发明较佳实施例的具有语音识别功能的打印装置。
21、进行语音识 别程序及利用语音识别转换成数据的打印流程图。如图所示, 本发明的语音识别程序及利 用语音识别转换成数据的打印方法包括步骤 : 首先, 如步骤 S40 所示, 先提供一具有语音识 说 明 书 CN 102476509 A 5 4/5 页 6 别功能的打印装置 3, 且打印装置 3 可为喷墨打印机、 激光打印机或点阵打印机等, 但不以 此为限。接着, 如步骤 S41 所示, 通过用户 1 直接提供一语音信号, 或是通过手机 2 或是其 它电子装置以录音的方式发送一语音信号, 使打印装置 3 可接收到该语音信号, 且该语音 信号是一兼容的语音信号格式, 但不以此为限。其次, 如步骤 S4。
22、2 所示, 当打印装置 3 的数 据处理模块 32 接收到该语音信号后, 即进入语音识别程序, 通过该语音识别程序将语音信 号进行比较、 识别, 并取得识别后的文字数据 ; 然后, 再如步骤 S43 所示, 将该文字数据进行 数据格式转换及排列, 或依据数据的不同类型, 予以进行不同的解码或转换程序后, 以取得 一打印格式数据。最后, 如步骤 S44 所示, 打印装置 3 可直接依据该打印格式数据而进行打 印动作。 0024 请同时参阅图4及图5, 其中图5为本发明较佳实施例的具有语音识别功能的打印 装置进行语音识别的子流程图。如图所示, 当具有语音识别功能的打印装置 3 在进行语音 识别程序。
23、时 ( 如步骤 S42 所示 ), 主要先通过将语音信号进行前端处理 ( 如步骤 S420a 所 示 ) 以将语音信号进行特定处理, 以利于进行后续相关识别程序, 即其后进行的语音信号 后端处理(如步骤S420b所示), 其主要是将处理后的语音信号通过音讯比较等步骤而输出 一文字数据。 在进行步骤S420a的语音信号前端处理时, 首先如图5的步骤S421所示, 对打 印装置 3 所接收的语音信号进行数字取样, 由于一般接收的声音信号是属于模拟数据, 需 要通过转换为数字信号格式, 才能供一般的电子装置进行处理, 因而通过数字取样的步骤, 可将打印装置 3 所接收的语音信号转换为可进一步处理的数。
24、字信号格式。 0025 接着, 如步骤 S422 所示, 对转换过的数字信号格式进行标准化的动作, 其主要是 因每个人在说话时声音大小各不相同, 若语音声调过小, 在后续进行端点检测步骤时可能 会导致某些有声部分遭致切除, 因而会造成比较上的错误, 所以需要先通过此标准化的流 程, 将取样值标准化。然后, 如步骤 S423 所示, 将数个取样点集合成一个单位, 即为取音框, 于后续分析时, 音框可能重叠, 也可能不重叠, 取完音框后, 则如步骤 S424 所示, 进行端点 检测, 其意义即为因一个语音的前后段一定会有静音的部分, 然而这些静音部分并不需进 入到分析阶段, 因而在此阶段是进一步地。
25、检测语音信号的端点部分, 将前后端的静音部分 去除, 以增加识别的准确率。再来, 如步骤 S425 所示, 通过预强调及乘上汉明窗的步骤, 以 完成语音信号前端处理的程序。 其中, 由于声音由人口中发出后, 声音频率较高的部分较容 易产生衰减, 在识别时即不易识别到高频部分的声音, 因此需要通过预强调的方式, 让语音 信号通过一高通滤波器, 来补偿高频的损失, 以及, 为了避免因直接切割而导致音框产生不 连续的情形, 再以乘上汉明窗的方式进行处理, 增加音框左右两端的连续性, 以使音框信号 更完整。 0026 请续参阅图 5, 当语音信号前端处理的步骤 S420a 结束后, 则语音识别程序将进。
26、入 到后半部的步骤 S420b, 即为语音信号后端处理程序。首先, 如步骤 S426 所示, 将先选取 特征参数, 以取得足以代表整个语音信号的特性, 并利用此特征参数进行后续的语音识别 动作。接着, 如步骤 S427 所示, 将特征参数输出至数据库进行相关字词比较, 以及, 如步骤 S428 所示, 于数据库中进行相关搜寻与比较, 于一些实施例中, 数据库可包含多个数据库, 例如 : 听觉模型数据库、 词库、 语言模型数据库等, 但不以此为限。 听觉模型数据库主要可用 来记录说话者的发音习惯, 通过自我学习的方式, 提声语音识别的正确率。 词库则包含某种 语言的字词以及每个字的发音数据。 至。
27、于语言模型数据库则包括某种语言的字词以及其间 说 明 书 CN 102476509 A 6 5/5 页 7 该如何组合的规则。当特征参数如步骤 S427 所示输出至数据库后, 其后则如步骤 S428 所 示, 在听觉模型数据库、 词库以及语言模型数据库中进行语音识别, 通过搜寻相符的字词及 其组合, 再如步骤 S429 所示, 将数据转变为字符串组合, 并输出文字文件格式数据, 其主要 为通过前述流程将语音信号解译后, 进而将文字、 字句进行组合, 并将组合后的结果转换为 文字文件格式数据, 以输出一文字数据。 0027 请同时参阅图 4 及图 6, 图 6 是本发明较佳实施例的具有语音识别功。
28、能的打印装 置进行数据转换及排列的子流程图。如图 4 所示, 当步骤 S42 的语音识别程序结束后, 则进 入步骤 S43 的数据转换及排列的程序中, 其详细步骤则如图 6 所示, 首先, 如步骤 S430 所 示, 将前述语音识别程序后所获得的文字数据进行数据转换, 其中包含了数据格式的转换、 压缩以及记录用户打印设定等相关程序。接着, 再如步骤 S431 所示, 对转换后的数据进行 数据排列的工作, 其中, 先对该数据进行属性判断, 当判断该数据属于影像数据时, 则进行 步骤 S432, 由数据处理模块 32 进一步对该数据进行数据解析 (Data Parser), 并于解析后 进行相应的。
29、色彩转换 (ColorConversion), 以完成转换半色调影像的准备动作 ; 反之, 若数 据处理模块 32 判断影像数据属于脚本语言 (Script Language) 时, 则进行步骤 S433, 由数 据处理模块 32 对该数据进行语言解析 (Language Parser), 并于解析后进行数据格式化 (DataFormat), 将其转换为半色调影像的前置数据, 以完成转换半色调影像的准备动作。 然 后, 再如步骤 S434 所示, 将经过前述步骤 S432 色彩转换或步骤 S433 数据格式化的数据转 换为半色调影像后, 即为一打印格式数据, 再将该打印格式数据传送至打印模块 。
30、33。最后, 则如图 4 的步骤 S44 所示, 当打印模块 33 接收前述转换为打印格式的数据后, 则依据该打 印格式数据进行相关的打印动作, 藉以输出语音识别转换后的文件数据。 0028 综上所述, 本发明的具有语音识别功能的打印装置及其打印方法主要是由该打印 装置接收一语音信号, 通过其中的数据处理模块对该语音信号进行语音识别程序以及数据 转换、 排列程序, 进而获得一数据, 而可使打印模块据以进行打印工作, 藉此以将语音信息 转换并输出为文字文件, 不仅可简化及减少用户将语音信息汇整为文字信息所需耗费的程 序及时间。 同时, 用户更无需将汇整后的文字数据文件输入电子装置, 再传输至打印。
31、装置进 行打印, 其仅需通过语音信号的输入, 而可直接进行相关语音识别程序并进行打印, 大幅提 升用户于操作、 使用上的便利性, 且使其应用性更为广泛。因而, 本发明的具有语音识别功 能的打印装置及其打印方法实为一具产业价值的发明, 爰依法提出申请。 0029 纵使本发明已由上述实施例详细叙述而可由熟悉本技术人士任施匠思而为诸般 修饰, 然而皆不脱离如附本申请权利要求所欲保护的范围。 说 明 书 CN 102476509 A 7 1/5 页 8 图 1 图 2 说 明 书 附 图 CN 102476509 A 8 2/5 页 9 图 3 说 明 书 附 图 CN 102476509 A 9 3/5 页 10 图 4 说 明 书 附 图 CN 102476509 A 10 4/5 页 11 图 5 说 明 书 附 图 CN 102476509 A 11 5/5 页 12 图 6 说 明 书 附 图 CN 102476509 A 12 。