一种网络搜音机的实现方法及其专用设备.pdf

摘要
申请专利号：	CN200910154892.X	申请日：	2009.11.26
公开号：	CN101739437A	公开日：	2010.06.16
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30公开日:20100616\|\|\|实质审查的生效IPC(主分类):G06F 17/30申请日:20091126\|\|\|公开
IPC分类号：	G06F17/30; G10L13/08; G10L15/06	主分类号：	G06F17/30
申请人：	杭州鑫方软件有限公司
发明人：	卜佳俊; 陈伟; 陈华; 毛菥; 何占盈; 李辉; 张勤勤; 俞琦
地址：	310012 浙江省杭州市天目山路160号国际花园西塔楼14F室A
优先权：
专利代理机构：	杭州天正专利事务所有限公司 33201	代理人：	王兵;黄美娟
PDF下载：	PDF下载

内容摘要

一种网络搜音机的实现方法，由服务器向外界获取信息，从服务器获取信息，判断当前获取信息是否为文本信息，将文本信息转换为音频信息，播放给用户，将音频信息直接播放给用户；判断用户是否需要搜索新信息，获取用户输入的关键词，将此关键词发送至服务器、由服务器根据关键词进行检索。网络搜音机包括与服务器进行数据交换的网络通信模块，网络通信模块与存储模块连接；存储模块与语音合成模块连接，语音合成模块与播放模块连接；网络搜音机还包括交互模块，交互模块通过网络通信模块将关键词传输至服务器。本发明具有涉猎的信息面广，与服务器间信息交换速度快，且用户可自由选择感兴趣的信息的优点。

权利要求书

1：一种网络搜音机的实现方法，包括以下步骤： 1)、由服务器从网络中获取信息资源，或由管理员手动将文本或音频信息输入到服务器，服务器将所有信息按其所述类别(如新闻类、博客类、电子书类、音乐类、评书类……)，所述主题(如体育、军事、娱乐……)分别标识； 2)、服务器按照用户收听兴趣主动将信息推送给网络搜音机，网络搜音机接收并识别当前信息所述的类别和主题； 3)、判断当前获取的信息是文本信息还是音频，若是文本信息，则先将文本信息转换为音频信息，再将该音频信息播放给用户；若是音频信息，则直接播放给用户； 4)、判断用户是否需要搜索未推送的新信息，若是，则获取用户输入的代表其感兴趣的信息的关键词，将此关键词发送至服务器、由服务器根据关键词进行检索，再执行步骤2。
2：如权利要求1所述的一种网络搜音机的实现方法，其特征在于：步骤4中，用户输入关键词的方式为文本输入和语音输入，若用户输入的关键词是文本信息，则直接将此文本发送至服务器；若用户输入的关键词是音频信息，则先将此音频信息转换为文本信息，将文本信息发送至服务器。
3：如权利要求2所述的一种网络搜音机的实现方法，其特征在于：步骤4中，将音频信息转换为文本信息的步骤包括： 1)建立文本与音频对应的语音模型； (1.1)定期分析网络上的新闻文本，提取当前时间点的新闻热点词组成热点词库； (1.2)设置热点词的最低权重阈值，随着时间的推移调整热点词库中所有热点词的权重，删除权重低于所述的最低权重阈值的热点词； (1.3)使用语音语料库对每个热点词进行语音训练，得到每个热点词对应的特征矢量模型，保存热点词及其对应的特征矢量模型作为语音模型。 2)获取用户输入的音频的特征矢量模型，将用户输入的音频与语音模型比对，识别出与用户音频对应的文本。
4：如权利要求1-3之一所述的一种网络搜音机的实现方法，其特征在于：判断用户是否要切换当前收听的信息，若是，则获取用户选择收听的信息，将该文本信息转换为音频信息，再播放给用户。
5：如权利要求4所述的一种网络搜音机的实现方法，其特征在于：以用户收听过的信息所属的类别及主题、该信息的文本标注、该信息长度和收听的时间作为用户收听兴趣，记录用户收听兴趣并将其发送给服务器。
6：使用如权利要求1所述的一种网络搜音机的实现方法的网络搜音机，其特征在于：包括与能从网络中获取信息资源或由管理员手动输入、且将所有信息分类别、主题标识的服务器进行数据交换、识别来自服务器的文本信息的所属类别、主题的网络通信模块，所述的网络通信模块与能分类别、分主题存储来自服务器的文本信息的存储模块连接；所述的存储模块与一能将文本信息转换为音频信息的语音合成模块连接，所述的语音合成模块与一能将其转换好的音频播发给用户的播放模块连接；所述的网络搜音机还包括允许用户输入代表其兴趣的关键词、以便搜索用户感兴趣的新信息的交互模块，所述的交互模块通过所述的网络通信模块将关键词传输至服务器、由服务器根据关键词进行检索。
7：如权利要求6所述的网络搜音机，其特征在于：所述的输入单元包括手写屏输入、键盘输入和音频输入；所述的交互模块包括能获取用户输入的文本或音频关键词的输入单元，将音频关键词转换为文本的语音识别单元，所述的交互模块通过所述的网络通信模块将文本关键词传输至服务器。所述的语音识别单元中包括解析用户输入的音频所对应的目标特征矢量模型的解析单元，构建文本与音频对应的语音模型的语音单元，和将目标特征矢量模型与语音模型比对、以识别出与用户音频所对应的文本的识别单元，所述的识别单元通过所述的网络通信模块与服务器连接。
8：如权利要求7所述的网络搜音机，其特征在于：所述的语音单元包括提取网络中的新闻热点词、构建热点词库的词库单元，根据时间推移调整词库中的热点词的权重信息、并删除权重低于设定阈值的热点词的管理单元，使用语音语料库对每个热点词进行语音训练以获取每个热点词对应的特征矢量模型、形成语音模型的训练单元。
9：如权利要求6-8之一所述的网络搜音机，其特征在于：所述的网络搜音机还包括能获取用户选择收听的信息的导航模块。
10：如权利要求9所述的网络搜音机，其特征在于：所述的网络搜音机还包括能记录用户收听过的信息所属的类别及主题、该信息的文本标注、该信息长度和收听的时间的反馈模块，所述的反馈模块通过所述的网络通信模块将时间总和发送至服务器。

说明书

一种网络搜音机的实现方法及其专用设备
    【技术领域】

    本发明涉及一种网络信息的推送方法和专用设备，特别是一种网络搜音机的实现方法及其专用设备

    技术背景

    随着Internet的不断发展和日益普及，互联网上的信息量正在以惊人的速度增长。人们面对海量的信息，总是会感到眼花缭乱。虽然人们获取信息的手段多种多样，比如互联网、报刊杂志、电视节目等等，但是仍然有许多群体不能享受信息化带来的便利。尤其是一些社会弱势群体，比如：盲人或者视弱者无法通过视觉途径获取资讯，需要借助读屏软件；老年人不会操作电脑等新型的资讯终端设备；还有其他各种各样的低收入群体买不起价格昂贵的终端设备。

    中国专利第02260990.3号公布了一种网络收音机，包括一壳体，该壳体内设有一电路板，该电路板上所分布的电路与一微处理器相连接，微处理器与以下各元件相连接：可使该网络收音机连接到网络上、并可下载各网络电台的电台网址的数据模组，用以储存各网络电台的网址、以及自各网络电台下载的数字音效，可将网络收音机自网络电台所接受的数字音效转换呈模拟音效的音讯处理模组，用以提供该网络收音机运作时所需的电力的电源供应器，显示所连接的网站的网址的显示界面和输入网址的功能键。工作时，通过数据模组自网络下载各网络电台的电台网址，并将各电台网址储存于数据储存媒体中，在下次使用网络收音机时，只要调出预先储存于数据储存媒体的电台网址，即可连接至该网络电台，收听该电台播放的广播节目。

    这种网络收音机存在以下缺点：1、只能收听网络电台播放的节目，涉猎的信息面狭小。2、网络服务器与网络收音机之间传递的是音频信息，占用的空间大，传输速度慢。3、用户只能被动地收听电台播放的节目，无法自己选择感兴趣的信息，交互性差。

    【发明内容】

    为克服现有技术的涉猎的信息面狭小，信息占用空间大，传输速度慢，与用户的交互性差的缺点，本发明提供了一种涉猎的信息面大，与服务器间信息传递速度快，且用户可自己选择感兴趣的信息来收听的网络搜音机的实现方法及其专用设备。

    一种网络搜音机的实现方法，包括以下步骤：

    1、由服务器从网络中获取信息资源，或由管理员手动将文本或音频信息输入到服务器，服务器将所有信息按其所述类别(如新闻类、博客类、电子书类、音乐类、评书类……)，所述主题(如体育、军事、娱乐……)分别标识；

    2、服务器按照用户收听兴趣主动将信息推送给网络搜音机，网络搜音机接收并识别当前信息所述的类别和主题；

    3、判断当前获取的信息是文本信息还是音频，若是文本信息，则先将文本信息转换为音频信息，再将该音频信息播放给用户；若是音频信息，则直接播放给用户；

    4、判断用户是否需要搜索未推送的新信息，若是，则获取用户输入的代表其感兴趣的信息的关键词，将此关键词发送至服务器、由服务器根据关键词进行检索，再执行步骤2。

    进一步，步骤4中，用户输入关键词的方式为文本输入和语音输入，若用户输入的关键词是文本信息，则直接将此文本发送至服务器；若用户输入的关键词是音频信息，则先将此音频信息转换为文本信息，将文本信息发送至服务器。

    进一步，步骤4中，将音频信息转换为文本信息的步骤包括：

    1)建立文本与音频对应的语音模型；

    (1.1)定期分析网络上的新闻文本，提取当前时间点的新闻热点词组成热点词库；

    (1.2)设置热点词的最低权重阈值，随着时间的推移调整热点词库中所有热点词的权重，删除权重低于所述的最低权重阈值的热点词；

    (1.3)使用语音语料库对每个热点词进行语音训练，得到每个热点词对应的特征矢量模型，保存热点词及其对应的特征矢量模型作为语音模型。

    2)获取用户输入的音频的特征矢量模型，将用户输入的音频与语音模型比对，识别出与用户音频对应的文本。

    进一步，判断用户是否要切换当前收听的信息，若是，则获取用户选择收听地信息，判断该被选择的信息是音频信息还是文本信息，若是音频信息，则直接播放给用户；若文本信息，则先将该文本信息转换为音频信息，再播放给用户；

    进一步，以用户收听过的信息所属的类别及主题、该信息的文本标注、该信息长度和收听该信息的时间长度作为用户收听兴趣，记录用户收听兴趣并将其发送给服务器。

    一种网络搜音机，包括与能从网络中获取信息资源或由管理员手动输入、且将所有信息分类别、主题标识的服务器进行数据交换、识别来自服务器的文本信息的所属类别、主题的网络通信模块，所述的网络通信模块与能分类别、分主题存储来自服务器的文本信息的存储模块连接；所述的存储模块与一能将文本信息转换为音频信息的语音合成模块连接，所述的语音合成模块与一能将其转换好的音频播发给用户的播放模块连接；

    所述的网络搜音机还包括允许用户输入代表其兴趣的关键词、以便搜索用户感兴趣的新信息的交互模块，所述的交互模块通过所述的网络通信模块将关键词传输至服务器、由服务器根据关键词进行检索。

    进一步，所述的交互模块包括能获取用户输入的文本或音频关键词的输入单元，将音频关键词转换为文本的语音识别单元，所述的交互模块通过所述的网络通信模块将文本关键词传输至服务器。

    进一步，所述的语音识别单元中包括解析用户输入的音频所对应的目标特征矢量模型的解析单元，构建文本与音频对应的语音模型的语音单元，和将目标特征矢量模型与语音模型比对、以识别出与用户音频所对应的文本的识别单元，所述的识别单元通过所述的网络通信模块与服务器连接。

    进一步，所述的语音单元包括提取网络中的新闻热点词、构建热点词库的词库单元，根据时间推移调整词库中的热点词的权重信息、并删除权重低于设定阈值的热点词的管理单元，使用语音语料库对每个热点词进行语音训练以获取每个热点词对应的特征矢量模型、形成语音模型的训练单元。

    进一步，所述的输入单元包括手写屏输入、键盘输入和音频输入。

    进一步，所述的网络搜音机还包括能将当前收听信息切换到用户想要收听的信息的导航模块，所述的导航模块与所述的存储模块连接。

    进一步，所述的网络搜音机还包括能记录用户收听过的信息所属的类别及主题、该信息的文本标注、该信息长度和收听该信息的时间长度的反馈模块，所述的反馈模块通过所述的网络通信模块将时间总和发送至服务器。

    本发明的技术构思是：将从互联网中获取的信息资源或由管理员手动输入的信息资源分类别分主题存储，并将其中的文本信息利用成熟的语音合成技术以语音方式播放给用户，用户收听的信息不局限于电台网站，可以扩展到互联网上的所有资源类型，涉猎的信息面广，且网络搜音机与服务器不但可以通过音频形式进行数据交换，还可以文本形式进行数据交换(除音频资源外)，与只能通过音频形式进行数据交换的相比，本发明的传输速度更快，占用的存储空间小，便于管理。

    服务器获取、分析用户收听兴趣，向网络搜音机推送信息的方法已由中国专利第200810121950.4号公开。

    同时，为了使用户不至于淹没在互联网的海量信息中，可以像在计算机上搜索相关信息一般，网络搜音机还为用户提供了良好的交互接口。用户不仅可以选择要收听的内容，还可以通过文字或者语音输入关键词，从服务器获取相关信息。网络搜音机整合语音识别技术将输入的语音数据转化为关键词。之后，网络搜音机将关键词通过网络发送给服务器，服务器根据用户兴趣模型推荐相关的信息资源，并将其发送回网络搜音机。

    网络搜音机将互联网和报刊等媒体平台与传统收音机结合，能够主动以语音方式将符合用户需求的信息推送给他，不仅使普通大众受益，也能够使各类弱势群体获得资讯时代的福利。

    网络搜音机可以基于该方法开发运行在各类智能终端(如支持联网的手机、PDA、IPTV等)的软件；也可以单独以智能终端的形式出现；还可以与传统的收音机集成，替换传统的收音机，如在汽车上使用新型的网络搜音机。

    本发明具有涉猎的信息面广，与服务器间信息交换速度快，且用户可自由选择感兴趣的信息的优点。

    【附图说明】

    图1为本发明的主流程图

    图2为音频转换为文本的流程图

    图3为用户操作示意图

    图4为本发明的结构图

    【具体实施方式】

    实施例一

    参照图1、2、3

    一种网络搜音机的实现方法，包括以下步骤：

    1、由服务器从网络中获取信息资源，或由管理员手动将文本或音频信息输入到服务器，服务器将所有信息按其所述类别(如新闻类、博客类、电子书类、音乐类、评书类……)，所述主题(如体育、军事、娱乐……)分别标识；

    2、以用户收听过的每个主题下的具体信息条目以及收听的时间作为用户收听兴趣，服务器按照用户收听兴趣主动将信息推送给网络搜音机，网络搜音机接收并识别当前信息所述的类别和主题；

    3、判断当前获取的信息是文本信息还是音频，若是文本信息，则先将文本信息转换为音频信息，再将该音频信息播放给用户；若是音频信息，则直接播放给用户；

    4、判断用户是否需要搜索未推送的新信息，若是，则获取用户输入的代表其感兴趣的信息的关键词，将此关键词发送至服务器、由服务器根据关键词进行检索，再执行步骤2。

    步骤4中，用户输入关键词的方式为文本输入和语音输入，若用户输入的关键词是文本信息，则直接将此文本发送至服务器；若用户输入的关键词是音频信息，则先将此音频信息转换为文本信息，将文本信息发送至服务器。

    步骤4中，将音频信息转换为文本信息的步骤包括：

    1)建立文本与音频对应的语音模型；

    (1.1)定期分析网络上的新闻文本，提取当前时间点的新闻热点词组成热点词库；

    (1.2)设置热点词的最低权重阈值，随着时间的推移调整热点词库中所有热点词的权重，删除权重低于所述的最低权重阈值的热点词；

    (1.3)使用语音语料库对每个热点词进行语音训练，得到每个热点词对应的特征矢量模型，保存热点词及其对应的特征矢量模型作为语音模型。

    2)获取用户输入的音频的特征矢量模型，将用户输入的音频与语音模型比对，识别出与用户音频对应的文本。

    判断用户是否要切换当前收听的信息，若是，则获取用户选择收听的信息，判断该被选择的信息是音频信息还是文本信息，若是音频信息，则直接播放给用户；若文本信息，则先将该文本信息转换为音频信息，再播放给用户；

    记录用户收听兴趣并发送给服务器。

    本发明的技术构思是：将从互联网中获取的信息资源或由管理员手动输入的信息资源分类别分主题存储，并将其中的文本信息利用成熟的语音合成技术以语音方式播放给用户，用户收听的信息不局限于电台网站，可以扩展到互联网上的所有资源类型，涉猎的信息面广，且网络搜音机与服务器不但可以通过音频形式进行数据交换，还可以文本形式进行数据交换(除音频资源外)，与只能通过音频形式进行数据交换的相比，本发明的传输速度更快，占用的存储空间小，便于管理。

    同时，为了使用户不至于淹没在互联网的海量信息中，可以像在计算机上搜索相关信息一般，网络搜音机还为用户提供了良好的交互接口。用户不仅可以选择要收听的内容，还可以通过文字或者语音输入关键词，从服务器获取相关信息。网络搜音机整合语音识别技术将输入的语音数据转化为关键词。之后，网络搜音机将关键词通过网络发送给服务器，服务器根据用户兴趣模型推荐相关的信息资源，并将其发送回网络搜音机。

    网络搜音机将互联网和报刊等媒体平台与传统收音机结合，能够主动以语音方式将符合用户需求的信息推送给他，不仅使普通大众受益，也能够使各类弱势群体获得资讯时代的福利。

    网络搜音机可以基于该方法开发运行在各类智能终端(如支持联网的手机、PDA、IPTV等)的软件；也可以单独以智能终端的形式出现；还可以与传统的收音机集成，替换传统的收音机，如在汽车上使用新型的网络搜音机。

    实施例二

    参照图1-4

    一种网络搜音机，包括与能从网络中获取信息资源或由管理员手动输入、且将所有信息分类别、主题标识的服务器进行数据交换、识别来自服务器的文本信息的所属类别、主题的网络通信模块，所述的网络通信模块与能分类别、分主题存储来自服务器的文本信息的存储模块连接；所述的存储模块与一能将文本信息转换为音频信息的语音合成模块连接，所述的语音合成模块与一能将其转换好的音频播发给用户的播放模块连接；

    所述的网络搜音机还包括允许用户输入代表其兴趣的关键词、以便搜索用户感兴趣的新信息的交互模块，所述的交互模块通过所述的网络通信模块将关键词传输至服务器、由服务器根据关键词进行检索。

    所述的交互模块包括能获取用户输入的文本或音频关键词的输入单元，将音频关键词转换为文本的语音识别单元，所述的交互模块将文本关键词传输至服务器。

    所述的语音识别单元中包括解析用户输入的音频所对应的目标特征矢量模型的解析单元，构建文本与音频对应的语音模型的语音单元，和将目标特征矢量模型与语音模型比对、以识别出与用户音频所对应的文本的识别单元，所述的识别单元通过所述的网络通信模块与服务器连接。

    所述的语音单元包括提取网络中的新闻热点词、构建热点词库的词库单元，根据时间推移调整词库中的热点词的权重信息、并删除权重低于设定阈值的热点词的管理单元，使用语音语料库对每个热点词进行语音训练以获取每个热点词对应的特征矢量模型、形成语音模型的训练单元。

    所述的输入单元包括手写屏输入、键盘输入和音频输入。

    所述的网络搜音机还包括能将当前收听信息切换到用户想要收听的信息的导航模块，所述的导航模块与所述的存储模块连接。

    所述的网络搜音机还包括能记录用户收听过的每个主题下的具体信息条目以及收听的时间的反馈模块，所述的反馈模块通过所述的网络通信模块将时间总和发送至服务器。

    本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。