车辆用装置、服务器和信息处理方法.pdf

上传人:柴****2 文档编号:4042695 上传时间:2018-08-12 格式:PDF 页数:27 大小:1.65MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410320576.6

申请日:

2014.07.07

公开号:

CN104516449A

公开日:

2015.04.15

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 1/18申请日:20140707|||公开

IPC分类号:

G06F1/18

主分类号:

G06F1/18

申请人:

歌乐株式会社

发明人:

清水淳史; 段清柱; 关口隆昭; 永井靖; 泽尻晴彦; 山口隆

地址:

日本埼玉县

优先权:

2013-200754 2013.09.27 JP

专利代理机构:

北京尚诚知识产权代理有限公司11322

代理人:

龙淳

PDF下载: PDF下载
内容摘要

本发明提供一种与驾驶者适当地进行声音对话处理的声音对话处理技术。进行与驾驶者的对话处理的车辆用装置,包括:通信部,其与服务器进行通信;输出部,其向驾驶者输出声音信息;输入部,其输入基于驾驶者的发声的信息;和控制部,其对上述通信部、上述输出部和上述输入部进行控制,上述控制部进行如下控制:在上述车辆用装置或上述服务器中产生了开始对话处理的触发信息的情况下,从上述服务器接收表示作为对话处理的起点的第一对话种类的信息、和与上述第一对话种类不同的表示作为对话处理的终点的第二对话种类的信息,并基于接收到的信息执行对话处理。

权利要求书

权利要求书
1.  一种进行与驾驶者的对话处理的车辆用装置,其特征在于,包 括:
通信部,其与服务器进行通信;
输出部,其向驾驶者输出声音信息;
输入部,其输入基于驾驶者的发声的信息;和
控制部,其对所述通信部、所述输出部和所述输入部进行控制,
所述控制部进行如下控制:
在所述车辆用装置或所述服务器中产生了开始对话处理的触发信 息的情况下,从所述服务器接收表示作为对话处理的起点的第一对话 种类的信息、和与所述第一对话种类不同的表示作为对话处理的终点 的第二对话种类的信息,并基于接收到的信息执行对话处理。

2.  如权利要求1所述的车辆用装置,其特征在于:
所述输出部在所述对话处理没有到达所述第二对话种类的情况 下,也能够根据驾驶者的状态的变化来结束所述对话处理。

3.  如权利要求1或2所述的车辆用装置,其特征在于:
所述输出部在所述对话处理结束以前,即使在所述车辆用装置或 所述服务器中产生了新的触发信息的情况下,也不开始基于该新的触 发信息的对话处理。

4.  如权利要求1~3中任一项所述的车辆用装置,其特征在于:
所述通信部根据搭载于所述车辆用装置或所述服务器的应用的种 类,从所述服务器接收不同的表示所述第二对话种类的信息。

5.  如权利要求1~4中任一项所述的车辆用装置,其特征在于:
所述通信部根据有无同乘者,从所述服务器接收不同的表示所述 第二对话种类的信息。

6.  如权利要求1~5中任一项所述的车辆用装置,其特征在于,包 括:
检测部,其检测表示车辆的状况、车辆内的状况、和所述车辆用 装置的操作状况中的至少任一者的环境信息,
所述通信部将所述检测部检测到的环境信息发送至所述服务器。

7.  一种服务器,其能够与进行与驾驶者的对话处理的车辆用装置 进行通信,所述服务器的特征在于,包括:
通信部,其与所述车辆用装置进行通信;和
控制部,其控制所述通信部,
所述控制部进行如下的控制:
在所述车辆用装置或所述服务器中产生了开始对话处理的触发信 息的情况下,将表示作为对话处理的起点的第一对话种类的信息、和 与所述第一对话种类不同的表示作为对话处理的终点的第二对话种类 的信息发送至所述车辆用装置。

8.  如权利要求7所述的服务器,其特征在于:
所述通信部在所述车辆用装置中的所述对话处理没有到达所述第 二对话种类的情况下,也能够根据驾驶者的状态的变化,将用于使所 述对话处理结束的信息发送至所述车辆用装置。

9.  如权利要求7或8所述的服务器,其特征在于:
所述通信部在所述车辆用装置中的所述对话处理结束以前,即使 在所述车辆用装置或所述服务器中产生了新的触发信息的情况下,也 不将基于该新的触发信息的表示所述第一对话种类的信息和表示所述 第二对话种类的信息发送至所述车辆用装置。

10.  如权利要求7~9中任一项所述的服务器,其特征在于:
所述通信部根据搭载于所述车辆用装置或所述服务器的应用的种 类,将不同的表示所述第二对话种类的信息发送至所述车辆用装置。

11.  如权利要求7~10中任一项所述的服务器,其特征在于:
所述通信部根据有无同乘者,将不同的表示所述第二对话种类的 信息发送至所述车辆用装置。

12.  如权利要求7~11中任一项所述的服务器,其特征在于:
所述通信部从所述车辆用装置接收表示车辆的状况、车辆内的状 况、和所述车辆用装置的操作状况中的至少任一者的环境信息,
所述控制部基于所述通信部接收到的环境信息,决定所述第二对 话种类。

13.  一种信息处理方法,其为包括进行与驾驶者的对话处理的车辆 用装置、和能够与该车辆用装置进行通信的服务器的系统的信息处理 方法,所述信息处理方法的特征在于,包括:
检测步骤:用所述车辆用装置的检测部检测表示车辆的状况、车 辆内的状况、和所述车辆用装置的操作状况中的至少任一者的环境信 息;
生成步骤:在所述车辆用装置或所述服务器中产生了开始对话处 理的触发信息的情况下,在所述服务器的生成部生成与该触发信息对 应的表示作为对话处理的起点的第一对话种类的信息、和与所述第一 对话种类不同的与所述环境信息对应的表示作为对话处理的终点的第 二对话种类的信息;和
对话处理步骤:基于所述生成步骤中生成的信息,用所述车辆用 装置的输出部进行与驾驶者的对话处理。

说明书

说明书车辆用装置、服务器和信息处理方法
技术领域
本发明涉及车辆用装置、服务器和信息处理方法。
背景技术
作为本技术领域的背景技术,有日本特开2003-131691号公报(专 利文献1)。该公报中,记载了“在用于进行车辆电部件的控制的声音 对话系统中,利用来自检测车辆各部的状态的传感器的输出使声音识 别装置起动,并且从声音输出装置与传感器输出对应地输出预先决定 的话语,对用户给予声音对话的机会(契机)。由此,无需从用户侧制 造用于声音识别的时机,而能够开始对话。”(参考摘要)。
现有技术文献
专利文献
专利文献1:日本特开2003-131691号公报
发明内容
发明想要解决的技术问题
在上述专利文献1中,声音对话系统侧自发地输出话语时,不能 例如根据驾驶者的状态等,动态地决定、变更话题等。
于是,本发明提供一种与驾驶者适当地进行声音对话处理的声音 对话处理技术。
用于解决问题的技术方案
为了解决上述技术问题,例如采用权利要求书中记载的结构。本 申请包括多种解决上述技术问题的方法,列举其中一例时,其特征在 于:“一种进行与驾驶者的对话处理的车辆用装置,包括:通信部,其 与服务器进行通信;输出部,其向驾驶者输出声音信息;输入部,其 输入基于驾驶者的发声(发话)的信息;和控制部,其对上述通信部、 上述输出部和上述输入部进行控制,上述控制部进行如下控制:在上 述车辆用装置或上述服务器中产生了开始对话处理的触发(trigger)信 息的情况下,从上述服务器接收表示作为对话处理的起点的第一对话 种类的信息、和与上述第一对话种类不同的表示作为对话处理的终点 的第二对话种类的信息,并基于接收到的信息执行对话处理”。
发明效果
根据本发明,能够提供与驾驶者适当地进行声音对话处理的声音 对话处理技术。
上述以外的技术问题、结构和效果通过以下实施方式的说明将显 而易见。
附图说明
图1是对话处理系统的功能结构图。
图2是车辆用装置硬件结构图。
图3是服务器的硬件结构图。
图4是一系列对话的说明图。
图5是事件和环境信息的说明图。
图6是表示对话控制处理部的对话域及其转移方针的选择的图。
图7是表示对话控制处理部的对话域及其转移方针的选择的图。
图8是表示对话控制处理部的对话域及其转移方针的选择的图。
图9是一系列对话的起点和终点的说明图。
图10是对话控制处理部的处理的流程图。
图11是语句存储部的数据结构。
图12是触发优先度定义的数据结构。
图13是车辆用装置的画面。
图14是车辆用装置的画面。
附图标记说明
2……车辆用装置,3……服务器,4……对话控制处理部,5…… 外部服务器事件接收处理部,6……车辆用装置事件接收处理部,7…… 对话域·语句选择处理部,8……发声控制处理部,9……提示方法选 择处理部,10……驾驶者状态估计处理部,11……一系列对话状态管 理处理部,12……环境信息接收处理部,21……服务合同状态存储部, 22……环境信息存储部,23……ID关联存储部,24……语句存储部, 25……触发队列,26……触发优先度定义,31……通信线路,32…… 信道,41……车辆信号输入处理部,42……位置检测处理部,43…… 车辆用装置操作状态检测处理部,44……声音输入处理部,45……车 辆用装置事件·环境信息发送处理部,46……内容接收·提示处理部, 51~55……外部服务服务器,200……CPU,201……基带处理器, 202……输入部,203……主存储器,204……测位传感器,205……陀 螺仪传感器,206……加速度传感器,207……车辆信号接口,209…… 显示部,210……总线,211……无线通信接口,300……CPU,301…… 输入部,302……显示部,303……主存储器,303……主存储器,304…… 辅助存储部,305……网络接口,310……总线。
具体实施方式
以下,用附图说明本发明的实施例。
首先,用图1说明本实施例的与驾驶者的对话处理系统的结构。
图1是本实施例的系统整体的功能结构图。本实施例的对话处理 系统如图1所示包括车辆用装置2和服务器3,车辆用装置2和服务器 3通过通信线路31连接。将车辆用装置2和服务器3连接的通信线路 31例如是3G网络等无线线路。
用图1说明服务器3的软件结构。
服务器3具备对话控制处理部4。对话控制处理部4包括外部服务 器事件接收处理部5、车辆用装置事件接收处理部6、对话域·语句选 择处理部7、发声控制处理部8、提示方法选择处理部9、驾驶者状态 估计处理部10、一系列对话状态管理处理部11、环境信息接收处理部 12、服务合同状态存储部21、环境信息存储部22、ID关联存储部23、 语句存储部24、触发队列(trigger queue)25、触发优先度定义26。
外部服务器事件接收处理部5从外部服务服务器(51~55)接收 后述的外部服务器事件。
车辆用装置事件接收处理部6从车辆用装置2接收后述的车辆用 装置事件。
环境信息接收处理部12从车辆用装置2接收后述的环境信息。
服务合同状态存储部21存储驾驶者签订的后述的外部服务的合同 状态。
环境信息存储部22存储环境信息接收部12接收的环境信息。
ID关联存储部23存储事件ID、触发ID、对话域ID、语句ID的 关联。
此处,对各ID进行说明。对话控制处理部4通过赋予事件、触发、 对话域、语句的每一个以固有的ID,唯一地标识其每一个。
事件指的是后述的外部服务器事件或车辆用装置事件。触发指的 是与单一的事件或多个事件的组合对应地定义的作为用于开始一系列 对话的机会(契机)的信息。
ID关联存储部23构成在输入了事件ID的情况下,能够输出对应 的触发ID的数据结构。
此外,对话域指的是包括驾驶者与对话控制处理部4进行一系列 对话时的具体话题和目的等在内的对话种类,例如用交通信息、新闻、 环保驾驶诊断等的名称来定义。
ID关联存储部23构成在输入了触发ID的情况下,能够输出对应 的对话域ID的数据结构。
语句(sentence)指的是在上述对话域的上下文中,驾驶者与对话 控制处理部4交谈的对话文。
各语句是在某一个对话域中的一系列对话中交谈(互换)的,所 以各语句被包含在某一个对话域中的关系成立。因此,ID关联存储部 23构成在输入了某对话域ID的情况下,能够输出对应的多个或单个语 句ID的数据结构。
此处,为了能够标识作为对话的起点或终点的语句、和不是对话 的起点或终点的语句,对语句ID附加“起点且终点”、“起点”、“终点”、 “既不是起点也不是终点”、“中间报告”等属性而将其存储,并在输 出语句ID时,也能够一同输出该属性。
通过这样附加属性,ID关联存储部23在输入了某对话域ID和属 性信息的情况下,能够从对应的语句ID中仅抽取具有该属性的语句ID 并将其输出。
此外,上述数据结构例如也能够利用将事件ID作为上级,使触发 ID、对话域ID、语句ID依次配置为下级的树(tree)状结构来实现。
返回图1,对话域·语句选择处理部7根据从外部服务器事件接收 处理部5和车辆用装置事件接收处理部6接收的事件,利用服务合同 状态存储部21和环境信息存储部22中存储的信息、以及ID关联存储 部23中存储的信息,生成作为一系列对话的机会的触发,并利用语句 存储部24中存储的信息,抽取作为起点的语句ID和作为终点的语句 ID。然后,将生成的触发和抽取的语句ID发送至发声控制处理部8。 此处,一系列对话指的是由驾驶者发出的语句、和系统侧发出的语句 的多个语句构成的对话。对一系列对话在后文说明。
语句存储部24将在一系列对话中发出的语句与语句ID有对应地 存储。
驾驶者状态估计处理部10利用环境信息存储部22的环境信息估 计后述的驾驶者的状态。
一系列对话状态管理处理部11对驾驶者与系统是否在进行一系列 对话的状态进行管理。
发声控制处理部8根据驾驶者状态估计处理部10所管理的驾驶者 的状态,从接收自对话域·语句选择处理部7的多个语句ID中,进一 步抽取对话中实际使用的语句的语句ID。此外,进行如下控制:按照 预先定义的对应性,向驾驶者发出与基于驾驶者发声的内容的驾驶者 发声数据的语句对应的语句。其中,驾驶者发声数据可以是声音数据, 也可以是将驾驶者发声的声音数据转换为文本数据后的数据。
此外,在接收到触发时,参考一系列对话状态管理处理部11的状 态,判定为处于一系列对话的中途的情况下,1)将接收到的触发临时 保存在触发队列25中,或2)参考触发优先度定义26,在接收到的触 发的优先度为高优先度的情况下,使已经在实施中的一系列对话中断, 开始进行与接收到的触发对应的一系列对话。此外,在发出了与作为 终点的语句ID对应的语句的情况下,在一系列对话存储部11中记录 一系列对话已结束。
提示方法选择处理部9根据驾驶者的状态,选择是向驾驶者发声, 还是提示用于选择对来自系统侧的提问的回答的GUI(Graphical User  Interface:图形用户界面),还是同时进行发声和提示等,并将所选择 的内容发送至车辆用装置2。
此处,内容由系统发声数据和/或选择列表构成。系统发声数据可 以是文本数据,也可以是声音数据。
接着,用图1说明车辆用装置2的软件结构。
车辆用装置2具备车辆信号输入处理部41、位置检测处理部42、 车辆用装置操作状态检测处理部43、声音输入处理部44、车辆用装置 事件·环境信息发送处理部45、内容接收·提示处理部46。
车辆信号输入处理部41从车辆信号接口207参考车辆的CAN (Control Area Network:控制器局域网)的信息。作为CAN的信息, 例如参考后述的环境信息的车辆状况。车辆状况指的是例如基于加速 度或速度较大地发生变化等状况的信息。
位置检测处理部42根据后述的测位传感器204、陀螺仪传感器 205、加速度传感器206检测车辆的位置。
车辆用装置操作状态检测处理部43参考车辆用装置所存储的驾驶 者的车辆用装置操作状态。其中,车辆用装置操作状态是例如后述的 环境信息的车辆用装置状况,例如为基于正在导航操作(正在操作车 辆导航应用的菜单等)等状况的信息。
声音输入处理部44通过后述输入部202的麦克风接收来自驾驶者 的声音输入。此外,参考后述的环境信息的车室内状况。车室内状况 指的是例如基于向麦克风输入了单人或多人的声音等状况的信息。
车辆用装置事件·环境信息发送处理部45基于来自车辆信号输入 处理部41、位置检测处理部42、车辆用装置操作状态检测处理部43 的信息,生成车辆用装置事件和/或环境信息并将其发送至服务器3。
内容接收·提示处理部46从服务器3接收内容,向驾驶者进行提 示。在将内容的系统发声数据再现时,能够使用将文本数据转换为声 音数据进行再现的TTS(Text To Speech:文本到语音)功能。其中, 上述内容的选择列表是用于向驾驶者提示例如“A.是,B.否”、“A.名 词1,B.名词2”等是A还是B的选项的列表。内容接收·提示处理 部46使该选项与GUI的按钮重叠地进行提示,能够促使驾驶者来选择。
图2是车辆用装置的硬件结构图。
车辆用装置2如图2所示,其硬件结构包括:CPU200、基带处理 器201、输入部202、主存储器203、测位传感器204、陀螺仪传感器 205、加速度传感器206、车辆信号接口207、辅助存储部208、显示部 209、无线通信接口211,各结构部通过总线210连接。
CPU(Central Processing Unit:中央处理单元)200是用于对车辆 用装置2的各结构部进行控制,进行用于执行主存储器203上加载的 车辆用装置的应用软件的运算、控制的单元。其中,图1所示的车辆 用装置2的各处理部作为该应用软件而被执行。此外,图1所示的车 辆用装置2的各存储部安装在辅助存储装置208中,由各处理部参考。
输入部202由用户用手指操作车辆用装置2的按钮、开关、键盘、 触控面板、麦克风等构成。
主存储器203是将辅助存储部208中存储的程序加载并临时保管, 或存储工作数据的半导体存储装置。
无线通信接口211是用于将基带处理器201的信号转换为无线波 段的高频信号,或相反地将无线波段的高频信号转换为基带处理器201 的信号的接口装置。车辆用装置2经由无线通信接口201通过互联网 等通信线路31与服务器3进行通信,并进行所需信息的交换或数据的 下载。
测位传感器204是用于测定用地球上的纬度和经度表示的自身位 置的传感器。
陀螺仪传感器205是用于计测搭载有该传感器的车辆的角度或角 速度的传感器。
加速度传感器206是用于计测搭载有该传感器的车辆的加速度的 传感器。
车辆信号接口207是用于连接车辆信号线的接口,其能够引入车 辆行驶状态或内部状态。
辅助存储部208是存储地图数据库等各种数据、和车辆用装置的 应用软件的大容量的存储装置,例如是HDD(Hard Disk Drive:硬盘 驱动器)或SSD(Solid State Drive:固态驱动器)。
输出部209是液晶显示器、有机EL(Electro-Luminescence:场致 发光)显示器、或扬声器等向驾驶者输出图像信息或声音信息的结构 部。
图3是服务器3的硬件结构图。
服务器3如图3所示,其硬件结构包括:CPU300、输入部301、 显示部302、主存储器303、辅助存储部304、网络接口305,各结构 部通过总线310连接。
CPU300对服务器3的各结构部进行控制,将辅助存储部304中存 储的程序和数据加载到主存储器303上并执行。其中,图1所示的服 务器3的各处理部作为该应用软件而被执行。此外,图1所示的服务 器3的各存储部安装在辅助存储装置304中,由各处理部参考。
输入部301是键盘、鼠标等,管理者从这些输入部301输入命令 等。
显示部302是液晶显示器、有机EL(Electro-Luminescence)显示 器等,其显示运转状况的监视或输出结果。
主存储器303是将辅助存储部304中存储的程序加载并临时保管, 或存储工作数据的半导体存储装置。
辅助存储部304是保存数据和程序的HDD等存储装置。在服务器 3的情况下,也存在HDD被连接到阵列上构成磁盘阵列的情况。
网络接口305是与通信线路31连接的接口,用其与外部的装置进 行通信。
另外,图1中说明的对话控制处理部4可以设置在如上所述由服 务器3和车辆用装置2构成的系统上,也可以设置在仅由车辆用装置2 构成的系统。
接着,用图4说明上述一系列对话。
本实施例中,例如,定义与搭载于车辆用装置2或服务器3的应 用即“环保驾驶诊断”、“SNS”(Social Networkin Service:社会性网络 服务)、“日历”等外部服务的种类(401)对应的对话域。其中,一个 对话域可以与外部服务的种类一对一地对应,也可以与多个外部服务 的种类对应。此外,还可以与外部服务的种类以外对应。本实施例中, 首先选择对话域,之后,根据驾驶者的状态等,在该对话域内选择实 际发出的语句,由此构成一系列对话。由此,驾驶者能够应用为了使 用而签订合同或下载的服务并进行对话。此外,驾驶者处于适合对话 的状态的情况下,能够以能够实现对话域的目的的方式推进对话,而 在驾驶者处于不适合对话的状态的情况下,能够决定稍后实现对话域 的目的,而简短地结束对话。
另外,图4中,列举了使对话域与作为外部服务的种类的“环保 驾驶诊断”一对一地对应的例子、和作为与多个外部服务的种类对应 的例子的使对话域从“SNS”转移至“日历”的例子。
对话开始的机会的种类(402)有:来自车辆用装置的事件(车辆 用装置事件)、或来自外部服务服务器的事件(外部服务器事件)。
各个对话域中的一系列对话由如图4的403中记载的驾驶者发出 的语句、和系统发出的语句等多个语句构成。
接着,用图5说明本实施例中的事件和环境信息、以及根据环境 信息来估计的驾驶者的状态。
事件包括外部服务器事件和车辆用装置事件,外部服务器事件指 的是由外部服务器产生的事件,例如在外部服务器上存在最新新闻的 情况、在外部服务器上通过SNS接收了消息的情况、在外部服务器上 的日历中注册了日程的情况、在外部服务器上存在基于新闻、天气等 的信息的情况下产生。
此外,车辆用装置事件指的是由车辆用装置产生的事件,例如在 车辆用装置中搭载的应用的动作状态产生了变化的情况、驾驶者对应 用进行了操作的情况、在车辆用装置中搭载的导航应用中的正在引导 的路线上产生事故等产生了状况变化的情况、车辆用装置朗读“请注 意前方左侧的合流车辆”、“前方约700米处是高速公路入口”等关于 车辆状况的信息的情况下等产生。或者,在ACC/ON的情况、位置信 息为加油站等规定的建筑物附近的情况、解除了驻车制动器(或在解 除后规定时间以内)的情况、乘车后设定了目的地的情况、从车辆用 装置向服务器发送了位置信息的情况下等产生。
另外,环境信息包括车辆状况、车室内状况和车辆用装置状况, 车辆状况是经由车辆信号接口207检测的信息,例如是基于加速度或 速度较大地产生了变化、按下了喇叭、正在停车(为了在停车场中停 车而驾驶时)等状况的信息。
车室内状况指的是基于车室内是否有人、车室内是否有人向麦克 风发声、车室内是否有人们在交谈等的信息,例如根据是否向麦克风 输入了声音、是否向麦克风输入了多人的声音等进行判定。
车辆用装置状况指的是基于驾驶者对车辆用装置的操作状态(正 在操作车辆导航的菜单等)、车辆用装置所搭载的应用对麦克风、扬声 器等声音资源的使用状态、车辆用装置的车辆导航等应用能够检测出 的“正在进入/退出高速公路”、“正在进入/退出高速公路交汇处 (junction)”、“正在倒车(开始/结束)”等的信息。
图1中说明的驾驶者状态估计处理部10根据环境信息估计驾驶者 的状态。
例如在本实施例中,如“非常忙碌”、“有些忙碌”、“不忙碌”那 样,将驾驶者的状态分级而定义,令接收环境信息所包含的信息中的 任一个后的规定时间(例如30秒)为“非常忙碌”状态,令此后直至 进一步经过规定时间为止的期间(例如接收后30秒至120秒后为止) 为“有些忙碌”状态,令除此以外(例如接收后120秒后起)为“不 忙碌”。此外,根据环境信息的种类不同,也可以在接收到该信息的情 况下也不视为“非常忙碌”状态,而是视为“有些忙碌”状态。例如, 可以在接收到图5的#3中记载的车辆状况的情况下视为“非常忙碌” 状态,而在接收到图5的#4中记载的车室内状况的情况下视为“有些 忙碌”状态。由此,能够进行进一步反映了驾驶者的状态的处理。
图6是表示本实施例的对话控制处理部4的对话域及其转移方针 的选择的图,其示出的是这样的例子:作为对话域及其转移方针,根 据事件来选择作为起点的对话域(起点对话域),根据驾驶者的状态和 有无外部服务合同来选择作为终点的对话域(终点对话域)。图6中, 作为外部服务的种类列举了“备忘录”和“日历”。
其中,有无外部服务合同根据驾驶者是否已经实施用于使用“备 忘录”、“日历”等外部服务的合同来判别,例如,如果已经实施了合 同则设为“有”,未实施则设为“无”。此处,“有”、“无”能够根据是 否已经取得用于使用外部服务的用户ID和密码等帐户来判别。
作为事件,图1中说明的对话域·语句选择处理部7接收到作为 外部服务器事件的“SNS有活动通知(近日)”的事件。该情况下,驾 驶者的状态为“非常忙碌”的情况下,将与上述事件对应的触发加入 触发队列25,在此时不发声从而不干扰驾驶者。
另一方面,驾驶者的状态为“有些忙碌”或“不忙碌”的情况下, 根据有无外部服务合同,来选择起点对话域和起点语句(作为起点的 语句)。例如为“有些忙碌”的情况下,仅通过发出单一的语句使一系 列对话结束等,不干扰驾驶者。在“不忙碌”的情况下,用多个语句 进行能够引导驾驶者应用已签订合同的外部服务的功能的对话。
图7是表示本实施例的对话控制处理部4的对话域及其转移方针 的选择的另一例的图,该例子为外部服务的种类为“天气”和“交通 信息”的情况。图7中,作为事件,对话域·语句选择处理部7接收 到作为外部服务器事件的“SNS中有活动通知(本日)”的事件。关于 “天气”、“交通信息”的对话域的语句分别为用下划线表示的地方。
图8是表示本实施例的对话控制处理部4的对话域及其转移方针 的选择的另一例的图,该例子为外部服务的种类为具有公共模式和私 有模式的“SNS”和“日历”的情况。图8中,作为事件,对话域·语 句选择部7接收到作为外部服务器事件的“SNS中有活动通知(近日)” 的事件。另外,公共模式指的是使用外部服务的本人在本人和本人以 外双方都能够参考信息的前提下进行信息注册或信息参考的模式。另 一方面,私有模式指的是在只有使用外部服务的本人能够参考信息的 前提下进行信息注册或信息参考的模式。本实施例中,“SNS(公共模 式)”、“SNS(私有模式)”、“日历(公共模式)”、“日历(私有模式)” 等分别构成对话域。
此处,图8中,“有无同乘者”根据对话域·语句选择处理部7从 车辆信号输入处理部41取得的座椅传感器的信息、或从声音输入处理 部44取得的是否向麦克风输入了多人的声音等环境信息来判断。
同乘者为“有”的情况下,仅将SNS(公共)中处理的信息(此 处用●●图示)作为话题,仅参考、显示、注册日历(公共)中处理 的信息。
另一方面,同乘者为“无”的情况下,将SNS(私有)中处理的 信息(此处用○○图示)也作为话题,也参考、显示、注册日历(私 有)中处理的信息。
图9是本实施例的一系列对话的起点和终点的说明图。
对话域·语句选择处理部7选择起点语句和终点语句。语句也可 以选择多个候选。此外,也可以有起点且终点(既是起点也是终点) 的语句。
发声控制处理部8通过发出起点语句进入一系列对话的中途状态。 此外,通过发出终点语句中的任一个来判定为一系列对话已结束。
图10是本实施例的发声控制处理部8的处理的流程图。
发声控制处理部8发出起点语句(S601)。
接着,发出与驾驶者发出的语句相应的语句(S602)。
接着,在发声控制处理部8发出终点语句的情况下(S603:Yes), 结束一系列对话。
另一方面,发声控制处理部8还未发出终点语句的情况下(S603: No),检查驾驶者的状态是否为“有些忙碌”(S604)。在“有些忙碌” 状态的情况下(S604:Yes),发出“本打算请您在日历中注册日程的, 但暂时先中断这个话题了。”等暗示意在引导至终点对话域的中间报告 的语句,从系统侧强制结束一系列对话。此处,也可以不检查是否为 “有些忙碌”,而是改为根据是否反复对话已达到预先定义的上限步骤 数,从系统侧强制结束一系列对话。
此外,作为驾驶者的状态不是“有些忙碌”的情况,有“非常忙 碌”、“不忙碌”的状态,但在“非常忙碌”的情况下起始就不开始起 点语句(S601)的发出,不开始一系列对话。此外,在正在实施S601~ S605时,从其他两个状态转移至“非常忙碌”的状态的情况下,例如, 也可以从服务器3向车辆用装置2发送用于结束一系列对话的信息等, 立刻中断S601~S605的实施而结束(End)。由此,能够减少对驾驶者 的负担。
在驾驶者的状态不是“有些忙碌”的情况(S604:No)、即“不忙 碌”的情况下,继续发出语句,继续一系列对话(S602)。
这样,在一系列对话开始后驾驶者的状态变化为“有些忙碌”的 状态的情况、或在对话难以到达终点而不能将驾驶者引导至作为目的 的外部服务功能的情况下,也能够不浪费此前的对话地结束一系列对 话。
图11是图1中说明的语句存储部24的数据结构。使各语句与语 句ID对应地存储。
对话域·语句选择处理部7如上所述,根据语句存储部24中存储 的信息,抽取作为起点的语句ID、作为终点的语句ID、作为起点且终 点的语句ID。
接着,发声控制部处理部8如上所述,将对话域·语句选择处理 部7抽取的语句ID临时存储。
然后,发声控制处理部8在进行按照预先定义的对应性向驾驶者 发出与驾驶者发出的语句对应的语句的控制时,参考语句存储部24的 语句并且参考语句ID。然后,检查该语句ID是否对应于上述临时存储 的作为起点的语句ID、或作为终点的语句ID、作为起点且终点的语句 ID。
然后,发声控制处理部8在要发出的语句对应于作为起点的语句 ID的情况下,将处于一系列对话的中途的信息注册到一系列对话状态 管理处理部11。另一方面,在对应于作为终点的语句ID或作为起点且 终点的语句ID的情况下,将不是一系列对话的中途的信息注册到一系 列对话状态管理处理部11。此外,在既不是起点也不是终点的语句ID 的情况下,不变更一系列对话状态管理处理部11中管理的状态。
图12是图1中说明的触发优先度定义26的数据结构。
在触发优先度定义26中,用数值记载与各个事件对应的触发及其 优先度。
此处,触发也可以由多个事件的组合(例如,“ACC/ON”和“位 置信息为加油站附近”的组合等)生成。
关于优先度,例如设0~99为优先度“高”,使与优先度“高”的 触发对应的一系列对话即使在其他一系列对话的中途也允许插入。此 外例如设100~199为优先度“中”,与优先度“中”的触发对应的一 系列对话,在其他一系列对话的中途的情况下,将该触发临时保存在 图1中说明的触发队列25中。此外例如设200~299为优先度“低”, 与优先度“低”的触发对应的一系列对话,在其他一系列对话的中途 的情况下,不将触发临时保存在触发队列25中而是将其放弃。
其中,优先度的数值由系统运营者等事先设定即可。此外,也能 够对触发队列25中临时保存的触发赋予规定的有效期限(例如480 秒),在有效期限届满的情况下将该触发放弃。
此处,作为另一处理的一例,用图13说明根据驾驶者的意向决定 向一系列对话的插入可否的流程。
对话控制处理部4在检测到在一系列对话中产生了与事件对应的 触发的情况下,将该触发保存在触发队列25中,向车辆用装置2的内 容接收·提示处理部46发送1)与该触发对应的对话域或发声内容的 摘要、2)触发产生时刻,3)用于对话控制处理部4唯一地标识触发 的触发标识ID。
内容接收·提示处理部46接收到信息时,用通知音等通知驾驶者, 并且将接收到的上述1)2)的信息与操作按钮(703)(例如促使“放 弃”或“开始”的按钮)一同在车辆用装置画面(701)上提示(702)。
驾驶者想要中断正在实施的一系列对话而开始提示的对话的情况 下,按下“开始”按钮。内容接收·提示处理部46在按下了按钮时, 与触发标识ID一起发送至对话控制处理部4。
对话控制处理部4在接收到信息时,如上所述通过参考ID关联存 储部23和语句存储部24来选择与触发标识ID对应的语句,并向内容 接收·提示处理部46发送。这样,能够重新开始驾驶者选择的一系列 对话。
此外,驾驶者对提示的对话没有兴趣的情况下,按下“放弃”按 钮。此外,也能够通过进行对话控制处理部4与内容接收·提示处理 部46的信息传输,有意地放弃所选择的一系列对话。
另外,对话控制处理部4,根据驾驶者按下“开始”按钮,检测出 驾驶者认为所选择的对话域的一系列对话比正在实施的对话域的一系 列对话更为优先。对话控制处理部4例如通过检测出规定次数的该现 象,记录某一对话域相对于某一对话域更为优先,无需等待驾驶者按 下“开始”按钮,也能够向正在实施的一系列对话插入新的一系列对 话。
这种情况下,也可以向驾驶者提示如图14所示的消息(704),在 事先得到驾驶者的同意后使新的一系列对话自动插入。例如,驾驶者 在关于SNS(活动)的一系列对话中较多地按下交通信息的“开始” 按钮的情况下等,提示消息(704)这样的用于得到同意的文章。
此外,已转移至新的一系列对话的情况下,也可以如图13所示, 显示中断的话题已被临时保存的消息(705)。由此,能够进一步提高 对于驾驶者的便利性。
另外,对话控制处理部4例如在检测出规定次数的“放弃”按钮 的按下的情况下,记录在正在实施的对话域的一系列对话中放弃了所 选择的对话域的一系列对话,无需等待驾驶者按下“放弃”按钮,也 能够自动放弃新的一系列对话。
此外,也可以通过设定规定的有效期限(例如180秒),仅在有效 期限内进行提示(7702)。
另外,作为本实施例中的提示方法选择处理部9的GUI的例子, 有这样的按钮等,该按钮是在例如有来自SNS的活动通知的情况下, 记载有“写入备忘录”、“注册到日历中”等回答的按钮。该GUI的例 子例如与“是否写入备忘录?还是注册到日历中?”等来自系统侧的 发声对应。提示方法选择处理部9例如在驾驶者的状态为“有些忙碌” 的情况下,仅进行来自系统侧的发声,在“不忙碌”的情况下,以能 够实施来自系统侧的发声和GUI显示双方的方式,向车辆用装置2发 送内容。
根据以上说明的本实施例,在声音对话处理技术中,将以发送源 不同的多个事件为契机的自发的发声作为起点进行“一系列对话”的 情况下,能够选择符合驾驶者的状态和服务合同状态的对话域及其转 移方针。此外,能够抑制向对话的插入,并且保存发声的机会,看准 适当的时机进行发声。
此外,本发明不限定于上述实施例,包括各种变形例。例如,上 述实施例是为了易于理解地说明本发明而详细说明的,并不限定于必 须具备所说明的所有结构。此外,能够将某个实施例的结构的一部分 置换为其他实施例的结构,另外也能够在某个实施例的结构上添加其 他实施例的结构。此外,对于各实施例的结构的一部分,能够追加、 删除、置换其他结构。
此外,控制线和信息线示出了认为说明上必要的部分,并不一定 示出了产品上所有的控制线和信息线。实际上也可以认为几乎所有结 构都相互连接。
此外,以上的实施例中,说明了服务器具备对话控制处理部4的 例子,但也可以在车辆用装置2中进行与对话控制处理部4同样的处 理。

车辆用装置、服务器和信息处理方法.pdf_第1页
第1页 / 共27页
车辆用装置、服务器和信息处理方法.pdf_第2页
第2页 / 共27页
车辆用装置、服务器和信息处理方法.pdf_第3页
第3页 / 共27页
点击查看更多>>
资源描述

《车辆用装置、服务器和信息处理方法.pdf》由会员分享,可在线阅读,更多相关《车辆用装置、服务器和信息处理方法.pdf(27页珍藏版)》请在专利查询网上搜索。

本发明提供一种与驾驶者适当地进行声音对话处理的声音对话处理技术。进行与驾驶者的对话处理的车辆用装置,包括:通信部,其与服务器进行通信;输出部,其向驾驶者输出声音信息;输入部,其输入基于驾驶者的发声的信息;和控制部,其对上述通信部、上述输出部和上述输入部进行控制,上述控制部进行如下控制:在上述车辆用装置或上述服务器中产生了开始对话处理的触发信息的情况下,从上述服务器接收表示作为对话处理的起点的第一对。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1