信息处理装置、信息处理方法和程序.pdf

上传人:54 文档编号:65579 上传时间:2018-01-22 格式:PDF 页数:29 大小:4.93MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380006634.1

申请日:

2013.01.25

公开号:

CN104081444A

公开日:

2014.10.01

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G09B 5/06申请公布日:20141001|||公开

IPC分类号:

G09B5/06; G09B19/04; G09B19/06

主分类号:

G09B5/06

申请人:

索尼公司

发明人:

本间文规; 奥村泰史; 宫下健; 梨子田辰志

地址:

日本东京

优先权:

2012.02.03 JP 2012-021840

专利代理机构:

中国国际贸易促进委员会专利商标事务所 11038

代理人:

郑宗玉

PDF下载: PDF下载
内容摘要

一种信息处理系统,读取输出装置再现的内容的当前回放时间;控制显示器以显示与输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取对应于内容的属性的特征信息;以及控制显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。

权利要求书

1.  一种信息处理系统,包括:
电路,所述电路被配置成:
读取输出装置再现的内容的当前回放时间;
控制显示器以显示与所述输出装置再现的内容对应的字幕信息;
基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及
控制所述显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。

2.
  根据权利要求1所述的信息处理系统,其中所述输出装置再现的内容是音频内容,并且所述字幕信息对应于所述音频内容。

3.
  根据权利要求2所述的信息处理系统,其中所述特征信息对应于所述音频内容的音调。

4.
  根据权利要求2所述的信息处理系统,其中所述特征信息对应于所述音频内容的节奏。

5.
  根据权利要求2所述的信息处理系统,其中所述特征信息对应于所述音频内容的强度。

6.
  根据权利要求1所述的信息处理系统,其中所述电路控制所述显示器以在显示的所述字幕信息上叠加可视效果作为所述预定效果。

7.
  根据权利要求1所述的信息处理系统,其中所述预定效果是 与内容的属性对应的波形。

8.
  根据权利要求7所述的信息处理系统,其中所述电路被配置成控制所述显示器以将所述波形叠加在显示的字幕信息上。

9.
  根据权利要求1所述的信息处理系统,其中所述电路被配置成控制所述显示器以显示与所述字幕信息对应的光标,并且控制所述显示器以基于读取的所述音频内容的当前回放时间移动所述光标。

10.
  根据权利要求9所述的信息处理系统,其中所述电路被配置成控制所述显示器以基于获取的特征信息向所述光标应用所述预定效果。

11.
  根据权利要求9所述的信息处理系统,其中所述电路被配置成控制所述显示器以基于获取的所述特征信息向所述光标的前边缘应用所述预定效果。

12.
  根据权利要求10所述的信息处理系统,其中
获取的所述特征信息对应于内容的音调或强度,并且
所述电路控制所述显示器以基于获取的所述特征信息,与内容的音调或强度相对应地改变所述光标的大小。

13.
  根据权利要求12所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度增大时增大所述光标的大小。

14.
  根据权利要求12所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度减小时减小所述光标的大小。

15.
  根据权利要求1所述的信息处理系统,其中所述输出装置再现的内容包括视频数据,并且所述字幕信息对应于所述视频数据。

16.
  根据权利要求1所述的信息处理系统,其中所述电路被配置成向显示的所述字幕信息中包括的文本字符应用所述预定效果。

17.
  根据权利要求16所述的信息处理系统,其中应用于所述文本字符的所述预定效果包括改变所述文本字符的大小、形状、颜色和显示角度中的至少一个。

18.
  根据权利要求17所述的信息处理系统,其中所述电路被配置成基于读取的内容的当前回放时间向所述文本字符的前导字符应用所述预定效果。

19.
  一种通过信息处理系统执行的方法,所述方法包括:
读取输出装置再现的内容的当前回放时间;
控制显示器以显示与所述输出装置再现的内容对应的字幕信息;
基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及
控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。

20.
  一种包括计算机程序指令的非暂态计算机可读介质,所述计算机程序指令当由电路执行时使得所述电路执行包括以下的处理:
读取输出装置再现的内容的当前回放时间;
控制显示器以显示与所述输出装置再现的内容对应的字幕信息;
基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及
控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。

说明书

信息处理装置、信息处理方法和程序
技术领域
本公开内容涉及信息处理装置、信息处理方法和程序。
背景技术
当学习除了某人母语之外的语言时,存在通过听音频学习发音的情况。此时,如果显示对应于音频的文本,用户就容易掌握音频的内容。例如,专利文献1公开了一种回放装置,该回放装置可以基于添加到视频的字幕搜索视频中的回放位置。该回放装置可以基于字幕反复地执行回放。因此,可以反复地回放难以听懂的部分,从而增强学习效果。
引用列表
专利文献
PTL1:日本专利申请公开No.JP-A-09-115224
发明内容
技术问题
然而,即使用户能够通过查看显示的文本掌握音频的内容,用户也无法掌握音频的特征。为了解决这个问题,本公开内容提供了新颖的、改进的并且能够显示音频的特征的信息处理装置、信息处理方法和程序。
问题的解决方案
根据第一示例性实施例,本公开内容涉及一种信息处理系统,包括:电路,所述电路被配置成:读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信 息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。
根据另一个示例性实施例,本公开内容涉及一种通过信息处理系统执行的方法,所述方法包括:读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。
根据另一个示例性实施例,本公开内容涉及一种包括计算机程序指令的非暂态计算机可读介质,所述计算机程序指令当由电路执行时使得所述电路执行包括以下的处理:读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。
本发明的有益效果
如上所述,根据本公开内容,可以显示音频的特征。
附图说明
[图1]图1是示出表明由根据本公开内容的实施例的语言学习装置显示的音频特征的动画的概要的说明图。
[图2]图2是示出表明由根据实施例的语言学习装置显示的音频特征的动画的概要的说明图。
[图3]图3是示出根据实施例的语言学习装置的硬件配置示例的框图。
[图4]图4是示出根据实施例的语言学习装置的功能配置示例的框图。
[图5]图5是示出由根据实施例的语言学习装置显示的显示画面的第一示例的示图。
[图6]图6是示出由根据实施例的语言学习装置显示的显示画面的第二示例的示图。
[图7]图7是示出由根据实施例的语言学习装置使用的音频特征信息的说明图。
[图8]图8是示出包括由根据实施例的语言学习装置使用的音频特征信息的字幕信息的示例的说明图。
[图9]图9是示出由根据实施例的语言学习装置使用音频特征信息执行回放控制的示例的说明图。
[图10]图10是示出根据实施例的语言学习装置基于音频特征显示的动画的示例的说明图。
[图11]图11是示出根据实施例的语言学习装置基于音频特征显示的另一个动画的示例的说明图。
[图12]图12是示出根据实施例的语言学习装置基于音频特征显示的另一个动画的示例的说明图。
[图13]图13是示出根据实施例的语言学习装置的第一操作示例的流程图。
[图14]图14是示出根据实施例的语言学习装置的第二操作示例的流程图。
[图15]图15是示出日语音频特征和英语音频特征的说明图。
[图16]图16是示出音频波形信息叠加并显示在文本上的示例的说明图。
[图17]图17是示出根据音频长度映射文本的显示示例的说明图。
具体实施方式
下文中,将参照附图详细描述本公开内容的优选实施例。注意,在本说明书和附图中,用相同的参考标号表示具有基本上相同功能和 结构的结构元件,并且省略对这些结构元件的重复说明。
注意,将按以下次序进行说明。
1.概要
2.硬件配置示例
3.功能配置示例
4.显示画面示例
5.音频特征信息示例
6.动画示例
7.操作示例
8.总结
1.概要
首先,将参照图1、图2和图15至图17描述根据本公开内容的实施例的语言学习装置的概要。图1是示出表明由根据本公开内容的实施例的语言学习装置显示的音频特征的动画的概要的说明图。图2是示出表明由根据实施例的语言学习装置显示的音频特征的动画的概要的说明图。图15是示出日语音频特征和英语音频特征的说明图。图16是示出音频波形信息叠加并显示在文本上的示例的说明图。图17是示出根据音频长度映射文本的显示示例的说明图。
根据本公开内容的实施例的提供语言学习服务的语言学习装置100可以使用动画示出音频特征。这里,将在假设日本人正在学习英语的情况下进行说明。然而,本技术不限于这个示例,并且可以应用于学习除了某人母语之外的语言的学习服务。
当比较日语语言和英语语言时,存在这样的特征:这两种语言之间的音频的音调(声高)不同。日语语言是由眼睛看到的字符和由耳朵听到的字符的发音之间存在相对高度一致性的语言,而英语语言是在许多情况下由眼睛看到的字符不同于由耳朵听到的字符的发音的语言。例如,图15示出日语中的“kinkyu-jishin-sokuhou”(意思是“早期地震预警”)的音频特征和英语中的“I’ll inform you about our  business hours(我会告诉你我们的营业时间)”的音频特征。在日语中,文本中的间隔基本上匹配音调中的间隔,并且音调形成每个单词的小峰。与此相比,在英语中,文本中的间隔不匹配音调中的间隔,并且音调形成整句话的大峰。由于存在这种差异,因此母语是日语的人难以听懂英语。
在这种情况下,提出了将对应于英语文本的音频特征与英语文本一起显示。这里,音频特征例如可以包括音频的音调、声音长度(节奏)和声音强度(强度)中的至少一个。
作为显示音频特征的方法,例如可料想到音频波形信息叠加并显示在文本上,如图16中所示。然而,在音频波形信息被叠加在文本上的情况下,为了确保显示波形的高度,文本行之间的间隔被加宽。由于这个原因,当波形被叠加并显示在文本上时设置的高度h2大于当不显示波形时设置的高度h1。
另外,在声音长度和字符长度不匹配的语言(例如,英语)中,如果根据声音长度映射文本,则文本的布局如图17中所示被打破并且难以阅读文本。另外,尽管在附图中未示出,但如果根据文本的长度输出音频,则回放速度自然不是恒定的,并且难以听懂输出音频。
以此方式,如果旨在通过静态显示来示出音频特征,则会出现各种不方便。为了解决这个问题,本公开内容提出了使用动画来显示音频特征。例如,图1和图2各自示出表明音频特征的动画的示例。
例如,如图1中所示,光标显示可被用作添加到语句“Then he’ll ask,“Can you make more?”(然后他问“你能做更多吗?”)”的动画。以与当光标位置与所谓的卡拉OK中当前正在唱的歌词的片段同步地移动时类似的方式,光标根据音频的输出位置移动。图1的上部示出当输出音频片段“he(他)”时的光标状态。图1的中部示出当输出音频片段“ask(问)”时的光标状态。图1的下部示出当输出音频片段“you(你)”时的光标状态。以此方式,使音频输出位置和光标位置同步。因此,用光标位置指示音频的节奏。
另外,这里显示的光标的形式可以改变,如图2中所示。例如, 光标前端部分的大小可根据音频音调或强度而改变。图2中的图案1示出在语句的结尾处音频音调或强度下降的情况的动画示例。在音频音调或强度下降时,光标前端部分的大小减小。图2中的图案2示出在语句的结尾处音频音调或强度上升的情况的动画示例。在音频音调或强度上升时,光标前端部分的大小增大。图2中的图案3示出在语句的中间音频音调或强度上升然后返回到初始水平的情况的动画示例。在音频音调或强度上升时,光标前端部分的大小增大,然后返回到初始光标大小。
如上所述,与针对整个文本静态地示出输出视频的特征的情况相比,根据使用动画(以动画对象形式的改变)示出“audio that is being output(正在输出的音频)”的特征的本技术,可以在有限的空间中向用户有效呈现音频特征。以下,将描述实现这种类型的语言学习服务的语言学习装置100。
2.硬件配置示例
首先,将参照图3描述根据本公开内容的实施例的语言学习装置100的硬件配置示例。图3是示出根据实施例的语言学习装置100的硬件配置示例的框图。
例如,语言学习装置100是可以通过执行应用来提供根据本公开内容的实施例的语言学习服务的信息处理装置的示例。语言学习装置100例如可以是诸如移动电话、个人计算机(PC)、视频处理装置、游戏机、家用电器、音乐回放装置等信息处理装置。
(语言学习装置100)
语言学习装置100主要包括例如中央处理单元(CPU)105、随机存取存储器(RAM)110、非易失性存储器115、显示装置120、触摸传感器125和音频输出装置130。
CPU 105用作计算装置和控制装置。CPU 105根据各种程序来控制语言学习装置100的整体操作。另外,CPU 105可以是微处理器。RAM 110暂时存储由CPU 105执行的程序和当执行程序时适当地变化的参数等。非易失性存储器115存储由CPU 105使用的程序 和操作参数。
显示装置120是显示部分的示例,并且例如可以是液晶显示(LCD)装置、有机电致发光显示(OLED)装置、阴极射线管(CRT)显示装置等。
触摸传感器125是操作部分的示例,并且被设置成使得将触摸传感器125叠加在显示装置120上。触摸传感器125是位置输入装置,并且可以基于显示画面上的位置信息接收操作。
音频输出装置130是输出音频的扬声器。音频输出装置130可以输出例如包括在被回放的内容中的音频。另外,音频输出装置130还可以输出合成语音,合成语音是根据包括在被回放的内容中的文本数据产生的。
这里示出的语言学习装置100的硬件配置只是示例,并且本技术不限于这个示例。在实现语言学习服务的硬件配置中,可以根据在执行本实施例时的技术水平适当地改变要使用的配置。
3.功能配置示例
接着,将参照图4描述语言学习装置100的功能配置示例。图4是示出根据实施例的语言学习装置100的功能配置示例的框图。
语言学习装置100主要包括回放控制部分150、操作部分155、音频输出控制部分160、音频输出部分165、显示控制部分170、显示部分175和音频特征信息存储部分180。
回放控制部分150具有控制内容的回放的功能。回放控制部分150可以基于从操作部分155供应的操作信息进行操作。回放控制部分150可以基于操作信息选择要回放的内容。另外,回放控制部分150可以通过控制音频输出控制部分160和显示控制部分170来控制内容的回放。
操作部分155是用户在其上执行所需操作的输入装置,并且例如可以是触摸传感器125。操作部分155可以基于由用户执行的操作生成操作信息,并且可以与回放控制部分150共享操作信息。例如,当用户执行选择要回放的内容的操作、选择内容中的回放位置的操作、 以及设置与回放有关的各种参数(例如,回放音量和回放速度)的操作时,操作部分155可以根据这些操作生成操作信息。
音频输出控制部分160可以根据回放控制部分150的控制来控制由音频输出部分165输出的音频。音频输出控制部分160控制与由回放控制部分150指定的内容中的指定回放片段对应的音频的输出。当音频数据包括在指定内容中时,音频输出控制部分160可以控制音频数据的输出。另外,音频输出控制部分160可以根据指定内容的文本产生合成语音,并且可以控制所产生的合成语音的输出。
音频输出部分165具有根据音频输出控制部分160的控制输出音频的功能。音频输出部分165可以是音频输出装置130。注意,这里,尽管语言学习装置100包括音频输出装置130,但本技术不限于这个示例。例如,音频输出部分165可以是向外部音频输出装置输出音频的接口。
显示控制部分170可以根据回放控制部分150的控制来控制由显示部分175输出的显示画面的内容。显示控制部分170可以控制显示部分175的显示画面的内容,使得由回放控制部分150指定的内容中的指定回放片段被显示。显示控制部分170可以基于由音频输出部分165正在输出的音频的特征,控制形式改变的动画对象的显示。这里,动画对象例如可以是叠加并显示在用于指示音频内容的文本上的对象。另外,动画对象例如可以是包括在指示音频内容的文本中的字符。显示控制部分170可以通过改变动画对象的形式使用动画示出音频的特征。这里,动画对象的形式例如可以是形状、大小、颜色、显示角度等。
显示部分175具有根据显示控制部分170的控制向用户提供显示画面的功能。显示部分175可以是显示装置120。尽管这里语言学习装置100包括显示装置120,但本技术不限于这个示例。例如,显示部分175可以是使得外部显示装置输出显示画面的接口。
音频特征信息存储部分180是具有存储音频特征信息的功能的存储部分的示例。音频特征信息存储部分180例如可以是非易失性存储 器115。尽管随后将描述音频特征信息的细节,但音频特征信息是指示音频特征的信息,并且例如可以包括识别内容中音频具有特定特征的点的信息。音频特征点例如可以是音频的音调、节奏或强度改变的点。
以上,描述了根据本实施例的语言学习装置100的功能示例。上述结构元件中的每个可以通过图3中示出的硬件配置来实现,或者可以通过使用通用的构件和电路来实现。另外,上述结构元件中的每个可以通过专用于每个结构元件的功能的硬件来形成。另外,可以通过算术装置(例如,中央处理单元(CPU))从记录介质(例如,只读存储器(ROM)、随机存取存储器(RAM)等)读取控制程序以及解释并执行控制程序来执行每个结构元件的功能。存储介质存储控制程序,在控制程序中描述了实现这些功能的处理过程。因此,可以根据在执行本实施例时的技术水平适当改变要使用的配置。
注意,可以在个人计算机等中创建并且安装上述的实现根据本实施例的语言学习装置100的每个功能的计算机程序。另外,还可以提供其中存储了这种类型的计算机程序的计算机可读记录介质。记录介质例如是磁盘、光盘、磁光盘、闪存存储器等。另外,在不使用记录介质的情况下,例如可以经由网络分发上述计算机程序。
4.显示画面示例
接着,将参照图5和图6描述由根据本实施例的语言学习装置100显示的显示画面示例。图5示出由根据本实施例的语言学习装置100显示的显示画面的第一示例。图6示出由根据本实施例的语言学习装置100显示的显示画面的第二示例。
这里,将描述使用视频内容(例如,电影)提供语言学习服务的第一显示画面和输出文本内容的所选片段的音频的第二显示画面作为示例。
(第一显示画面)
图5中示出的第一显示画面是使用视频内容提供语言学习服务的显示画面的示例。图5中示出的第一显示画面可以包括内容显示区 11、字幕显示区12、学习记录显示区13、内容列表显示区14、字典显示区15和相关视频显示区16。字幕显示区12可以包括活动标题显示区。在活动标题显示区中显示当前正输出的音频。在活动标题显示区中显示随后将详细描述的动画对象。
(第二显示画面)
图6中示出的第二显示画面是提供输出文本数据的指定片段的音频的语言学习服务的显示画面的示例。尽管这里输出在因特网上打开的HTML内容中的文本的指定片段的音频,但本技术不限于这个示例。例如,本技术可以应用于包括文本数据的全部内容,而不限于HTML内容。
5.音频特征信息示例
接着,将参照图7至图9描述由根据本公开内容的实施例的语言学习装置100使用的音频特征信息的示例。图7是示出由根据实施例的语言学习装置100使用的音频特征信息的说明图。图8是示出包括由根据实施例的语言学习装置100使用的音频特征信息的字幕信息的示例的说明图。图9是示出由根据实施例的语言学习装置100使用音频特征信息执行的回放控制的示例的说明图。
当以回放视频内容(例如,电影)的字幕和音频数据的第一显示画面为例时,例如,音频特征信息具有图7中示出的格式。音频特征信息例如可以包括commandID(命令ID)、识别音频特征点的时间、和在每个音频特征点之间进行区分的分隔符(separator)。commandID的示例包括PU、PD和SP,其中,PU指示音调增大的点,PD指示音调减小的点,而SP指示节奏改变的点。描述示例包括PU24868;SP25058;等。PU24868;指示音调在24868毫秒增大。SP25058;指示节奏在25058毫秒改变。
例如,如图8中所示,这种类型的音频特征信息可被包括为字幕信息的一部分。字幕信息例如可以包括字幕ID、字幕显示时间、音频特征信息和字幕文本。图9示出当通过参照这种类型的字幕信息来控制内容回放时使用的控制方法的示例。
这里,将描述以下情况作为示例:字幕ID 9的字幕显示时间是“00:00:34,448”至“00:00:36,575”,并且四条音频特征信息“SP34348;SP35568;SP35578;SP36188”被添加到对应于该字幕的音频。该字幕的字幕文本是“I wasn’t talking about China anymore,I was talking about me.(我不再谈论中国,我谈论自己。)”。此时,语言学习装置100可以基于该音频特征信息控制光标显示。
该音频特征信息指示节奏在四个时间点(即,34348、35568、35578和36188)改变。因此,可以考虑到这四个时间点分别对应于字幕文本中的“I wasn’t talking about China anymore,”的开始位置和结束位置、以及“I was talking about me.”的开始位置和结束位置。在这种情况下,语言学习装置100可以使用这多条信息来分配光标速度。更具体地讲,对于这个示例,“I wasn’t talking about China anymore,”的开始时间和结束时间可以分别被设置成34348毫秒和35568毫秒,而“I was talking about me.”的开始时间和结束时间可以分别被设置成35578毫秒和36188毫秒。
6.动画示例
接着,将参照图10至图12描述由根据本公开内容的实施例的语言学习装置100显示的动画对象的显示示例。图10是示出根据实施例的语言学习装置100基于音频特征所显示的动画的示例的说明图。图11是示出根据实施例的语言学习装置100基于音频特征所显示的动画的另一个示例的说明图。图12是示出根据实施例的语言学习装置100基于音频特征所显示的动画的另一个示例的说明图。
显示控制部分170例如可以使用图1、图2和图10至图12中示出的动画来显示音频特征。参照图10,示出通过改变字符的形式来指示音频特征的动画对象的示例。这里,可以通过基于音频特征改变显示的字符来实现动画表达。例如,可以放大或缩小字符的大小。可以旋转字符的显示角度。可以使字符的一部分(例如,顶点)变形。这里,显示指示动画图案的多个图形。动画对象的形式可以根据图形而变化。另外,尽管在附图中未示出,但字符的颜色可以根据音频特 征而变化。显示控制部分170可以改变音频特征信息所指示的特征点处的动画对象的形式。
图11示出这样的示例:将通过改变字符大小所表达的动画对象与通过光标移动和光标前端部分的大小改变所表达的图2中示出的动画对象相结合。例如,可以在包括在文本数据中的音频特征点处放大或缩小光标前端部分的大小和字符的大小。
另外,如图12中所示,可以通过字符间隔指示音频特征。如果根据音频节奏显示全部内容,则整个布局如图17中所示地被打破并且难以阅读文本。另外,根据音频节奏,在字符之间必须有间隔。结果,与文本被显示为使得字符等间隔并且紧挨着布置的情况相比,显示区增大。然而,这里,根据音频节奏显示正在针对其输出音频的文本的片段,并且显示除了正在针对其输出音频的片段之外的文本,使得字符紧挨着。另外,此时,因为显示区由于对应于正在输出的音频的文本的放大而变得不够,所以除了正在针对其输出音频的片段之外的文本可以被挤压并显示。因此,使用与当文本被显示为使得字符等间隔并且紧挨着布置时大小相同的显示区,显示正在针对其输出音频的文本的片段,使得字符之间的间隔根据音频节奏被放大。
7.操作示例
接着,将参照图13和图14描述根据本公开内容的实施例的语言学习装置100的操作示例。注意,这里,将分别描述当提供图5中示出的使用视频内容(例如,电影)提供语言学习服务的第一显示画面时的第一操作示例和当提供输出图6中示出的文本内容的所选片段的音频的第二显示画面时的第二操作示例。图13是示出根据实施例的语言学习装置100的第一操作示例的流程图。图14是示出根据实施例的语言学习装置100的第二操作示例的流程图。
(第一操作示例)
首先,将参照图13描述第一操作示例。回放控制部分150判定是否正在回放内容(步骤S100)。换句话讲,重复下述操作,直到内容回放停止为止。
当判定正在回放内容时,回放控制部分150读取当前回放时间(步骤S105)。回放控制部分150执行控制,使得音频输出控制部分160和显示控制部分170分别输出对应于回放时间的音频和显示画面。这里,显示控制部分170从当前回放时间读取接下来要显示的字幕和字幕时间(步骤S110)。另外,显示控制部分170读取音频特征信息(步骤S115)。
然后,基于音频特征信息,显示控制部分170判定在当前回放时间是否存在音频特征点(步骤S120)。当在当前回放时间存在音频特征点时,显示控制部分170使得显示基于音频特征信息的动画(步骤S125)。
利用上述操作,在存在音频特征的片段中,诸如,例如在音调或强度改变了至少预定阈值的片段中,或者在节奏改变的片段中,将动画显示在视频内容(例如,电影)中的字幕上。这里显示的动画是通过动画对象的形式的改变来实现的。动画对象可以是叠加在文本上的光标。可替选地,动画对象可以是文本本身。另外,形式的改变可以是大小、形状、颜色或布置的改变。因此,用户可以可视地掌握音频特征。另外,如果通过动画仅显示“当前正在输出的”音频的特征,则可以有效地使用显示区。
(第二操作示例)
接着,将参照图14描述第二操作示例。回放控制部分150判定是否正在执行应用(步骤S200)。换句话讲,重复下述的操作,直到停止执行应用为止。
当判定正在执行应用时,回放控制部分150判定操作部分155是否检测到对文本的触摸操作(S205)。当检测到对文本的触摸操作时,回放控制部分150识别与被触摸片段的文本对应的音频数据(步骤S210)。回放控制部分150控制音频输出控制部分160输出被识别片段的音频数据,并且控制显示控制部分170显示对应于音频数据的显示画面。这里,音频输出控制部分160开始输出被识别的音频数据(步骤S215)。尽管这里假设音频数据是预先存在的,但本技术 不限于这个示例。例如,当如上所述地识别被触摸片段的文本时,音频输出控制部分160可以根据被识别的文本产生合成语音。
显示控制部分170读取音频特征信息(步骤S220)。另外,显示控制部分170读取当前音频输出时间(步骤S225)。然后,显示控制部分170判定在当前音频输出时间是否存在音频特征点(步骤S230)。当在当前音频输出时间存在音频特征点时,显示控制部分170使得显示基于音频特征信息的动画(步骤S235)。另一方面,当在当前音频输出时间不存在音频特征点时,省略步骤S235中的处理。接着,回放控制部分150判定在结束之前是否输出了被识别的音频数据(步骤S240)。当在结束之前还没有输出音频数据时,处理返回到步骤S225并且重复该处理。另一方面,当在结束之前输出了音频数据时,处理返回到步骤S200并且重复该处理。
8.总结
如上所述,利用根据本公开内容的实施例的语言学习装置100,可以在显示画面上有效地示出音频特征。通过使用动画,与同时示出内容中包括的所有音频特征的情况相比,有效地示出了正在输出的音频的特征。另外,由于只显示正在输出的音频的特征,因此除了对应于正在输出的音频的片段之外的片段可以在有限的显示区中以正常状态显示。因此,还提高了可读性。
以上参照附图详细描述了本公开内容的优选实施例。然而,本公开内容的技术范围不限于上述示例。本领域的技术人员应该理解,根据设计要求和其它因素,可以进行各种修改、组合、子组合和改变,只要其在所附权利要求书或其等同物的范围内即可。
例如,应用本技术的信息处理装置可以应用于具有显示音频特征的显示控制功能的任何装置。以上描述说明了在电影内容的字幕上显示光标的示例和在HTML内容的文本上显示动画的示例。然而,本技术不限于这些示例。根据通过电影内容的字幕上的动画来显示音频特征的实际例子,电影内容可以被用作语言学习的教育工具。另外,根据通过内容的文本上的动画来显示音频特征的实际例子,任何一般 文本可以被用作语言学习的教育工具。注意,尽管以上将具有触摸传感器的平板终端或智能电话描述为硬件的示例,但本技术不限于这种示例。本技术可以应用于所有的信息处理装置。
在本说明书中,流程图中描述的步骤不仅包括以所描述的次序按时序执行的处理,而且包括并行地或单独地执行而非一定按时序执行的处理。另外,即使在按时序处理的步骤中,不用说的是也可以适当地改变次序。
另外,本技术还可以如下地配置。
(1)一种信息处理系统,包括:电路,所述电路被配置成:读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。
(2)根据(1)所述的信息处理系统,其中所述输出装置再现的内容是音频内容,并且所述字幕信息对应于所述音频内容。
(3)根据(2)所述的信息处理系统,其中所述特征信息对应于所述音频内容的音调。
(4)根据(2)所述的信息处理系统,其中所述特征信息对应于所述音频内容的节奏。
(5)根据(2)所述的信息处理系统,其中所述特征信息对应于所述音频内容的强度。
(6)根据(1)至(5)中的任一项所述的信息处理系统,其中所述电路控制所述显示器以在显示的所述字幕信息上叠加可视效果作为所述预定效果。
(7)根据(1)至(6)中的任一项所述的信息处理系统,其中所述预定效果是与内容的属性对应的波形。
(8)根据(7)所述的信息处理系统,其中所述电路被配置成控制所述显示器以将所述波形叠加在显示的字幕信息上。
(9)根据(1)至(8)中的任一项所述的信息处理系统,其中 所述电路被配置成控制所述显示器以显示与所述字幕信息对应的光标,并且控制所述显示器以基于读取的所述音频内容的当前回放时间移动所述光标。
(10)根据(9)所述的信息处理系统,其中所述电路被配置成控制所述显示器以基于获取的特征信息向所述光标应用所述预定效果。
(11)根据(9)和(10)中的任一项所述的信息处理系统,其中所述电路被配置成控制所述显示器以基于获取的特征信息向所述光标应用所述预定效果。
(12)根据(10)和(11)中的任一项所述的信息处理系统,其中获取的所述特征信息对应于内容的音调或强度,并且所述电路控制所述显示器以基于获取的所述特征信息,与内容的音调或强度相对应地改变所述光标的大小。
(13)根据(12)所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度增大时增大所述光标的大小。
(14)根据(12)和(13)中的任一项所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度减小时减小所述光标的大小。
(15)根据(1)至(14)中的任一项所述的信息处理系统,其中所述输出装置再现的内容包括视频数据,并且所述字幕信息对应于所述视频数据。
(16)根据(1)至(15)中的任一项所述的信息处理系统,其中所述电路被配置成向显示的所述字幕信息中包括的文本字符应用所述预定效果。
(17)根据(16)所述的信息处理系统,其中应用于所述文本字符的所述预定效果包括改变所述文本字符的大小、形状、颜色和显示角度中的至少一个。
(18)根据(17)所述的信息处理系统,其中所述电路被配置成 基于读取的内容的当前回放时间向所述文本字符的前导字符应用所述预定效果。
(19)一种通过信息处理系统执行的方法,所述方法包括:读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。
(20)一种信息处理装置,包括:
音频输出控制部分,控制音频的输出;以及
显示控制部分,基于正在输出的音频的特征,控制形式改变的动画对象的显示。
(21)根据(20)所述的信息处理装置,其中
所述显示控制部分使得在正在输出的音频的特征改变的点,改变所述动画对象的大小、形状、颜色或显示角度中的至少一个。
(22)根据(20)或(21)所述的信息处理装置,其中
音频的特征是音频的音调、节奏或强度中的至少一个。
(23)根据(20)至(22)中的任一项所述的信息处理装置,其中所述动画对象叠加并显示在文本上。
(24)根据(23)所述的信息处理装置,其中
叠加并显示在文本上的所述动画对象是光标,所述光标的大小与正在输出的音频的位置同步地改变,以及当在音频的特征改变的点改变形式时,所述光标的前端大小改变。
(25)根据(20)至(24)中的任一项所述的信息处理装置,其中所述动画对象是对应于音频的文本。
(26)根据(25)所述的信息处理装置,其中
所述显示控制部分使得基于正在输出的音频的特征改变文本的字符间隔。
(27)根据(20)至(26)中的任一项所述的信息处理装置,其中对应于音频的文本是视频内容的字幕文本。
(28)一种信息处理方法,包括:
控制音频的输出;以及
控制动画对象的显示,所述动画对象的形式基于正在输出的音频的特征而改变。
(29)一种使得计算机用作信息处理装置的程序,所述信息处理装置包括:
音频输出控制部分,控制音频的输出;以及
显示控制部分,控制动画对象的显示,所述动画对象的形式基于正在输出的音频的特征而改变。
(30)根据(29)所述的程序,其中
所述显示控制部分使得在正在输出的音频的特征改变的点,改变所述动画对象的大小、形状、颜色或显示角度中的至少一个。
(31)根据(29)或(30)所述的程序,其中
音频的特征是音频的音调、节奏或强度中的至少一个。
(32)根据(29)至(31)中的任一项所述的程序,其中
所述动画对象叠加并显示在文本上。
(33)根据(32)所述的程序,其中
叠加并显示在文本上的所述动画对象是光标,所述光标的大小与正在输出的音频的位置同步地改变,并且当在音频的特征改变的点改变形式时,所述光标的前端大小改变。
(34)根据(29)至(33)中的任一项所述的程序,其中
所述动画对象是对应于音频的文本。
(35)根据(34)所述的程序,其中
所述显示控制部分使得基于正在输出的音频的特征改变文本的字符间隔。
(36)根据(29)至(35)中的任一项所述的程序,其中对应于音频的文本是视频内容的字幕文本。
(37)一种包括计算机程序指令的非暂态计算机可读介质,所述计算机程序指令当由电路执行时使得所述电路执行包括以下的处理: 读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。
[参考符号列表]
100 语言学习装置
105 CPU
110 RAM
115 非易失性存储器
120 显示装置
125 触摸传感器
130 音频输出装置
150 回放控制部分
155 操作部分
160 音频输出控制部分
165 音频输出部分
170 显示控制部分
175 显示部分
180 音频特征信息存储部分

信息处理装置、信息处理方法和程序.pdf_第1页
第1页 / 共29页
信息处理装置、信息处理方法和程序.pdf_第2页
第2页 / 共29页
信息处理装置、信息处理方法和程序.pdf_第3页
第3页 / 共29页
点击查看更多>>
资源描述

《信息处理装置、信息处理方法和程序.pdf》由会员分享,可在线阅读,更多相关《信息处理装置、信息处理方法和程序.pdf(29页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104081444A43申请公布日20141001CN104081444A21申请号201380006634122申请日20130125201202184020120203JPG09B5/06200601G09B19/04200601G09B19/0620060171申请人索尼公司地址日本东京72发明人本间文规奥村泰史宫下健梨子田辰志74专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人郑宗玉54发明名称信息处理装置、信息处理方法和程序57摘要一种信息处理系统,读取输出装置再现的内容的当前回放时间;控制显示器以显示与输出装置再现的内容对应的字幕信息;基于读取的内。

2、容的当前回放时间获取对应于内容的属性的特征信息;以及控制显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。30优先权数据85PCT国际申请进入国家阶段日2014072586PCT国际申请的申请数据PCT/JP2013/0003792013012587PCT国际申请的公布数据WO2013/114837EN2013080851INTCL权利要求书2页说明书12页附图14页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书12页附图14页10申请公布号CN104081444ACN104081444A1/2页21一种信息处理系统,包括电路,所述电路被配置成读取输出装置再现。

3、的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。2根据权利要求1所述的信息处理系统,其中所述输出装置再现的内容是音频内容,并且所述字幕信息对应于所述音频内容。3根据权利要求2所述的信息处理系统,其中所述特征信息对应于所述音频内容的音调。4根据权利要求2所述的信息处理系统,其中所述特征信息对应于所述音频内容的节奏。5根据权利要求2所述的信息处理系统,其中所述特征信息对应于所述音频内容的强度。6根据权利要求1所述的信息处理系统,其中所述。

4、电路控制所述显示器以在显示的所述字幕信息上叠加可视效果作为所述预定效果。7根据权利要求1所述的信息处理系统,其中所述预定效果是与内容的属性对应的波形。8根据权利要求7所述的信息处理系统,其中所述电路被配置成控制所述显示器以将所述波形叠加在显示的字幕信息上。9根据权利要求1所述的信息处理系统,其中所述电路被配置成控制所述显示器以显示与所述字幕信息对应的光标,并且控制所述显示器以基于读取的所述音频内容的当前回放时间移动所述光标。10根据权利要求9所述的信息处理系统,其中所述电路被配置成控制所述显示器以基于获取的特征信息向所述光标应用所述预定效果。11根据权利要求9所述的信息处理系统,其中所述电路被。

5、配置成控制所述显示器以基于获取的所述特征信息向所述光标的前边缘应用所述预定效果。12根据权利要求10所述的信息处理系统,其中获取的所述特征信息对应于内容的音调或强度,并且所述电路控制所述显示器以基于获取的所述特征信息,与内容的音调或强度相对应地改变所述光标的大小。13根据权利要求12所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度增大时增大所述光标的大小。14根据权利要求12所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度减小时减小所述光标的大小。15根据权利要求1所述的信息处理系统,其中所述输出装置再现的内容。

6、包括视频数据,并且所述字幕信息对应于所述视频数据。16根据权利要求1所述的信息处理系统,其中所述电路被配置成向显示的所述字幕信息中包括的文本字符应用所述预定效果。权利要求书CN104081444A2/2页317根据权利要求16所述的信息处理系统,其中应用于所述文本字符的所述预定效果包括改变所述文本字符的大小、形状、颜色和显示角度中的至少一个。18根据权利要求17所述的信息处理系统,其中所述电路被配置成基于读取的内容的当前回放时间向所述文本字符的前导字符应用所述预定效果。19一种通过信息处理系统执行的方法,所述方法包括读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容。

7、对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。20一种包括计算机程序指令的非暂态计算机可读介质,所述计算机程序指令当由电路执行时使得所述电路执行包括以下的处理读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。权利要求书CN104081444A1/12页4信息处理装置、信息处理方法和程序技术领域0001本公开内。

8、容涉及信息处理装置、信息处理方法和程序。背景技术0002当学习除了某人母语之外的语言时,存在通过听音频学习发音的情况。此时,如果显示对应于音频的文本,用户就容易掌握音频的内容。例如,专利文献1公开了一种回放装置,该回放装置可以基于添加到视频的字幕搜索视频中的回放位置。该回放装置可以基于字幕反复地执行回放。因此,可以反复地回放难以听懂的部分,从而增强学习效果。0003引用列表0004专利文献0005PTL1日本专利申请公开NOJPA09115224发明内容0006技术问题0007然而,即使用户能够通过查看显示的文本掌握音频的内容,用户也无法掌握音频的特征。为了解决这个问题,本公开内容提供了新颖的。

9、、改进的并且能够显示音频的特征的信息处理装置、信息处理方法和程序。0008问题的解决方案0009根据第一示例性实施例,本公开内容涉及一种信息处理系统,包括电路,所述电路被配置成读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。0010根据另一个示例性实施例,本公开内容涉及一种通过信息处理系统执行的方法,所述方法包括读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内。

10、容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。0011根据另一个示例性实施例,本公开内容涉及一种包括计算机程序指令的非暂态计算机可读介质,所述计算机程序指令当由电路执行时使得所述电路执行包括以下的处理读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。0012本发明的有益效果0013如上所述,根据本公开内容,可以显示音频的特征。说明书CN。

11、104081444A2/12页5附图说明0014图1图1是示出表明由根据本公开内容的实施例的语言学习装置显示的音频特征的动画的概要的说明图。0015图2图2是示出表明由根据实施例的语言学习装置显示的音频特征的动画的概要的说明图。0016图3图3是示出根据实施例的语言学习装置的硬件配置示例的框图。0017图4图4是示出根据实施例的语言学习装置的功能配置示例的框图。0018图5图5是示出由根据实施例的语言学习装置显示的显示画面的第一示例的示图。0019图6图6是示出由根据实施例的语言学习装置显示的显示画面的第二示例的示图。0020图7图7是示出由根据实施例的语言学习装置使用的音频特征信息的说明图。。

12、0021图8图8是示出包括由根据实施例的语言学习装置使用的音频特征信息的字幕信息的示例的说明图。0022图9图9是示出由根据实施例的语言学习装置使用音频特征信息执行回放控制的示例的说明图。0023图10图10是示出根据实施例的语言学习装置基于音频特征显示的动画的示例的说明图。0024图11图11是示出根据实施例的语言学习装置基于音频特征显示的另一个动画的示例的说明图。0025图12图12是示出根据实施例的语言学习装置基于音频特征显示的另一个动画的示例的说明图。0026图13图13是示出根据实施例的语言学习装置的第一操作示例的流程图。0027图14图14是示出根据实施例的语言学习装置的第二操作示。

13、例的流程图。0028图15图15是示出日语音频特征和英语音频特征的说明图。0029图16图16是示出音频波形信息叠加并显示在文本上的示例的说明图。0030图17图17是示出根据音频长度映射文本的显示示例的说明图。具体实施方式0031下文中,将参照附图详细描述本公开内容的优选实施例。注意,在本说明书和附图中,用相同的参考标号表示具有基本上相同功能和结构的结构元件,并且省略对这些结构元件的重复说明。0032注意,将按以下次序进行说明。00331概要00342硬件配置示例00353功能配置示例00364显示画面示例00375音频特征信息示例00386动画示例说明书CN104081444A3/12页6。

14、00397操作示例00408总结00411概要0042首先,将参照图1、图2和图15至图17描述根据本公开内容的实施例的语言学习装置的概要。图1是示出表明由根据本公开内容的实施例的语言学习装置显示的音频特征的动画的概要的说明图。图2是示出表明由根据实施例的语言学习装置显示的音频特征的动画的概要的说明图。图15是示出日语音频特征和英语音频特征的说明图。图16是示出音频波形信息叠加并显示在文本上的示例的说明图。图17是示出根据音频长度映射文本的显示示例的说明图。0043根据本公开内容的实施例的提供语言学习服务的语言学习装置100可以使用动画示出音频特征。这里,将在假设日本人正在学习英语的情况下进行。

15、说明。然而,本技术不限于这个示例,并且可以应用于学习除了某人母语之外的语言的学习服务。0044当比较日语语言和英语语言时,存在这样的特征这两种语言之间的音频的音调声高不同。日语语言是由眼睛看到的字符和由耳朵听到的字符的发音之间存在相对高度一致性的语言,而英语语言是在许多情况下由眼睛看到的字符不同于由耳朵听到的字符的发音的语言。例如,图15示出日语中的“KINKYUJISHINSOKUHOU”意思是“早期地震预警”的音频特征和英语中的“ILLINFORMYOUABOUTOURBUSINESSHOURS我会告诉你我们的营业时间”的音频特征。在日语中,文本中的间隔基本上匹配音调中的间隔,并且音调形成。

16、每个单词的小峰。与此相比,在英语中,文本中的间隔不匹配音调中的间隔,并且音调形成整句话的大峰。由于存在这种差异,因此母语是日语的人难以听懂英语。0045在这种情况下,提出了将对应于英语文本的音频特征与英语文本一起显示。这里,音频特征例如可以包括音频的音调、声音长度节奏和声音强度强度中的至少一个。0046作为显示音频特征的方法,例如可料想到音频波形信息叠加并显示在文本上,如图16中所示。然而,在音频波形信息被叠加在文本上的情况下,为了确保显示波形的高度,文本行之间的间隔被加宽。由于这个原因,当波形被叠加并显示在文本上时设置的高度H2大于当不显示波形时设置的高度H1。0047另外,在声音长度和字符。

17、长度不匹配的语言例如,英语中,如果根据声音长度映射文本,则文本的布局如图17中所示被打破并且难以阅读文本。另外,尽管在附图中未示出,但如果根据文本的长度输出音频,则回放速度自然不是恒定的,并且难以听懂输出音频。0048以此方式,如果旨在通过静态显示来示出音频特征,则会出现各种不方便。为了解决这个问题,本公开内容提出了使用动画来显示音频特征。例如,图1和图2各自示出表明音频特征的动画的示例。0049例如,如图1中所示,光标显示可被用作添加到语句“THENHELLASK,“CANYOUMAKEMORE”然后他问“你能做更多吗”的动画。以与当光标位置与所谓的卡拉OK中当前正在唱的歌词的片段同步地移动。

18、时类似的方式,光标根据音频的输出位置移动。图1的上部示出当输出音频片段“HE他”时的光标状态。图1的中部示出当输出音频片段“ASK问”时的光标状态。图1的下部示出当输出音频片段“YOU你”时的光标状态。以此方式,使音频输出位置和光标位置同步。因此,用光标位置指示音频的节奏。说明书CN104081444A4/12页70050另外,这里显示的光标的形式可以改变,如图2中所示。例如,光标前端部分的大小可根据音频音调或强度而改变。图2中的图案1示出在语句的结尾处音频音调或强度下降的情况的动画示例。在音频音调或强度下降时,光标前端部分的大小减小。图2中的图案2示出在语句的结尾处音频音调或强度上升的情况的。

19、动画示例。在音频音调或强度上升时,光标前端部分的大小增大。图2中的图案3示出在语句的中间音频音调或强度上升然后返回到初始水平的情况的动画示例。在音频音调或强度上升时,光标前端部分的大小增大,然后返回到初始光标大小。0051如上所述,与针对整个文本静态地示出输出视频的特征的情况相比,根据使用动画以动画对象形式的改变示出“AUDIOTHATISBEINGOUTPUT正在输出的音频”的特征的本技术,可以在有限的空间中向用户有效呈现音频特征。以下,将描述实现这种类型的语言学习服务的语言学习装置100。00522硬件配置示例0053首先,将参照图3描述根据本公开内容的实施例的语言学习装置100的硬件配置。

20、示例。图3是示出根据实施例的语言学习装置100的硬件配置示例的框图。0054例如,语言学习装置100是可以通过执行应用来提供根据本公开内容的实施例的语言学习服务的信息处理装置的示例。语言学习装置100例如可以是诸如移动电话、个人计算机PC、视频处理装置、游戏机、家用电器、音乐回放装置等信息处理装置。0055语言学习装置1000056语言学习装置100主要包括例如中央处理单元CPU105、随机存取存储器RAM110、非易失性存储器115、显示装置120、触摸传感器125和音频输出装置130。0057CPU105用作计算装置和控制装置。CPU105根据各种程序来控制语言学习装置100的整体操作。另。

21、外,CPU105可以是微处理器。RAM110暂时存储由CPU105执行的程序和当执行程序时适当地变化的参数等。非易失性存储器115存储由CPU105使用的程序和操作参数。0058显示装置120是显示部分的示例,并且例如可以是液晶显示LCD装置、有机电致发光显示OLED装置、阴极射线管CRT显示装置等。0059触摸传感器125是操作部分的示例,并且被设置成使得将触摸传感器125叠加在显示装置120上。触摸传感器125是位置输入装置,并且可以基于显示画面上的位置信息接收操作。0060音频输出装置130是输出音频的扬声器。音频输出装置130可以输出例如包括在被回放的内容中的音频。另外,音频输出装置1。

22、30还可以输出合成语音,合成语音是根据包括在被回放的内容中的文本数据产生的。0061这里示出的语言学习装置100的硬件配置只是示例,并且本技术不限于这个示例。在实现语言学习服务的硬件配置中,可以根据在执行本实施例时的技术水平适当地改变要使用的配置。00623功能配置示例0063接着,将参照图4描述语言学习装置100的功能配置示例。图4是示出根据实施例的语言学习装置100的功能配置示例的框图。0064语言学习装置100主要包括回放控制部分150、操作部分155、音频输出控制部分说明书CN104081444A5/12页8160、音频输出部分165、显示控制部分170、显示部分175和音频特征信息存。

23、储部分180。0065回放控制部分150具有控制内容的回放的功能。回放控制部分150可以基于从操作部分155供应的操作信息进行操作。回放控制部分150可以基于操作信息选择要回放的内容。另外,回放控制部分150可以通过控制音频输出控制部分160和显示控制部分170来控制内容的回放。0066操作部分155是用户在其上执行所需操作的输入装置,并且例如可以是触摸传感器125。操作部分155可以基于由用户执行的操作生成操作信息,并且可以与回放控制部分150共享操作信息。例如,当用户执行选择要回放的内容的操作、选择内容中的回放位置的操作、以及设置与回放有关的各种参数例如,回放音量和回放速度的操作时,操作部。

24、分155可以根据这些操作生成操作信息。0067音频输出控制部分160可以根据回放控制部分150的控制来控制由音频输出部分165输出的音频。音频输出控制部分160控制与由回放控制部分150指定的内容中的指定回放片段对应的音频的输出。当音频数据包括在指定内容中时,音频输出控制部分160可以控制音频数据的输出。另外,音频输出控制部分160可以根据指定内容的文本产生合成语音,并且可以控制所产生的合成语音的输出。0068音频输出部分165具有根据音频输出控制部分160的控制输出音频的功能。音频输出部分165可以是音频输出装置130。注意,这里,尽管语言学习装置100包括音频输出装置130,但本技术不限于。

25、这个示例。例如,音频输出部分165可以是向外部音频输出装置输出音频的接口。0069显示控制部分170可以根据回放控制部分150的控制来控制由显示部分175输出的显示画面的内容。显示控制部分170可以控制显示部分175的显示画面的内容,使得由回放控制部分150指定的内容中的指定回放片段被显示。显示控制部分170可以基于由音频输出部分165正在输出的音频的特征,控制形式改变的动画对象的显示。这里,动画对象例如可以是叠加并显示在用于指示音频内容的文本上的对象。另外,动画对象例如可以是包括在指示音频内容的文本中的字符。显示控制部分170可以通过改变动画对象的形式使用动画示出音频的特征。这里,动画对象的。

26、形式例如可以是形状、大小、颜色、显示角度等。0070显示部分175具有根据显示控制部分170的控制向用户提供显示画面的功能。显示部分175可以是显示装置120。尽管这里语言学习装置100包括显示装置120,但本技术不限于这个示例。例如,显示部分175可以是使得外部显示装置输出显示画面的接口。0071音频特征信息存储部分180是具有存储音频特征信息的功能的存储部分的示例。音频特征信息存储部分180例如可以是非易失性存储器115。尽管随后将描述音频特征信息的细节,但音频特征信息是指示音频特征的信息,并且例如可以包括识别内容中音频具有特定特征的点的信息。音频特征点例如可以是音频的音调、节奏或强度改变。

27、的点。0072以上,描述了根据本实施例的语言学习装置100的功能示例。上述结构元件中的每个可以通过图3中示出的硬件配置来实现,或者可以通过使用通用的构件和电路来实现。另外,上述结构元件中的每个可以通过专用于每个结构元件的功能的硬件来形成。另外,可以通过算术装置例如,中央处理单元CPU从记录介质例如,只读存储器ROM、随机存取存储器RAM等读取控制程序以及解释并执行控制程序来执行每个结构元件的功能。存储介质存储控制程序,在控制程序中描述了实现这些功能的处理过程。因此,可以说明书CN104081444A6/12页9根据在执行本实施例时的技术水平适当改变要使用的配置。0073注意,可以在个人计算机等。

28、中创建并且安装上述的实现根据本实施例的语言学习装置100的每个功能的计算机程序。另外,还可以提供其中存储了这种类型的计算机程序的计算机可读记录介质。记录介质例如是磁盘、光盘、磁光盘、闪存存储器等。另外,在不使用记录介质的情况下,例如可以经由网络分发上述计算机程序。00744显示画面示例0075接着,将参照图5和图6描述由根据本实施例的语言学习装置100显示的显示画面示例。图5示出由根据本实施例的语言学习装置100显示的显示画面的第一示例。图6示出由根据本实施例的语言学习装置100显示的显示画面的第二示例。0076这里,将描述使用视频内容例如,电影提供语言学习服务的第一显示画面和输出文本内容的所。

29、选片段的音频的第二显示画面作为示例。0077第一显示画面0078图5中示出的第一显示画面是使用视频内容提供语言学习服务的显示画面的示例。图5中示出的第一显示画面可以包括内容显示区11、字幕显示区12、学习记录显示区13、内容列表显示区14、字典显示区15和相关视频显示区16。字幕显示区12可以包括活动标题显示区。在活动标题显示区中显示当前正输出的音频。在活动标题显示区中显示随后将详细描述的动画对象。0079第二显示画面0080图6中示出的第二显示画面是提供输出文本数据的指定片段的音频的语言学习服务的显示画面的示例。尽管这里输出在因特网上打开的HTML内容中的文本的指定片段的音频,但本技术不限于。

30、这个示例。例如,本技术可以应用于包括文本数据的全部内容,而不限于HTML内容。00815音频特征信息示例0082接着,将参照图7至图9描述由根据本公开内容的实施例的语言学习装置100使用的音频特征信息的示例。图7是示出由根据实施例的语言学习装置100使用的音频特征信息的说明图。图8是示出包括由根据实施例的语言学习装置100使用的音频特征信息的字幕信息的示例的说明图。图9是示出由根据实施例的语言学习装置100使用音频特征信息执行的回放控制的示例的说明图。0083当以回放视频内容例如,电影的字幕和音频数据的第一显示画面为例时,例如,音频特征信息具有图7中示出的格式。音频特征信息例如可以包括COMM。

31、ANDID命令ID、识别音频特征点的时间、和在每个音频特征点之间进行区分的分隔符SEPARATOR。COMMANDID的示例包括PU、PD和SP,其中,PU指示音调增大的点,PD指示音调减小的点,而SP指示节奏改变的点。描述示例包括PU24868;SP25058;等。PU24868;指示音调在24868毫秒增大。SP25058;指示节奏在25058毫秒改变。0084例如,如图8中所示,这种类型的音频特征信息可被包括为字幕信息的一部分。字幕信息例如可以包括字幕ID、字幕显示时间、音频特征信息和字幕文本。图9示出当通过参照这种类型的字幕信息来控制内容回放时使用的控制方法的示例。0085这里,将描述。

32、以下情况作为示例字幕ID9的字幕显示时间是“000034,448”至“000036,575”,并且四条音频特征信息“SP34348;SP35568;SP35578;SP36188”被添加到说明书CN104081444A7/12页10对应于该字幕的音频。该字幕的字幕文本是“IWASNTTALKINGABOUTCHINAANYMORE,IWASTALKINGABOUTME我不再谈论中国,我谈论自己。”。此时,语言学习装置100可以基于该音频特征信息控制光标显示。0086该音频特征信息指示节奏在四个时间点即,34348、35568、35578和36188改变。因此,可以考虑到这四个时间点分别对应于字。

33、幕文本中的“IWASNTTALKINGABOUTCHINAANYMORE,”的开始位置和结束位置、以及“IWASTALKINGABOUTME”的开始位置和结束位置。在这种情况下,语言学习装置100可以使用这多条信息来分配光标速度。更具体地讲,对于这个示例,“IWASNTTALKINGABOUTCHINAANYMORE,”的开始时间和结束时间可以分别被设置成34348毫秒和35568毫秒,而“IWASTALKINGABOUTME”的开始时间和结束时间可以分别被设置成35578毫秒和36188毫秒。00876动画示例0088接着,将参照图10至图12描述由根据本公开内容的实施例的语言学习装置100。

34、显示的动画对象的显示示例。图10是示出根据实施例的语言学习装置100基于音频特征所显示的动画的示例的说明图。图11是示出根据实施例的语言学习装置100基于音频特征所显示的动画的另一个示例的说明图。图12是示出根据实施例的语言学习装置100基于音频特征所显示的动画的另一个示例的说明图。0089显示控制部分170例如可以使用图1、图2和图10至图12中示出的动画来显示音频特征。参照图10,示出通过改变字符的形式来指示音频特征的动画对象的示例。这里,可以通过基于音频特征改变显示的字符来实现动画表达。例如,可以放大或缩小字符的大小。可以旋转字符的显示角度。可以使字符的一部分例如,顶点变形。这里,显示指。

35、示动画图案的多个图形。动画对象的形式可以根据图形而变化。另外,尽管在附图中未示出,但字符的颜色可以根据音频特征而变化。显示控制部分170可以改变音频特征信息所指示的特征点处的动画对象的形式。0090图11示出这样的示例将通过改变字符大小所表达的动画对象与通过光标移动和光标前端部分的大小改变所表达的图2中示出的动画对象相结合。例如,可以在包括在文本数据中的音频特征点处放大或缩小光标前端部分的大小和字符的大小。0091另外,如图12中所示,可以通过字符间隔指示音频特征。如果根据音频节奏显示全部内容,则整个布局如图17中所示地被打破并且难以阅读文本。另外,根据音频节奏,在字符之间必须有间隔。结果,与。

36、文本被显示为使得字符等间隔并且紧挨着布置的情况相比,显示区增大。然而,这里,根据音频节奏显示正在针对其输出音频的文本的片段,并且显示除了正在针对其输出音频的片段之外的文本,使得字符紧挨着。另外,此时,因为显示区由于对应于正在输出的音频的文本的放大而变得不够,所以除了正在针对其输出音频的片段之外的文本可以被挤压并显示。因此,使用与当文本被显示为使得字符等间隔并且紧挨着布置时大小相同的显示区,显示正在针对其输出音频的文本的片段,使得字符之间的间隔根据音频节奏被放大。00927操作示例0093接着,将参照图13和图14描述根据本公开内容的实施例的语言学习装置100的操作示例。注意,这里,将分别描述当。

37、提供图5中示出的使用视频内容例如,电影提供语言学习服务的第一显示画面时的第一操作示例和当提供输出图6中示出的文本内容的说明书CN104081444A108/12页11所选片段的音频的第二显示画面时的第二操作示例。图13是示出根据实施例的语言学习装置100的第一操作示例的流程图。图14是示出根据实施例的语言学习装置100的第二操作示例的流程图。0094第一操作示例0095首先,将参照图13描述第一操作示例。回放控制部分150判定是否正在回放内容步骤S100。换句话讲,重复下述操作,直到内容回放停止为止。0096当判定正在回放内容时,回放控制部分150读取当前回放时间步骤S105。回放控制部分15。

38、0执行控制,使得音频输出控制部分160和显示控制部分170分别输出对应于回放时间的音频和显示画面。这里,显示控制部分170从当前回放时间读取接下来要显示的字幕和字幕时间步骤S110。另外,显示控制部分170读取音频特征信息步骤S115。0097然后,基于音频特征信息,显示控制部分170判定在当前回放时间是否存在音频特征点步骤S120。当在当前回放时间存在音频特征点时,显示控制部分170使得显示基于音频特征信息的动画步骤S125。0098利用上述操作,在存在音频特征的片段中,诸如,例如在音调或强度改变了至少预定阈值的片段中,或者在节奏改变的片段中,将动画显示在视频内容例如,电影中的字幕上。这里显。

39、示的动画是通过动画对象的形式的改变来实现的。动画对象可以是叠加在文本上的光标。可替选地,动画对象可以是文本本身。另外,形式的改变可以是大小、形状、颜色或布置的改变。因此,用户可以可视地掌握音频特征。另外,如果通过动画仅显示“当前正在输出的”音频的特征,则可以有效地使用显示区。0099第二操作示例0100接着,将参照图14描述第二操作示例。回放控制部分150判定是否正在执行应用步骤S200。换句话讲,重复下述的操作,直到停止执行应用为止。0101当判定正在执行应用时,回放控制部分150判定操作部分155是否检测到对文本的触摸操作S205。当检测到对文本的触摸操作时,回放控制部分150识别与被触摸。

40、片段的文本对应的音频数据步骤S210。回放控制部分150控制音频输出控制部分160输出被识别片段的音频数据,并且控制显示控制部分170显示对应于音频数据的显示画面。这里,音频输出控制部分160开始输出被识别的音频数据步骤S215。尽管这里假设音频数据是预先存在的,但本技术不限于这个示例。例如,当如上所述地识别被触摸片段的文本时,音频输出控制部分160可以根据被识别的文本产生合成语音。0102显示控制部分170读取音频特征信息步骤S220。另外,显示控制部分170读取当前音频输出时间步骤S225。然后,显示控制部分170判定在当前音频输出时间是否存在音频特征点步骤S230。当在当前音频输出时间存。

41、在音频特征点时,显示控制部分170使得显示基于音频特征信息的动画步骤S235。另一方面,当在当前音频输出时间不存在音频特征点时,省略步骤S235中的处理。接着,回放控制部分150判定在结束之前是否输出了被识别的音频数据步骤S240。当在结束之前还没有输出音频数据时,处理返回到步骤S225并且重复该处理。另一方面,当在结束之前输出了音频数据时,处理返回到步骤S200并且重复该处理。01038总结0104如上所述,利用根据本公开内容的实施例的语言学习装置100,可以在显示画面上说明书CN104081444A119/12页12有效地示出音频特征。通过使用动画,与同时示出内容中包括的所有音频特征的情况。

42、相比,有效地示出了正在输出的音频的特征。另外,由于只显示正在输出的音频的特征,因此除了对应于正在输出的音频的片段之外的片段可以在有限的显示区中以正常状态显示。因此,还提高了可读性。0105以上参照附图详细描述了本公开内容的优选实施例。然而,本公开内容的技术范围不限于上述示例。本领域的技术人员应该理解,根据设计要求和其它因素,可以进行各种修改、组合、子组合和改变,只要其在所附权利要求书或其等同物的范围内即可。0106例如,应用本技术的信息处理装置可以应用于具有显示音频特征的显示控制功能的任何装置。以上描述说明了在电影内容的字幕上显示光标的示例和在HTML内容的文本上显示动画的示例。然而,本技术不。

43、限于这些示例。根据通过电影内容的字幕上的动画来显示音频特征的实际例子,电影内容可以被用作语言学习的教育工具。另外,根据通过内容的文本上的动画来显示音频特征的实际例子,任何一般文本可以被用作语言学习的教育工具。注意,尽管以上将具有触摸传感器的平板终端或智能电话描述为硬件的示例,但本技术不限于这种示例。本技术可以应用于所有的信息处理装置。0107在本说明书中,流程图中描述的步骤不仅包括以所描述的次序按时序执行的处理,而且包括并行地或单独地执行而非一定按时序执行的处理。另外,即使在按时序处理的步骤中,不用说的是也可以适当地改变次序。0108另外,本技术还可以如下地配置。01091一种信息处理系统,包。

44、括电路,所述电路被配置成读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的特征信息应用与显示的字幕信息对应的预定效果。01102根据1所述的信息处理系统,其中所述输出装置再现的内容是音频内容,并且所述字幕信息对应于所述音频内容。01113根据2所述的信息处理系统,其中所述特征信息对应于所述音频内容的音调。01124根据2所述的信息处理系统,其中所述特征信息对应于所述音频内容的节奏。01135根据2所述的信息处理系统,其中所述特征信息对应于所述音频内容的强度。01。

45、146根据1至5中的任一项所述的信息处理系统,其中所述电路控制所述显示器以在显示的所述字幕信息上叠加可视效果作为所述预定效果。01157根据1至6中的任一项所述的信息处理系统,其中所述预定效果是与内容的属性对应的波形。01168根据7所述的信息处理系统,其中所述电路被配置成控制所述显示器以将所述波形叠加在显示的字幕信息上。01179根据1至8中的任一项所述的信息处理系统,其中所述电路被配置成控制所述显示器以显示与所述字幕信息对应的光标,并且控制所述显示器以基于读取的所述音频内容的当前回放时间移动所述光标。说明书CN104081444A1210/12页13011810根据9所述的信息处理系统,其。

46、中所述电路被配置成控制所述显示器以基于获取的特征信息向所述光标应用所述预定效果。011911根据9和10中的任一项所述的信息处理系统,其中所述电路被配置成控制所述显示器以基于获取的特征信息向所述光标应用所述预定效果。012012根据10和11中的任一项所述的信息处理系统,其中获取的所述特征信息对应于内容的音调或强度,并且所述电路控制所述显示器以基于获取的所述特征信息,与内容的音调或强度相对应地改变所述光标的大小。012113根据12所述的信息处理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度增大时增大所述光标的大小。012214根据12和13中的任一项所述的信息处。

47、理系统,其中所述电路控制所述显示器,以当获取的所述特征信息指示内容的音调或强度减小时减小所述光标的大小。012315根据1至14中的任一项所述的信息处理系统,其中所述输出装置再现的内容包括视频数据,并且所述字幕信息对应于所述视频数据。012416根据1至15中的任一项所述的信息处理系统,其中所述电路被配置成向显示的所述字幕信息中包括的文本字符应用所述预定效果。012517根据16所述的信息处理系统,其中应用于所述文本字符的所述预定效果包括改变所述文本字符的大小、形状、颜色和显示角度中的至少一个。012618根据17所述的信息处理系统,其中所述电路被配置成基于读取的内容的当前回放时间向所述文本字。

48、符的前导字符应用所述预定效果。012719一种通过信息处理系统执行的方法,所述方法包括读取输出装置再现的内容的当前回放时间;控制显示器以显示与所述输出装置再现的内容对应的字幕信息;基于读取的内容的当前回放时间获取与内容的属性对应的特征信息;以及控制所述显示器以基于获取的所述特征信息应用与显示的字幕信息对应的预定效果。012820一种信息处理装置,包括0129音频输出控制部分,控制音频的输出;以及0130显示控制部分,基于正在输出的音频的特征,控制形式改变的动画对象的显示。013121根据20所述的信息处理装置,其中0132所述显示控制部分使得在正在输出的音频的特征改变的点,改变所述动画对象的大。

49、小、形状、颜色或显示角度中的至少一个。013322根据20或21所述的信息处理装置,其中0134音频的特征是音频的音调、节奏或强度中的至少一个。013523根据20至22中的任一项所述的信息处理装置,其中所述动画对象叠加并显示在文本上。013624根据23所述的信息处理装置,其中0137叠加并显示在文本上的所述动画对象是光标,所述光标的大小与正在输出的音频的位置同步地改变,以及当在音频的特征改变的点改变形式时,所述光标的前端大小改变。013825根据20至24中的任一项所述的信息处理装置,其中所述动画对象是对应于音频的文本。013926根据25所述的信息处理装置,其中说明书CN104081444A1311/12页140140所述显示控制部分使得基于正在输出的音频的特征改变文本的字符间隔。014127根据20至26中的任一项所述的信息处理装置,其中对应于音频的文本是视频内容的字幕文本。014228一种信息处理方法,包括0143控制音频的输出;以及0144控制动画对象的显示,所述动画对象的形式基于正在输出的音频的特征而改变。014529一种使得计算机用作信息处理装置的程序,所述信息处理装置包括0146音频输出控制部分,控制音频的输出;以及0147显示控制部分,控制动画对象的显示,所述动画对象的形式基于正在输出的音频的特征而改变。014830根据29所述的程序,其中0149所。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 教育;密码术;显示;广告;印鉴


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1