本发明涉及一种用于传送信息的方法和装置,特别是涉及使用一台标准计算机和一台电话来传送多媒体信息的方法和装置。 多媒体硬件,软件及操作程序是将信息传送给一计算机用户的有效手段。当信息以图象和音响方式来表示时,表明这种信息是保持在一较高的等级上。近年来,在对音频和视频计算机传送装置的研制中虽然采取了许多措施,但是所有的改进措施都需要附加硬件设施,例如,IBM公司推出的一种用于“人个系统/2”(“PS/2”)计算机的模拟全行程视频卡(M-行程适配器),能够将视频信号呈现在一个“呈现管理”窗口中。该卡还允许将伴随的音频信息传送到一个连接在“PS/2”上的外部扬声器中。IBM公司还制造出一种音频捕获放音适配器(ACPC),它用以将音频信号转换为数字信号,并通过一外部扬声器将这些数字化信号放出。另外的一个例子是IBM数字全行程视频卡装置(作用媒体),它用于使得模拟视频数字化并读出所得到的数字视频信号。在上述所有的情况中,这些卡是用户在建立连接音频和视频的工作站时所必须负担的额外的成本和附加地器件。
降低传送多媒体信息成本的一种途径包括这样一个系统,在该系统中,一个多终端网络的多个终端访问和操作一个数字化音频和/视频信息(即具有音频讲述的视频滑动片)的中央数据库。该视频是通过一光栅扫描送入该系统的。一页图象从扫描源一次将一行图象传送到一通讯控制器,这种通讯控制器接口具有一中央数据库视频存贮器。该页面图象被压缩,并且将被压缩的图象存贮在一大容量、高容积效率文件(即磁盘)中。该音频被转换成三角形调制毕特并以256毕特或音频输入的三十分之一秒的固定增量散布在视频信号中一起被传送到该通讯控制器。每一个音频毕特的置位是由一个具有适当的寻址控制标识符的机构来识别的。当大量的用户使用时,由于在该工作站中需要特殊的放音卡,因而这种方法的使用受到限制。
因此,需要一种用来将低成本音频/视频信息传送到一工作站而无须额外成本和附加再现器件的装置和方法。
本发明涉及一种用于将多媒体信息传送给一数据处理系统的一个工作站中的一个用户的方法和装置。本发明利用现有的办公设施来再现音频和视频信息:使用一电话放出音频信息,使用一工作站的图象显示功能来再现视频信息。音频信息被捕获并被存贮在一可通过电话连接来存取的器件中。音频信息的存贮可以是模拟方式或数字方式。视频信息的捕获使用了一视频捕获适配器、与计算机连接的扫描器件和/或一显示图形的编辑程序,并以一种再现器件所适应的数字化形式存贮起来。一为该视频信息准备的工作清单用来识别视频显示的次序和间隔。该视频和音频信息然后按下述的方法提供给该目标用户:该视频和相关的工作清单通过调制解调器,本地区域网络(LAN)等传送到该目标用户的工作站,当到达该目标用户的工作站时,该视频信息的再现是利用用来指示该视频图象的顺序和间隔的工作清单来完成的。该音频信息是调用一特定的电话号码去访问前面录制的与该视频信息同步的音频信息而被提供的。
图1是一本发明可实施的数据处理系统的方框示意图;
图2是一本发明实施中所使用的人机对话工作站的方框图;
图3是在本发明中所使用的用来捕获多媒体信息的准备部分的说明;
图4是在本发明中所使用的在一工作站中再现多媒体信息的说明。
这里所披露的低成本音频/视频系统(LCAVS)具有可使用现有的办法设备来再现多种形式信息的优点。使用一台电话来再现音频信息和使用工作站的图象显示能力来再现视频信息。该LCAVS包括有几个特殊部分,其中有1)一个准备部分,2)一个传送部分,和3)一个再现部分。该准备部分用来建立音频/视频形式数据。该音频准备部分包括有一用来捕获该音频信息并存贮该音频信息的器件,以便它可通过一电话连接而被存取。这里所使用的电话指的是用来传送谈话或其它的声音。例如,该音频捕获和存贮器件可以是一种应答机,它可存贮模拟形式的音频并且当该器件的电话号码被调用时可通过电话连接再现该音频信号。另一方面,该音频存贮器件可以是计算机控制的音频响应部分,该部件存贮数字形式的音频数据,并且可与电话网络相连接。
视觉信息可以通过类似IBM视频捕获适配器的一个器件来捕获。另外,与计算机相连的扫描器件也可用来捕获视觉信号。一旦该视觉信息被捕获,则可见图象以一种便于由再现部分来观察的格式被数字化地存贮。例如,可见图象可以存贮在.PCX(图象交换文件)或.BMP(位映象)格式中,这些格式可由若干诸如“IBM STORYBOARD”,“HOLLYWOOD”,“AVC”(音频视频连接)等众所周知的再现过程或其它的图象文件浏览器来重现。为了节省存贮和带宽,对这种数字数据还可使用压缩技术。
该准备部分的最后步骤是形成用于可见图象的工作清单,所述可见图象可以由包括Story Board,Hollywood和AVC在内的许多文件浏览器来形成。这个工作清单指出了出现的每一个被捕获视觉图象的顺序和间隔。该工作清单是通过将每个可见图象与音频信息相联系并记录伴随着视觉信号的音频削波的持续时间来得到的。
该传送部分是用来将该音频和视觉信息传送到该工作站。通常,对于音频数据的传送部分是被合并在该再现部分,这样在该再现期间该音频数据通过电话来存取。对于该数字化可见图象和相应的工作清单是利用一种诸如调制解调器,本地区域网络(LAN)、LAN文件盘等分布装置直接传送到该工作站的。
再现部分用来将音频和视觉信息呈现给工作站中的一目标用户。该视觉再现部分的基本单元是一个如像在Story Board、Hollywood和AVC中存在的自动图象呈现程序。这个程序将显示由准备部分所捕获并由传送部分送来的视觉图象。该视觉图象将按照工作清单中所指示的顺序和持续时间而被显示出来。该音频信息是通过该电话而表现的,这样就使一目标用户呼叫一特定的电话号码去存取一予记录的音频信息。
该音频和视觉信息的同步是按如下方式来实现的;启动对视觉信息的显示,并继续显示直到该视觉信号中的一个被插入文本信息的点上,当得到指示后,该文本立即通知用户拨动一个电话号码并准备按下在该工作站的I/O器件(即键盘、鼠标)中的一个特定的键,视觉显示暂停并且等待该键的按压,用户拨动该电话号码并且当听到一个声音时用户接收这个音频信息去触发该工作站的特定键。当该声音响起时按压该键可使得音频和视觉显示得以同步进行。在大多数情况下,在声音和键按压之间出现的快或慢一秒的差异是可允许的。
此外,更多的先进的同步技术也可以采用。例如,如果该显现工作站装备有一拨号输出装置及声音发生器,则视觉显示程序可以为目标用户安排通话,并且通过与电话应答器件相配合起动自动视频显示。在同样的方式中,当采用先进的电话应答器件时,在显示进行过程中,随着用户要求按压该电话键盘中的某个键而使暂停插入该显示中,这种技术还可以用来改变该显示的内容,例如按压1要求帮助,按压2用于观察,按压3使其继续。另外,在一个先进的构形中,该显示工作站可以产生适于该目标用户的正确声调。
现在参见附图,特别是图1,图1介绍了数据处理系统8的图形显示,该系统可用来实现本发明所述的方法。由图可看到,该数据处理系统8包括有多个网络,例如本地区域网络(LAN)10和32,每个网络最好是分别包括有多个单独的计算机12和30。当然,本领域的技术人员都了解,多个人机对话工作站(IWS)连接到一个主处理器上也可以作为每个这样的网络。
在这种数据处理系统中,每个单独的计算机都连接到一个存贮器件14和/或一个打字/输出器件16上。根据本发明所述的方法,可以使用一个或多个这样的存贮器件14来存贮操作程序或资源目标,所存贮的内容可供任何用户在该数据处理系统8内周期性进行存取。在先有技术的一个众所周知的方案中,被存贮在存贮器件14中的每个这样的操作程序或资源目标都与一个资源管理程序相连接,后者决定了保持和更新所有的与其相联系的资源目标。
再参见图1,可看到数据处理系统8还包括有例如计算机主机18那样的复杂的计算机主机,它通过通讯线路22与本地区域网络(LAN)10相连接。计算机主机18还可与一个可作为对本地区域网络10进行远距离存贮的存贮器件20相连接。同样,本地区域网络(LAN)10可通过通讯线路24并再经过一子系统控制单元/通讯控制器26以及通讯线34与一入口服务器28相连接。该入口服务器最好是一台单独的计算机或一台交互式工作站(IWS),它用来使本地区域网络(LAN)32与本地区域网络(LAN)10相连系。
由上面对有关的本地区域网络(LAN)32和本地区域网络(LAN)10的讨论可知,当资源管理程序被这样存贮时,资源目标可以存贮在存贮器件20中并可由计算机主机18来控制,当然,本技术领域的普通技术人员都很清楚,计算机主机18可距离本地区域网络(LAN)10较远的距离,同样本地区域网络(LAN)10可与本地区域网络(LAN)32相距一相当的距离。这就是说,本地区域网络(LAN)32可以安置在加利福尼亚,而本地区域网络(LAN)10可安置在得克萨斯,并且计算机主机18可被安置在纽约。
再看看图2,图2详细地给出了一种在上面已描述的数据处理系统8中使用的交互式工作站(下面称之为“工作站”)的图示。可以看到,工作站50包括有一个处理单元52,该处理单元52中有一中央处理单元56(CPU)与存贮器54相连。当然,本技术领域的普通技术人员都清楚,多种用户输入/输出装置可以与该处理器52相连接,包括有用于用户输入的键盘60,用于观察计算机程序输出的显示器62,打字机58以及诸如鼠标64之类的指示器件。
在这种工作站中,辅助存贮器可由固定硬磁盘70和/或软磁盘机68来提供。一种具塑料软磁盘66形式的可移动记录媒体可用来经过软磁盘机68将一计算机程序输入到工作站50。将会了解到,本发明所披露的方法可以在一计算机程序中得到描述并以上面说明的方式输入。还会了解到,上述的工作站可以是一个“IBM PERSONAL SYSTEM/2”(PS/2)或一个所谓的IBM兼容计算机。
再参看图3,图3示出了本发明的准备部分。在框82中进行查询以检测一用户是否打算捕获音频信息,如果希望捕获音频信息,则在框84中该音频捕获器件开始运行,该音频信息然后被存贮在框86中;捕获音频信息之后,流程继续进行,在框88中查询是否希望捕获视频信息,如果希望捕获视频信息,则在框90中该视频捕获器件开始运行,被捕获的视频被存贮在框92中,与该视频信息被捕获并被存贮之后,在框94中产生工作清单,该工作清单可以由人工或自动技术来产生。在由人工技术来产生时,准备专家观察被捕获的视觉信息,选择那些对音频磁适中存在的信息有最佳显示的视觉信息。一旦这些视觉信息被选定后,则它们显示的顺序也可被确定。接着,再观察音频信息,这次记录与每一个选定的视觉信息相联系的音频信息的持续时间。现在,该工作清单就被产生了。它包括有每个视觉信息的文件名称,列出了它们被观察的次序以及有关的每个视觉信息所呈现的持续时间。这个工作清单产生技术也可以是自动的,用一计算机系统记录在该捕获过程中被捕获的视觉信息之间的持续时间。当捕获完成之后,这个持续时间被加到工作清单中。工作清单产生之后,在框96中整个过程结束。虽然图3只示出了在串行方式中该音频和视频的捕获,但一个本技术领域的普通技术人员可识别出这些过程也可在并行的场合中使用。
参见图4,现在将要说明被捕获的信息的再现100。在框102中该工作清单从存贮装置中取出,该工作清单被用于指导视觉信息的显示。在框104中,在该工作清单中被指定的视觉图象被取出并且使用适当的图象浏览器来呈现该图象。一旦图象呈现出来,则在框106中对当前视觉图象的工作清单进行检验,如果工作清单指定该显示暂停,则该过程在框108中继续执行。如果工作清单没有指示暂停,则该过程在框118中继续执行。在框118中,该过程等待指定时间周期并返回到框104执行,在框104中由该工作清单指定的下一个视觉信息被取出并被显示出来。
再返回框108,当该工作清单指示暂停时则执行框108,当该目标用户需要采取某些行动时则插入这种暂停。所需采取的行动在视觉上进行指示。在框108中,该指令被跟踪。在框110中,如果这些指令指定进行电话呼叫,则过程继续至框112中执行。反之,则过程将继续至框116中执行,在框116中,该目标用户按压该计算机系统I/O器件中的一个键,以便重新启动显示。例如,如果在继续该显示之前,该视觉显示要求目标用户启动另外的操作程序时,框110至框116的通路是必须的。
在框112中,该目标用户拨动特定的电话号码(#)。该电话被连通并且开始放出音频信息。在框114中,该目标用户等待该音频信息指示视觉信息应被启动。如果有这种指示时,则在框116中该目标用户按下I/O器件中的键去重新启动该视觉信息。这就导致了该音频和视觉信息的同步。因为工作清单中的延迟时间被指定与音频是同步的,所以该视觉信息的连续重现将与该音频保持同步。
总之,本发明提供了一种用来将低成本的多种方式的信息传送给在一数据处理系统中的一工作站的一个用户的方法和装置。与一工作站中的图象视觉显示同步的通用电话被用于该多媒体表现中。音频信息可存贮在一中央装置中,例如存贮在一电话邮政信箱、一个拨号音频接收机、或一个带有语音发生能力的电话可存取计算机中。当将音频传送至工作站时,每个不同的音频捕获和存贮设施都有不同程度的灵活性。在最大极限情况下,目标用户可以人工地拨出一电话号码来取回用于多媒体再现的音频信息。另一方面,一个带有可任意选择的电话功能的接收工作站可以自动地拨出该电话号码以取回该音频信息。另外,一台具有扬声器电话能力的电话接收机可以提供不需手工操作的音频信息传送。该视觉信息被整理为指示视频表现中特征点的一组“滑动片”。该滑动片是由图象或视频捕获装置来捕获的,并且以一标准化格式(即位映象(.BMP)被编码。该滑动片然后通过连通性装置(即网络、LAN等)分配至一目标用户的工作站。该滑动片数据库包括有一表示该滑动片的观察顺序和每个滑动片的观察持续时间的表格。目标用户可使用该表格使该观察过程自动化并且可使该滑动片的显示与原始视频显示同步。该工作站装备有观察软件,该软件按在该表格中所规定的顺序和持续时间来显示该视觉信息。该观察软件选择与一特定的工作站的硬件显示能力相关的正确的观察要求,包括有以定标形式对这种信息置位、颜色调色板、PEL增密等。本发明在一个不允许多媒体显示的工作站中提供了对一个原始的全行程多媒体表现的显示。因此,对于一数据处理系统中的一工作站的用户来说,可采用若干多媒体部件。例如,电台新闻节目的播音员/报告员可以读出附加有播音员/报告员及其所播出的故事情景的活动的视频画面的新闻。所公开的发明还提供了从该活动的视频显示中逐字地捕获音频信息。被选择的运动的视频序列的静止图象可以利用IBM视频捕获适配器来捕获和存贮。该静止图象是播音员/报告员和有关情景的图象的混合。一个工作清单是通过将一个画面和一段音频相联系并记录每段话的持续时间而产生的。对数据的读出提供给目标用户原始显示的全部音频内容以及从原始显示中所提取的与音频同步的静止图象。本发明还可扩展到程序性指令的显示。例如,步进式音响指令可与一过程的显象同步被提供,这个过程例如是元件装配、软件装置指令,用户接口相互作用、文化协议等。同样,音频/视觉邮件也可这样表现。该视觉图象与工作清单一起可用电子方法邮寄给具有显示部分的某个人。当邮件打开时,第一个图象将指示该目标用户去调用该信息的音频部分的电话号码,或者另一方面,该工作站可以被启动去打这个电话。最后,利用本发明可以容易地提供多媒体显示。显示诸如来自公司总裁的一个信息,最近的公司利益程序包中的指令,以及如何去解释最新的价格/性能数据,都可以利用本发明。
尽管本发明详细地示出了发明内容并参考最佳实施例作了详细说明,但本技术领域的普通技术人员都清楚,在不违背本发明的精神和范围的原则下,可对其构成和细节部分作出变化。