用于将声音文件添加到JPEG文件中的方法及装置.pdf

摘要
申请专利号：	CN200810144972.2	申请日：	2008.08.18
公开号：	CN101656814A	公开日：	2010.02.24
当前法律状态：	驳回	有效性：	无权
法律详情：	发明专利申请公布后的驳回IPC(主分类):H04N 1/21申请公布日:20100224\|\|\|实质审查的生效IPC(主分类):H04N 1/21申请日:20080818\|\|\|公开
IPC分类号：	H04N1/21; G06F17/30	主分类号：	H04N1/21
申请人：	爱思开电讯投资（中国）有限公司
发明人：	汤宝伟; 殷律; 罗栋元; 李相研
地址：	100084北京市海淀区中关村东路1号院清华科技园8号楼启迪科技大厦D座9层
优先权：
专利代理机构：	永新专利商标代理有限公司	代理人：	林锦辉;王英
PDF下载：	PDF下载

内容摘要

本发明提供了一种用于在JPEG文件中添加声音文件的方法，该方法在具有音频和视频能力的设备上执行，所述方法包括：通过所述设备获取声音文件；通过所述设备获取JPEG文件；将所述声音文件添加到所述JPEG文件的空闲域中。本发明还提供了一种用于在观看JPEG文件时播放声音文件的方法，所述方法包括：打开所述JPEG文件；读出嵌入有所述声音文件的空闲域的总长度和文件名扩展名长度，然后确定所述声音文件的字节长度；从所述JPEG中读取出所确定的长度个字节；创建二进制文件，并将从所述JPEG文件读取出所确定

权利要求书

1：一种用于在JPEG文件中添加声音文件的方法，该方法在具有音频和视频能力的设备上执行，所述方法包括：通过所述设备获取声音文件；通过所述设备获取JPEG文件；将所述声音文件添加到所述JPEG文件的空闲域中。
2：如权利要求1所述的方法，其中，将所述声音文件添加到所述JPEG文件的空闲域中还包括：打开所述JPEG文件；在所述JPEG文件的头文件中搜索用于指示扫描线开始的第一标记；在找到所述第一标记后，将该第一标记以后的数据，包括该第一标记在内，读入缓存器中进行缓存；在对所述第一标记以后的数据进行缓存后，将所述JPEG的文件指针移动到所述第一标记处，向所述JPEG文件写入第二标记，其中所述第二标记用于指示所述空闲域；在写入所述第二标记后，打开所述声音文件；将所述声音文件写入所述JPEG文件的所述空闲域中，并且在写入所述声音文件后，再将所述缓存器所缓存的数据写入所述 JPEG文件中。
3：如权利要求2所述的方法，其中，向所述JPEG文件写入第二标记的步骤还包括：将所述文件指针移动两个字节，并向所述JPEG文件写入第三标记，所述第三标记用于指示在所述JPEG文件中存在有所述声音文件。
4：如权利要求3所述的方法，还包括；在写入所述第三标记后，向所述JPEG文件写入第四和第五标记，其中所述第四和第五标记分别用于指示所述声音文件的扩展名长度和扩展名。
5：如权利要求4所述的方法，还包括：计算所述声音文件的大小，并判断所述声音文件长度是否超过预设值T＝64k-(第二标记的长度)-2-(第三标记的长度)-(第四标记的长度)-(第五标记的长度)，如果所述声音文件的长度未超过所述预设值，则将所述声音文件写入所述JPEG文件中。
6：如权利要求1所述的方法，其中，所述空闲域可以是COM 域或保留域。
7：如权利要求1所述的方法，其中，所述声音文件是从所述设备中读取的已记录的声音文件。
8：如权利要求1所述的方法，其中，所述声音文件是用户通过录音而获得的。
9：如权利要求1所述的方法，其中，所述声音文件可以是不同格式的音频文件。
10：如权利要求1所述的方法，其中，所述JPEG文件是从所述设备中读取的已记录的JPEG文件。
11：如权利要求1所述的方法，其中，所述JPEG文件是所述设备正拍摄的JPEG文件。
12：如权利要求1所述的方法，其中，所述设备可以是具有照像功能的移动设备和具有图像浏览器的PC中之一。
13：一种用于在观看JPEG文件时播放声音文件的方法，所述方法包括：打开所述JPEG文件；读出嵌入有所述声音文件的空闲域的总长度以及文件名扩展名长度，并确定所述声音文件的字节长度；从文件名扩展名的结束处开始，从所述JPEG中读取出所确定的长度个字节；创建二进制文件，并将从所述JPEG文件读取出所确定的长度个字节写入到该二进制文件中，作为声音文件，以供在观看所述JPEG 文件时进行播放。
14：如权利要求13所述的方法，其中所述空闲域可以是COM 域或保留域。
15：如权利要求13所述的方法，还包括步骤：确定所述JPEG文件的空闲域中是否存在声音文件；如果所述JPEG文件的空闲域中存在声音文件，则读出所述空闲域的总长度以及文件名扩展名长度。
16：一种用于在JPEG文件中添加声音文件的设备，所述设备包括：声音文件获取装置，用于获取声音文件； JPEG文件获取装置，用于获取JPEG文件；以及声音文件添加装置，用于将所述声音文件添加到所述JPEG文件的空闲域中。
17：如权利要求16所述的设备，其中，所述声音文件添加装置还包括： JPEG文件打开装置，用于打开所述JPEG文件；搜索装置，用于在所述JPEG文件的头文件中搜索用于指示扫描线开始的第一标记；读出装置，用于在找到所述第一标记后，读出该第一标记以后的包括该第一标记在内的数据；缓存装置，用于对所读出的该第一标记以后的数据，包括该第一标记在内，进行缓存；写入装置，用于在对所述第一标记以后的数据进行缓存后，将所述JPEG的文件指针移动到所述第一标记处，向所述JPEG文件写入第二标记，其中所述第二标记用于指示所述空闲域；声音文件打开装置，用于在写入所述第二标记后，打开所述声音文件；声音文件写入装置，用于将所述声音文件写入所述JPEG文件的所述空闲域中，以及缓存数据写入装置，用于在写入所述声音文件后，再将所述缓存器所缓存的数据写入所述JPEG文件中。
18：如权利要求17所述的设备，其中，所述写入装置还用于，在写入所述第二标记后，将所述文件指针移动两个字节，并向所述JPEG文件写入第三标记，其中所述第三标记用于指示在所述JPEG 文件中存在有所述声音文件。
19：如权利要求18所述的设备，其中，所述写入装置还用于，在写入所述第三标记后，向所述JPEG文件写入第四和第五标记，其中所述第四和第五标记分别用于指示所述声音文件的扩展名长度和扩展名。
20：如权利要求19所述的设备，还包括：计算装置，用于计算所述声音文件的大小，以及判断装置，用于判断所述声音文件的大小是否超过预设值 T＝64k-(第二标记的长度)-2-(第三标记的长度)-(第四标记的长度)-(第五标记的长度)，如果所述声音文件的大小未超过所述预设值T，则将所述声音文件写入所述JPEG文件。
21：如权利要求16所述的设备，其中，所述空闲域是COM域或保留域。
22：一种用于在观看JPEG文件时播放声音文件的设备，所述设备包括： JPEG文件打开装置，用于打开所述JPEG文件；第一读出装置，用于读出嵌入有所述声音文件的空闲域的总长度和所述声音文件的文件名扩展名长度；第一确定装置，用于根据所读出的空闲域的总长度和文件名扩展名长度，确定所述声音文件的字节长度；第二读出装置，用于从文件名扩展名的结束处开始，从所述JPEG 中读取出所确定的字节长度个字节；创建装置，用于创建二进制文件，并将由所述第二读取装置从所述JPEG文件读取出所确定的字节长度个字节写入到该二进制文件中，作为声音文件，并将该声音文件输出给图像浏览器；以及图像浏览器，用于观看JPEG文件并播放所接收的声音文件。
23：如权利要求22所述的设备，其中，还包括第二确定装置，用于确定所述JPEG的空闲域中是否存在声音文件。
24：一种JPEG图像处理系统，其包括如权利要求16-21中任何一个所述的设备和如权利要求22-23中任何一个所述的设备。

说明书

用于将声音文件添加到JPEG文件中的方法及装置
    【技术领域】

    本发明涉及一种基于JPEG的图像处理方法及系统，更具体地，涉及一种将声音文件添加到JPEG文件中的方法及装置，一种在呈现JPEG文件时播放声音文件的方法及装置以及一种包括上述的图像处理方法及系统。

    背景技术

    近年来，随着成像设备的技术不断发展，图像变得越来越大。为了在较小的图像大小内包含较多的信息，目前在成像时通常采用JPEG压缩技术，形成JPEG格式的图像文件。这是因为在形成JPEG图像文件时，通常会丢弃图像中所包含的被认为是对图像呈现并不重要的信息，因此，JPEG压缩技术具有令人吃惊的降低存储量的能力。与未压缩的BMP或TIF格式的位图相比，JPEG图像文件的大小通常只有它们的10％或更小。

    但是，大部分拍摄的JPEG文件中并不包含照片拍摄地点的信息，特别是由不支持GPS功能的照相机所拍摄的照片。随着用户拍摄的照片越来越多，在拍摄过后较长一段时间再来观看照片时，用户通常会忘记该照片是在何处拍摄的。

    另外，在由GPS功能的数字相机拍摄照片时，可以形成具有Exif(Exchangeable Image File，可交换图像文件)格式的JPEG文件，在该Exif文件的头文件信息中包含有拍摄地点的位置信息。但是，由于该位置信息的格式是文本格式，并且在所显示的图片上并不显示该信息，因此，用户只有在调用图片属性的情况下，才能够得到该位置信息，这使得用户在使用时感到很不方便。

    因此，需要新的图像处理方法和装置，其能够将位置信息声音文件添加到JPEG文件中，以及在呈现JPEG文件时同时播放位置信息声音文件来方便用户的使用。

    【发明内容】

    鉴于上述问题，提供一种新的图像处理方法和系统，利用该图像处理方法和系统，可以将声音文件添加到JPEG文件中，并且在利用图像浏览器观看该JPEG文件时播放该声音文件，从而使得用户可以在观看多张拍摄的照片时，能够容易地知道每张照片的拍摄地点等，由此增加用户的使用便利性。

    根据本发明的一个方面，提供了一种用于在JPEG文件中添加声音文件的方法，该方法在具有音频和视频能力的设备上执行，所述方法包括：通过所述设备获取声音文件；通过所述设备获取JPEG文件；将所述声音文件添加到所述JPEG文件的空闲域中。

    根据本发明的另一方面，提供了一种用于在观看JPEG文件时播放声音文件的方法，其中所述声音文件嵌入在所述JPEG文件的空闲域中，所述方法包括：打开所述JPEG文件；在所述JPEG文件中搜索所述空闲域；在搜索到所述空闲域后，分别读出文件名扩展名长度和文件名扩展名，并确定所述声音文件的字节长度；从所述文件名扩展名的结束处开始，从所述JPEG文件中读取出具有所确定的长度的字节；创建二进制文件，并将从所述JPEG文件读取出所确定的长度的字节写入到该二进制文件中，作为声音文件，以供在观看所述JPEG文件时进行播放。

    根据本发明的另一方面，提供了一种用于在JPEG文件中添加声音文件的设备，所述设备包括：声音文件获取装置，用于获取声音文件；JPEG文件获取装置，用于获取JPEG文件；以及声音文件添加装置，用于将所述声音文件添加到所述JPEG文件的空闲域中。

    根据本发明的另一方面，提供了一种用于在观看JPEG文件时播放声音文件的设备，其中所述声音文件嵌入在所述JPEG文件的空闲域中，所述设备包括：JPEG文件打开装置，用于打开所述JPEG文件；搜索装置，用于在所述JPEG文件中搜索所述COM域；第一读出装置，用于在搜索到所述空闲域后，分别读出文件名扩展名长度和文件名扩展名，并确定所述声音文件的字节长度；第二读出装置，用于从所述文件扩展名的结束处开始，从所述JPEG文件中读取出具有所确定的长度的字节；创建装置，用于创建二进制文件，并将由所述第二读取装置从所述JPEG文件读取出所确定的长度地字节写入到该二进制文件中，作为声音文件，并将该声音文件输出给图像浏览器；以及图像浏览器，用于观看JPEG文件并播放所接收的声音文件。

    通过参考以下结合附图的说明及权利要求书的内容，并且随着对本发明的更全面理解，本发明的其他目的及结果将更加明白及易于理解。

    【附图说明】

    以下将结合附图和具体实施例对本发明进行详细描述，其中：

    图1示出了JPEG文件中的部分头文件表；

    图2示出了根据本发明的实施例，将声音文件添加到JPEG文件中的方法的流程图；

    图3示出了根据本发明的实施例，在观看JPEG文件时播放声音文件的方法的流程图；

    图4示出了根据本发明的实施例，用于在JPEG文件中添加声音文件的JPEG图像形成设备的示意图；

    图5示出了根据本发明的实施例，用于在观看JPEG文件时播放声音文件的JPEG图像浏览设备的示意图；以及

    图6示出了根据本发明的实施例，用于在JPEG文件中添加声音文件并在观看JPEG文件时播放声音文件的系统。

    在所有附图中，相同的标号指示相似或相应的特征或功能。

    发明详述

    下面将参照附图对本发明的实施例进行详细说明。

    在对实施例进行详细说明之前，首先对JPEG的头文件进行简要介绍。

    图1示出了JPEG文件中的头文件表。

    如图1所述，在头文件表中，仅仅示出了基线JPEG的基本标记(marker)，所有标记都以FF(十六进制)开头。其中，标记0xFFFE用于标记COM域，用于写入注释字段，其长度用两个字节表示，因此，COM域的可变长度应该不超过64K。

    当录制声音文件时，使用8K采样率，单通道，每个采样点采用16bit编码且录制时间为两秒钟，在这种条件下将录音内容存为wav文件，其文件大小为32K。因此，将这样的声音文件嵌入在COM域中时，完全可以满足COM域的长度不超过64k的条件。此外，如果将该2秒的录音内容存储为经过压缩处理的其它格式的声音文件，比如ogg，vorbit文件时，其大小为10K，远小于64K。也就是说，当采用其它压缩格式的声音文件时，大小为64K的声音文件可以对应于时间长度远多于2秒的录音内容。

    另外，一般情况下，用于表述拍摄地点的短语通常包含2个单词，比如“北京”，而以正常语速说出该短语“北京”所需要的时间大约为1秒，即其录音内容的时间长度为1秒。从上面可以看出，完全可以将比如“北京”或包含更多单词的声音文件(其大小小于64K)嵌入在头文件的COM域中，并且满足COM域的长度小于64K的规定。这里，COM域仅仅是用来例示，还可以使用JPEG文件中的其他空闲域，比如图1中的保留域0xFF02，0xFFBF。在本发明中，正是利用上述特性来实现将声音文件添加到JPEG文件的空闲域中。

    以下参照图2和3来具体说明将声音文件添加到JPEG文件中的过程。该过程是在具有音频和视频处理能力的设备(下文中，称为音频/视频处理设备)中实施的。

    图2示出了根据本发明的实施例，将声音文件添加到JPEG文件中的方法的流程图。在该实施例中，以声音文件“Beijing.amr”为例，以及以JPEG文件的头文件中的COM域作为空闲域来具体说明如何利用音频/视频处理设备200来在JPEG文件中添加声音文件。为了说明简单，在下面的实施例中，都以JPEG文件的头文件中的COM域作为空闲域来进行说明。要注意的是，在本发明的实施例中，还可以使用JPEG文件中的其他空闲域，比如图1中的保留域0xFF02，0xFFBF。

    如图2所示，在步骤S210中，首先，通过音频/视频处理设备200得到声音文件“Beijing.amr”。在该步骤中，声音文件“Beijing.amr”可以是从音频/视频处理设备200中读取的已记录的声音文件，也可以是用户通过录音而获得的声音文件。此外，要注意的是，除了amr格式以外，该声音文件还可以是采用其它格式的文件，比如wav文件、rm文件、mp3文件、MP4文件或者其它音频文件。

    在步骤S220，通过音频/视频处理设备200获得JPEG文件。同样，在该步骤中，所获得的JPEG文件可以是从音频/视频处理设备200中读取的已记录的JPEG文件，也可以是音频/视频处理设备200正拍摄的JPEG文件。

    在步骤S230中，音频/视频处理设备200将声音文件“Beijing.amr”添加到JPEG文件的头文件中的COM域中。以下对步骤S230进行更为详细的说明。这里，步骤S230进一步包括子步骤S231～S237。

    在步骤S231，以可读写方式打开JPEG文件。然后，在JPEG的头文件中搜索标记0xFFDA，该标记用于指示扫描线开始。

    在搜索到标记0xFFDA后，在步骤S232，将标记0xFFDA以后的数据，包括0xFFDA在内，读入缓存装置以进行缓存。

    在对标记0xFFDA以后的数据进行缓存后，在步骤S233，将文件指针移动到0xFFDA的0xFF，向JPEG文件中写入标记0xFFFE，其用于标记COM域。该标记的长度为2个字节。而后，将文件指针移动两个字节，向JPEG文件中写入标记“Place Voice”，其表示存在有声音文件。标记“Place Voice”的长度固定为11字节。此外，还向JPEG文件中写入标记extension length，其用于指示扩展名长度。标记extension length的长度为1个字节。另外，还向JPEG文件中写入标记extension，其用于记录扩展名。在本实例中，因为扩展名为.amr，而.amr的长度是4，所以标记Extension中所记录的内容为.amr，其长度为4。要明白的是，由于不同的扩展名具有不同的长度，所以依据不同的扩展名，标记Extension的长度是可变的。

    需要说明的是，标记“Place Voice”和标记0xFFFE之间的两个字节被标记为Length，其用来记录COM域的总长度。

    然后，在步骤S234中，以二进制可读方式打开声音文件beijing.amr，并计算该声音文件的大小。

    在计算出该声音文件的大小后，在步骤S235，判断该声音文件的大小是否超过预设值T＝64k-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)。其中，标记0xFFFE、length、“Place Voice”、extension length的长度是不变的。具体地，标记0xFFFE的长度为2字节，Length的长度为2字节，“Place Voice”的长度为11字节，Extension Length的长度为1字节。此外，根据不同的扩展名，标记Extension的长度是可变的，其一般不超过10。因此，该预设值通常被设置为T＝64k-26。在该声音文件的大小未超过该预设值时，进行到步骤S236。否则，该过程结束。

    在步骤S236，将声音文件beijing.amr读入内存，然后写入JPEG文件。在写入声音文件beijing.amr后，再将原0xFFDA及以后的数据写入JPEG文件。

    随后，在步骤S237，计算标记0xFFFE、length、“Place Voice”、extension length、extension和声音文件的长度和。然后，将JPEG文件指针移动到0xFFFE的后面，将上述长度和(以两个字节表示)写入到length中。

    在进行完上述操作后，关闭JPEG文件和声音文件。

    以上示例性地给出了如何向JPEG文件中添加声音文件的过程，下面结合图3来说明如何在观看JPEG文件时播放声音文件。

    图3示出了根据本发明的实施例，在观看JPEG文件时播放声音文件的方法的流程图。在本实施例中，仍旧以声音文件为“Beijing.amr”，和以COM域为空闲域为例进行说明。

    如图3所示，首先，在步骤S310，以可读方式打开JPEG文件。

    然后，在步骤S320中，确定该JPEG文件中是否存在声音文件。具体地，首先，在JPEG的头文件中搜索是否存在0xFFFE，即是否存在COM域。如果没有COM域，则该JPEG文件中不存在声音文件，过程结束.如果搜索到COM域，在COM域后，读取两个字节，以获得标记Length中记录的长度，即COM域的总长度。如果COM域的总长度小于15，则该JPEG文件中不存在声音文件，过程结束。如果COM域的总长度大于15，再读取11个字节。如果所读取的11个字节是“Place Voice”，则该JPEG文件中存在声音文件。否则，则该JPEG文件中不存在声音文件，过程结束。

    在搜索到COM域并确定存在“Place Voice”后，即确定该JPEG文件中存在声音文件后，在步骤S330中，在从JPEG文件中读取11个字节后，再读取1个字节，即读取声音文件的扩展名长度。此后，再读取声音文件的扩展名长度个字节，以获得读取文件名扩展名，在本实例中为.amr。

    然后，在步骤S340中，在读取声音文件的扩展名长度个字节后，从文件名扩展名的结束处开始，再从JPEG文件中读取出[(标记Length中记录的长度)-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)]个字节，并存储到内存中。在上述计算式中，标记Length中记录的值是指COM域的总长度。标记0xFFFE的长度为2，标记Length的长度为2，标记“Place Voice”的长度为11，以及标记extensionlength的长度为1。标记Extension的长度是所读取的文件名扩展名长度。从将声音文件添加到JPEG文件的方法的描述中可知，上述计算式所得到的结果实质上就是声音文件的长度。因此，从JPEG文件中读出的[(标记Length中记录的长度)-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)]个字节实际上就是所添加的声音文件。

    随后，在步骤S350中，创建一个二进制文件，其文件名为xxxx.amr，在本例中，命名为“Beijing.amr”，并将在内存中所保存的[(标记Length中记录的长度)-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)]个字节写入到该二进制文件中，作为声音文件，即beijing.amr，并将其输出给图像浏览器。在步骤S360中，在观看该JPEG文件时，利用图像浏览器来播放该声音文件“Beijing.amr”。

    上面的实施例仅仅是示例性地说明了本发明的优选实施例，还可以对上述实施例进行各种合适的变形。该变形也应该落在本发明的保护范围之内。

    例如，步骤S210和S220的顺序可以互换。

    此外，上述将声音文件添加到JPEG文件中的过程以及在观看JPEG文件时播放声音文件的过程虽然是以独立的两个实施例进行描述的，但是还可以将上述两个过程组合，以实现将声音文件添加到JPEG文件中并在观看JPEG文件时播放该声音文件。

    本发明的上述用于将声音文件添加到JPEG文件中以及在观看JPEG文件时播放声音文件的方法，可以采用软件实现，也可以采用硬件实现，或采用软硬件结合的方式实现。

    图4示出了根据本发明实施例的JPEG图像形成设备400的方框图。如图4所示，JPEG图像形成设备400包括声音文件获取装置410，JPEG文件获取装置420，以及声音文件添加装置430。该声音文件添加装置430进一步包括JPEG文件打开装置431，搜索装置432，读出装置433，缓存装置434，移动装置435，写入装置436，声音文件打开装置437，计算装置438和判断装置439。

    首先，分别通过声音文件获取装置410和JPEG文件获取装置420获取声音文件和JPEG文件。这里，声音文件可以是从音频/视频处理设备200中读取的已记录的声音文件，也可以是用户通过录音而获得的声音文件。此外，该声音文件可以具有不同的格式，比如amr文件、wav文件、ogg文件，rm文件、mp3文件、mp4文件或者其它音频文件。同样，该JPEG文件可以是音频/视频处理设备200中读取的已记录的JPEG文件，也可以是正拍摄的JPEG文件。

    在获得声音文件和JPEG文件后，JPEG文件打开装置431以可读写方式打开JPEG文件。搜索装置432在JPEG文件的头文件信息中搜索标记0xFFDA。

    在搜索到标记0xFFDA，读出装置433从JPEG文件中读出标记0xFFDA以后的数据，包括0xFFDA在内，并将所读出的数据输出到缓存装置434中进行缓存。

    在对所读出的数据进行缓存后，移动装置435将文件指针移动到标记0xFFDA的0xFF，并通过写入装置436向JPEG文件中写入0xFFFE标记，用于标识COM域。在写入标记0xFFFE后，移动装置435将文件指针移动两个字节，并通过写入装置436向JPEG文件中写入标记“Place Voice”，其表示JPEG中存在有声音文件。在写入标记“Place Voice”后，写入装置436还向JPEG文件中写入标记extensionlength，其用于指示扩展名长度，以及标记extension，其用于记录扩展名。

    然后，声音文件打开装置437以二进制可读方式打开声音文件，并通过计算装置438计算该声音文件的大小。

    在计算出该声音文件的大小后，判断装置439判断该声音文件的大小是否超过预设值T＝64k-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)。其中，标记0xFFFE、length、“Place Voice”、extension length的长度是不变的。具体地，标记0xFFFE的长度为2字节，Length的长度为2字节，“Place Voice”的长度为11字节，Extension Length的长度为1字节。此外，根据不同的扩展名，标记Extension的长度是可变的，其一般不超过10。因此，该预设值通常被设置为T＝64k-26。

    在该声音文件的大小未超过该预设值时，将声音文件缓存到缓存装置434，然后写入装置436将该声音文件写入JPEG文件。在写入声音文件后，写入装置436再将缓存装置434所存储的0xFFDA及以后的数据写入JPEG文件中。

    在写入原0xFFDA及以后的数据后，计算装置438计算标记0xFFFE、length、“Place Voice”、extension length、extension和声音文件的长度和。然后，移动装置435将JPEG文件指针移动到标记0xFFFE的后面，并通过写入装置436将上述长度和(以两个字节表示)写入到标记length中。

    图5示出了根据本发明的实施例，用于在观看JPEG文件时播放声音文件的JPEG图像浏览装置500的示意图。

    如图5所示，JPEG图像浏览装置500包括JPEG文件打开装置510，确定装置520、移动装置530，读取装置540，缓存装置550，创建装置560以及图像浏览器570。

    首先，JPEG文件打开装置510以可读方式打开JPEG文件。然后，确定装置520在JPEG的头文件中搜索是否存在标记0xFFFE，即COM域。

    在搜索到COM域后，移动装置530将文件指针向后移动两个字节。然后，读取装置540读取11个字节。确定装置520确定所读取的11个字节是否是“Place Voice”。

    在确定单元520确定该JPEG文件中存在声音文件后，读取装置540再读取1个字节，即读取声音文件的扩展名长度。

    在读出扩展名长度后，读取装置540在读取该扩展名长度个字节，以获得文件扩展名。

    在读取文件扩展名后，读取装置540从JPEG中读取出[(标记Length中记录的长度)-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)]个字节，并将该读出的字节送到缓存装置550中进行缓存。

    随后，创建单元560创建一个二进制文件，其文件名为xxxx.amr，在本例中为“Beijing.amr”，并将在缓存装置550中所保存的[(标记Length中记录的长度)-(标记0xFFFE的长度)-(标记length的长度)-(标记Place Voice的长度)-(标记Extension length的长度)-(标记Extension的长度)]个字节写入到该二进制文件中，作为声音文件，并将其输出给图像浏览器570，以供图像浏览器570在观看该JPEG文件时播放该声音文件。

    图6示出了根据本发明的实施例的JPEG图像处理系统600，其包括如图4所示的JPEG图像形成设备400和JPEG图像浏览设备500。

    结合这里公开的实施例描述的方法或者技术可直接体现为硬件，由处理器执行的软件模块，或者这二者的组合。一个软件模块可能驻留在RAM存储器，闪存，ROM存储器，EPROM存储器，EEPROM存储器，寄存器，硬盘，移动磁盘，CD-ROM，或者本领域熟知的任何其他形式的存储介质中。一种存储介质可以与处理器耦合，使得处理器能够从该存储介质中读信息，以及向该存储介质写信息。在替换实例中，存储介质可能与处理器集成。处理器和存储介质可能驻留在一个ASIC中。该ASIC可能驻留在终端或其他地方。在一个替换实例中，处理器和存储介质可以作为终端或其他地方中的分立组件驻留。

    有益效果

    通过以上结合附图对本发明实施例的详细描述，不难看出：利用本发明提供的JPEG图像处理方法和装置，可以将个人感兴趣的信息制成声音文件添加到JPEG文件的COM域中，并且在通过图像浏览器观看该JPEG文件时播放该声音文件，可以使得用户可以在观看多张拍摄的照片时，能够容易地知道关于每张照片的感兴趣的信息，比如该照片的拍摄地点等，从而增加用户的便利性。

    提供所述公开的实施例的上述描述可使得本领域的技术人员能够实现或者使用本发明。但是，对于本领域的技术人员来说，这些实施例的各种修改是显而易见的，并且这里定义的总体原理也可以在不脱离本发明的主旨和范围的基础上应用于其他实施例。因此，本发明并不限于这里示出的实施例，而是与符合这里公开的原理和新颖特征的最广范围相一致。