Android MediaProvider数据库模式

来源：互联网发布：kali linux 使用教程编辑：程序博客网时间：2024/06/06 00:50

摘要： Android MediaProvider 使用 SQLite 数据库存储图片、视频、音频等多媒体文件的信息，供视频播放器、音乐播放器、图库使用。本文详细分析了 Android MediaProvider 多媒体数据库（以 SDK 2.3.3 为例）的模式（schema），并简要叙述与系统媒体扫描服务 MediaScanner 的交互。

1. 如何提取数据库

以 root 权限进入 adb shell，使用 sqlite3 打开位于手机上 /data/data/com.android.providers.media/databases上的一个数据库。以 external 开头的数据库存储的是 SD 卡媒体信息，一张卡对应一个，所以如果手机使用过多张卡会有多个数据库。以 internal 开头的数据库存储手机内部存储器的媒体信息。因为一般用户无法访问手机内部存储器，而且这两个数据库结构是大体上是相同的，所以只需要关注 external 数据库即可。

Note: 数据库都是以类似 external-ffffffff.db 的形式命名的，后面的 8 个 16 进制字符是该 SD 卡 FAT 分区的 Volume ID。该 ID 是分区时决定的，只有重新分区或者手动改变才会更改，可以防止插入不同 SD 卡时数据库冲突。要简单了解 FAT 文件系统请看 Understanding FAT Filesystems

接着在 sqlite3 执行命令 .schema 即可导出创建数据库的 SQL 语句，也就是数据库模式，具体如下（单击展开代码）：

Note: 如果手机没有 sqlite3 程序，可以搜索编译过的源代码的 out 目录找到可执行文件，大约 90kb，然后 adb push 到手机的 /system/bin/ 目录。安装 sqlite3、查询数据库均需要 adb root 权限。 Android 的多媒体数据库主要由表、视图、索引以及触发器组成。

接着还需要把数据库转换成图，手工转换的话就是根据 SQL 语句自行画图；推荐懒人使用自动转换，先使用 adb pull 把数据库导出，再使用 Power Designer 或者 Visio 的逆向工程（Reverse Engineer）功能生成物理数据模型（Physical Data Model）。注意要连接 sqlite 数据库文件的话需要先安装 sqlite 的 ODBC 驱动，教程在这里：SQLite ODBC Driver

2. 数据库模式分析

图片数据库

图片数据库由两个表组成，分别是 images 和 thumbnails，物理数据模型如下所示（Power Designer 逆向工程生成）

Note: 如何数据库物理模型图：<pk> 表示此为主键。其余的表名、字段名、数据类型应该都能看明白。

Note: SQLite 从 3.6.19 版才开始支持外键约束，Android 2.3.3 使用的是 3.7.x，但并没有使用此特性，而是通过操作数据库的程序（如 MediaScanner）以及触发器来维护数据库的一致性。这里可以了解 SQLite 的外键支持情况

数据表字段解析如下：

images：图片信息字段解析_id主键。图片 id，从 1 开始自增_data图片绝对路径_size文件大小，单位为 byte_display_name文件名mime_type类似于 image/jpeg 的 MIME 类型title不带扩展名的文件名date_added添加到数据库的时间，单位秒date_modified文件最后修改时间，单位秒description picasa_id用于 picasa 网络相册isprivate latitude纬度，需要照片有 GPS 信息longitude经度，需要照片有 GPS 信息datetaken取自 EXIF 照片拍摄时间，若为空则等于文件修改时间，单位毫秒orientation取自 EXIF 旋转角度，在图库旋转图片也会改变此值mini_thumb_magic取小缩略图时生成的一个随机数，见 MediaThumbRequestbucket_id等于 path.toLowerCase.hashCode()，见 MediaProvider.computeBucketValues()bucket_display_name直接包含图片的文件夹就是该图片的 bucket，就是文件夹名thumbnails：缩略图字段解析_id主键。缩略图 id，从 1 开始自增_data图片绝对路径image_id缩略图所对应图片的 id，依赖于 images 表 _id 字段，可建立外键kind缩略图类型，1 是大缩略图，2 基本不用，3 是微型缩略图但其信息不保存在数据库width缩略图宽度height缩略图高度

视频数据库

数据表字段解析如下：

video：视频信息字段解析_id主键。视频 id_data视频绝对路径_display_name文件名_size文件大小，单位为 bytemime_type类似于 video/avi 的 MIME 类型date_added添加到数据库的时间，单位秒date_modified文件最后修改时间，单位秒title不带扩展名的文件名duration视频时长，单位毫秒artist艺术家album专辑名，一般为文件夹名resolution description isprivate tags category language mini_thumb_data latitude longitude datetaken mini_thumb_magic取小缩略图时生成的一个随机数，见 MediaThumbRequestbucket_id等于 path.toLowerCase.hashCode()，见 MediaProvider.computeBucketValues()bucket_display_name直接包含视频的文件夹就是该图片的 bucket，就是文件夹名bookmark videothumbnails：视频缩略图字段解析_id主键。缩略图 id_data缩略图绝对路径video_id缩略图所对应视频的 id，依赖于 video 表 _id 字段kind缩略图类型，1 是大图，视频只能取类型 1width缩略图宽度height缩略图高度

音频数据库

音频数据库是最复杂的，由 10 个表组成。物理数据模型如下所示：

album_art：专辑封面字段解析album_id主键。专辑 id_data专辑封面缓存的路径albums：专辑信息字段解析album_id主键。专辑 idalbum_key全大写字母，用于字母索引album专辑名android_metadata：当前字符编码字段解析locale默认字符编码，例如 zh_CNartists：艺术家字段解析artist_id主键。艺术家 idartist_key全大写字母，用于字母索引artist艺术家audio_genres：流派字段解析_id主键。流派 idname流派名称audio_genres_map：音频流派映射字段解析_id主键。映射 idaudio_id音频 idgenre_id流派 id

Note: 为何要建立映射表：为了消除数据冗余。假如有大量音频属于同一流派，如果没有映射表则需要每个音频都需要记录同样的流派数据，有了映射表之后则只有一条记录就够了。这符合数据库设计的第三范式（the 3rd normal form）

audio_meta：音频信息字段解析_id主键。音频 id_data文件绝对路径_display_name文件名_size文件大小，单位 bytemime_type类似于 audio/mpeg 的 MIME 类型date_added添加到数据库的时间，单位秒date_modified文件最后修改时间，单位秒title来自 ID3 信息的标题，无则为不带扩展名的文件名title_key全大写字母的标题duration时长artist_id艺术家 idcomposer来自 ID3 信息，作曲家album_id专辑 idtrack来自 ID3 信息，音轨year来自 ID3 信息，年代is_ringtone是否铃声，0 或 1is_music是否音乐，1 才会在音乐播放器显示is_alarm是否闹钟铃声is_notification是否通知铃声is_podcast是否 podcastbookmark audio_playlists：播放列表字段解析_id主键。播放列表 id_data name播放列表名date_added date_modified audio_playlists_map：音频播放列表映射字段解析_id主键。映射 idaudio_id音频 idplaylist_id播放列表 idplay_order播放顺序

索引

在 Android 数据库当中基本上使用自增 id 值作为主键，并建立了索引。索引可以加快数据查找速度，但由于需要维护索引所以插入/删除等写入操作速度会变慢。索引如下：

1CREATE INDEX album_id_idx onaudio_meta(album_id);
2CREATE INDEX album_idx onalbums(album);
3CREATE INDEX albumkey_index onalbums(album_key);
4CREATE INDEX artist_id_idx onaudio_meta(artist_id);
5CREATE INDEX artist_idx onartists(artist);
6CREATE INDEX artistkey_index onartists(artist_key);
7CREATE INDEX image_bucket_index ONimages(bucket_id, datetaken);
8CREATE INDEX image_id_index onthumbnails(image_id);
9CREATE INDEX sort_index onimages(datetaken ASC, _id ASC);
10CREATE INDEX title_idx onaudio_meta(title);
11CREATE INDEX titlekey_index onaudio_meta(title_key);
12CREATE INDEX video_bucket_index ONvideo(bucket_id, datetaken);
13CREATE INDEX video_id_index onvideothumbnails(video_id);

由于比较简单就不解释了，要深入了解索引可以参考这个关于 SQL Server 的分析MySQL索引背后的数据结构及算法原理，原理应该是差不多的。

视图

视图类似于表，但并非独立存在，是从其他表里面查询数据得到的。使用视图可以加快数据库查询速度，不用每次都执行复杂的 SQL 语句查询。图如下所示：

Note: 如何看视图：图下面的部分是数据来源的表，中间是从表中选取的字段，但类似于 COUNT 等 SQL 查询操作无法在图上体现，最好还是看实际 SQL 语句。

Note: SQLite 当中视图都是只读的，也就是说不能对视图进行插入、更新、删除等操作。但是可以在视图建立INSTEAD OF 触发器来达到同样的目的，多媒体数据库当中的 audio_delete 触发器就是如此。

触发器

触发器是为了维护数据库删除操作而建立的，因为所删除的表可能与另外的表有关系，需要同时删除另外一个表的字段。可以看以下一个例子：

1CREATE TRIGGER audio_meta_cleanup
2DELETE ON audio_meta
3BEGIN
4    DELETE FROM audio_genres_mapWHERE audio_id = old._id;
5    DELETE FROM audio_playlists_mapWHERE audio_id = old._id;
6END;

这是关于 audio_meta 表的触发器，意思是当删除此表上的记录时，同时删除 audio_genres_map 表上 audio_id 与此表 id 相同的记录，删除 audio_playlists_map 表上 audio_id 与此表 id 相同的记录。这样当删除 audio_meta 表的记录时，另外两个表的相应记录也会自动删除，不会由于漏删除而残留多余数据。

3. 如何维护数据库

插入

插入、更新主要由 MediaScanner 进行，当删除/移动媒体文件时 MediaScanner 会扫描磁盘并更新数据库。数据插入主要在 endFile() 方法中进行，例如插入音频记录时相关的表都会插入相应的记录。而图片、视频缩略图，专辑封面这几个则是第一次取图片的时候才会生成缩略图保存到磁盘，并把记录插入到数据库中。

删除

删除操作主要由触发器维护。例如当一个应用删除图片时，一般只会删除图片数据库，所以必须要有触发器同时删除缩略图数据库。

转：http://my.oschina.net/u/259928/blog/53203

0 0