On this page
二级索引
像 Deno KV 这样的键值存储将数据组织为键值对的集合,其中每个唯一的键都与单个值关联。这样的结构使得可以根据键轻松检索值,但不允许根据值本身进行查询。为了克服这一限制,您可以创建二级索引,它在包含(部分)该值的附加键下存储相同的值。
倾向于在二级索引中将主键(或对主键的紧凑引用)作为值存储。这可以减少存储使用,并避免维护多个相同数据副本的同步。代价是在通过索引查询时需要双重读取(索引 → 主键)。
优点
- 降低存储和写入放大
- 在非索引字段更改时减少更新次数
- 事务更新更清晰:同时更新主键和索引
缺点
- 需要第二次读取以解析主值
- 必须以原子方式维护引用完整性(在单个事务中创建/更新/删除)
在使用二级索引时,保持主键与二级键之间的一致性至关重要。如果在主键处更新了一个值,但没有在二级键处更新,则通过针对二级键的查询返回的数据将是不正确的。为了确保主键和二级键始终表示相同的数据,在插入、更新或删除数据时使用原子操作。这种方法确保一组变更操作作为一个单元执行,或者全部成功或者全部失败,从而防止不一致。
唯一索引(一对一) Jump to heading
唯一索引将索引中的每个键与确切的一个主键关联。例如,当存储用户数据并通过唯一的 ID 和电子邮件地址查找用户时,可以将用户数据存储在两个单独的键下:一个用于主键(用户 ID),另一个用于二级索引(电子邮件 → 用户 ID)。这种设置允许根据用户的 ID 或电子邮件查询用户。二级索引还可以对存储中的值施加唯一性约束。在用户数据的例子中,使用该索引确保每个电子邮件地址只与一个用户关联——换句话说,确保电子邮件是唯一的。
要实现这个例子的唯一二级索引,请按照以下步骤操作:
-
创建一个表示数据的
User接口:interface User { id: string; name: string; email: string; } -
定义一个
insertUser函数,在主键和二级键上存储用户数据:async function insertUser(user: User) { const primaryKey = ["users", user.id] as const; const byEmailKey = ["users_by_email", user.email.toLowerCase()] as const; const res = await kv.atomic() .check({ key: primaryKey, versionstamp: null }) .check({ key: byEmailKey, versionstamp: null }) .set(primaryKey, user) // 存储指针,而非完整用户数据 .set(byEmailKey, user.id) .commit(); if (!res.ok) { throw new TypeError("ID 或电子邮件已存在的用户"); } }该函数使用原子操作进行插入,检查没有具有相同 ID 或电子邮件的用户存在。如果违反其中任何一项约束,插入将失败且不会修改任何数据。
-
定义一个
getUser函数,根据用户 ID 检索用户:async function getUser(id: string): Promise<User | null> { const res = await kv.get<User>(["users", id]); return res.value; } -
定义一个
getUserByEmail函数,通过电子邮件地址检索用户:async function getUserByEmail(email: string): Promise<User | null> { const idRes = await kv.get<string>([ "users_by_email", email.toLowerCase(), ]); if (!idRes.value) return null; const res = await kv.get<User>(["users", idRes.value]); return res.value; }该函数使用二级键进行存储查询(
["users_by_email", email])。 -
定义一个
deleteUser函数,通过用户 ID 删除用户:async function deleteUser(id: string) { let res = { ok: false } as { ok: boolean }; while (!res.ok) { const cur = await kv.get<User>(["users", id]); if (cur.value === null) return; res = await kv.atomic() .check(cur) .delete(["users", id]) .delete(["users_by_email", cur.value.email.toLowerCase()]) .commit(); } }该函数首先通过用户 ID 检索用户,以获取用户的电子邮件地址。这是获取用户地址的二级索引键所需的。然后执行原子操作,检查数据库中的用户未更改,并删除指向用户值的主键和二级键。如果此操作失败(用户在查询和删除之间被修改),则原子操作将中止。整个过程将重试直到删除成功。检查是必需的,以防止在检索和删除之间值被修改的竞争条件。如果更新更改了用户的电子邮件,则会发生这种竞争,因为在这种情况下二级索引发生变化。然后二级索引的删除将失败,因为删除的目标是旧的二级索引键。
非唯一索引(一对多) Jump to heading
非唯一索引是二级索引,其中单个键可以与多个主键关联,使您能够根据共享属性查询多个项目。例如,当根据用户的最爱颜色查询用户时,可以使用非唯一二级索引来实现。最爱颜色是一个非唯一属性,因为多个用户可以拥有相同的最爱颜色。
要为这个例子实现一个非唯一二级索引,请按照以下步骤操作:
-
定义
User接口:interface User { id: string; name: string; favoriteColor: string; } -
定义
insertUser函数:async function insertUser(user: User) { const primaryKey = ["users", user.id] as const; const byColorKey = [ "users_by_favorite_color", user.favoriteColor, user.id, ] as const; await kv.atomic() .check({ key: primaryKey, versionstamp: null }) .set(primaryKey, user) // 存储指针,而非完整用户数据 .set(byColorKey, user.id) .commit(); } -
定义一个函数,根据用户的最爱颜色检索用户:
async function getUsersByFavoriteColor(color: string): Promise<User[]> { const iter = kv.list<string>({ prefix: ["users_by_favorite_color", color], }); const ids: string[] = []; for await (const { value: id } of iter) { ids.push(id); } if (ids.length === 0) return []; const results = await kv.getMany<User>( ids.map((id) => ["users", id] as const), ); return results.map((r) => r.value!).filter(Boolean); }
这个例子演示了非唯一二级索引的使用,users_by_favorite_color,该索引允许根据用户的最爱颜色进行查询。主键仍然是用户的 id。
唯一索引和非唯一索引的实现主要区别在于二级键的结构和组织。在唯一索引中,每个二级键与确切的一个主键关联,确保索引属性在所有记录中是唯一的。在非唯一索引的情况下,单个二级键可以与多个主键关联,因为索引属性可能在多个记录中共享。为了实现这一点,非唯一二级键通常以附加的唯一标识符(例如主键)作为键的一部分来构建,从而允许多个具有相同属性的记录共存,而不会发生冲突。
在何种情况下复制值可能是可接受的 Jump to heading
虽然推荐使用指针索引,但在以下情况下,在二级索引中复制完整值是可以接受的:
- 值较小且读取几乎完全通过二级索引发生
- 希望避免第二次读取,可以容忍额外的存储开销
- 可以通过原子事务可靠地保持主键和二级索引同步
如果复制值,确保插入/更新/删除操作在同一个原子事务中同时修改两个键。
从复制值索引迁移 Jump to heading
迁移已存在的复制值索引到指针索引:
- 回填:扫描主键并将二级索引值设置为主键(例如用户 ID)。
- 切换:更新写入路径以维护指针索引;临时保留旧索引以支持读取。
- 清理:切换读取器使用指针索引,然后删除重复的索引条目。