mongodb 索引

索引的直接影响查询的效率与速度。mongodb索引规则基本上与传统的关系库一样,大部分优化MySQL索引的技巧也同样适用于mongodb。mongodb介于关系型与非关系型数据之间。

当查询中用到某些条件时,可以对该键建立索引,能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。然而,这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,性能非常低下,没法接受的。

索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构。

1. 创建索引

语法:

>db.COLLECTION_NAME.ensureIndex({KEY:1})

KEY 值为要创建的索引字段,1为指定按升序创建索引,如果你想按降序来创建索引指定为-1即可。

ensureIndex() 也可以设置使用多个字段创建索引(在关系型数据库中称作复合索引)。

实例:

可接受的参数:

Parameter Type Description
background Boolean 建索引过程会阻塞其它数据库操作,background可指定以后台方式创建索引,即增加 “background” 可选参数。 “background” 默认值为false
unique Boolean 建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
name string 索引的名称。如果未指定,MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups Boolean 在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.
sparse Boolean 对文档中不存在的字段数据不启用索引;这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSeconds integer 指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间。
v index version 索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weights document 索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重。
default_language string 对于文本索引,该参数决定了停用词及词干和词器的规则的列表。 默认为英语
language_override string 对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language.

2.  查询已有索引

语法:

> db.COLLECTION_NAME.getIndexes()

3. 查询索引大小

语法:

>  db.COLLECTION_NAME.totalIndexSize()

4. 删除索引

语法:

db.COLLECTION_NAME.dropIndex(index)

db.COLLECTION_NAME.dropIndexes()   //删除全部索引,_id索引不会被删除

5. 索引种类

1). 默认索引:每个collection都会有一个默认主键_id,不能删除不能更改,当collection创建后,_id索引自动创建。

2). 单列索引

3). 组合索引

4). 子文档索引:为内嵌文档的键创建索引。如:

需要对registerdae创建索引,如:

> db.COLLECTION_NAME.ensureIndex({ “TIME.registerdate” : 1},{‘background’:true})

5). 唯一索引:唯一索引可以确保指定的键的唯一性,当文档不存在指定的键时,会被认为键值为null。在创建唯一索引时,可能需要加上dropDups选项来删除重复的文档,慎用。

6). sparse索引:解决索引文件过大的问题。不会对该键值为空的行做索引。

7). covered索引:如果你查找的值正好是在索引中,则可以直接返回索引中存的值,而不用到数据文件中查找。当用explain时,当indexOnly=true,表示有用到covered index。

8). 全文索引:

6. 强制使用索引

如果发现用了非预期的索引,可以用hint来强制使用某个索引。如:

> db.COLLECTION_NAME.find({ “TIME.registerdate”: { $gte: “2014-04-19” }}).hint(“TIME.registerdate_1”)

大多数情况下没必要指定,mongodb会选择用哪个索引,初次查询时,查询优化器会同时尝试各种查询方案,最先完成的被确定使用,其他的则终止掉。查询方案也会记录下来,查询优化器也会定期重试其他的方案,以防新的数据增加或索引改变,之前的方案不再是最优的。

7. explain和profile

参见《mongodb索引&explain&profile