1 简介

MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。
在高负载的情况下,添加更多的节点,可以保证服务器性能。
MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。
MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。
一 简介与安装 - 图1


1.1 主要特点

  • MongoDB 是一个面向文档存储的数据库,操作起来比较简单和容易。
  • 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName=”Sameer”,Address=”8 Gandhi Road”)来实现更快的排序。
  • 你可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性。
  • 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。
  • Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
  • MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
  • Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
  • Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
  • Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
  • GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
  • MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
  • MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
  • MongoDB安装简单。

    1.2 MongoDB 工具

    有几种可用于MongoDB的管理工具。

    1.2.1 监控

    MongoDB提供了网络和系统监控工具Munin,它作为一个插件应用于MongoDB中。
    Gangila是MongoDB高性能的系统监视的工具,它作为一个插件应用于MongoDB中。
    基于图形界面的开源工具 Cacti, 用于查看CPU负载, 网络带宽利用率,它也提供了一个应用于监控 MongoDB 的插件。

    1.2.2 GUI

  • Fang of Mongo – 网页式,由Django和jQuery所构成。

  • Futon4Mongo – 一个CouchDB Futon web的mongodb山寨版。
  • Mongo3 – Ruby写成。
  • MongoHub – 适用于OSX的应用程序。
  • Opricot – 一个基于浏览器的MongoDB控制台, 由PHP撰写而成。
  • Database Master — Windows的mongodb管理工具
  • RockMongo — 最好的PHP语言的MongoDB管理工具,轻量级, 支持多国语言.

2 安装

https://www.mongodb.com/try/download/community

3 启动

mongod.exe是mongodb服务的启动工具。
我们可以通过mongod --help查看mongod的所有参数说明,以下是各参数的中文解释。

3.1 基本配置参数

参数 说明
—quiet # 安静输出
—port arg # 指定服务端口号,默认端口27017
—bind_ip arg # 绑定服务IP,若绑定127.0.0.1,则只能本机访问,不指定默认本地所有IP
—logpath arg # 指定MongoDB日志文件,注意是指定文件不是目录
—logappend # 使用追加的方式写日志
—pidfilepath arg # PID File 的完整路径,如果没有设置,则没有PID文件
—keyFile arg # 集群的私钥的完整路径,只对于Replica Set 架构有效
—unixSocketPrefix arg # UNIX域套接字替代目录,(默认为 /tmp)
—fork # 以守护进程的方式运行MongoDB,创建服务器进程
—auth # 启用验证
—cpu # 定期显示CPU的CPU利用率和iowait
—dbpath arg # 指定数据库路径
—diaglog arg # diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads
—directoryperdb # 设置每个数据库将被保存在一个单独的目录
—journal # 启用日志选项,MongoDB的数据操作将会写入到journal文件夹的文件里
—journalOptions arg # 启用日志诊断选项
—ipv6 # 启用IPv6选项
—jsonp # 允许JSONP形式通过HTTP访问(有安全影响)
—maxConns arg # 最大同时连接数 默认2000
—noauth # 不启用验证
—nohttpinterface # 关闭http接口,默认关闭27018端口访问
—noprealloc # 禁用数据文件预分配(往往影响性能)
—noscripting # 禁用脚本引擎
—notablescan # 不允许表扫描
—nounixsocket # 禁用Unix套接字监听
—nssize arg (=16) # 设置信数据库.ns文件大小(MB)
—objcheck # 在收到客户数据,检查的有效性,
—profile arg # 档案参数 0=off 1=slow, 2=all
—quota # 限制每个数据库的文件数,设置默认为8
—quotaFiles arg # number of files allower per db, requires —quota
—rest # 开启简单的rest API
—repair # 修复所有数据库run repair on all dbs
—repairpath arg # 修复库生成的文件的目录,默认为目录名称dbpath
—slowms arg (=100) # value of slow for profile and console log
—smallfiles # 使用较小的默认文件
—syncdelay arg (=60) # 数据写入磁盘的时间秒数(0=never,不推荐)
—sysinfo # 打印一些诊断系统信息
—upgrade # 如果需要升级数据库

3.2 Replicaton 参数

参数 说明
—fastsync # 从一个dbpath里启用从库复制服务,该dbpath的数据库是主库的快照,可用于快速启用同步
—autoresync # 如果从库与主库同步数据差得多,自动重新同步,
—oplogSize arg # 设置oplog的大小(MB)

3.3 主/从参数

参数 说明
—master # 主库模式
—slave # 从库模式
—source arg # 从库 端口号
—only arg # 指定单一的数据库复制
—slavedelay arg # 设置从库同步主库的延迟时间

3.4 Replica set(副本集)选项:

参数 说明
—replSet arg # 设置副本集名称

3.5 Sharding(分片)选项

—configsvr # 声明这是一个集群的config服务,默认端口27019,默认目录/data/configdb
—shardsvr # 声明这是一个集群的分片,默认端口27018
—noMoveParanoia # 关闭偏执为moveChunk数据保存

3.6 示例

  1. ./mongod -shardsvr -replSet shard1 -port 16161 -dbpath /data/mongodb/data/shard1a -oplogSize 100 -logpath /data/mongodb/logs/shard1a.log -logappend -fork -rest

上述参数都可以写入 mongod.conf 配置文档里例如:

  1. dbpath = /data/mongodb
  2. logpath = /data/mongodb/mongodb.log
  3. logappend = true
  4. port = 27017
  5. fork = true
  6. auth = true