1 简介
MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。
在高负载的情况下,添加更多的节点,可以保证服务器性能。
MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。
MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。
1.1 主要特点
- MongoDB 是一个面向文档存储的数据库,操作起来比较简单和容易。
- 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName=”Sameer”,Address=”8 Gandhi Road”)来实现更快的排序。
- 你可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性。
- 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。
- Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
- MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
- Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
- Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
- Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
- GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
- MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
- MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
-
1.2 MongoDB 工具
1.2.1 监控
MongoDB提供了网络和系统监控工具Munin,它作为一个插件应用于MongoDB中。
Gangila是MongoDB高性能的系统监视的工具,它作为一个插件应用于MongoDB中。
基于图形界面的开源工具 Cacti, 用于查看CPU负载, 网络带宽利用率,它也提供了一个应用于监控 MongoDB 的插件。1.2.2 GUI
Fang of Mongo – 网页式,由Django和jQuery所构成。
- Futon4Mongo – 一个CouchDB Futon web的mongodb山寨版。
- Mongo3 – Ruby写成。
- MongoHub – 适用于OSX的应用程序。
- Opricot – 一个基于浏览器的MongoDB控制台, 由PHP撰写而成。
- Database Master — Windows的mongodb管理工具
- RockMongo — 最好的PHP语言的MongoDB管理工具,轻量级, 支持多国语言.
2 安装
https://www.mongodb.com/try/download/community
3 启动
mongod.exe
是mongodb服务的启动工具。
我们可以通过mongod --help
查看mongod的所有参数说明,以下是各参数的中文解释。
3.1 基本配置参数
参数 | 说明 |
---|---|
—quiet | # 安静输出 |
—port arg | # 指定服务端口号,默认端口27017 |
—bind_ip arg | # 绑定服务IP,若绑定127.0.0.1,则只能本机访问,不指定默认本地所有IP |
—logpath arg | # 指定MongoDB日志文件,注意是指定文件不是目录 |
—logappend | # 使用追加的方式写日志 |
—pidfilepath arg | # PID File 的完整路径,如果没有设置,则没有PID文件 |
—keyFile arg | # 集群的私钥的完整路径,只对于Replica Set 架构有效 |
—unixSocketPrefix arg | # UNIX域套接字替代目录,(默认为 /tmp) |
—fork | # 以守护进程的方式运行MongoDB,创建服务器进程 |
—auth | # 启用验证 |
—cpu | # 定期显示CPU的CPU利用率和iowait |
—dbpath arg | # 指定数据库路径 |
—diaglog arg | # diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads |
—directoryperdb | # 设置每个数据库将被保存在一个单独的目录 |
—journal | # 启用日志选项,MongoDB的数据操作将会写入到journal文件夹的文件里 |
—journalOptions arg | # 启用日志诊断选项 |
—ipv6 | # 启用IPv6选项 |
—jsonp | # 允许JSONP形式通过HTTP访问(有安全影响) |
—maxConns arg | # 最大同时连接数 默认2000 |
—noauth | # 不启用验证 |
—nohttpinterface | # 关闭http接口,默认关闭27018端口访问 |
—noprealloc | # 禁用数据文件预分配(往往影响性能) |
—noscripting | # 禁用脚本引擎 |
—notablescan | # 不允许表扫描 |
—nounixsocket | # 禁用Unix套接字监听 |
—nssize arg (=16) | # 设置信数据库.ns文件大小(MB) |
—objcheck | # 在收到客户数据,检查的有效性, |
—profile arg | # 档案参数 0=off 1=slow, 2=all |
—quota | # 限制每个数据库的文件数,设置默认为8 |
—quotaFiles arg | # number of files allower per db, requires —quota |
—rest | # 开启简单的rest API |
—repair | # 修复所有数据库run repair on all dbs |
—repairpath arg | # 修复库生成的文件的目录,默认为目录名称dbpath |
—slowms arg (=100) | # value of slow for profile and console log |
—smallfiles | # 使用较小的默认文件 |
—syncdelay arg (=60) | # 数据写入磁盘的时间秒数(0=never,不推荐) |
—sysinfo | # 打印一些诊断系统信息 |
—upgrade | # 如果需要升级数据库 |
3.2 Replicaton 参数
参数 | 说明 |
---|---|
—fastsync | # 从一个dbpath里启用从库复制服务,该dbpath的数据库是主库的快照,可用于快速启用同步 |
—autoresync | # 如果从库与主库同步数据差得多,自动重新同步, |
—oplogSize arg | # 设置oplog的大小(MB) |
3.3 主/从参数
参数 | 说明 |
---|---|
—master | # 主库模式 |
—slave | # 从库模式 |
—source arg | # 从库 端口号 |
—only arg | # 指定单一的数据库复制 |
—slavedelay arg | # 设置从库同步主库的延迟时间 |
3.4 Replica set(副本集)选项:
参数 | 说明 |
---|---|
—replSet arg | # 设置副本集名称 |
3.5 Sharding(分片)选项
—configsvr | # 声明这是一个集群的config服务,默认端口27019,默认目录/data/configdb |
---|---|
—shardsvr | # 声明这是一个集群的分片,默认端口27018 |
—noMoveParanoia | # 关闭偏执为moveChunk数据保存 |
3.6 示例
- ./mongod -shardsvr -replSet shard1 -port 16161 -dbpath /data/mongodb/data/shard1a -oplogSize 100 -logpath /data/mongodb/logs/shard1a.log -logappend -fork -rest
上述参数都可以写入 mongod.conf 配置文档里例如:
- dbpath = /data/mongodb
- logpath = /data/mongodb/mongodb.log
- logappend = true
- port = 27017
- fork = true
- auth = true