Tag Archives: MongoDB

精通 MEAN: MEAN 堆栈

在 2002 年的一本著作中,David Weinberger 将发展迅速的 Web 内容描述成一个 小块松散组合(Small Pieces                    Loosely Joined)。这个比喻让我印象深刻,因为大家一般很容易认为 Web                 是一个巨大的技术堆栈。实际上,您访问的每个网站都是库、语言与 Web 框架的一种独特组合。

LAMP 堆栈 是早期表现突出的开源                 Web 技术集合之一:它使用 Linux® 作为操作系统,使用 Apache 作为 Web 服务器,使用 MySQL 作为数据库,并使用                 Perl(或者 Python 和 PHP)作为生成基于 HTML Web                 页面的编程语言。这些技术的出现并非为了一起联合工作。它们是独立的项目,由多位雄心勃勃的软件工程师前赴后继地整合在一起。自那以后,我们就见证了 Web                 堆栈的大爆发。每一种现代编程语言似乎都有一个(或两个)对应的 Web                 框架,可将各种混杂的技术预先组装在一起,快速而又轻松地创建一个新的网站。

MEAN 堆栈是 Web 社区中赢得大量关注和令人兴奋的一种新兴堆栈:MongoDBExpressAngularJSNode.js。MEAN 堆栈代表着一种完全现代的 Web                 开发方法:一种语言运行在应用程序的所有层次上,从客户端到服务器,再到持久层。本系列文章演示了一个 MEAN Web                 开发项目的端到端开发情况,但这种开发并不仅限于简单的语法。本文将通过作者的亲身实践向您深入浅出地介绍了该堆栈的组件技术,包括安装与设置。参见 下载 部分,以便获取示例代码。

关于本系列

在使用开源软件构建专业网站领域时,MEAN(MongoDB、Express、AngularJS 和 Node.js)堆栈是对流行已久的                     LAMP 堆栈的一个新兴挑战者。MEAN 代表着架构与心理模型(mental model)方面的一次重大变迁:从关系数据库到                     NoSQL,以及从服务器端的模型-视图-控制器到客户端的单页面应用程序。本系列文章将介绍 MEAN                     堆栈技术如何互补,以及如何使用堆栈创建二十一世纪的、现代的全堆栈 JavaScript Web 应用程序。

“实际上,您访问的每个网站都是库、语言与 Web 框架的独特组合。”

 

从 LAMP 到 MEAN

MEAN 不仅仅是一次首字母缩写的简单重新安排与技术升级。将基础平台从操作系统 (Linux) 转变为 JavaScript 运行时                 (Node.js) 让操作系统变得独立:Node.js 在 Windows® 与 OS X 上的运行情况和在 Linux 上一样优秀。

Node.js 同样取代了 LAMP 堆栈中的 Apache。但 Node.js 远远不止是一种简单的 Web                 服务器。事实上,用户不会将完成后的应用程序部署到单机的 Web 服务器上;相反,Web 服务器已经包含在应用程序中,并已在 MEAN                 堆栈中自动安装。结果,部署过程得到了极大简化,因为所需的 Web 服务器版本已经与余下的运行时依赖关系一起得到了明确定义。

不仅是 MEAN

尽管本系列文章重点讲述的是 MEAN 太阳系中的四大行星,但也会介绍 MEAN 堆栈中的一些较小的(但并非不重要的)卫星类技术:

从传统数据库(如 MySQL)到 NoSQL,再到无架构的、以文档为导向的持久存储(如                 MongoDB),这些代表着持久化策略发生了根本性的转变。用户花费在编写 SQL 上的时间将会减少,将会有更多的时间编写 JavaScript                 中的映射/化简功能。用户还能省掉大量的转换逻辑,因为 MongoDB 可以在本地运行 JavaScript Object Notation                    (JSON)。因此,编写 RESTful Web 服务变得前所未有的容易。

但从 LAMP 到 MEAN 的最大转变在于从传统的服务器端页面生成变为客户端 单页面应用程序                     (SPA)。借助 Express 仍然可以处理服务器端的路由与页面生成,但目前的重点在客户端视图上,而 AngularJS                 可以实现这一点。这种变化并不仅仅是将 模型-视图-控制器 (MVC)                 工件从服务器转移到客户端。用户还要尝试从习惯的同步方式转而使用基本由事件驱动的、实质上为异步的方式。或许最重要的一点是,您将从以页面为中心的应用程序视图转到面向组件的视图。

MEAN 堆栈并非以移动为中心,AngularJS                 在桌面电脑、笔记本电脑、智能手机、平板电脑和甚至是智能电视上的运行效果都一样,但它不会把移动设备当作二等公民对待。而且测试事后不再是问题:借助世界级的测试框架,比如                     MochaJSJasmineJSKarmaJS,您可以为自己的 MEAN                 应用程序编写深入而又全面的测试套件。

准备好获得 MEAN 了吗?


回页首

安装 Node.js

您需要安装 Node.js,以便在本系列中的示例应用程序上工作,如果尚未安装它,那就立刻开始安装吧。

如果使用 UNIX® 风格的操作系统(Linux、Mac OS X 等),我推荐使用 Node Version Manager                    (NVM)。(否则,在 Node.js 主页上单击                     Install,下载适合您操作系统的安装程序,然后接受默认选项即可。)借助 NVM,您可以轻松下载                 Node.js,并从命令行切换各种版本。这可以帮助您从一个版本的 Node.js 无缝转移到下一版本,就像我从一个客户项目转到下一个客户项目一样。

NVM 安装完毕后,请输入命令 nvm ls-remote 查看哪些 Node.js 版本可用于安装,如清单 1 中所示。

清单 1. 使用 NVM 列出可用的 Node.js                 版本

输入 nvm ls 命令可以显示本地已经安装的 Node.js 版本,以及目前正在使用中的版本。

在撰写本文之际,Node 网站推荐 v0.10.28 是最新的稳定版本。输入 nvm install v0.10.28                 命令在本地安装它。

安装 Node.js 后(通过 NVM 或平台特定的安装程序均可),可以输入 node --version                 命令来确认当前使用的版本:


回页首

什么是 Node.js?

Node.js 是一种 headless JavaScript 运行时。它与运行在 Google Chrome 内的 JavaScript                 引擎(名叫 V8)是一样的,但使用 Node.js 可以从命令行(而非浏览器)运行 JavaScript。

访问浏览器的开发人员工具

熟悉自己所选浏览器中的开发人员工具。我将在整个系列中通篇使用 Google Chrome,但用户可以自行选择使用 Firefox、Safari                     或者甚至是 Internet Explorer。

  • 在 Google Chrome 中,单击 Tools > JavaScript                            Console
  • 在 Firefox 中,单击 Tools > Web Developer > Browser                            Console
  • 在 Safari 中,单击 Develop > Show Error                        Console。(如果看不到 Develop 菜单,可以在 Advanced preferences 页面上单击                             Show Develop menu in menu bar。)
  • 在 Internet Explorer 中,单击 Developer Tools > Script >                            Console

我曾有些学生嘲笑过从命令行运行 JavaScript 的主意:“如果没有要控制的 HTML,那 JavaScript 还有什么好处呢?”                 JavaScript 是在浏览器(Netscape Navigator 2.0)中来到这个世界的,因此那些反对者的短视和天真是可以原谅的。

事实上,JavaScript 编程语言并未针对 文档对象模型 (DOM) 操作或形成 Ajax 请求提供本地功能。该浏览器提供了 DOM API,可以方便用户使用                 JavaScript 来完成这类工作,但在浏览器之外的地方,JavaScript 不具备这些功能。

下面给出了一个例子。在浏览器中打开一个 JavaScript 控制台(参见 访问浏览器的开发人员工具)。输入 navigator.appName。获得响应后,请输入                 navigator.appVersion。得到的结果类似于图 1 中所示。

图 1. 在 Web 浏览器中使用 JavaScript navigator                     对象

在 Web 浏览器中使用 navigator JavaScript 对象的屏幕截图

在图 1 中,Netscape 是对 navigator.appName 的响应,而对                 navigator.appVersion 的响应则是经验丰富的 Web                 开发人员已经熟知但爱恨不一的、神秘的开发人员代理字符串。在图 1 中(截自 OS X 上的 Chrome 浏览器),该字符串是                 5.0 (Macintosh; Intel Mac OS X 10_9_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36

现在,我们要创建一个名为 test.js 的文件。在文件中输入同样的命令,并将每个命令包含在 console.log()                 调用中:

保存文件并输入 node test.js 来运行它,如清单 2 中所示。

清单 2. 查看 Node.js 中的                     navigator is not defined 错误

正如您看到的那样,navigator 在浏览器中可用,但在 Node.js 中不可用。(不好意思,让您的第一个                 Node.js 脚本失败了,但我想确保让您相信,在浏览器中运行 JavaScript 与在 Node.js 中运行它是不同的。)

根据堆栈跟踪的情况,正确的 Module 没有得到加载。(Modules 是在浏览器中运行 JavaScript 与在                 Node.js 中运行它之间的另一主要区别。我们将立刻讲述 Modules 的更多相关内容。)为了从 Node.js 获得类似的信息,请将                 test.js 的内容修改为:

再次输入 node test.js,可以看到类似于清单 3 中的输出。

清单 3. 在 Node.js                 中使用过程模块

在 Node.js 中成功运行第一个脚本之后,我们将接触下一个主要概念:模块。


回页首

什么是模块?

可以在 JavaScript 中创建单一功能的函数,但与在 Java、Ruby 或 Perl 中不同,无法将多个函数打包到一个能够导入导出的内聚模块或                 ”包“ 中。当然,使用 <script> 元素可以包含任意 JavaScript                 源代码文件,但这种历史悠久的方法在两个关键方面缺少正确的模块声明。

首先,使用 <script> 元素包含的任意 JavaScript                 将被加载到全局命名空间中。使用模块可以导入的函数被封装在一个局部命名的变量中。其次,同时更为关键的是,可以使用模块显式地声明依赖关系,而使用                 <script> 元素则做不到这一点。结果,导入 Module A 时也会同时导入依赖的 Modules B                 和 C。当应用程序变得复杂时,传递依赖关系管理很快将成为一种关键需求。

CommonJS

顾名思义,CommonJS 项目定义了一种通用的模块格式(包括其他浏览器之外的 JavaScript 规范)。Node.js 属于众多非官方的                     CommonJS 实现之一。RingoJS (类似于 Node.js 的一种应用服务器,运行在 JDK 上的 Rhino/Nashorn                    JavaScript 运行时之上) 基于 CommonJS,流行的 NoSQL 持久存储 CouchDB 和 MongoDB 也是如此。

模块是用户衷心期盼的下一 JavaScript 主要版本 (ECMAScript 6) 的功能,但直到该版本被广泛接受之前,Node.js                 目前使用的是它自己基于 CommonJS                 规范的模块版本。

使用 require 关键字可以在脚本中包含 CommonJS 模块。例如,清单 4 是对 Node.js 主页上的                 Hello World 脚本稍微进行修改后的版本。创建一个名为 example.js 的文件,并将清单 4 中的代码复制到其中。

清单 4. Node.js 中的 Hello                World

输入 node example.js 命令运行新的 Web 服务器,然后在 Web 浏览器中访问 http://127.0.0.1:9090

看一看清单 4 中的头两行。您很可能写过几百次(或几千次)像 var port = 9090;                 这样的简单语句。这条语句定义了一个名为 port 的变量,并将数字 9090 赋值给它。第一行                 (var http = require('http');) 用于导入一个 CommonJS 模块。它引入                 http 模块并将它指派给一个局部变量。 and assigns it to a local variable. All                of the corresponding modules that http 依赖的所有对应模块也同时被                 require 语句导入。

example.js 后面的代码行:

  1. 创建一个新的 HTTP 服务器。
  2. 指定一个函数来处理响应。
  3. 开始监听指定端口上进入的 HTTP 请求。

这样通过寥寥几行 JavaScript 代码,就可以在 Node.js 中创建了一个简单的 Web                 服务器。在本系列随后的文章中您会看到,Express 将这个简单的例子被扩展用于处理更为复杂的路由,同时还将提供静态与动态生成的资源。

http 模块是 Node.js 安装的标准组件之一。其他标准的 Node.js 模块还支持文件                 I/O,读取来自用户的命令行输入,处理底层的 TCP 和 UDP 请求等等。访问 Node.js 文档的 Modules                 部分,查看标准模块的完整列表并了解它们的功能。

尽管模块列表内容十分丰富,但与可用的第三方模块列表相比,仍然是小巫见大巫。要访问它们,您需要熟悉另一个命令行实用工具:NPM。


回页首

什么是 NPM?

NPM 是 Node Packaged Modules 的简写。要查看包含超过 75,000 个公用第三方 Node 模块的清单,请访问 NPM 网站。在网站上搜索 yo                 模块。图 2 显示了搜索结果。

图 2. yo 模块的详细情况

显示了 yo 模块的详细信息的 NPM 搜索结果的屏幕截图

结果页面简要介绍了该模块(搭建 Yeoman 项目的 CLI                 工具),并显示它在过去一天、一周和一月内被下载的次数、编写该模块的作者、它依赖于哪些其他的模块(如果存在)等内容。最重要的是,结果页面给出了安装该模块的命令行语法。

要从命令行获取关于 yo 模块的类似信息,请输入 npm info yo                 命令。(如果您还不知道模块的官方名称,可以输入 npm search yo 来搜索名称中包含字符串                 yo 的所有模块。)npm info 命令显示模块的 package.json 文件的内容。

了解 package.json

每个 Node.js 模块都必须关联一个格式良好的 package.json 文件,因此,熟悉此文件的内容是值得的。清单 5、清单 6 和清单 7 分三部分显示了                 yo 模块的 package.json 文件的内容。

如清单 5 中所示,第一个元素通常是 namedescription 和一个可用                 versions 的 JSON 数组。

清单 5. package.json,第 1                 部分

要安装一个模块的最新版本,请输入 npm install package 命令。输入                 npm install package@version 可以安装一个特定的版本。

如清单 6 中所示,接下来将显示作者、维护者和可以直接查找源文件的 GitHub 库。

清单 6. package.json,第 2                 部分

在这个例子中,还可以看到一个指向项目主页的链接和一个相关关键字的 JSON 数组。并非所有 package.json                 文件中都会出现所有这些字段,但用户很少会抱怨与一个项目相关的元数据太多。

最后,清单 7                 中列出了附有显式版本号的依赖关系。这些版本号符合主版本.次版本.补丁版本的常用模式,被称为                     SemVer(语义版本控制)。

清单 7. package.json,第 3                 部分

这个 package.json 文件表明,它必须安装在 0.8.0 或更高版本的 Node.js 实例上。如果试图使用                 npm install 命令安装一个不受支持的版本,那么安装将会失败。

SemVer 的快捷语法

清单 7 中,您会注意到,很多依赖关系版本中都有一个波浪符号 (~)。这个符号相当于                     1.0.x(也属于有效语法),意思是 ”主版本必须是 1,次版本必须是 0,但您可以安装所能找到的最新补丁版本“。SemVer                         中的这种隐含表达法意味着,补丁版本绝不会 对 API                     做出重大修改(通常是对现有功能的缺陷修复),而次版本会在不打破现有功能的情况下引入另外的功能(比如新的函数调用)。

除了平台要求之外,这个 package.json 文件还提供几个依赖关系列表:

  • dependencies 部分列出了运行时的依赖关系。
  • devDependencies 部分列出了开发过程中需要的模块。
  • peerDependencies 部分支持作者定义项目之间的 ”对等“                     关系。这种功能通常用于指定基础项目与其插件之间的关系,但在这个例子中,它指出了包含 Yeoman 项目与 Yo 的其他两个项目(Grunt                     与 Bower)。

如果在不指定模块名的情况下输入 npm install 命令,那么 npm 会访问当前目录中的                 package.json 文件,并安装我刚刚讨论过的三部分内容中列出的所有依赖关系。

安装一个能正常工作的 MEAN 堆栈,下一步是安装 Yeoman 与相应的 Yeoman-MEAN 生成器。


回页首

安装 Yeoman

作为一名 Java 开发人员,我无法想象在没有诸如 Ant 或 Maven 这样的编译系统的情况下如何启动一个新项目。类似地,Groovy 和                 Grails 开发人员依靠的是 Gant(Ant 的一种 Groovy 实现)或                 Gradle。这些工具可以搭建起一个新的目录结构,动态下载依赖关系,并准备好将项目发布。

在纯粹的 Web 开发环境中,Yeoman 可以满足这种需要。Yeoman 是三种 Node.js 工具的集合,包括用于搭建的纯 JavaScript                 工具 Yo,管理客户端依赖关系的 Bower,以及准备项目发布的 Grunt。通过分析 清单 7                 可以得出这样的结论:安装 Yo 时也会安装它对等的 Grunt 和 Bower,这要感谢 package.json 中的                 peerDependencies 部分。

通常,输入 npm install yo --save 命令可以安装 yo 模块并更新                 package.json 文件中的 dependencies                 部分。(npm install yo --save-dev 用于更新                 devDependencies 部分。)但这三个对等的 Yeoman                 模块算不上是特定于项目的模块,它们是命令行实用工具,而非运行时依赖关系。要全局安装一个 NPM 包,需要在 install                 命令后增加一个 -g 标志。

在系统上安装 Yeoman:

在完成包安装后,输入 yo --version 命令来验证它已经在运行中。

Yeoman 与基础架构的所有余下部分都准备就绪后,便可以开始安装 MEAN 堆栈了。


回页首

安装 MeanJS

您可以手动安装 MEAN 堆栈的每一部分,但需要十分小心。谢天谢地,Yeoman 通过其 generators(生成器)                提供了一种更轻松的安装方式。

Yeoman 生成器就是引导一个新 Web                 项目更轻松的方式。该生成器提供了基础包及其所有依赖关系。此外,它通常还会包含一个工作的编译脚本及其所有相关插件。通常,该生成器还包含一个示例应用程序,包括测试在内。

Yeoman 团队构建和维护了几个 “官方的”                     Yeoman 生成器社区驱动的 Yeoman 生成器(超过 800 个)远远超过官方生成器的数量。

您将用于引导第一个 MEAN 应用程序的社区生成器被称为 MEAN.JS,这也在意料之中。

在 MEAN.JS 主页上,单击 Yo Generator 菜单选项或者直接访问 Generator 页面,图 3                 中显示了其中的一部分。

图 3. MEAN.JS Yeoman 生成器

MEAN.JS Yeoman 生成器页面的屏幕截图

该页面上的说明指出要首先 Yeoman,这一点您已经完成。下一步是全局安装 MEAN.JS 生成器:

生成器准备就绪后,便可以开始创建您的第一个 MEAN 应用程序了。创建一个名为 test 的目录,使用 cd                 命令进入它,然后输入 yo meanjs 命令生成应用程序。回答最后两个问题,如清单 8                 中所示。(您可以为开始四个问题提供自己的答案。)

清单 8. 使用 MEAN.JS Yeoman                generator

在回答最后一个问题后,您会看到一系列行为,这是 NPM 在下载所有服务器端的依赖关系(包括 Express)。NPM 完成后,Bower                 将下载所有客户端的依赖关系(包括 AngularJS、Bootstrap 和 jQuery)。

至此,您已经安装了 EAN 堆栈(Express、AngularJS 和 Node.js) — 目前只缺少 M                (MongoDB)。如果现在输入 grunt 命令,在没有安装 MongoDB 的情况下启动应用程序,您会看到类似于清单                 9 中的一条错误消息。

清单 9. 试图在没有 MongoDB 的情况下启动                 MeanJS

如果启动应用程序时看到这条错误消息,请按下 Ctrl+C 键停止应用程序。

为了使用新的 MEAN 应用程序,现在需要安装 MongoDB。


回页首

安装 MongoDB

MongoDB 是一种 NoSQL 持久性存储。它不是使用 JavaScript 编写的,也不是 NPM 包。必须单独安装它才能完成 MEAN                 堆栈的安装。

访问 MongoDB 主页,下载平台特定的安装程序,并在安装                 MongoDB 时接受所有默认选项。

安装完成时,输入 mongod 命令启动 MongoDB 守护程序。

MeanJS Yeoman 生成器已经安装了一个名为 Mongoose 的                 MongoDB 客户端模块,您可以检查 package.json 文件来确认这一点。我将在后续的文章中详细介绍 MongoDB 和                 Mongoose。

安装并运行 MongoDB 后,最终您可以运行您的 MEAN 应用程序并观察使用效果了。


回页首

运行 MEAN 应用程序

要启动新安装的 MEAN 应用程序,在运行 MeanJS Yeoman 生成器之前,一定要位于您创建的 test 目录中。在输入                 grunt 命令时,输出内容应该如清单 10 中所示。

清单 10. 启动 MEAN.JS                 应用程序

jshintcsslint                     模块(均由生成器进行安装)可以确保源代码在句法和语体上是正确的。nodemon                 包监控文件系统中的代码修改情况,并在检测到有的情况下自动重启服务器,当开发人员需要快速而频繁地修改代码基础时,这可以极大地提高他们的效率。(nodemon                 包只在开发阶段运行,要监测生产环境的变化,必须重新部署应用程序并重启 Node.js。)

按照控制台输出的提示,访问 http://localhost:3000                 并运行您的新 MEAN 应用程序。

图 4 显示了 MEAN.JS 示例应用程序的主页。

图 4. MEAN.JS 示例应用程序的主页

MEAN.JS 主页的屏幕截图

在菜单栏中单击 Signup 创建一个新的用户账号。现在填写 Sign-up 页面上的所有字段(如图 5                 中所示),然后单击 Sign up。在后续的指南中,您可以通过 Facebook、Twitter 等启用                 OAuth 登录

图 5. MEAN.JS 示例应用程序的 Sign-up 页面

MEAN.JS 示例应用程序的 Sign-up 页面的屏幕截图

现在,您的本地 MongoDB 实例中已经保存了一组用户证书,您可以开始撰写新的文章了。单击 Articles                 菜单选项(当您登录之后才会显示出来),并创建一些示例文章。图 6 显示了 Articles 页面。

图 6. MeanJS 的文章页面

MeanJS 文章页面的屏幕截图

您已经创建了自己的第一个 MEAN 应用程序。欢迎加入!

结束语

在这篇指南中,您完成相当多的内容。安装 Node.js 并编写了第一个 Node.js 脚本。学习了模块并使用 NPM 安装了几个第三方模块。安装                 Yeoman 并将它作为可靠的 Web 开发平台,其中包含一个搭建实用工具 (Yo),一个编译脚本                 (Grunt),以及一个管理客户端依赖关系的实用工具 (Bower)。安装 MeanJS Yeoman 生成器,并使用它来创建第一个 MEAN                 应用程序。安装 MongoDB 与 Node.js 客户端库 Mongoose。最后运行您的首个 MEAN 应用程序。

下一次,我们会详细了解示例应用程序的源代码,从而了解 MEAN 太阳系中的所有四颗行星 (MongoDB、Express、AngularJS 和                 Node.js)是如何相互作用的。


回页首

下载

描述 名字 大小
样例代码 wa-mean1src.zip 1.38MB

 

参考资料

学习

  • 使用 Node.js、Express、AngularJS 和 MongoDB 构建一个实时投票应用程序”                 (developerWorks,2014 年 6 月):剖析一个在 IBM Bluemix™ 上部署的 MEAN                 开发项目。
  • 针对 Java 开发人员的 Node.js“(developerWorks,2011 年 11 月):介绍 Node.js                 并分析其事件驱动的并发性为何能引发用户广泛兴趣,甚至在死硬派 Java 开发人员中也是如此。
  • Node.js 起步(developerWorks,2014 年 1 月):查看这个时长 9 分钟的演示,其中快速介绍了                 Node.js 和 Express。
  • MongoDB:一种具有(所有正确的)RDBMS 行为的 NoSQL 数据库“(developerWorks,2010 年 9                 月):了解 MongoDB 的自定义 API、交互式 shell,以及对 RDBMS 样式的动态查询与快速简便的 MapReduce                 计算的支持。
  • 开始使用 JavaScript 语言“(developerWorks,2011 4 月和 8 月):在这篇由两部分组成的文章中学习                 JavaScript 的基础知识。
  • 针对 Java 开发人员的 JavaScript“(developerWorks,2011 年 4 月):分析                 JavaScript 为何是现代 Java 开发人员的重要工具的原因,并开始学习 JavaScript 变量、类型、函数和类。
  • LAMP 技术简介“(developerWorks,2005 年 5 月):将 MEAN                 与其以前的堆栈进行比较。
  • Mastering Grails(developerWorks, 2008-2009 年):查阅                 Scott Davis 撰写的关于 Grails (基于 Groovy 的 Web 开发框架)的系列文章。
  • 查看 HTML5 专题,了解更多和 HTML5 相关的知识和动向。
  • developerWorks Web development                专区:通过专门关于 Web 技术的文章和教程,扩展您在网站开发方面的技能。
  • developerWorks Ajax 资源中心:这是有关 Ajax 编程模型信息的一站式中心,包括很多文档、教程、论坛、blog、wiki 和新闻。任何 Ajax 的新信息都能在这里找到。

讨论

from:http://www.ibm.com/developerworks/cn/web/wa-mean1/index.html?ca=drs

MongoDB中时间比实际时间小8小时的解决方法

现象

存储到数据库的时间总是比实际时间小8小时。

原因

存储在mongodb中的时间是标准时间UTC +0:00 , 而中国的时区是+8.00 。

解决办法

如果使用C#的Mongodb.Driver驱动,则只需要在实体的时间属性上添加一个特性并指时区就可以了。

比如:

[BsonDateTimeOptions(Kind = DateTimeKind.Local)]
public DateTime EntryTime
{get;set;}

此特性需要引用MongoDB.Bson.dll 。

using MongoDB.Bson.Serialization.Attributes;

 

 

mongodb配置文件详解

运行时数据库配置

命令行配置文件界面可为 MongoDB 管理员提供大量选项和设置,用于控制数据库系统的运行。该文档提供了通用配置以及普通使用案例的最佳配置示例。

尽管两种界面都可访问相同的选项和设置集合,但该文档主要使用配置文件界面。如果您使用控制脚本或操作系统的程序包来运行 MongoDB,很可能已经有一个配置文件,该文件位于 /etc/mogondb.conf。检查/etc/init.d/mongod /etc/rc.d/mongod 脚本的内容确定这一点,以确保控制脚本会以适当的配置文件启动 mongod(见下文)。

要使用该配置启动 MongoDB 实例,按以下格式发出一个命令:

修改系统上的 /etc/mongodb.conf 文件中的值,以控制数据库实例的配置。

启动、停止和运行数据库

请看以下基本配置:

对于大多数独立服务器,这是足够使用的基本配置。它作了几个假定,但请看以下说明:

  • fork true,可为 mongod 启用后台模式 ,使(如 “forks”)MongoDB 从当前会话中分离,并允许您将数据库作为传统服务器来运行。
  • bind_ip 127.0.0.1,它会强制服务器仅侦听本地主机 IP 上的请求。仅绑定至安全接口,该接口可由应用程序级系统通过系统网络过滤(如“防火墙”)系统提供的访问控制权限来访问。
  • 端口27017,这是数据库实例的默认 MongoDB 端口。MongoDB 可绑定至任何端口。您也可以使用网络过滤工具来过滤访问权限。

    注意

    UNIX 类系统要求超级用户权限才能将进程连接至低于 1000 的端口。

  • quiet true。这会禁止输出/日志文件中的所有条目,但最重要的条目除外。在正常操作中,这是避免日志噪音的最佳操作。在诊断或测试情况中,将该值设为false。使用 setParameter 可在运行时过程中修改该设置。
  • dbpath /srv/mongodb,它指定 MongoDB 存储其数据文件的位置。/srv/mongodb /var/lib/mongodb 都是常用的位置。mongod 运行时所在的用户帐户将需要对该目录具有读写权限。
  • logpath /var/log/mongodb/mongod.log,其中 mongod 将写入其输出。如果您不设置此值,mongod 将把所有输出写入到标准输出(即 stdout)中。
  • logappendtrue,确保 mongod 在服务器启动操作之后不会覆盖现有的日志文件。
  • journal true,这样将启用 日志

    日志可确保单实例写入耐久性。 64 位版本的 mongod默认情况下启用日志。因此,此设置可能是多余的。

如果采用默认配置,有些值可能是多余的。但是,在很多情况下,明确地描述配置可促进对整个系统的理解。

安全考虑事项

下面的配置选项集合对于限制对 mongod 实例的访问权限很有用。请考虑以下配置:

考虑对这些配置决定的下列解释:

  • bind_ip”有三个值:127.0.0.1,本地主机接口;10.8.0.10,通常用于本地网络和 VPN 接口的专用 IP 地址;192.168.4.24,通常用于本地网络的专用网络接口。

    由于生产 MongoDB 实例需要从多个数据库服务器访问,因此务必将 MongoDB 绑定到多个可从您的应用程序服务器访问的接口。同时,务必将这些接口限制为在网络层实现控制和保护的接口。

  • nounixsocket”为 true,这样将会禁用 UNIX 套接字,而在默认情况下为启用。这样可限制对本地系统的访问。使用共享权限连续运行 MongoDB 时这种情况很理想,但在大多数情况下影响极小。
  • auth”为 true,这样将在 MongoDB 中启用身份验证。如果已启用,第一次登录时您需要通过本地主机接口建立连接,以创建用户凭证。

另见

安全和身份验证”维基页面。

复制和分片配置

复制配置

副本集配置简单明了,只需要 replSet 有一个在集合的所有成员之间保持一致的值即可。请考虑以下配置:

使用描述性的副本集名称。配置后,使用 mongo壳将主机添加到副本集。

另见

副本集重新配置”。

要对副本集启用身份验证,请添加下列项:

1.8 版新特性:针对副本集;1.9.1 版针对分片副本集。

设置keyFile以启用身份验证,并指定一个密钥文件供副本集成员使用,确定相互之间何时进行身份验证。密钥文件的内容可以任意规定,但在副本集 以及连接到该集的 mongos 实例的所有成员上必须相同。 keyfile 的大小必须小于 1 KB,可以只包含 base64 编码集字符,文件在 UNIX 系统上不得拥有组或“世界”权限。

另见

副本集重新配置”部分,以了解在操作期间更改副本集的流程方面的信息。

此外,请考虑“副本集安全性”部分以了解使用副本集配置身份验证的信息。

最后,请参阅“复制” 索引和“复制基础”文档,以了解关于 MongoDB 中的复制以及一般副本集配置的信息。

分片配置

分片需要若干采用不同配置的 mongod 实例。配置服务器存储群集的元数据,而群集将数据发布到一个或多个分片服务器。

注意

配置服务器不是副本集

设置一个或三个“配置服务器”实例作为正常 mongod 实例,然后添加下列配置选项:

这样将创建一个运行于专用 IP 地址:10.8.0.12,端口:27001 的配置服务器。确保没有端口冲突,且配置服务器可从您的“mongos”和“mongod”实例访问。

要设置分片,请配置两个或更多 mongod实例,使用您的基本配置并添加 shardsvr 设置:

最后建立群集,使用下列设置来配置至少一个 mongos 进程:

您可以通过在逗号分隔列表的表格中指定主机名和端口来指定多个 configdb 实例。通常,避免将 chunkSize 修改为默认值 64 以外的值,[1]并应当确保此设置在所有 mongos实例中都保持一致。

[1] 数据块大小默认值为 64 MB,可在最均匀的数据分布(较小的数据块最佳)和最小化数据块迁移(较大的数据块最佳)之间实现理想的平衡。

另见

分片”维基页面,以了解关于分片和分片群集配置的详细信息。

在同一系统上运行多个数据库实例

在很多情况下,建议不要在单个系统上运行多个 mongod 实例。有些类型的部署[2]可能会出于测试目的而需要在单个系统上运行多个 mongod

在这些情况下,为每个实例应用基本配置,但是请考虑下列配置值:

dbpath 值控制 mongod 实例的数据目录的位置。确保每个数据库都有明确且标签正确的数据目录。pidfilepath 控制 mongod 进程将其pid 文件放置到的位置。由于此轨迹取决于具体的 mongod文件,因此务必确保该文件是唯一的且标签正确,以便于开始和停止这些进程。

创建附加控制脚本并/或调整现有 MongoDB 的配置以及控制这些进程所需的控制脚本。

[2] 使用 SSD 或其他高性能磁盘的单租户系统可为多 mongod 实例提供可接受的性能水平。此外,您还会发现,使用小工作集的多数据库在单系统上的性能可以接受。

诊断配置

下列配置选项控制多种用于诊断的 mongod 行为。下列使用针对一般生产目的调整的默认值:

使用基本配置,如果您遇到一些未知的问题或性能问题,根据需要添加这些选项:

  • slowms 配置数据库探查器的阈值以考虑“缓慢”的查询。默认值为 100 毫秒。如果数据库探查器未返回有用的结果,则设置较低的值。请参阅“优化”维基页面,以了解 MongoDB 中的优化操作的详细信息。
  • profile 设置数据库探查器 等级。探查器默认情况下不活动,因为那样可能会影响探查器本身的性能。除非为此设置指定了一个值,否则不对查询进行探查。
  • verbose 启用详细记录模式,在此模式下可修改 mongod 输出并增加记录以包括更多的事件。仅在遇到不能正常反映日志记录级别的问题时使用此选项。如果您需要达到更详细的级别,请考虑下列选项:

    增加的每个 v 级别都会额外地增加记录的详细程度。verbose 选项相当于 v=true

  • diaglog 启用诊断日志记录。等级 3 记录所有读写选项。
  • objcheck 强制 mongod 在收到来自客户端的请求时全部进行验证。使用此选项确保无效的请求不会导致错误,特别是在不可信客户机运行数据库时。此选项可能会影响数据库的性能。
  • cpu 强制 mongod 报告

    写锁定所用的最后时间间隔的百分比。时间间隔通常为 4 秒,日志中的每个输出行都包括自上次报告以来的实际时间间隔和写锁定所用的时间百分比。

    from:http://blog.sina.com.cn/s/blog_9c5dff2f01012n0f.html

探索 MongoDB

MongoDB 是什么?

近几年来,我们已经看到不同于传统关系模型的数据库管理系统越来越受欢迎。它的核心是 NoSQL 概念,这个共同的术语表示不使用 SQL 语言与数据库交互的数据库软件。比较著名的 NoSQL 项目之一就是 MongoDB,一个开放源码、面向文档的数据库,它在类似于 JSON 的文档集合存储数据。MongoDB 相比其他 NoSQL 数据库的优势之一是它强大的、基于文档的查询语言,由于查询非常容易转换,这使得从关系数据库到 MongoDB 的过渡变得简单。

MongoDB 是用 C++ 语言编写的。它在类似于 JSON 的文档中存储数据(使用 BSON,一个 JSON 的二进制版本),存储数据的方式是使用键/值对。MongoDB 优于其他文档数据库的一个特性是它很容易将 SQL 语句转换成 MongoDB 查询函数调用。这使得当前使用关系数据库的组织很容易迁移到 MongoDB。它也很容易安装和使用,有二进制和驱动程序两种形式,兼容主流操作系统和编程语言。

MongoDB 是一个开放源码项目,其数据库基于 GNU AGPL (Affero General Public License) version 3.0 的许可。此许可是 GNU GPL 的一个修正版,它弥补了版权限制不适用于软件使用而仅适用软件分发的漏洞。这对于在云中存储而不经常安装在客户端设备上的软件当然是重要的。使用常规 GPL ,您会感觉到实际上无法进行分发,因此潜在地规避了许可条款。

AGPL 只适用于它自己的数据库应用程序,不适用于 MongoDB 的其他组成部分。允许开发人员从各种编程语言连接 MongoDB 的官方驱动程序在 Apache License Version 2.0 许可下分发。 MongoDB 文档的使用基于 Creative Commons 许可。

面向文档的数据库

面向文档的数据库与传统关系数据库有很大不同。与在类似于表的固定结构中存储数据不同,面向文档的数据库在松散定义的文档中存储数据。利用关系数据库管理系统(RDBMS)表,如果您需要添加一个新的列,您需要改变表本身的定义,这会将该列添加到每一条现有的记录(虽然可能是一个空值)。这是由于 RDBMS 严格的基于模式的设计。然而,利用文档时,您可在不改变任何其他文档的情况下为个别文档添加新属性。这是因为面向文档的数据库在设计上通常非模式化的。

另一个基本差异是面向文档的数据库不在文档之间规定严格的关系。这有助于维护它们的非模式化设计。这与十分依赖规范化数据存储关系的关系型数据库有很大不同。与在一个单独的存储区存储相关数据不同,在文档数据库中它们被嵌入文档本身,这要比将引用存储到另一个存储相关数据的文档中要快得多,因为每个引用都需要一个附加查询。

对于许多应用程序来说,如果它需要在一个父文档中包含自成体系的数据,这种面向文档的数据库非常适合。一个好的示例(可在 MongoDB 文档中找到)是博客文章和评论。评论只适用于一篇文章,所以把它们从该文章分开是无意义的。在 MongoDB 中,有关博客文章的文档只需要一个 comments 属性来存储该文章的评论。而如果使用关系数据库,则可能需要一个带 ID 主关键字的 comments 表、一个带 ID 主关键字的 posts 表和一个中间的映射表 post_comments,此映射表用于定义哪个评论属于哪篇文章。这为本应很简单的事增加了不必要的复杂性。

不过,如果您必须分开存储相关数据,在 MongoDB 中也可以简单地使用一个独立的集合来完成。另一个好的示例是您把客户订单信息存储在 MongoDB 文档中。它通常包含以下信息:客户、订单、订单条目和产品信息。使用 MongoDB ,您可以在独立的集合中存储客户、产品和订单,但是您需要把订单项数据嵌入在相关的订单文档中。然后,您需要使用类似于外部关键字的 ID 来引用 productscustomers 集合。由于这种混合方法非常简单,使得 MongoDB 成为已习惯于使用 SQL 的开发 人员的极好选择。如上所述,应该花点时间细心地为每个单独用例选择合适的方法,因为相比于从其他集合中引用数据,采用在文档中嵌入数据的方法将获得显著的性能收益。

功能概览

MongoDB 不仅仅是一个基本的键/值对存储数据库,让我们简单地看一下它的其他特性:

  • 可用于 Windows®、Mac OS X、Linux® 和 Solaris 的官方二进制版本,可用于自构建的源代码分发
  • 可用于 C、C#、C++、Haskell、Java™、JavaScript、Perl、PHP、Python、Ruby 和 Scala 的官方驱动程序,以及广泛可用于其他语言的社区支持的驱动程序。
  • Ad-hoc JavaScript 查询让您能够使用基于任何文档属性的任何条件来查找数据。这些查询对应于 SQL 查询的功能,使 SQL 开发人员能够很直观地编写 MongoDB 查询。
  • 支持查询中的正则表达式
  • MongoDB 查询结果存储在提供过滤、聚合和排序等一系列功能的游标中,包括 limit()skip()sort()count()distinct()group()
  • 高级聚合的 map/reduce实现
  • 使用 GridFS 的大文件存储
  • 类似于 RDBMS 的属性索引支持,您可以直接在文档的选定属性上创建索引
  • 使用提示、解释计划和分析的查询优化特性
  • 类似于 MySQL 的主/从复制
  • 基于集合的对象存储,在需要规范化数据时允许参考查询
  • 通过自动分片功能水平扩展
  • 高性能无争用并发机制的即时更新
  • 在线 shell 让您能够不安装 MongoDB 即可试用
  • 深入的文档资料,已出版或正在写作中的多本图书

回页首

安装 MongoDB

幸运的是,MongoDB 在各种平台上的安装都非常简单。二进制发行版在 Windows、Mac OS X、 Linux 和 Solaris 上都可以使用,同时,各种包管理器为其他系统提供了简单的安装和设置选项。如果您够勇敢,可以自己编译源代码。在本节中,您将学会如何在 Windows 和 OS X 上安装 MongoDB,在 Windows 上将进程设置为服务或在 OS X 上将进程设置为守护程序。

在 Windows 上安装

在 Windows 上安装 MongoDB 十分简单。在 Web 浏览器中,转到 http://www.mongodb.org/downloads 并下载适用于 Windows 的最新版本的稳定产品。如果您正使用 64 位版本的 Windows 操作系统,建议使用 64 位版本。如果您不确定,就使用 32 位版本。

把压缩文件解压到 C:\ 驱动器,这将创建一个名称类似于 mongodb-win32-i386-1.6.4 的文件夹。为了简便,将这个文件夹重命名为 mongo 。接下来,需要创建一个数据目录。在 Windows 资源管理器中,转到 C:\ 驱动器的根目录下并创建一个名为 data 的新文件夹。在此文件夹中,创建一个名为 db 的文件夹。

您现在可以启动 MongoDB 服务器。使用 Windows 资源管理器导航至 C:\mongo\bin 并双击 mongod.exe。关闭打开的命令提示符窗口将会停止 MongoDB 服务器。因此,将 MongoDB 服务器设置为 Windows 服务更为方便。我们现在来完成。

打开命令提示符窗口 (启动 > 运行 >,输入 cmd 并按 确定),然后发出清单 1 中的命令。

清单 1. 将 MongoDB 服务器设置为一个服务

您将看到清单 2 中的输出。

清单 2. 创建服务成功

将 Mongo 作为服务安装后,您现在可以用以下命令启动它:> net start "MongoDB"

您将看到清单 3 中的输出。

清单 3. Mongo 成功启动

您现在可以运行 MongoDB shell 客户端。如果现在有一个命令提示符窗口打开,确认位于 c:\mongo\bin 文件夹中并输入以下命令:> mongo.

另一种方法是,在 Windows 资源管理器中导航至 C:\mongo\bin 并双击 mongo.exe。无论选择哪种方法来启动 shell,您都应看到如清单 4中所示的提示。

清单 4. 启动 shelll

如果您不想在 Mac OS X 计算机上设置 MongoDB,现在可以跳过本节的下一部分,转到“入门指南”,您将学习如何使用 shell 客户端与 MongoDB 服务器进行交互。

在 Mac OS X 中安装

假设您现在使用 Mac OS X 的 64 位版本,以下步骤详细说明了如何下载 MongoDB 的 64 位 OS X 二进制版本,解压它,配置并开始使用,还将教您如何作为守护程序运行 MongoDB。

首先,启动 Terminal (Applications>Utilities>Terminal)。在 Terminal 窗口,运行清单 5 中的命令。

清单 5. 在 Mac OS X上设置 MongoDB

MongoDB 现在设置完成并准备使用。在继续之前,最好把 MongoDB 添加到您的路径中,执行以下命令: $ nano ~/.bash_profile.

此文件可能还不存在。在这种情况下,添加以下行: export PATH={$PATH}:~/mongo/bin.

按 ctrl + O 保存文件,然后在提示符下按 Enter。再按 ctrl + X 退出。现在,用以下命令重新载入 bash 配置文件: $ source ~/.bash_profile.

您现在已经准备好启动 MongoDB。只需发出以下命令就可以启动: $ mongod.

这将作为前台进程启动 MongoDB 数据库服务器。如果您想作为后台守护程序启动 MongoDB ,发出以下命令: $ sudo mongod --fork --logpath /var/log/mongodb.log --logappend.

将要求您输入密码,在此提示下输入 Mac OS X 管理员密码。

无论您选择哪种方法启动 MongoDB,服务器现在都能运行。如果作为前台进程启动,您将需要一个单独的 Terminal 标签或窗口来启动客户端。要启动客户端,只需使用命令:$ mongo

将会看到清单 6 中的提示:

清单 6. 启动客户端

在下一节中,您将学习如何使用 MongoDB shell 来创建数据库、集合、文档等。


回页首

MongoDB 使用入门

MongoDB 发行版包含一个 shell 应用程序,使您能够完全控制数据库。通过使用 shell,您可以使用服务器端 JavaScript 功能来创建和管理数据库、集合、文件和索引。这使快速启动和运行 MongoDB 变得容易。在本节中,您将学习如何启动 shell 并了解一些进行基本数据库存储和检索的命令。

MongoDB shell

MongoDB shell 应用程序包含在 MongoDB 发行版的 bin 文件夹中。在 Windows 系统中,它就是 mongo.exe 应用程序。在 Windows 资源管理器中,双击此程序即可启动 shell 。在基于 UNIX® 的操作系统中(包括 Mac OS X),您可通过在一个终端窗口(假使您按照以上说明将 MongoDB 目录加入到路径)执行 mongo 命令启动 MongoDB shell。

第一次启动 shell 时,您将看到清单 7 中消息。

清单 7. 启动 shell 时的消息

您现在已连接到本地 MongoDB 服务器,尤其是“测试”服务器。在下一节中,您将学习如何创建数据库、文档和集合。如果您在某个阶段需要帮助,只需要在 Mongo shell 提示符下发出 “help” 命令。 图 1 显示了典型的帮助命令的输出。

图 1. Mongo shell help命令的输出

如果您想查看 MongoDB 函数背后的源代码,只需简单地在 shell 中输入函数的名称,它将会输出 JavaScript 源代码。例如,输入 connect 后按回车键,您将看到用于连接 MongoDB 数据库的源代码。

创建数据库、集合和文档

默认情况下,Mongo shell 连接到“测试”数据库。如果要切换到一个不同的数据库,使用 “use 数据库名” 命令。如果数据库不存在,在您将数据添加到数据库时,MongoDB 将会创建它。用以下命令切换到 “mymongo” 数据库: > use mymongo.

shell 将返回以下信息: switched to db mymongo.

这时,数据库仍未真正存在,因为它没有包含任何数据。在 MongoDB 中,数据以集合的形式存储。如果需要,您可以分割文档。下面创建一个文档并把它存储到一个名为 “colors” 的新集合中: > db.colors.save({name:"red",value:"FF0000"});.

通过查询数据库来验证文档已保存: > db.colors.find();.

您将看到类似于下面的响应(_id 属性是唯一标识符,与您的结果可能会不同): { "_id" : ObjectId("4cfa43ff528bad4e29beec57"), "name" : "red", "value" : "FF0000" }.

MongoDB 中的文档以 BSON(二进制 JSON)形式存储。通过 Mongo shell,可以使用类似于 JSON 的语法插入数据,其中每个文档都是一个键-值对形式的对象。在这个例子中,我们创建一个具有两个属性的文档:namevalue,值分别为 redFF0000(标准红色的十六进制表示形式)。

您可能已经注意到,不需要预定义 colors 集合,当您使用存储功能插入一个条目时,文档将自动创建。

在这个例子中,您创建了一个非常简单的文档。然而,使用类似于 JSON 的语法可以创建更复杂的文档。考虑下面的 JSON 文档,它表示了一个订单或发票(参见 清单 8)。

清单 8. 创建一个简单的文档

您可以看到,这些文档可以存储包括字符串、整数、浮点数、日期、对象、数组等的各种数据类型。在清单 8 中,订单条目直接嵌入在订单文档中,使得以后查询文档时检索信息快得多。

由于 MongoDB shell 使用 JavaScript,当您与数据库交互时,可以编写规则的 JavaScript 结构 。以清单 9为例,它创建一个字符文档集合,每个集合都包含字符的字符串表示形式及其关联的 ASCII 代码。

清单 9. 创建一个字符文档集合

此循环将创建 26 个文档,代表字母表的每个小写字母,每个文档包含字符本身及其 ASCII 字符码。在下一节中,您将学习如何用不同方法检索数据。

检索数据

在最后一节中,您不仅会学习如何向 MongoDB 数据库中插入数据,而且会实际学习如何使用最基本的数据检索函数 find。我们以上一节结尾时创建的字母表集合为例,学习使用 find 命令: db.alphabet.find();

这将生成如清单 10 所示的响应。

清单 10. 生成响应

默认情况下,find() 函数会检索集合中的所有文档,但只显示前 20 个文档。给出命令 it 将检索剩余的 6 个文档(参见清单 11)。

清单 11. 检索剩余的 6 个文档

find() 函数实际上向查询结果集返回了一个指针,在本例中是检索所有文件。如果没有分配一个变量或没有执行其他函数,它将在屏幕上默认打印一个样例结果集。要显示所有结果集,应执行以下命令: > db.alphabet.find().forEach(printjson);

这将打印结果集中的每条记录,而不是显示一个子集。接下来我们将了解更多有关使用指针和查询来筛选数据的方法。


回页首

查询数据

MongoDB 最强大的功能之一是它对 ad-hoc 查询的强大支持,其工作方式与传统关系数据库几乎一样,它筛选和返回 BSON 文档而不是表中的行。这种方法使它有别于其他文档存储,对于 SQL 开发人员来说,这一点很难掌握。利用 MongoDB ,相对复杂的 SQL 查询可以简单地转换为 JavaScript 函数调用。在本节中,您将学习可让您在 MongoDB 中查询数据的各种函数,以及如何建立索引来帮助优化查询,就像在 DB2、MySQL 或 Oracle 中一样。

基本查询

在上一节中,您学习了如何使用 find 函数来检索所有文档。find 函数接受一系列参数来筛选返回的结果。例如,在上面创建的字母表集合中,您能用以下命令找到 “char” 属性的值为 “q” 的任何记录: > db.alphabet.find({char: "o"});

这将返回以下响应: { "_id" : ObjectId("4cfa4adf528bad4e29beec9a"), "char" : "o", "code" : 111 }

如果您想要返回编码小于或等于 100 的所有字符,可以使用以下命令: > db.alphabet.find({code:{$lte:100}});.

这将返回清单 12 中的结果,与您期望的一致。

清单 12. 结果

MongoDB 支持各种条件运算符,包括:

  • $lt(小于)
  • $lte(小于等于)
  • $gt(大于)
  • $gte(大于等于)
  • $all(匹配数组中的所有值)
  • $exists(检查字段是否存在)
  • $mod(模数)
  • $ne(不等)
  • $in(匹配数组一个或多个值)
  • $nin(匹配数组中的零值)
  • $or(匹配一个或另一个查询)
  • $nor(不匹配查询)
  • $size(匹配具有预定数量元素的任何数组)
  • $type(匹配具有指定 BSON 数据类型的值)
  • $not (不等于)

有关所有这些运算符的详细信息,请参阅 MongoDB 文档(参见参考资料中的链接)。

您可以使用 find 函数中的第二个参数来限制查询返回的字段。例如,下面的查询只返回所有文档中编码值范围在 102 至 105 之间的 char 属性: > db.alphabet.find({code:{$in:[102,103,104,105]}}, {char: 1});.

这将产生 清单 13 中的结果。

清单 13. 结果

在下一节中,您将学习如何创建索引来加速查询。

索引

MongoDB 索引与关系数据库中的索引十分相似。您可以基于任何属性建立索引。此外,索引后的字段可以是任何数据类型,包括一个对象或数组。与 RDBMS 索引相似,可以使用多个属性创建复合索引,也可创建唯一索引,确保不存在重复的值。

要创建一个基本索引,使用 ensureIndex 函数。下面使用字母表集合中的 codechar 属性创建一个索引。(参见清单 14)。

清单 14. 创建索引

可以使用 dropIndex 和 dropIndexes 函数删除索引。可参阅 MongoDB 文档获得更多信息。

排序

要对结果集进行排序,可以对指针应用 sort 函数。字母表集合已经基于 code 和 char 属性的升序排序,下面按 code 属性的升序排序,返回一个子集: > db.alphabet.find({code: {$gte: 118}}).sort({code: 0});

这将返回清单 15 中的结果。

清单 15. 结果

如果在上一条命令中为 sort 函数提供参数 {code: 1} ,它将会以升序对结果排序。为了确保高效的查询,一定要为排序的数据属性添加索引。


回页首

使用 skip 和 limit 分页结果

通常在处理数据结果集时,一次只想检索一个子集,也许是在网页上提供分页结果。在 MySQL 中,您通常使用 LIMIT 关键字来实现。您在 MongoDB 中只需使用 skip 和 limit 函数即可实现这一功能。要返回字母表集合中的前 5 个文档,可执行以下操作: > db.alphabet.find().limit(5);

这将返回清单 16 中的结果。

清单 16. 结果

要获得下一页,使用以下命令: > db.alphabet.find().skip(5).limit(5);

清单 17 所示,这将获取接下来的 5 条记录。

清单 17. 获取接下来的 5 条记录


回页首

分组函数和聚合

MongoDB 的查询引擎也使得对数据应用聚合和分组函数变得非常简单。这类似于 SQL 中的相应功能。可以说,应用最广泛的函数是 count() 函数:> db.alphabet.find().count();

这将返回 26。您可以简单对筛选出的查询结果进行计数: > db.alphabet.find({code: {$gte: 105}}).count();

以上命令将返回 18。

另一个有用的聚合函数是 distinct。利用它可返回针对某个属性的一组不同的值。由于所有数据都是唯一的,因此字母表集合不是一个合适的例子。我们向本文开头创建的 colors 集合中添加一些记录(参见清单 18)。

清单 18. 向 color 集合中添加记录

假定您没有删除 colors 集合,您将看到 清单 19 中的响应。

清单 19. 响应

您可以看到,在这个集合中明显有两个 red 文档。现在使用 distinct 函数从此集合中获得一组唯一的 name 属性: > db.colors.distinct("name");

这将返回: [ "red", "white" ]

值得注意的是,您在执行其他查询函数时不能在指针和结果集上执行 distinct 函数,而应直接在集合上执行。还应注意,它返回的不是一组文档,而是一组值。

MongoDB 还为执行类似于 SQL 中的 GROUP BY 表达式的操作提供了 group 函数。group 函数是一个异常复杂的函数,所以我在这里只给出一个简短的示例。例如,我们要按 name 值来分组计算文档数。在 SQL 中,可以定义表达式为 SELECT name, COUNT(*) FROM colors GROUP BY name;

要在 MongoDB 中执行此查询,需要使用清单 20 中的命令。

清单 20. 使用 group 函数

这将产生在清单 21 中的结果。

清单 21. 结果

如果需要执行高级聚合或使用大型数据集,MongoDB 还包含一个 map/reduce 实现,让您能够完成这一任务。上面介绍的 group 函数在分片的 MongoDB 安装中无法工作,所以如果您要使用分片,一定要使用 map/reduce 来替代 group 函数。

更新现有数据

在 MongoDB shell 中,更新文档非常容易。在前面创建的 colors 集合中,有两条 red 记录。要从记录中取出一个并将它更改为 black,且值属性为 000000 (黑色的十六进制值)。首先,可以使用 findOne 函数来检索值为 red 的单个项目,根据需要更改其属性,并将文档存储到数据库中。

获取名称为 red 的单一文档并把它存储在 blackDoc 变量中: > var blackDoc = db.colors.findOne({name: "red"});

接下来,使用点表示法修改文档的属性(参见清单 22)。

清单 22. 修改文档属性

在保存之前,检查文档是否正确(它应该有 _id 属性,否则只是插入了一条新记录而不是覆盖 red 记录): > printjson(blackDoc);

如果返回结果类似于清单 23,则表示您准备好了。

清单 23. 结果

最后,使用 save 函数将文档保存回数据库中的 colors 集合: > db.colors.save(blackDoc);

现在可以使用 find 函数来确保集合是正确的: > db.colors.find();

这将返回类似于清单 24 的结果。如果您有 4 条记录,您就错了。

清单 24. 结果

除了 Mongo shell 之外,您可以在应用程序中使用 update 函数来将更改应用到现有数据。有关 update 函数的更多信息,请参阅 MongoDB 文档。

删除数据

要删除 MongoDB 中的数据,可使用 remove 函数。请注意这适用于 MongoDB shell 程序,某些驱动程序可能使用 delete 函数或者没有。如有必要,可查阅某个具体实现的相关文档。

remove 函数与 find 函数工作方式类似。要删除 colors 集合中与名称 white 相匹配的任何文档,可使用以下命令: > db.colors.remove({name:"white"});

然后,可以检查此文档是否已删除: > db.colors.find();

如果正确,您将只会看见两个文档(参见清单 25)。

清单 25. 删除数据

要删除集合中的所有文档,只需在命令中省略筛选器,类似如下: > db.colors.remove();

现在如果您试图使用 find 函数,将得不到响应,表示一个空的结果集: > db.colors.find();

如果文档存储在变量中,也可以将此文档传送给 remove 函数以删除它,但这么做非常低效。最好找到这个文档的 _id 属性并把它传送给 remove 函数。

要删除一个集合,使用以下命令: > db.colors.drop();

这将返回以下结果: true

现在可以使用 show collections 命令检查集合确实已被删除。这将产生清单 26 中的输出。

清单 26. 使用 show collections 命令

最后,如果您想要删除整个数据库,执行如下命令:> db.dropDatabase();

这将删除当前选定的数据库。您将看到以下输出: { "dropped" : "mymongo", "ok" : 1 }.

可以使用 show dbs 命令获得可用数据库列表。mymongo 将不会出现在这个列表中。


回页首

工具及其他特性

MongoDB 包含一系列用于管理数据库的有用工具。无论是报表还是备份,它都提供了各种方式来导入和导出数据。在本节中,您将了解如何以 JSON 格式导入和导出文件,以及如何创建用于高效恢复的热备份文件。您还将学习如何使用 map/reduce 函数作为 Mongo 用于复杂数据聚合的常规查询函数的一种替代方式。

导入和导出数据

MongoDB 的 bin 目录包含了一系列工具,可用于以各种格式导入和导出数据。 mongoimport 工具允许您提供一个文件,其中每行包含一个 JSON 、CSV 或 TSV 格式的文档,并将这些文档插入 MongoDB 数据库。由于 MongoDB 使用 BSON 格式,如果希望利用在常规 JSON 中无法使用的 BSON 附加数据类型,在导入 JSON 文档时需要提供一些说明信息。

mongoexport 工具允许您生成一个文件输出,其中 MongoDB 数据库中的每个文档都以 JSON 或 CSV 格式表示。这对于生成报表非常有用,因为应用程序接受 JSON 或 CSV 数据作为输入。要生成一个 CSV 文件,需要按输出文件中显示的顺序提供字段。

备份和恢复数据库

当需要从 MongoDB 中取出数据以用于其他应用程序或从其他使用 JSON 或 CSV 数据的应用程序中导入数据时,mongoimport 和 mongoexport 工具非常有用。然而,这些工具不能用于获得定期备份或 MongoDB 数据库,也不能用于恢复 MongoDB 数据库。因为 MongoDB 使用 BSON 而不是 JSON 或 CSV ,从这些格式中导入数据时很难保留数据类型。

为了提供适当的备份和恢复功能,MongoDB 提供了两个工具:mongodump 和 mongorestore。 mongodump 用于生成数据库的二进制文件备份,mongorestore 用于读取此文件并使用它恢复数据库,并根据需要自动创建索引(除非已将 system.indexes.bson 文件从备份目录中删除)。


回页首

管理工具

MongoDB 还提供了一个基于 Web 的诊断接口,在默认 MongoDB 配置上从 http://localhost:28017/ 可以获得。这个屏幕类似于图 2

图 2. MongoDB 诊断

为了获得其他管理信息,也可以在 MongoDB shell 中运行以下命令:

  • db.serverStatus();
  • db.stats();

如果 MongoDB 服务器崩溃,应修复数据库以检查错误并执行一些数据精简。可以通过在操作系统命令行中运行 mongod --repair 进行修复,或选择从 MongoDB shell 运行 db.repairDatabase() 命令。后一个命令在每个数据库的级别上运行,所以您需要针对服务器上的每个数据库都运行此命令。

您也可以使用 validate 函数验证集合数据。如果拥有一个名为 contacts 的集合,可以用 db.contacts.validate() 命令验证此集合。

MongoDB 有很多其他特性可让数据库管理员更轻松,包括各种各样的第三方管理工具和可用的接口。请参阅 MongoDB 文档以获得更多信息。

map/reduce 函数

如果您以前使用过 CouchDB 数据库,可能熟悉 map/reduce 函数,因为视图引擎默认使用 map/reduce 函数来筛选和聚合数据。在 MongoDB 中,情况不是这样的,简单的查询和筛选(甚至聚合)不依靠 map/reduce 来完成。不过,MongoDB 确实为聚合大型数据集的应用提供了 map/reduce 实现。

map/reduce 这一主题可能需要一整篇文章来描述。有关 MongoDB 实现的详细信息,请参阅 MongoDB 文档。(参见参考资料中的链接)。


回页首

扩展 MongoDB

键/值存储和面向文档数据库最近流行的主要原因是它们占用资源少及其高度可扩展性。为了发挥这些优势,MongoDB 引入了分片和复制的概念,您将在本节中学习。此外,您还将学习如何在 MongoDB 中使用 GridFS 存储大文件。最后,您将了解如何对查询进行分析以优化数据库的性能。

分片

数据库基础架构的一个重要部分就是确保其良好的可扩展性。MongoDB 实现采用一种自动分片机制来确保其横向扩展,这使得 MongoDB 配置可扩展至数千个节点,具有自动负载平衡、无单点故障和自动故障转移功能,向 MongoDB 集群添加新机器也非常简单。

MongoDB 的自动分片特性的好处是它使得从单一服务器转向分片集群变得非常容易,通过无需或很少需要对所需的程序代码进行改动。有关自动分片的工作原理及如何实现它的详细信息,请参阅 MongoDB 文档。

复制

为了实现故障转移和冗余,MongoDB 在主从配置中提供了复制特性(类似于 MySQL),从而确保节点之间的高度一致性。也就是说,MongoDB 可以在任何时候使用副本集将某个节点定义为主节点,在故障时另一节点担负起主节点的任务。

与 CouchDB 使用复制作为扩展机制的思路不同,MongoDB 主要使用复制来确保高度可用性,方法是使用从属节点作为冗余副本。

有关 MongoDB 复制的更多信息,请参阅文档(参见参考资料中的链接)。

使用 GridFS 的大文件存储

MongoDB 数据库以 BSON 文档存储数据。BSON 文档的最大大小是 4MB,这不适合存储大文件和对象。MongoDB 通过将文件划分为多个文档之间的较小块,使用 GridFS 规范来存储大文件。

标准 MongoDB 发行版包含将 GridFS 文件添加到本地文件系统以及从本地文件系统检索 GridFS 文件的命令行工具。另外,所有官方 MongoDB API 驱动程序都包含对 GridFS 的支持。有关详细信息,请参阅 MongoDB 文档(参见参考资料)。


回页首

结束语

在本文中,您学习了 MongoDB 数据库管理系统,以及它成为 DBMS 市场受欢迎的 NoSQL 中成长最快的可选产品的原因。您学习了为何要选择优于传统 RDBMS 的面向文档数据库,以及 MongoDB 提供的各种强大功能。还学习了如何安装和使用 MongoDB 来存储和检索数据,以及它提供的各种工具和可扩展性选项。

参考资料

学习

获得产品和技术

讨论

from:http://www.ibm.com/developerworks/cn/opensource/os-mongodb4/