MongoDB+GridFS存储文件方案
zhezhongyun 2025-01-05 00:38 90 浏览
GridFS是MongoDB的一个内置功能, 它提供一组文件操作的API以利用MongoDB存储文件, GridFS的基本原理是将文件保存在两个Collection中, 一个保存文件索引, 一个保存文件内容, 文件内容按一定大小分成若干块,
每一块存在一个Document中, 这种方法不仅提供了文件存储, 还提供了对文件相关的一些附加属性(比如MD5值, 文件名等等)的存储。
http://www.mongodb.org/display/DOCS/GridFS
http://www.mongodb.org/display/DOCS/GridFS+Specification
安装文档
https://docs.mongodb.com/manual/installation/
环境搭建
1.安装mongoDb
vim /etc/yum.repos.d/mongodb.repo
如果是64bit的
[mongodb]
name=MongoDB Repository
baseurl=http://downloads-distro.mongodb.org/repo/redhat/os/x86_64/
gpgcheck=0
enabled=1
32bit的系统:
[mongodb]
name=MongoDB Repository
baseurl=http://downloads-distro.mongodb.org/repo/redhat/os/i686/
gpgcheck=0
enabled=1
然后安装, 会提示Y/N:
yum install mongo-10gen mongo-10gen-server # 此时在安装之前会自动更新yum源 mongodb-org与mongo-10gen 10gen 是 MongoDB 原来的名字, 在源里还留着 10gen 只是为了旧包的维护, 现在就不要用 10gen 了
启动:
service mongod start
查看状态
service mongod status
停止
service mongod stop
2.安装nginx及nginx-gridfs
依赖库、工具
# yum -y install pcre-devel openssl-devel zlib-devel
# yum -y install gcc gcc-c++
下载nginx-gridfs源码
# git clone https://github.com/mdirolf/nginx-gridfs.git
# cd nginx-gridfs
# git checkout v0.8
# git submodule init
# git submodule update
下载nginx源码,编译安装。(高版本支持不好)
# wget http://nginx.org/download/nginx-1.4.7.tar.gz
# tar zxvf nginx-1.4.7.tar.gz
# cd nginx-1.4.7
# ./configure --with-openssl=/usr/include/openssl --add-module=../nginx-gridfs/
# make -j8 && make install –j8
解释: make -j4 作业数是在编译的时候指定主机的CPU个数
../nginx-gridfs/ 配置成对应nginx-gridfs的路径
3. 配置nginx-gridfs
vim /usr/local/nginx/conf/nginx.conf
在 server 节点中添加 location 节点
location /img/ {
gridfs testdb
field=filename
type=string;
mongo 192.168.0.159:27017;
}
location /files/ {
gridfs testdb
field=_id
type=objectid;
mongo 192.168.0.159:27017;
}
这里我们的mongo服务在IP 192.168.0.159。
如果不指定 field, 默认为 MongoDB 的自增ID, 且type为int
配置参数介绍:
gridfs:nginx识别插件的关键字
testdb:db名
[root_collection]: 选择collection, 如root_collection=blog, mongod就会去找blog.files与blog.chunks两个块, 默认是fs
[field]: 查询字段, 保证mongdb里有这个字段名, 支持_id, filename, 可省略, 默认是_id
[type]: 解释field的数据类型, 支持objectid, int, string, 可省略, 默认是int
[user]: 用户名, 可省略
[pass]: 密码, 可省略
mongo: mongodb url
启动nginx服务
# /usr/local/nginx/sbin/nginx
可能出现:
Nginx [emerg]: bind() to 0.0.0.0:80 failed (98: Address already in use)
这时可用使用命令关闭占用80端口的程序
sudo fuser -k 80/tcp
GridFS使用
MongoDB提供了一个命令行工具mongofiles可以来处理GridFS, 在bin目录下。
列出所有文件:
mongofiles list
上传一个文件:
mongofiles put xxx.txt
下载一个文件:
mongofiles get xxx.txt
查找文件:
mongofiles search xxx //会查找所有文件名中包含“xxx”的文件
mongofiles list xxx //会查找所有文件名以“xxx”为前缀的文件
参数说明:
–d 指定数据库, 默认是fs, Mongofiles list –d testGridfs
-u –p 指定用户名, 密码
-h 指定主机
-port 指定主机端口
-c 指定集合名, 默认是fs
-t 指定文件的MIME类型, 默认会忽略
使用MongoVUE来查看,管理GridFS
MongoVUE地址:http://www.mongovue.com/
MongoVUE是个免费软件, 但超过15天后功能受限。可以通过删除以下注册表项来解除限制:
[HKEY_CURRENT_USER\Software\Classes\CLSID\{B1159E65-821C3-21C5-CE21-34A484D54444}\4FF78130]
把这个项下的值全删掉就可以了。
<?php
// 初始化gridfs
$conn = new Mongo(); // 连接MongoDB
$db = $conn->photos; // 选择数据库
$collection = $db->getGridFS(); // 取得gridfs对象
// gridfs有三种方式存储文件
// 第一种直接存储文件
$id = $collection->storeFile("./logo.png");
// 第二种存储文件二进制流
$data = file_get_contents("./logo.png");
$id = $collection->storeBytes($data,array("param" => '附加参数将随图片一起存入'));
// 第三种保存直接表单提交的文件$_FILES
$id = $collection->storeUpload('upfile');
// 相当于
$id = $collection->storeFile($_FILES['upfile']['tmp_name']);
//--------------以上是保存图片--下面开始读取图片----------------
// 保存成功后返回$id = md5字符串
$logo = $collection->findOne(array('_id'=>$id)); // 以_id为索引取得文件
header('Content-type: image/png'); // 输出图片头
echo $logo ->getBytes(); // 输出数据流
?>
特别备注:
通过 $id = $collection->storeFile($_FILES['upfile']['tmp_name']); 产生的ID, 是MongoDB的 ID对象, 而不是一个 字符串! 如以下格式:
{
"_id": ObjectId("525418525ba8a18c1b000001"),
"filename": "D:\\php\\xampp\\tmp\\php8116.tmp",
"uploadDate": ISODate("2013-10-08T14:36:02.0Z"),
"length": NumberInt(55862),
"chunkSize": NumberInt(262144),
"md5": "a6f19f3434f0b36bb2611cd4c6d82b35"
}
不过, 我们可以通过 $id = strval($id), 把上述 ID对象字符串化, 如可得到上述的 525418525ba8a18c1b000001 值, 再把这个值存到MySQL数据库中, 到时候可通过这个字符串ID 作为条件, 找到相应的MongoDB资源。
参考代码如下:
$conn = new Mongo(C('127.0.0.1:27017')); //如果设置了密码自己配置DSN
$db=$conn->selectDB('edu_sns'); // 选择数据库
$collection = $db->getGridFS('zk_attach'); // 选择集合,相等于选择数据表
$id=$_GET['id'];
$object=$collection->findOne(array('_id'=>new MongoId($id)));
header('Content-type: image/png');
echo $object->getBytes();
完整流程
1、前端上传文件html index.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Mongo Gridfs</title>
</head>
<body>
<form action="upload.php" method="post" enctype="multipart/form-data">
<label for="upfile" >上传图片</label>
<input type="file" id="upfile" name="upfile" />
<input type="submit" />
</form>
</body>
</html>2、上传文件进入MongoDB数据库并返回图片的索引ID upload.php
<?php
//上传图片到
header("Content-type:text/html;charset=utf-8");
// 连接Mongo并初始化GFS
// 数据库命名 picDB;集合命名pic_userid
$conn = new MongoClient();
$db = $conn->picDB;
// 取得gridfs对象
$prefix = 'pic';
$collection = $db->getGridFS($prefix);
// 上传图片
if(isset($_FILES['upfile'])){
$id = $collection->storeUpload('upfile');
$id = strval($id);
echo "<p>图片路径为:<font color=red>http://{$_SERVER['HTTP_HOST']}/image.php?id={$id}</font></p>";
}
?>3、根据图片ID直接从MongoDB里面获取图片资源并显示 image.php
<?php
// 根据ID索引值将图片资源取出来,即图片二进制数据
$conn = new Mongo();
$db = $conn->picDB;
// 取得gridfs对象
$prefix = 'pic';
$collection = $db->getGridFS($prefix);
$id = $_GET['id'];
$object = $collection->findOne(array('_id' => new MongoId($id)));
header('Content-type:image/jpg');
echo $object->getBytes();
?>在upload.php里面万一根据ID无法取出数据! 应该做出提示。
在image.php里面应该添加异常处理, 如果取出的数据格式不是image而是其他格式! 要提前判断type。
最后, 要在MongoDB的使用中添加授权使用! 因为mongo默认是非授权使用的, 也就是访问数据库时不需要提供用户名和密码。
参考类库:
https://github.com/crodas/MongoFS
相关推荐
- Python入门学习记录之一:变量_python怎么用变量
-
写这个,主要是对自己学习python知识的一个总结,也是加深自己的印象。变量(英文:variable),也叫标识符。在python中,变量的命名规则有以下三点:>变量名只能包含字母、数字和下划线...
- python变量命名规则——来自小白的总结
-
python是一个动态编译类编程语言,所以程序在运行前不需要如C语言的先行编译动作,因此也只有在程序运行过程中才能发现程序的问题。基于此,python的变量就有一定的命名规范。python作为当前热门...
- Python入门学习教程:第 2 章 变量与数据类型
-
2.1什么是变量?在编程中,变量就像一个存放数据的容器,它可以存储各种信息,并且这些信息可以被读取和修改。想象一下,变量就如同我们生活中的盒子,你可以把东西放进去,也可以随时拿出来看看,甚至可以换成...
- 绘制学术论文中的“三线表”具体指导
-
在科研过程中,大家用到最多的可能就是“三线表”。“三线表”,一般主要由三条横线构成,当然在变量名栏里也可以拆分单元格,出现更多的线。更重要的是,“三线表”也是一种数据记录规范,以“三线表”形式记录的数...
- Python基础语法知识--变量和数据类型
-
学习Python中的变量和数据类型至关重要,因为它们构成了Python编程的基石。以下是帮助您了解Python中的变量和数据类型的分步指南:1.变量:变量在Python中用于存储数据值。它们充...
- 一文搞懂 Python 中的所有标点符号
-
反引号`无任何作用。传说Python3中它被移除是因为和单引号字符'太相似。波浪号~(按位取反符号)~被称为取反或补码运算符。它放在我们想要取反的对象前面。如果放在一个整数n...
- Python变量类型和运算符_python中变量的含义
-
别再被小名词坑哭了:Python新手常犯的那些隐蔽错误,我用同事的真实bug拆给你看我记得有一次和同事张姐一起追查一个看似随机崩溃的脚本,最后发现罪魁祸首竟然是她把变量命名成了list。说实话...
- 从零开始:深入剖析 Spring Boot3 中配置文件的加载顺序
-
在当今的互联网软件开发领域,SpringBoot无疑是最为热门和广泛应用的框架之一。它以其强大的功能、便捷的开发体验,极大地提升了开发效率,成为众多开发者构建Web应用程序的首选。而在Spr...
- Python中下划线 ‘_’ 的用法,你知道几种
-
Python中下划线()是一个有特殊含义和用途的符号,它可以用来表示以下几种情况:1在解释器中,下划线(_)表示上一个表达式的值,可以用来进行快速计算或测试。例如:>>>2+...
- 解锁Shell编程:变量_shell $变量
-
引言:开启Shell编程大门Shell作为用户与Linux内核之间的桥梁,为我们提供了强大的命令行交互方式。它不仅能执行简单的文件操作、进程管理,还能通过编写脚本实现复杂的自动化任务。无论是...
- 一文学会Python的变量命名规则!_python的变量命名有哪些要求
-
目录1.变量的命名原则3.内置函数尽量不要做变量4.删除变量和垃圾回收机制5.结语1.变量的命名原则①由英文字母、_(下划线)、或中文开头②变量名称只能由英文字母、数字、下画线或中文字所组成。③英文字...
- 更可靠的Rust-语法篇-区分语句/表达式,略览if/loop/while/for
-
src/main.rs://函数定义fnadd(a:i32,b:i32)->i32{a+b//末尾表达式}fnmain(){leta:i3...
- C++第五课:变量的命名规则_c++中变量的命名规则
-
变量的命名不是想怎么起就怎么起的,而是有一套固定的规则的。具体规则:1.名字要合法:变量名必须是由字母、数字或下划线组成。例如:a,a1,a_1。2.开头不能是数字。例如:可以a1,但不能起1a。3....
- Rust编程-核心篇-不安全编程_rust安全性
-
Unsafe的必要性Rust的所有权系统和类型系统为我们提供了强大的安全保障,但在某些情况下,我们需要突破这些限制来:与C代码交互实现底层系统编程优化性能关键代码实现某些编译器无法验证的安全操作Rus...
- 探秘 Python 内存管理:背后的神奇机制
-
在编程的世界里,内存管理就如同幕后的精密操控者,确保程序的高效运行。Python作为一种广泛使用的编程语言,其内存管理机制既巧妙又复杂,为开发者们提供了便利的同时,也展现了强大的底层控制能力。一、P...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 教程 (33)
- HTML 简介 (35)
- HTML 实例/测验 (32)
- HTML 测验 (32)
- JavaScript 和 HTML DOM 参考手册 (32)
- HTML 拓展阅读 (30)
- HTML文本框样式 (31)
- HTML滚动条样式 (34)
- HTML5 浏览器支持 (33)
- HTML5 新元素 (33)
- HTML5 WebSocket (30)
- HTML5 代码规范 (32)
- HTML5 标签 (717)
- HTML5 标签 (已废弃) (75)
- HTML5电子书 (32)
- HTML5开发工具 (34)
- HTML5小游戏源码 (34)
- HTML5模板下载 (30)
- HTTP 状态消息 (33)
- HTTP 方法:GET 对比 POST (33)
- 键盘快捷键 (35)
- 标签 (226)
- opacity 属性 (32)
- transition 属性 (33)
- 1-1. 变量声明 (31)
