设为首页 收藏本站
查看: 550|回复: 0

[经验分享] 【转】Python 分布式文件系统 Mongodb GridFS

[复制链接]

尚未签到

发表于 2017-5-6 12:08:54 | 显示全部楼层 |阅读模式
mongodb GridFS 性能
性能, 网评还不错.
不过在生产环境中,国外有用于存储视频流的.
GridFS的一个优点是可以存储上百万的文件而无需担心扩容性.
通过同步复制,可以解决分布式文件的备份问题.
通过ARP-ping可以实现一个双机热备切换,类mysql的mysql master master replic

使用Nginx module

http://github.com/mdirolf/nginx-gridfs
这是gridfs的nginx module. 可以通过nginx直接访问读取mongo gridfs中的文件.
和nginx对应的mogilefs module类似.
优点: 由于直接通过nginx,速度是最快的.
缺点: 只能通过file_path来查找,目前不支持_id来查找.因此必须在file_path上
建立索引.
其他一些信息:
1.通过runcommand可以直接在mongodb端运行处理脚本. 比如像mapreduce,或者一
些需要读取数据然后进行处理的.
这些command则是使用javascript方式来编写的,很容易. 好处就是避免了数据在服
务端和客户端之间的读取和传输,
提高效率.
2. sharding
sharding在目前开发版中已经具备,但还不成熟. 但是可以自己实现sharding比较
好.因为目前的sharding还是比较硬性的.
3.灵活使用magic操作符和upsert,比如$inc,$all,$in 等等

#!/bin/bash
安装mongodb
#mongodb 1.2.4
official
#http://www.mongodb.org/
admin
#http://www.mongodb.org/display/DOCS/Admin+Zone
Manual
http://www.mongodb.org/display/DOCS/manual
GridFS+Tools
http://www.mongodb.org/display/DOCS/GridFS+Tools
config
http://www.mongodb.org/display/DOCS/File+Based+Configuration
http://bytebucket.org/namlook/mongokit/wiki/html/gridfs.html
客户端
easy_install pymongo
API:http://api.mongodb.org/python/current/api/pymongo/
http://api.mongodb.org/python/1.4%2B/examples/gridfs.html

以下是安装脚本
mkdir mongodb   
cd mongodb   
wget http://downloads.mongodb.org/linux/mongodb-linux-x86_64-static-legacy-1.2.4.tgz   
tar xzf mongodb-linux-x86_64-static-legacy-1.2.4.tgz   
cd mongodb-linux-x86_64-static-1.2.4/  
mkdir mongodb
cd mongodb
wget http://downloads.mongodb.org/linux/mongodb-linux-x86_64-static-legacy-1.2.4.tgz
tar xzf mongodb-linux-x86_64-static-legacy-1.2.4.tgz
cd mongodb-linux-x86_64-static-1.2.4/
#建立数据保存路径
mkdir data
cd data
mkdir db

启动服务
cd /home/bmc/mongodb/mongodb-linux-x86_64-static-1.2.4/bin/   
./mongod --dbpath=/home/bmc/mongodb/data/db/  
cd /home/bmc/mongodb/mongodb-linux-x86_64-static-1.2.4/bin/
./mongod --dbpath=/home/bmc/mongodb/data/db/
config
根据如下链接编写自己的config文件
http://www.mongodb.org/display/DOCS/File+Based+Configuration
你可以使用nginx+gridfs插件来进行访问mongodb,但是gridfs 插件需要boost,由于boost版本问题,这个东东基本安装不上或是安装很费劲,您可以使用django启动服务来代替这个复杂的插件,代码如下 :)
Views
return HttpResponse(im, mimetype="image/JPEG")  
return HttpResponse(im, mimetype="image/JPEG")
后台连接代码:
#encoding=utf-8  
from pymongo import Connection   
from gridfs import *   
from PIL import Image   
import StringIO   
import threading, time   
#文件处理系统   
class GFS:   
#定义connection and fs   
c = None   
db = None   
fs = None   
instance = None   
locker = threading.Lock()   
#初始化   
def __init__(self):   
print "__init__"  
GFS._connect()   
print "server info " + " * " * 40  
print GFS.c.server_info   
#获得单列对象   
@staticmethod  
def getInstance():   
GFS.locker.acquire()   
try:   
GFS.instance   
if not GFS.instance:   
GFS.instance = GFS()   
return GFS.instance   
finally:   
GFS.locker.release()   
#写入   
def put(self,name,image,format="png",mime="image"):   
gf = None   
data = None   
try:   
data = StringIO.StringIO()   
image.save(data,format)   
data.getvalue()   
name = "%s.%s" % (name,format)   
print "name is %s" % name   
gf = GFS.fs.open(name,"w")   
gf.content_type = "%s/%s" % (mime,format)   
gf.write(data.getvalue())   
finally:   
try:   
gf.close()   
data.close()   
finally:   
GFS.c = None   
GFS._connect()   
#获得图片   
def get(self,name):   
gf = None   
try:   
gf  = GFS.fs.open(name,"r")   
print gf   
im = gf.read()   
dic = {}           
dic["chunk_size"] =  gf.chunk_size   
dic["metadata"] = gf.metadata   
dic["mode"] = gf.mode   
dic["length"] = gf.length   
dic["upload_date"] = gf.upload_date   
dic["name"] = gf.name   
dic["content_type"] = gf.content_type   
return (im , dic)   
except Exception,e:   
print e   
return (None,None)   
finally:   
if gf:   
if not gf.closed:   
gf.close()   

#获得文件列表   
def list(self):   
return GFS.fs.list()   
#删除文件   
def remove(self,name):   
GFS.fs.remove(name)   
@staticmethod  
def _connect():   
if  not GFS.c:   
GFS.c = Connection("*********",27017)   
GFS.db = GFS.c['imagesdb']   
GFS.fs = GridFS(GFS.db)  
原文链接:http://www.iteye.com/topic/619643

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-373793-1-1.html 上篇帖子: python入门(七)类与对象和类与方法 下篇帖子: python发送GET或POST请求以便干一些趣事
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表