设为首页 收藏本站
查看: 1346|回复: 0

[经验分享] python sqlite的编码问题

[复制链接]

尚未签到

发表于 2015-4-27 09:40:20 | 显示全部楼层 |阅读模式
从http://initd.org/tracker/pysqlite/wiki/pysqlite下载了SQLITE
的PYTHON绑定。并用WINDOWS下的sqlite3.exe创建了一个库一张表:
+++++++++++++++++++
-database: wanna
-table name: hello
-id name
---- ---------
0 帅哥
1 wannachan
2 dick.chan
3 雯雯
+++++++++++++++++++
好了,建表成功了!下面开始PYSQLITE来操作此数据库了!心情那个激动啊~~
首先建立连接:
>>> from pysqlite2 import dbapi2 as sqlite
>>> con=sqlite.connect("g:\sqlite\wanna")
再启用cursor:
>>> cur=con.cursor()
激动人心的时刻到了!执行SQL:
----------------------------------------------
>>> cur.execute('select * from hello')
Traceback (most recent call last):
File "", line 1, in  
cur.execute('select * from hello')
OperationalError: Could not decode to UTF-8 column 'name' with text '帅哥'
----------------------------------------------
OH!NO!竟说我的‘帅哥’不能以UTF-8编码!咋办捏?咋办捏?!
上网查查看!看到有人用这个con=sqlite.connect("database",encoding='cp936')
我也试试,结果:
----------------------------------------------------------------
>>> con=sqlite.connect("g:\sqlite\wanna",encoding='cp936')
Traceback (most recent call last):
File "", line 1, in  
TypeError: 'encoding' is an invalid keyword argument for this function
----------------------------------------------------------------
看来以前用的版本才有encoding这参数,现在我的2.5版没有哇!看来只有看manual
了!于是俺万分不情愿地翻开MAN看了起来,原来是要指定text_factory才行!
于是俺试着抄它一句例子来试试:
>>> con.text_factory=lambda x: unicode(x, "utf-8", "ignore")
表示是用UTF8来编码取得RECORD,如果非UTF-8则ignore。俺心知自己的编码是GBK,
但也想看看会有什么错出现,于是继续:
----------------------------------------------
>>> cur=con.cursor()
>>> cur.execute('select * from hello')

>>> rs=cur.fetchall()
>>> rs[0]
(0, u'')
>>> rs[1]
(1, u'wannachan')
>>> rs[2]
(2, u'dick.chan')
>>> rs[3]
(3, u'')
----------------------------------------------
可以看到,我的两项有中文的RECORD都由于编码不符被忽略成了u''了,这时我
心中看到了光明!下面用GBK(CP936)来编码试试:
----------------------------------------------
>>> con.text_factory=lambda x: unicode(x, "cp936", "ignore")
>>> cur=con.cursor()
>>> cur.execute('select * from hello')

>>> rs=cur.fetchall()
>>> rs[0]
(0, u'\u9648\u67f1')
>>> u'\u9648\u67f1'
u'\u9648\u67f1'
>>> print rs[0][1]
帅哥
----------------------------------------------
HOHO!成功了一大步!这时我想,如果我指它UTF-8不IGNORE会怎么样?
说干就干:
----------------------------------------------
>>> con.text_factory=lambda x: unicode(x, "utf-8")
>>> cur=con.cursor()
>>> cur.execute('select * from hello')
Traceback (most recent call last):
File "", line 1, in  
cur.execute('select * from hello')
File "", line 1, in  
con.text_factory=lambda x: unicode(x, "utf-8")
UnicodeDecodeError: 'utf8' codec can't decode byte 0xb3 in position 0:
unexpected code byte
----------------------------------------------
出错了!说明编码不MATCH真的不能用,那么如果我的RECORD有多种编码
咋办呢?于是我尝试用MANUAL上出现过的UNICODE OPTION来试试:
----------------------------------------------
>>> con.text_factory = sqlite.OptimizedUnicode
>>> cur=con.cursor()
>>> cur.execute('select * from hello')
Traceback (most recent call last):
File "", line 1, in  
cur.execute('select * from hello')
OperationalError: Could not decode to UTF-8 column 'name' with text '帅哥'
>>>
----------------------------------------------
TNND,竟然UNICODE也用UTF-8来ENCODE,这不是欺负人么?明知UTF-8存汉字占空间大的不行!
于是俺再仔细的看MANUAL,终于看到有个是以byteString的形式传回来的了。
俺想,这个不涉及到具体的ENCODING,应该就算有不同的CHARSET都不会有ERROR吧!
试试:
----------------------------------------------
>>> from pysqlite2 import dbapi2 as sqlite
>>> con=sqlite.connect("g:\sqlite\wanna")
>>> con.text_factory=str #str代表以byte string形式return
>>> cur=con.cursor()
>>> cur.execute('select * from hello')

>>> rs=cur.fetchall()
>>> rs[0][1]
'\xb3\xc2\xd6\xf9'
>>> print rs[0][1]
帅哥
----------------------------------------------
HAHA!成功了!得到了BYTECODE STRING,就可以按指定的编码来解码它,就可以
得到正确的输出了!
看看上面那个BYTECODE STRING '\xb3\xc2\xd6\xf9',试着给它解码:
>>> '\xb3\xc2\xd6\xf9'.decode('cp936')
u'\u9648\u67f1'
果然得到了一个UNICODE串了,俺再判断它是否等于我们预期的字串?
>>> _ == u'帅哥'
True
>>> u'帅哥'
u'\u9648\u67f1'
很明显是一样的串!OK,解决了!
最后的想法:
1,如果在text_factory=str之前,俺把str定义成了一个变量,override了它作
为的这个身份,那会不会出错呢?
2,喜欢用PYTHON,就是因为它的中文问题总是那么容易解决,想将编码怎么转
换就怎么转换!一点也不含糊!

from:http://www.iyunv.com/changyou/archive/2010/01/09/1642980.html

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-61054-1-1.html 上篇帖子: python数据库编程_sqlite 下篇帖子: python.sqlite3 简单操作
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表