设为首页 收藏本站
查看: 1150|回复: 0

[经验分享] 图解SQL的Join-python,爬虫,scrapy研究

[复制链接]

尚未签到

发表于 2018-10-23 08:40:03 | 显示全部楼层 |阅读模式
图解SQL的Join
  2011年1月11日陈皓发表评论阅读评论 34,566 人阅读
  对于SQL的Join,在学习起来可能是比较乱的。我们知道,SQL的Join语法有很多inner的,有outer的,有left的,有时候,对于Select出来的结果集是什么样子有点不是很清楚。Coding Horror上有一篇文章(实在不清楚为什么Coding Horror也被墙)通过 文氏图 Venn diagrams 解释了SQL的Join。我觉得清楚易懂,转过来。
  假设我们有两张表。

  •   Table A 是左边的表。
  •   Table B 是右边的表。
  其各有四条记录,其中有两条记录是相同的,如下所示:
id name       id  name  
-- ----       --  ----
  
1  Pirate     1   Rutabaga
  
2  Monkey     2   Pirate3  Ninja      3   Darth Vader
  
4  Spaghetti  4   Ninja
  下面让我们来看看不同的Join会产生什么样的结果。
SELECT * FROM TableAINNER JOIN TableB  
ON TableA.name = TableB.name
  

  
id  name       id   name
  
--  ----       --   ----
  
1   Pirate     2    Pirate
  
3   Ninja      4    Ninja
  Inner join
  产生的结果集中,是A和B的交集。

DSC0000.png SELECT * FROM TableAFULL OUTER JOIN TableB  
ON TableA.name = TableB.name
  

  
id    name       id    name
  
--    ----       --    ----
  
1     Pirate     2     Pirate
  
2     Monkey     null  null3     Ninja      4     Ninja
  
4     Spaghetti  null  nullnull  null       1     Rutabaganull  null       3     Darth Vader
  Full outer join 产生A和B的并集。但是需要注意的是,对于没有匹配的记录,则会以null做为值。

DSC0001.png SELECT * FROM TableALEFT OUTER JOIN TableB  
ON TableA.name = TableB.name
  

  
id  name       id    name
  
--  ----       --    ----
  
1   Pirate     2     Pirate
  
2   Monkey     null  null3   Ninja      4     Ninja
  
4   Spaghetti  null  null
  Left outer join 产生表A的完全集,而B表中匹配的则有值,没有匹配的则以null值取代。

DSC0002.png SELECT * FROM TableA  
LEFT OUTER JOIN TableB
  
ON TableA.name = TableB.nameWHERE TableB.id IS null id  name       id     name
  
--  ----       --     ----
  
2   Monkey     null   null4   Spaghetti  null   null
  产生在A表中有而在B表中没有的集合。

DSC0003.png SELECT * FROM TableA  
FULL OUTER JOIN TableB
  
ON TableA.name = TableB.nameWHERE TableA.id IS null
  
OR TableB.id IS nullid    name       id    name
  
--    ----       --    ----
  
2     Monkey     null  null4     Spaghetti  null  nullnull  null       1     Rutabaganull  null       3     Darth Vader
  产生A表和B表都没有出现的数据集。
DSC0004.png

  还需要注册的是我们还有一个是“交差集” cross join, 这种Join没有办法用文式图表示,因为其就是把表A和表B的数据进行一个N*M的组合,即笛卡尔积。表达式如下:
SELECT * FROM TableACROSS JOIN TableB  这个笛卡尔乘积会产生 4 x 4 = 16 条记录,一般来说,我们很少用到这个语法。但是我们得小心,如果不是使用嵌套的select语句,一般系统都会产生笛卡尔乘积然再做过滤。这是对于性能来说是非常危险的,尤其是表很大的时候。
  更新:2014年3月30日
DSC0005.jpg

  (全文完)
  原文链接:http://coolshell.cn/articles/3463.html



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-625208-1-1.html 上篇帖子: 40. SQL -- 批处理及流程控制语句(2) 下篇帖子: Configure VNC Server on CentOS 7 / RHEL 7-Permanent
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表