设为首页 收藏本站
查看: 860|回复: 0

[经验分享] SQL Server 按列连接字符串的三种方法

[复制链接]

尚未签到

发表于 2015-7-1 06:42:51 | 显示全部楼层 |阅读模式
最近做一个项目,遇到一个在分组的情况下,将某一列的字段值(varchar类型)连接起来的问题,类似于sum函数对int型字段值求和。 如有一个表t_table,结构和数据如图1

DSC0000.jpg

                                          图1

    其中要按着xh字段分组,并且将每一组name字段值连接起来。最终结果希望如图2所示


DSC0001.jpg

             图2
  表中的th字段值对于每一个xh值是唯一的,也是有限的,也就是说,对于一个xh值,th的值不会太多,如最多是10个(从1至10)。
  以上需求最终想了三种方法来解决这个问题。
  一、修改表结构
  如果是新的项目,可以考虑修改一下表的结构。如果t_table的结构修改如下:

    xh     value1 value2   value3    value4     .... ....                 value10
   0001 123456 654321 456789  
   0002 12abcd 4d2r343 343dfd
   0003 abcde3 132323
  这种方法将value的值纵向改为横向,也就是说,按每一个xh值,将value字段的值按逆时针旋转了90度。 但这种方法要有一个前提,就是假设xh的每一个值所对应的value值不会太多,如上面不超过10个,这样才有可能建立有限个字段。如果按着上面的字段结构,只需要将这些字段加一起就可以了,也不用分组。如下所示:


select xh , (value1 + value2 + value3 + DSC0002.gif + value10) as value from t_table  但这种方法至少有如下三个缺陷:
  1. 需要修改表结构,这对于已经进行很长时间或是已经上线的项目产不适用
  2. 对每一个xh字段的value取值数有限制,如果太多,就得建立很多字段。这样性能会降低。
  3. 这样做虽然查询容易,但如果需要对每一个xh的不同值频繁修改或加入新的值时,如果把它们都放到一行,容易因为行锁而降低性能。
二、动态生成select语句

    让我们先看三条SQL语句:


select xh,value as th1 from t_table where th=1
select xh,value as th2 from t_table where th=2
select xh,value as th3 from t_table where th=3

这三条语句分别使用th字段按着所有th可能的值来查询t_table,这三条SQL语句所查询出来的记录如图3所示。

DSC0003.jpg

                        图 3

  然后再使用下面的语句按着xh分组:



    select xh from t_table group by xh
得到的结果如图4所示。

DSC0004.jpg

       图4


  然后使用left join,以图4所示的表为最左边的表,进行连接,SQL语句如下:


select a.xh, b.th1, c.th2, d.th3 from
(select xh from t_table group by xh) a
left join
(select xh,value as th1 from t_table where th=1) b on a.xh=b.xh
left join
(select xh,value as th2 from t_table where th=2) c on a.xh=c.xh
left join
(select xh,value as th3 from t_table where th=3) d on a.xh=d.xh

    之所以使用left join,是因为按着th查询后,有的表的某些xh值可以没有,如图3中的第三个表,就没有0003。如果使用内连接,0003就无法在记录集中体现。这面的SQL的查询结果如图5所示。


DSC0005.jpg

              图5

    然后我们就可以使用如下的语句来连接th1、th2和th3了。  


select xh, (th1+th2+th3) as th from myview  myview表示将上面用left join的语句保存成的视图。
下面可以将这个过程写成一条SQL语句:


select xh, (th1+th2+th3) as th from
(
select a.xh,  (case when b.th1 is null then '' else b.th1 end) as th1,
(case when c.th2 is null then '' else c.th2 end) as th2,
(case when d.th3 is null then '' else d.th3 end) as th3
from
(select xh from t_table group by xh) a  
left join
(select xh,value as th1 from t_table where th=1) b on a.xh=b.xh
left join
(select xh,value as th2 from t_table where th=2) c on a.xh=c.xh
left join
(select xh,value as th3 from t_table where th=3) d on a.xh=d.xh
) x

  由于null加上任何字符串都为null,因此,使用case语句来将null转换为空串。上面的SQL就会得到图2所示的查询结果。也许有的读者会问,如果th的可能取值可变呢!如xh为0001的th值四个:1至4。 那上面的SQL不是要再加一个left join吗?这样不是很不通用。 要解决这个问题也很容易。可以使用程序(如C#、Java等)自动生成上述的SQL,然后由程序提交给数据库,再执行。 当然,这需要程序事先知道th值对于当前程序最多有几个值,然后才可以自动生成上述的SQL语句。
这种方法几乎适合于所有的数据库,不过如果th的取值比较多的话,可能SQL语句会很长,但是如果用程序自动生成的话,就不会管这些了。


三、使用C#实现SQL Server2005的扩展聚合函数(当然,也可以用VB.NET)

    这一种方法笔者认为是最“酷”的方法。因为每一个人都只想写如下的SQL语句就可以达到目录。


select xh, dbo.joinstr(value) from t_table group by xh
  其中joinstr是一个聚合函数,功能是将每一组的某个字符串列的值首尾连接。上面的SQL也可以查询图2所示的结果。但遗憾的是,sql server2005并未提供可以连接字符串的聚合函数。下面我们就来使用C#来实现一个扩展聚合函数。
     首先用VS2008/VS2005建立一个SQL Server项目,如图6所示。

DSC0006.jpg

                                                                    图6

    点击“确定”按钮后,SQL Server项目会要求连接一个数据库,我们可以选择一个数据库,如图7所示。

DSC0007.jpg

                                       图7

    然后在工程中加入一个聚合类(joinstr.cs),如图8所示。

DSC0008.jpg

                                                                                      图8
    joinstr.cs中的最终代码如下:



using System;
using System.Data;
using Microsoft.SqlServer.Server;
using System.Data.SqlTypes;
using System.IO;
using System.Text;

[Serializable]
[SqlUserDefinedAggregate(
    Format.UserDefined, //use custom serialization to serialize the intermediate result
    IsInvariantToNulls = true, //optimizer property
    IsInvariantToDuplicates = false, //optimizer property
    IsInvariantToOrder = false, //optimizer property   
    MaxByteSize = 8000) //maximum size in bytes of persisted value
]

public struct joinstr :IBinarySerialize
{
    private System.Text.StringBuilder intermediateResult;
   
    public void Init()
    {
        // 在此处放置代码
        intermediateResult = new System.Text.StringBuilder();
    }

    public void Accumulate(SqlString Value)
    {
        intermediateResult.Append(Value.Value);
    }

    public void Merge(joinstr Group)
    {
        intermediateResult.Append(Group.intermediateResult);
    }

    public SqlString Terminate()
    {
        return new SqlString(intermediateResult.ToString());
    }

    public void Read(BinaryReader r)
    {
        intermediateResult = new StringBuilder(r.ReadString());
    }

    public void Write(BinaryWriter w)
    {
        w.Write(this.intermediateResult.ToString());
    }
}

  由于本例需要聚合字符串,而不是已经被序列化的类型,如int等,因此,需要实现IBinarySerialize接口来手动序列化。使用C#实现SQL Server聚合函数,也会受到字符串最大长度为8000的限制。
     在编写完上述代码后,可以使用Visual Studio来部署(右向工程,在弹出菜单上选“部署”即可)。也可以使用SQL语句来部署。假设上面的程序生成的dll为MyAggregate.dll,可以使用下面的SQL语句来部署:


CREATE ASSEMBLY MyAgg FROM 'D:\test\MyAggregate.dll'

CREATE AGGREGATE joinstr (@input nvarchar(200)) RETURNS nvarchar(max)
EXTERNAL NAME MyAgg.joinstr

    要注意的是,字符串类型需要用nvarchar,而不能用varchar。
  第一条SQL语句是装载dll,第二条SQL语句是注册joinstr聚合函数(每一个C#类就是一个聚合函数)
在执行上面的SQL语句之前,需要将SQL Server2005的clr功能打开。如图9所示。


DSC0009.jpg

                                               图9

    如果想删除上面建立的聚合函数,可以使用如下的SQL语句:


drop aggregate joinstr
  在删除聚合函数后,可以将MyAggregate.dll卸载。

drop assembly MyAgg  OK,现在可以使用joinstr来聚合字符串了。

    这种方法虽然显示很“酷”,但却要求开发人员熟悉扩展聚合函数的开发方法,如果开发人员使有的不是微软的开发工具,如使用Java,恐怕这种方法就只能是空谈了(除非开发小组内有人会用微软的开发工具)。
  当然,如果使用其他的数据库,如oracle、mysql,也是可以实现类似扩展函数的功能的,如oracle可以使用java来进行扩展。但这要求开发人员具有更高的素质。
    以上介绍的三种方法仅供参考,至于采用哪种方法,可根据实际需要和具体情况而定。如果哪位读者有更好的方法,请跟贴!

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-82064-1-1.html 上篇帖子: 读取sql server 数据库图片信息 下篇帖子: [译] 流言终结者 —— “SQL Server 是Sybase的产品而不是微软的”
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表