设为首页 收藏本站
查看: 506|回复: 0

[经验分享] Oracle 中实现随机抽取数据

[复制链接]

尚未签到

发表于 2016-7-24 08:14:34 | 显示全部楼层 |阅读模式
  转载来源:http://www.orafans.org/2006/09/oracle-random-record.html
  转载来源:http://kb.cnblogs.com/a/1443619/
  
  一、Oracle取随机数据
1、Oracle访问数据的基本方法:
1)、全表扫描(Full table Scan):执行全表扫描,Oracle读表中的所有记录,考查每一行是否满足WHERE条件。Oracle顺序的读分配给该表的每一个数据块,且每个数据块Oracle只读一次.这样全表扫描能够受益于多块读.

2)、采样表扫描(sample table scan):扫描返回表中随机采样数据,这种访问方式需要在FROM语句中包含SAMPLE选项或者SAMPLE BLOCK选项.

注:从Oracle8i开始Oracle提供采样表扫描特性


2、使用sample获得随机结果集
2.1、语法: SAMPLE [ BLOCK ](sample_percent)[ SEED (seed_value) ]
SAMPLE选项:表示按行采样来执行一个全表扫描,Oracle从表中读取特定百分比的记录,并判断是否满足WHERE子句以返回结果。
BLOCK: 表示使用随机块例举而不是随机行例举。
sample_percent:是随机获取一张表中记录的百分比。比如值为10,那就是表中的随机的百分之10的记录。
值必须大于等于.000001,小于100。
SEED:表示从哪条记录返回,类似于预先设定例举结果,因而每次返回的结果都是固定的。该值必须介于0和4294967295之间。
2.2、举例说明
创建测试临时表:

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>createtablezeenoasselect*fromdba_objects;



SQL>create table zeeno as select * from dba_objects;   
  
1)、sample(sample_percent):

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • --从表zeeno中“全表扫描”随机抽取10%的记录,随机查询5条记录

  • SQL>selectobject_namefromzeenosample(10)whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • UET$

  • VIEW$
  • I_SUPEROBJ2
  • TRIGGERCOL$
  • I_VIEW1

  • SQL&gt;/

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • I_FILE1
  • IND$
  • CLU$
  • FET$
  • I_COBJ#




-- 从表zeeno中“全表扫描”随机抽取10%的记录,随机查询5条记录
SQL>select object_name from zeeno sample(10) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
UET$
VIEW$
I_SUPEROBJ2
TRIGGERCOL$
I_VIEW1   
SQL&gt; /
OBJECT_NAME
--------------------------------------------------------------------------------
I_FILE1
IND$
CLU$
FET$
I_COBJ#

  
2)、sample block(sample_percent)

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • --从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录

  • SQL>selectobject_namefromzeenosampleblock(10)whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • URIFACTORY
  • DBMS_XMLGEN
  • DBMS_XMLGEN
  • DBMS_XMLSTORE
  • DBMS_XMLSTORE




-- 从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录
SQL> select object_name from zeeno sample block(10) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
URIFACTORY
DBMS_XMLGEN
DBMS_XMLGEN
DBMS_XMLSTORE
DBMS_XMLSTORE

  
  3)、sample block(sample_percent) seed(seed_value)

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • --使用seed,返回固定的结果集。从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录。

  • SQL>selectobject_namefromzeenosample(10)seed(10)whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • UET$
  • I_CON1
  • I_FILE2
  • FET$
  • I_COL1


  • SQL&gt;selectobject_namefromzeenosample(10)seed(10)whererownum&lt;6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • UET$
  • I_CON1
  • I_FILE2
  • FET$
  • I_COL1




-- 使用seed,返回固定的结果集。从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录。
SQL> select object_name from zeeno sample(10) seed(10) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
UET$
I_CON1
I_FILE2
FET$
I_COL1
SQL&gt; select object_name from zeeno sample(10) seed(10) where rownum&lt;6;
OBJECT_NAME
--------------------------------------------------------------------------------
UET$
I_CON1
I_FILE2
FET$
I_COL1

  
  注意以下几点:
  1.sample只对单表生效,不能用于表连接和远程表
2.sample会使SQL自动使用CBO

  
  
  3、使用DBMS_RANDOM包
DBMS_RANDOM有两种主要的使用方法分别是:DBMS_RANDOM.VALUE()和DBMS_RANDOM.RANDOM
  
  3.1、取随机数

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>selectdbms_random.value()fromdual;

  • DBMS_RANDOM.VALUE()

  • -------------------
  • 0.146123095968043


  • SQL>selectdbms_random.value()fromdual;

  • DBMS_RANDOM.VALUE()

  • -------------------
  • 0.90175764902345



SQL> select dbms_random.value() from dual;
DBMS_RANDOM.VALUE()
-------------------
0.146123095968043
SQL> select dbms_random.value() from dual;
DBMS_RANDOM.VALUE()
-------------------
0.90175764902345
  

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>selectdbms_random.value(1,10)fromdual;

  • DBMS_RANDOM.VALUE(1,10)

  • -----------------------
  • 9.86601968210438


  • SQL>selectdbms_random.value(1,10)fromdual;

  • DBMS_RANDOM.VALUE(1,10)

  • -----------------------
  • 3.43475105499398



SQL> select dbms_random.value(1,10) from dual;
DBMS_RANDOM.VALUE(1,10)
-----------------------
9.86601968210438
SQL> select dbms_random.value(1,10) from dual;
DBMS_RANDOM.VALUE(1,10)
-----------------------
3.43475105499398
  
  3.2、举例说明
  

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>select*from(selectobject_namefromzeenoorderbydbms_random.random)whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • /6dd0fe0e_CertificateCertifica
  • /cf5224d7_SunJSSE_a4
  • KU$_PARSED_ITEMS
  • javax/swing/text/IconView
  • oracle/xml/jdwp/XSLJDWPString


  • SQL>select*from(selectobject_namefromzeenoorderbydbms_random.random)whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • java/io/ObjectOutputStream$1
  • sun/security/krb5/KrbAsReq
  • /2d52a21c_Last
  • SYS_YOID0000006594$
  • /308fbfa1_BeanContextServices



SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
/6dd0fe0e_CertificateCertifica
/cf5224d7_SunJSSE_a4
KU$_PARSED_ITEMS
javax/swing/text/IconView
oracle/xml/jdwp/XSLJDWPString
SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
java/io/ObjectOutputStream$1
sun/security/krb5/KrbAsReq
/2d52a21c_Last
SYS_YOID0000006594$
/308fbfa1_BeanContextServices
  

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>select*from(selectobject_namefromzeenoorderbytrunc(dbms_random.value(1,3)))whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • ICOL$
  • C_COBJ#
  • PROXY_ROLE_DATA$
  • I_OBJ#
  • UET$


  • SQL>select*from(selectobject_namefromzeenoorderbytrunc(dbms_random.value(1,3)))whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • ICOL$
  • UNDO$
  • I_PROXY_ROLE_DATA$_1
  • I_CDEF2
  • UET$



SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
ICOL$
C_COBJ#
PROXY_ROLE_DATA$
I_OBJ#
UET$
SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6;
OBJECT_NAME
--------------------------------------------------------------------------------
ICOL$
UNDO$
I_PROXY_ROLE_DATA$_1
I_CDEF2
UET$
  

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>selecttrunc(dbms_random.value(0,1000))randomNumfromdual;--(0-1000的整数)

  • RANDOMNUM

  • ----------
  • 790


  • SQL>selectdbms_random.value(0,1000)randomNumfromdual;--(0-1000的浮点数)

  • RANDOMNUM

  • ----------
  • 997.876726



SQL> select trunc(dbms_random.value(0, 1000)) randomNum from dual; --(0-1000的整数)
RANDOMNUM
----------
790
SQL> select dbms_random.value(0, 1000) randomNum from dual; --(0-1000的浮点数)
RANDOMNUM
----------
997.876726
  
  4、使用内部函数sys_guid()

Sql代码 http://hpitcn.javaeye.com/images/icon_copy.gif





  • SQL>select*from(selectOBJECT_NAMEfromzeenoorderbysys_guid())whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • /6bedadd5_KeyManagerFactory1
  • /ffd795c8_AddCRIF
  • TABLE_EXPORT_OBJECTS
  • /278cd3a4_CGParselet
  • KU$_REFCOL_T


  • SQL>select*from(selectOBJECT_NAMEfromzeenoorderbysys_guid())whererownum<6;

  • OBJECT_NAME

  • --------------------------------------------------------------------------------
  • sun/awt/InputMethodSupport
  • V_$RESTORE_POINT
  • COLORSLIST
  • java/util/WeakHashMap$Entry
  • DBMSOUTPUT_LINESARRAY



SQL>  select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6;
OBJECT_NAME
--------------------------------------------------------------------------------
/6bedadd5_KeyManagerFactory1
/ffd795c8_AddCRIF
TABLE_EXPORT_OBJECTS
/278cd3a4_CGParselet
KU$_REFCOL_T
SQL>  select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6;
OBJECT_NAME
--------------------------------------------------------------------------------
sun/awt/InputMethodSupport
V_$RESTORE_POINT
COLORSLIST
java/util/WeakHashMap$Entry
DBMSOUTPUT_LINESARRAY
  
  注:
   在使用sys_guid() 这种方法时,有时会获取到相同的记录,即和前一次查询的结果集是一样的,查找相关资料,有些说是和操作系统有关,在windows平台下正常,获取到的数据是随机的,而在linux等平台下始终是相同不变的数据集,有些说是因为sys_guid()函数本身的问题,即sys_guid()会在查询上生成一个16字节的全局唯一标识符,这个标识符在绝大部分平台上由一个宿主标识符和进程或进程的线程标识符组成,这就是说,它很可能是随机的,但是并不表示一定是百分之百的这样。

所以,为确保在不同的平台每次读取的数据都是随机的,我们大多采用使用sample函数或者DBMS_RANDOM包获得随机结果集,其中使用sample函数更常用,因为其查询时缩小了查询范围,在查询大表,且要提取数据不是很不多的情况下,会对查询速度上有明显的提高。

  

  二、其他数据库随机取出n条记录:
  
  1、SqlServer中随机提取数据库记录
  select top n * from 表 order by newid()
  --------------------------------------------------------------------------------
select top 10 * from tablename order by NEWID()
select top 10 * from tablename order by NEWID()

  2、mysql中随机提取数据库记录
  Select * From 表 order By rand() Limit n
  -------------------------------------------------------------------------------
select * from tablename order by rand() limit 10
select * from tablename order by rand() limit 10

3、Access中随机提取数据库记录

  Select top n * FROM 表 orDER BY Rnd(id)
  -------------------------------------------------------------------------------
SELECT top 10 * FROM tablename ORDER BY Rnd(FId)
SELECT top 10 * FROM tablename ORDER BY Rnd(FId)
FId:为你当前表的ID字段名

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-248456-1-1.html 上篇帖子: < 下篇帖子: Oracle开发专题之:窗口函数(转载)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表