mysql存在10亿条数据,如何高效随机返回N条纪录,sql如何写

news/2024/7/24 4:23:14 标签: mysql, sql, 数据库

1 低效方案

1.使用ORDER BY RAND():

SELECT * FROM your_table
ORDER BY RAND()
LIMIT 1;
这将随机排序表中的所有行,并且通过LIMIT 1仅返回第一行,从而返回一个随机记录。然而,对于大型表来说,ORDER BY RAND()可能会导致性能问题,因为它需要对整个表进行排序。

2 高效方案

2.使用RAND()函数和WHERE子句:
SELECT * FROM your_table
WHERE RAND() <= 0.01
LIMIT 1;

这个方法将RAND()函数与一个WHERE子句一起使用,以限制只有很小一部分行被选中(在这个例子中,是1%的行),然后再从中选择一行。这种方法对于大型表来说,通常比ORDER BY RAND()更高效,
因为它不需要对整个表进行排序,但需要调整0.01的值以控制所选行的数量。
请注意,这两种方法都可以返回一个随机的记录,但是在大型表上,第一种方法可能会导致性能问题。根据你的需求和数据库规模,你可以选择适合你的方法。


3 sql>mysql order by rand()内部查询原理

ORDER BY RAND() 在 MySQL 中用于随机排序查询结果的行。其内部工作原理如下:
生成随机数(seed): 当执行 ORDER BY RAND() 查询时,MySQL会生成一个随机种子 (seed)。这个种子通常基于系统时间或其他因素,以确保每次查询都有一个不同的种子。这个种子用来初始化伪随机数生成器。
计算随机值: 随机种子被用于伪随机数生成器,该生成器会计算一系列随机数。这些随机数将与查询结果的行相关联,以确定它们的排序顺序。
排序: 使用生成的随机数对查询结果的行进行排序。每行都与一个随机数相关联,根据这些随机数的值进行排序。这会导致行的顺序在每次查询时都不同,从而实现了随机排序。
返回结果: 排序完成后,查询返回结果,其中行的顺序是随机的。
虽然 ORDER BY RAND() 可以实现随机排序,但它在大型数据表上可能会导致性能问题,因为它需要对整个结果集进行排序。这种方法的效率不高,
特别是对于包含大量行的表。在这种情况下,可能需要考虑其他方法,例如使用 WHERE RAND() <= some_value 的方式来随机选择行,这不涉及全局排序,因此性能更好。


http://www.niftyadmin.cn/n/5129266.html

相关文章

Golang 自定义函数库(个人笔记)

1.用字符串连接切片元素&#xff08;类似php implode&#xff09; package mainimport ("fmt""strconv""strings" )func main() {data : []int{104, 101, 108, 108, 111}fmt.Println(IntSliceToString(data, ",")) }func IntSliceToS…

漫谈广告机制设计 | 混排:广告与自然结果的交锋博弈(2)

话说前文&#xff0c;在彼此不同的利益面前&#xff0c;自然侧和广告侧在混排战场展开了一番较量&#xff0c;一个浑水摸鱼&#xff0c;一个暗渡陈仓。最终双方不得不坐下来&#xff0c;为了平台整体的利益&#xff0c;一起谈谈各自的诉求&#xff0c;商讨一下解决方案。 第三…

2023版 STM32实战12 IIC总线读写AT24C02

IIC简述 一个多主从的串行总线&#xff0c;又叫I2C&#xff0c;是由飞利浦公司发明的通讯总线 IIC特点 -1- 串行(逐bit传输) -2- 同步(共用时钟线) -3- 半双工(收发不同进行) -4- 总线上的任何设备都可以是主机 开发使用习惯和理解 -1- 通过地址寻址 -2- 数据线的…

Android开发知识学习——HTTP基础

文章目录 学习资源来自&#xff1a;扔物线HTTPHTTP到底是什么HTTP的工作方式URL ->HTTP报文List itemHTTP的工作方式请求报文格式&#xff1a;Request响应报文格式&#xff1a;ResponseHTTP的请求方法状态码 HeaderHostContent-TypeContent-LengthTransfer: chunked (分块传…

百度超级链XuperChain使用JavaSDK接入

环境 &#xff1a; ubuntu20 xuperchain 5.3 go 1.17 springboot : 2.5.14 前言 请提前启动好xchain的节点&#xff0c;我选择简单启一个xchain节点作为测试&#xff0c;并且使用默认端口37101 SpringBoot项目初始化 我们先进行SpringBoot项目的配置进行讲解&#xff0c;这里…

全域数据连接器解决运营痛点问题,助力海尔节省200万+

随着电商渠道增多和数字技术发展&#xff0c;商家在全域运营和数字化建设方面的应用系统越来越多&#xff0c;诸如以天猫、京东等电商平台区分的店铺后台&#xff0c;以CRM、ERP、SCM等服务区分的应用软件。 这些系统数据各有侧重&#xff0c;但又独立运行&#xff0c;导致很多…

nodejs+vue宁夏旅游景点客流量数据分析

然后通过引入混沌算法构建了旅游景点客流量预测的学习样本,最后引入数据挖掘技术对旅游景点客流量预测进行建模, 与粒子群算法优化BP神经网络的,支持向量机的旅游景点客流量预测模型的 目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1…

【开源】基于SpringBoot的车险自助理赔系统的设计和实现

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 角色管理模块2.3 车辆档案模块2.4 车辆理赔模块2.5 理赔照片模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 角色表3.2.2 车辆表3.2.3 理赔表3.2.4 理赔照片表 四、系统展示五、核心代码5.1 查询车…