面试官:手撕一下雪花算法

雪花算法:使用一个 64 bit 的 long 型的数字作为全局唯一 ID。在分布式系统中的应用十分广泛,因此也是面试官们比较喜欢问的一个问题。

下面我给大家详细介绍一下,大家下次再遇到这样的问题,就可以直接在面试官面前手撕代码了!

先说一下雪花算法(SnowFlake)

SnowFlake是twitter公司内部分布式项目采用的ID生成算法,开源后广受国内大厂的好评。由这种算法生成的ID,我们就叫做SnowFlakeID。

SnowFlake算法生成id的结果是一个64bit大小的整数,它的结构如下图:

分为四段:
第一段: 1位为未使用,永远固定为0。
(因为二进制中最高位是符号位,1表示负数,0表示正数。生成的id一般都是用正整数,所以最高位固定为0 )
第二段: 41位为毫秒级时间(41位的长度可以使用69年)
第三段: 10位为workerId(10位的长度最多支持部署1024个节点)
(这里的10位又分为两部分,第一部分5位表示数据中心ID(0-31)第二部分5位表示机器ID(0-31))
第四段: 12位为毫秒内的计数(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号)


代码实现(含详细注解):

import java.util.HashSet;
import java.util.concurrent.atomic.AtomicLong;

public class SnowFlake {

    // 时间 41 位
    private static long lastTime = System.currentTimeMillis();

    // 数据中心 ID 5 位 (默认 0-31)
    private long datacenterId = 0;
    private long datacenterIdShift = 5;

    // 机房机器 ID 5 位 (默认 0-31)
    private long workerId = 0;
    private long workerIdShift = 5;

    // 随机数 12 位 (默认 0~4095)
    private AtomicLong random = new AtomicLong();
    private long randomShift = 12;
    // 随机数的最大值
    private long maxRandom = (long) Math.pow(2, randomShift);

    public SnowFlake() {
    }

    public SnowFlake(long workerIdShift, long datacenterIdShift){
        if (workerIdShift < 0 ||
                datacenterIdShift < 0 ||
                workerIdShift + datacenterIdShift > 22) {
            throw new IllegalArgumentException("参数不匹配");
        }
        this.workerIdShift = workerIdShift;
        this.datacenterIdShift = datacenterIdShift;
        this.randomShift = 22 - datacenterIdShift - workerIdShift;
        this.maxRandom = (long) Math.pow(2, randomShift);
    }

    // 获取雪花的 ID
    private long getId() {
        return lastTime << (workerIdShift + datacenterIdShift + randomShift) |
                workerId << (datacenterIdShift + randomShift) |
                datacenterId << randomShift |
                random.get();
    }

    // 生成一个新的 ID
    public synchronized long nextId() {
        long now = System.currentTimeMillis();

        // 如果当前时间和上一次时间不在同一毫秒内,直接返回
        if (now > lastTime) {
            lastTime = now;
            random.set(0);
            return getId();
        }

    // 将最后的随机数,进行 + 1 操作
        if (random.incrementAndGet() < maxRandom) {
            return getId();
        }

        // 自选等待下一毫秒
        while (now <= lastTime) {
            now = System.currentTimeMillis();
        }

        lastTime = now;
        random.set(0);
        return getId();

    }

    // 测试
    public static void main(String[] args) {
        SnowFlake snowFlake = new SnowFlake();
        HashSet<Long> set = new HashSet<>();
        for (int i = 0; i < 10000; i++) {
            set.add(snowFlake.nextId());
        }
        System.out.println(set.size());
    }

}

代码中获取 id 的方法利用位运算实现
img

1  |                    41                        |  5  |   5  |     12      

   0|0001100 10100010 10111110 10001001 01011100 00|00000|0 0000|0000 00000000 //41位的时间
   0|000000‭0 00000000 00000000 00000000 00000000 00|10001|0 0000|0000 00000000 //5位的数据中心ID
   0|0000000 00000000 00000000 00000000 00000000 00|00000|1 1001|0000 00000000 //5为的机器ID
or 0|0000000 00000000 00000000 00000000 00000000 00|00000|0 0000|‭0000 00000000‬ //12位的sequence
------------------------------------------------------------------------------------------
   0|0001100 10100010 10111110 10001001 01011100 00|10001|1 1001|‭0000 00000000‬ //结果:910499571847892992

面试官:写的非常好,那你知道它的优点和缺点么?

优点:

  1. 所有生成的id按时间趋势递增
  2. 整个分布式系统内不会产生重复id(因为有datacenterId和workerId来做区分)

缺点:
由于SnowFlake强依赖时间戳,所以时间的变动会造成SnowFlake的算法产生错误。


好了,今天关于雪花算法相关的内容就分享到这里。希望大家秋招路上早日拿到满意的Offer。

#面试##笔试速成法##算法题##算法##秋招#
全部评论
这东西就是你知道就简单 你不知道直接当场退役
3 回复 分享
发布于 2022-08-30 06:14 美国
手撕劝退,知道分为三段,位数真记不太清楚
点赞 回复 分享
发布于 2022-09-12 17:15 湖南
手撕这个怕是劝退了
点赞 回复 分享
发布于 2022-08-29 14:25 北京

相关推荐

2025-12-21 12:15
门头沟学院 Java
1、常见的方案有数据库自增ID、UUID、Redis生成和雪花算法。实际分布式场景下,雪花算法更常用,它将ID分为时间戳、机器ID和序列号三部分,性能高且趋势递增。但要注意时钟回拨问题,可通过记录上次生成时间戳或使用扩展版算法解决。2、雪花算法的ID在时间戳维度是递增的,但同一毫秒多机器生成的ID可能乱序。如需严格单调递增,可用数据库号段模式:服务启动时申请一个ID范围,内存分配用完后再次申请,这样单服务内ID严格递增。3、redo&nbsp;log是InnoDB的物理日志,崩溃恢复时重放提交的事务;undo&nbsp;log记录数据修改前的状态,用于回滚和MVCC读;binlog是MySQL&nbsp;Server层的逻辑日志,用于主从同步和数据备份。4、主库将变更写入binlog,从库通过IO线程拉取binlog到relay&nbsp;log,再由SQL线程重放SQL实现同步。5、优化索引时要减少回表和利用覆盖索引。索引失效常见于:违反最左前缀、对索引列计算、类型转换、LIKE左模糊匹配、OR连接非索引列等情况。6、InnoDB索引用B+树实现,联合索引按字段从左到右排序。如果跳过左侧字段,因为b的值在全局无序,无法利用索引快速定位,导致失效。7、当元素少且小时,用压缩列表节省内存;当元素多或大时,自动转为&nbsp;"跳跃表+字典"&nbsp;组合。跳跃表负责按分值排序,支持高效范围查询;字典负责成员到分值的映射,实现O(1)快速查分数。这种设计平衡了内存与性能。8、跳表插入节点时,从最高层向右向下逐层搜索并记录小于目标的分值位置(update[]);随后随机生成新节点层高,创建节点并按层将其插入:每层链接到对应update[]节点之后,并指向其原后继;最后更新跳表的最大层高和节点总数,实现高效定位与平衡插入。9、Redis有6种淘汰策略,常用的是allkeys-lru和allkeys-lfu。LRU淘汰最近最少访问的,LFU淘汰访问频率最低的。LFU更适合长期热点场景,而LRU对突发流量更敏感。10、Redis用惰性删除+定期删除组合:访问key时检查过期,同时后台定期抽样清理过期key。当内存不足时,再根据淘汰策略主动删除数据。11、TCP通过滑动窗口实现流量控制:接收方在ACK包中携带窗口大小。发送方根据这个窗口动态调整发送数据量,避免接收方缓冲区溢出。
点赞 评论 收藏
分享
一、个人信息问题1.简单做自我介绍。2.&nbsp;应聘成功后能否保证6个月试用期。3.&nbsp;两段实习经历中是否遇到过内存泄漏问题,如何定位与解决。二、Java基础与核心知识问题1.&nbsp;了解的Java常用集合有哪些,具体适用场景是什么。2.&nbsp;HashMap的键为何一般不可变。3.&nbsp;HashMap出现哈希冲突时如何解决。4.&nbsp;HashMap中链表为何要转为红黑树,为何不直接用红黑树实现。5.&nbsp;ArrayList的扩容机制是什么,为何扩容为原容量的1.5倍。6.&nbsp;如何理解Java反射,反射在工具类(如Spring)中有哪些应用,Spring的IOC通过反射具体怎么做。7.&nbsp;JVM内存结构包含哪些部分。8.&nbsp;Java中new一个对象,与内存分配使用相关的实现过程是什么。9.&nbsp;new对象时内存不足会发生什么操作。10.&nbsp;Minor&nbsp;GC如何上升到Full&nbsp;GC。11.&nbsp;如何理解线程安全,Java中线程安全相关案例及保障关键字(synchronized、volatile等)的作用。12.&nbsp;synchronized和ReentrantLock的区别,使用上有何不同。13.&nbsp;为何需要公平锁和非公平锁两种锁类型。14.&nbsp;是否用过多线程,线程池的拒绝策略有几种,分别作用是什么。15.&nbsp;线上使用线程池时,参数设定、拒绝策略制定有哪些经验。三、MySQL相关问题1.&nbsp;InnoDB存储引擎与MyISAM引擎的区别。2.&nbsp;COUNT(*)、COUNT(1)、COUNT(某一列)三者的区别,平常常用哪种。3.&nbsp;MySQL默认的事务隔离级别是什么,除默认外还有哪些事务隔离级别。4.&nbsp;可重复读隔离级别的MVCC除对应解决的问题外,还能解决哪些问题。5.&nbsp;InnoDB的索引结构为何是B+树。6.&nbsp;MySQL出现慢查询时如何处理,若加了索引仍扫描大量行该如何优化。7.&nbsp;1000万数据量的大表直接执行表结构修改的UPDATE语句是否合理,若不合理该怎么做。四、其他技术相关问题1.&nbsp;平常是否用K8S,是否了解K8S的使用方法。2.&nbsp;将个人简历基本信息(性别、手机号等)存入Redis,适合用什么数据结构,为何不用string类型。整体节奏平和,这周二约的面,原本在手子不想面了,但是HR一直在沟通,说一天可以走完流程之类的,加上之前没面过百度就想试一试,可能是由于岗位工作偏简单(前期工作配合测开写单测),所以面试难度很低,跟之前看的招超人那种完全不一样。抽象的是面试官迟到了半小时,发邮件也不回,HR也不接电话,后来HR终于接电话了,面试官给的回答是他忘记了,有点抽象。感觉最近裁员应该缺人蛮厉害,大家可以都试一试
北巷南街:不是,八股盛宴???
你今年做了几份实习?
点赞 评论 收藏
分享
评论
9
35
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务