1. 实习介绍2. 介绍项目3. 知不知道其他量化方法4. 对于量化误差而言,数据应该怎样分布较好5. 针对有异常值的情况,数据分布越均匀越好,在量化到int8,fp8,int4时都没问题,但是量化到fp4时却不是如此,为什么6. 熟悉CUDA,描述一下如何优化GEMM,在其中计算时shared memory的大小怎么取7. 手撕:CUDA写一个norm input: x[N] norm = (x – u)/ou = sum(x[N]), o = sqrt((sum(x - u))^2/N)