昨天 09:35 西安交通大学算法工程师

关注

大模型LLMs微调面经总结超全版

1.如果想要在某个模型基础上做全参数微调，究竟需要多少显存?
2.为什么SFT之后感觉LLM傻了?
3.SFT 指令微调数据如何构建?
4.领域模型Continue PreTrain 数据选取?
5.领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘通用能力?
6.领域模型Continue PreTrain ，如何让模型在预训练过程中就学习到更多的知识?
7.进行SFT操作的时候，基座模型选用Chat还是Base?
8.领域模型微调指令&数据输入格式要求?
9.领域模型微调领域评测集构建?
10.领域模型词表扩增是不是有必要的?
11.如何训练自己的大模型?
12.训练中文大模型有啥经验?
13.指令微调的好处?
14.预训练和微调哪个阶段注入知识的?
15.想让模型学习某个领域或行业的知识，是应该预训练还是应该微调?
16.多轮对话任务如何微调模型?
17.微调后的模型出现能力劣化，灾难性遗忘是怎么回事?
18.微调模型需要多大显存?
19.大模型LLM进行SFT操作的时候在学习什么?
20.预训练和SFT操作有什么不同
21.样本量规模增大，训练出现OOM错
22.大模型LLM进行SFT 如何对样本进行优化?
23.模型参数迭代实验

全部评论

推荐最新楼层

昨天 08:33

已编辑

门头沟学院 Java

字节春招AI投起来

昨天字节发了春招通知，还以为AI岗招聘满了，基本没了，没想到又要来机会了嘿嘿，后端开发看来是真的满了，也没说缺人AI没想到还好一些，但是字节AI估计强度很大，考的很难，我这几天快要过年，咔咔写论文还有过年玩一玩，没咋准备面试的事情，而且到现在快过年了。我好奇真的投了就有面试吗，是不是得等到过年后3月份陆续有面试吧，有没有投过的小伙伴评论区交流一波嘿嘿嘿

点赞评论收藏

分享

02-05 22:27

C++

C++高性能日志库开发实践

来源：程序员老廖1. 背景与目标1.1 为什么要做高性能日志日志是所有线上系统的“黑匣子”，但日志写入如果阻塞业务线程，会把 I/O 延迟 直接放大到业务请求上。高并发下，同步写日志常见问题：频繁系统调用（write/flush/open/close）锁竞争（多线程写同一输出）格式化开销（时间戳/字符串拼接/数字转字符串）缓存失效（小块写、跨核争用）1.2 本项目的设计目标吞吐优先：尽可能将业务线程的日志开销降低到“内存追加 + 少量同步开销”。异步落盘：将 I/O 操作从业务线程剥离到后台线程。可控刷盘与回滚：支持按大小滚动文件，按时间 flush（语义清晰）。可观测与可压测：提供压测程序（...

大厂面试问八股多还是项目...

点赞评论收藏

分享

02-05 08:35

西安交通大学算法工程师

快手多模态大模型一面凉经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 实习介绍2. 项目拷打3. 4B的模型部署需要多少显存？怎么算的？4. （项目）LoRA的数据怎么来的，结构长啥样？5. 说一下LoRA的原理；怎么理解“低秩”（r为什么远小于d）6. 了解Agent吗？说一下你做过的Agent workflow的具体流程7. 说一下LSTM的原理；其中门控机制提出是为了解决什么问题？8. 手撕代码：多头注意力；约瑟夫环

查看8道真题和解析

点赞评论收藏

分享

昨天 15:44

C++

C++项目-高性能C++调度器设计与实现

内容来自：程序员老廖1. 项目概述1.1 背景TaskScheduler 是一个 C++20 实现的单机任务调度器，用于管理和执行本地任务。它提供了完整的任务生命周期管理能力，包括任务提交、资源管理、进程执行、超时控制和状态跟踪。1.1.1 单机调度器能用在哪些领域？1. AI/机器学习训练与推理（最热门场景）场景：一台服务器上有多个 GPU，需要同时运行多个训练或推理任务。需求：按 GPU 显存、计算单元分配任务防止任务互相抢占资源（如一个任务占满显存导致其他 OOM）支持优先级（高优模型优先调度）例子：字节的 ByteScheduler 在单机上调度多卡训练任务华为 MindSpore 的...

牛客解忧铺

点赞评论收藏

分享

02-02 17:54

字节跳动_飞书_后端开发(实习员工)

腾讯会不会留面评呀

佬们问一下，腾讯实习面试会不会留面评呀

面试太紧张了怎么办？

点赞评论收藏

分享

评论

1

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 在大厂上班是一种什么样的体验 #

11617次浏览 150人参与

# 你的mentor是什么样的人？ #

51010次浏览 718人参与

# 程序员找工作至少要刷多少题？ #

20211次浏览 258人参与

# 我和mentor的爱恨情仇 #

106146次浏览 944人参与

# 论秋招对个人心气的改变 #

12439次浏览 169人参与

# 校招第一份工作你干了多久？ #

136590次浏览 597人参与

# 机械人避雷的岗位/公司 #

43871次浏览 304人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

5455次浏览 166人参与

# 设计人如何选offer #

189626次浏览 868人参与

# 你的秋招进行到哪一步了 #

2530354次浏览 23253人参与

# 机械人还在等华为开奖吗？ #

312066次浏览 1582人参与

# 牛客AI体验站 #

7353次浏览 199人参与

# 秋招投递记录 #

380822次浏览 3203人参与

# 重来一次，我还会选择这个专业吗 #

411165次浏览 3898人参与

# 12306一秒售罄，你抢到回家的票了吗？ #

2183次浏览 51人参与

# 我现在比当时_，你想录用我吗 #

9153次浏览 117人参与

# 互联网公司评价 #

485801次浏览 4111人参与

# 一张图晒一下你的AI员工 #

5492次浏览 122人参与

# AI Coding的使用心得 #

4985次浏览 105人参与

# 职场上哪些行为很加分？ #

322364次浏览 3598人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务