中电信人工智能科技(北京)有限公司一面

大模型数据算法实习生
2026.01.09,上午10:00,一面,线上,30多min,只有自己开摄像头,面试官没开
1.自我介绍
2.有没有用过正则表达式处理过数据?
3.假设给一个jsonl数据,和几个关键词,jsonl数据中命中3个以上关键词保留,让用python实现(用了两层循环)
4.往列表里添加一条数据是什么方法(append)
5.python中的多进程和多线程有什么区别?网络请求中是多进程快和多线程快?(答的不好)
6.python中的is和==的区别(说了is主要用于字符串或bool类型判断,==主要用于数值判断,结果面试官让用更“科学”的方式解释)
7.python里面的迭代器和生成器有什么区别?(答的不好)
8.假设给一个100G的jsonl文件,但内存只有10G,如何读取数据(说用pandas处理,结果不让用,让用最原始的方式处理,后来又说了对文件进行压缩)
9.手撕:LeetCode两数之和(哈希表)
10.问平常使用什么系统(说了windows,也用linux)
11.假设linux系统中没有root权限,如何给一个文件赋予读写权限(说了如果知道密码,可以sudo su转成root用户或者chmod -R)
12.给一个路径,求路径下面有多少个文件和文件夹(说了tree)又问如果只统计文件夹呢?(答的不好)
13.一个文件目录下有很多个txt文本文件,如何找到其中包含“乘式”的文件?(答的不好)
14.问了grep
15.问有没有使用过大数据相关的组件(说了hadoop,spark,flink但不熟悉)
反问:
1.部门的主要业务,主要是做大模型和多模态大模型相关的,我这个岗位主要是处理预训练的数据,可能会涉及算法
2.使用什么服务器,A100,H100,910B都有(居然有910B,NPU?!)

感受:没想到一道大模型相关的八股都没问,没想到居然问了一堆python基础,也没想到问了linux的一堆操作#牛客AI配图神器#
全部评论
一面过了吗
点赞 回复 分享
发布于 01-12 19:23 江苏

相关推荐

1.实习介绍2.你项目上面提到了长列表渲染优化,详细讲一下吧。3.讲讲这个webpack-bundle-analyse是怎么样的?删除了没出现兼容性的问题吗?4.element-ui的dialog是怎么封装的?那叫你封装一个组件,你会基于什么去封装?5.vue的组件是怎么进行通信的?6.插槽是什么?怎么用?作用域插槽是什么?有什么用?7.大文件上传是基于什么样的背景的?断点续传怎么传的?8.切片上传和断点续传。9.如何对大图片进行压缩?10.SVG有了解过吗?他和canvas有什么区别?11.用vue2多还是vue3多?讲讲vue2和vue3的区别吧。12.那Object.defineProperty这个方法接收几个参数,每个参数分别对应什么?13.vue3里面其实也用到了reflect,了解过吗?14.讲讲webpack为什么比vite快吧?他们之间有什么差异吗?15.为什么vue2里面data要写成函数而不能写成对象呢?16.nextTick了解过吗?什么时候用,举一个具体的例子。原理是怎么样的?17.为什么每个dom要加key值?key有什么作用呢?18.vue3有哪些常用的api吗?19.ref和reactive的区别?那我用reactive定义基本数据类型,ref定义引用数据类型可以不?20.==和===的区别?21.深拷贝和浅拷贝的区别?手动实现深拷贝怎么实现?正则日期那些呢?22.typeOf和instanceOf的应用场景,什么时候应该用谁?23.webpack有哪些常见的配置项呢?vite呢?24.webpack打包的整个过程是怎么样的呢?25.React有了解吗?
查看24道真题和解析
点赞 评论 收藏
分享
评论
2
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务