知乎 实时数据开发

#发面经攒人品#
前段时间也面试了知乎的实时数据开发
面试问题如下
1 先自我介绍一下
2 说一下你实时用到的技术,主要做了哪些实时的指标和表,时效性怎么样,对于实时任务失败,你们这边怎么拉起的,有没有数据不准问题
3 你们实时是用到了哪个olap引擎,为啥要选择这个,有遇到什么问题吗
4 你感觉实时和离线最大的区别是啥,为啥实时要有,而且对于技术要求能力很高
5 你在干实时的时候有遇到什么问题吗,对于实时计算的话资源和内存怎么分配,延迟了改怎么处理
6有啥要问我的
感觉还挺难的,我这边还好做过,要不然感觉都答不出来
全部评论

相关推荐

点赞 评论 收藏
分享
我是某985大四的陈某某,专业AI方向,平时刷题刷到秃头,但一提到写简历就脑壳疼。去年春招到秋招,我从一个大厂实习小螺丝钉,混到另一个大厂转正,现在想想那段日子真他妈像过山车:一开始以为大厂光鲜亮丽,结果进去才知道全是坑。但也多亏了那些坑,我才学会怎么写实习项目经历,简历从垃圾桶直接变offer收割机。这些大厂的共同点一:别信那些小红书、知乎上的鸡汤帖,大厂实习不是什么“高大上”的镀金之旅,就是个高强度劳改营。我大三下投实习时,简历上就俩项目:一个是学校的大作业图像识别,另一个是Kaggle的玩具比赛。投了三次才过筛,面试时leader问我:“你为什么选我们?”我当时脑子一热,说:“因为你们算法牛。”他点点头,说行,进来吧。我心想:卧槽,这么简单?入职第一天,园区看着真酷:到处是咖啡机、健身房、免费水果。但现实很快就打脸了。组里20多人,实习生占一半,大家从早9点卷到晚10点,中午饭盒饭扒两口继续干。我的第一个项目是优化推荐系统的A/B测试模块,leader扔给我一堆代码仓库,说:“一周内熟悉,输出报告。”我当时啥都不懂,PyTorch刚入门,熬了三天夜,代码跑了50次bug,终于调通。组会时,我汇报了优化结果:点击率提升了2%。leader冷冷地说:“2%?太低了,重做。”我差点儿当场崩溃。大厂的共同点二:别信那些“弹性工作制”。弹性是“早来晚走都行,但活儿必须干完”。我有次加班到凌晨2点,地铁没了,骑共享单车回家,路上还下雨,湿透了。第二天早上9点又得爬起来开晨会。组里有个前辈,名校硕士,天天戴着眼镜敲代码,我问他:“哥,你不累吗?”他说:“累,但为了期权。”期权?实习生有个P的期权,我们就5k工资+饭补,干得再好也只是“表现不错”。共同点三:人际关系复杂得像宫斗剧。组里分派系:一个是老鸟帮,从其他大厂跳槽过来的;一个是新人帮,我们实习生抱团取暖。有次项目delay了,leader开会甩锅,新人帮被怼得狗血淋头。我私下问前辈:“这正常吗?”他说:“大厂就这样,KPI压力大,谁弱谁挨刀。”我从那学到:干活别只埋头,得会汇报。不会汇报的项目,再牛逼也白搭。共同点四:福利听着好,实际抠门。健身房是免费,但你得加班完才有时间去;水果无限,但天天吃香蕉吃吐;还有传说中的“企业文化”,其实就是卷王文化。实习三个月,我瘦了6斤,头发掉了两把。朋友问我:“大厂实习爽吗?”我说:“爽个锤子,就是个加速器,把你从学生卷成社畜。”但话说回来,这些坑也让我成长了。尤其是实习项目经历,怎么写进简历,才是真金。很多人以为项目就是“做了啥”,其实写法有门道。我的方法论是基于那段血泪史总结的,我刷了很多帖,结合自己实践,归纳成几步。别急,我一步步讲,带例子。第一步:选材祛魅,别吹牛逼。大厂HR看简历,第一眼就筛“水分”。我刚开始写实习项目时,傻乎乎写:“参与推荐系统优化,提升点击率2%。”结果投下一个大厂时,直接初筛挂。为什么?太泛,太小。祛魅写法:选有痛点的项目,写真实挑战。比如,我改成:“在实习中,负责A/B测试模块优化,面对海量数据(每日亿级日志)导致的计算瓶颈,通过引入分布式Spark框架,将处理时延从30分钟降至5分钟,提升整体点击率2%。”见没?这不光写了结果,还写了问题(瓶颈)和解决方案(Spark),真实感爆棚。HR一看,就知道你不是水货。方法论核心:用STAR法则,但加“祛魅”味。S(Situation):背景真实,别编大场面,就说“实习期内,组内KPI压力下”;T(Task):任务具体,“优化模块,目标提升效率”;A(Action):行动详细,列步骤,“第一步分析日志,第二步调参,第三步上线测试”;R(Result):结果量化,但加反思,“虽提升2%,但后续迭代中发现边缘case,优化了异常处理”。这样写,不光牛逼,还接地气,像真人经历。第二步:量化+工具,数据说话。我在第二个项目是调试一个NLP模型,bug多得像筛子。原写法:“调试模型,修复bug。”投时拒了。祛魅改: “调试BERT-based NLP模型,识别出10+类常见bug(如token溢出、梯度爆炸),使用PyTorch Profiler工具定位瓶颈,优化后模型准确率从85%升至92%,每日处理查询量增加50%。”量化了bug数、准确率、查询量,工具名一扔,专业感up。有人说“数据假的也行”,别听,HR查得出来。真实数据最好,哪怕小,也写反思:“虽准确率提升,但部署时遇资源限制,学到云服务优化。”第三步:连项目,秀成长弧线。别孤立写一个项目,大厂爱看“连续剧”。我简历上把两个项目连起来:“从A/B测试入手,积累数据处理经验,后应用于NLP调试,提升整体技能。”这样,HR觉得你不是一次性英雄,是可持续发展的。祛魅点:加失败经历,“第一个项目delay一周,吸取教训后,第二个提前交付。”真人味儿十足。第四步:匹配JD,关键词植入。ATS系统筛简历靠关键词。我投下一个岗位时,JD上写“熟练ML框架、分布式计算”,我就把“PyTorch”“Spark”红字标出来。手动改太累,我当时用泡泡小程序的AiCV简历王,导入JD一键匹配,帮我补了“Kubernetes”“Docker”等词,简历匹配度从60%跳到90%。投出去,三天过筛。第五步:反思+软技能,别只写硬货。大厂不光看技术,还看人。我加了:“项目中与跨部门协作,处理需求冲突,锻炼沟通能力。”祛魅写:“一度因需求变更争执,学到用Jira工具跟踪,减少误解30%。”软硬结合,立体。实习结束,我用这套方法论重写简历,投下一个大厂算法岗。一面技术问项目细节,我背得滚瓜烂熟;二面HR问挑战,我讲了加班祛魅故事,她说:“真实。”三面leader聊成长,我秀弧线,他点头:“来吧,转正机会大。”现在我转正了,工资翻倍,但还是那个卷王营。祛魅后,我不迷信大厂了,就是个跳板。总结方法论:1. 选材真实,STAR+祛魅,加痛点反思。2. 量化数据,工具名点缀。3. 连项目成故事,秀弧线。4. 关键词匹配JD,用工具辅助。5. 加软技能,反思拉满。牛客兄弟们,大厂没那么神,实习项目写好了,offer随便拿。心态别崩,拒了继续改。
没有实习经历,还有机会进...
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-24 09:50
点赞 评论 收藏
分享
一、 技术深度问题A. 关于“身份识别与访问管理”项目系统部署与架构:这个系统的部署方式是怎样的?(本地部署、Docker部署等?)请描述一下这个服务的整体架构。JWT 技术细节:能简单说一下 JWT Token 的构成是什么样的吗?JWT Token 的头部(Header)一般包含什么内容?JWT Token 的载荷(Payload)部分,反解出来后一般会有什么内容?从一个业务逻辑上理解,要实现用户认证,这个 Payload 里应该放什么内容?加密算法为什么要放在 Payload 里?(面试官指出这是不合理的,意在考察理解深度)数据库设计:请说明用户表、角色表和权限表的库表设计,都有哪些字段?为什么要在用户表里存一个 Token?既然已经有 JWT Token 了,为什么还要把 Token 存在数据库里?你库表里面存的 Token 是什么信息?和 JWT Token 是什么关系?(面试官追问)这个 Token 存的是什么信息?技术选型与对比:有了解或使用过 Casdoor 或 Casbin 这类开源方案吗?B. 关于“校园社交平台”项目项目功能与设计:请说一下这个平台主要做了什么,流程是怎样的?登录方式用的是什幺?除了创建用户和发送文章,这个项目还有别的补充说明吗?比如库表设计或交互流程?帖子、文章和评论的库表是如何设计的?它们之间如何关联?有实现多级评论(评论中再评论)的功能吗?C. 通用技术问题(系统、数据库、语言)问题排查与性能优化:假设你开发的一个 API 接口,单个请求返回时间长达 4 秒,你会如何定位这个问题?如果发现是函数中查询数据库缓慢,又该如何定位?Docker:能简单说一下 Dockerfile 一般包含什么内容吗?有了解基础镜像(Base Image)吗?Go 语言底层:在 Go 语言中,对 map 执行 delete操作,如果 key 不存在,会有什么现象?如果 key 存在,删除后会立即释放内存吗?Go 语言中的 interface 能直接比较吗?Go 语言并发与上下文:对 context有了解吗?能简单说一下它一般用在什么地方吗?能举例说明会把什么数据存进 context里吗?数据库/SQL 优化:能说一下一般如何优化 SQL 语句吗?
查看28道真题和解析
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务