2021-10-15 14:02 云南大学 Java

关注

数据处理实践题，求解答

请使用ml-1m数据集（内含users.dat，movies.dat，ratings.dat三个数据文件，stop_words_list.txt是停用词表，README是对数据的说明），完成以下数据预处理：
(1).拼接三个数据文件，拼接后的数据包括UserID::MovieID::Rating::Timestamp::Gender::Age::Occupation::Zip-code::Title::Genres列；
(2).对Gender、Occupation列进行one-hot编码；
(3).从Title列中读出年份作为新的列，接着全部转换为小写字母并去掉停用词和标点符号，然后保留前四个词，不足四个词的用“null_word”补齐，将四个词分成四列，即Title一列变换为Year、FirstWord、SecondWord、ThirdWord、FourthWord五列；
(4).对Genres列，保留前三个类别（每个类别是|隔开的），不足三个类别的用“null_genre”补齐，将三个类别分成三列，即Genres一列变换为FirstGenre、SecondGenre、ThirdGenre三列；
(5).最后将数据导出为.csv文件，命名为ml1m.csv，与源代码一起打包提交。
#腾讯开发笔试题求解答呀#

全部评论

推荐最新楼层

02-24 19:38

科华数据股份有限公司_自动化测试工程师(准入职员工)

科华数据内推，科华数据内推码

科华数据 提前批 硬件工程师（2026届）面经投递时间：7月24日，投完简历过后收到测评，5个工作日内完成。7月30日收到笔试通知，笔试内容包括数电模电电力电子方面的内容（我个人遇到模电里反馈组态考得比较多，还有个Buck拓扑电路题）8月6号收到面试通知8月8日HR电话面试，（HR面没啥专业问题）面试过程很轻松：1.自我介绍2.从自我介绍中凝练三个自身优势3.性格自我评价优缺点4.有做过大功率吗5.有面试其他公司吗？手里有offer吗6.有考虑公务员和电网吗7.对科华有了解吗8.有女朋友吗9.问期望薪资待遇，为什么这个期望，组内师兄姐待遇还有一些不太记得了反问：1.公司晋升渠道。答：技术、管理...

点赞评论收藏

分享

02-21 13:54

柠檬微趣_HR(准入职员工)

柠檬微趣内推，柠檬微趣内推码

柠檬微趣前端一面1. 自我介绍2. JS定义变量方式？let const var区别？3. 为什么用const定义变量不可以被修改？底层原理？一定不能改？4. `let a = 1; let a = 2;` 会发生什么？会报什么错？5. `var a = 1; var a = 2;` 可以吗？`var a = 1; let a = 2;` 呢？6. `var`特性（如变量提升）？`console.log(a); var a = 1;` 的结果是什么？7. JS中基本数据类型？分别存储在哪里（栈/堆）？8. `let a = {}; b = a; `修改b会影响a吗（会）如何避免（深拷贝）9. ...

点赞评论收藏

分享

02-18 09:46

门头沟学院管理培训生

大家过年会给mentor拜年吗？

昨天给前mentor拜年，但是过去一天了他也没回我，是我说的话有问题吗？还是觉得我离职了不用向下维系这段关系了，感觉我俩关系还可以，难道是我的一厢情愿吗。。。。。内耗了一天

饥饿的小章鱼渴望wl...：可能是被排在低优先级队列太久被gc回收了

点赞评论收藏

分享

02-24 19:00

九州通医药集团_集团业务管培生(准入职员工)

步步高内推，步步高内推码

步步高实验学校 2026届校招启动啦【学校简介】东莞市步步高实验学校于 2023 年投入运营，占地 230 亩，是一所集幼儿园、小学、初中、高中于一体的十五年一贯制非营利性高端民办学校，学校全面实行小班化教学，学校师生比为 1:5；步步高教育专家团队由来自一流大学的国家课标专家、教育学家，来自著名学校的卓越校长，来自一线、有着丰富教学经验的著名特级教师，以及来自国家级教育媒体的教育策划专家共同组成，为步步高的课程、教学、管理奠定了坚实基础。【招聘岗位】• 幼儿园、小学部及初中部各学科类教师 & 国际教师，类别多多，等你pick！ 【福利待遇】• 薪资：幼儿园老师年收入16万起 、中小学...

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 开工第一帖 #

12874次浏览 273人参与

# 携程求职进展汇总 #

882562次浏览 5795人参与

# xx岗简历求拷打 #

4135次浏览 48人参与

# 工作不开心辞职是唯一出路吗 #

8033次浏览 30人参与

# 有转正机会的小厂实习值得去吗？ #

5980次浏览 73人参与

# 掌握什么AI技能，会为你的求职大大加分 #

4370次浏览 199人参与

# 实习期间如何提升留用概率？ #

241466次浏览 1824人参与

# 为什么国企只招应届生 #

238748次浏览 1301人参与

# 参加完秋招的机械人，还参加春招吗？ #

111096次浏览 709人参与

# 哪些公司开春招了？ #

32776次浏览 204人参与

# 秋招你经历过哪些无语的事 #

101336次浏览 597人参与

# 金三银四，你有感觉到吗 #

691665次浏览 6088人参与

# 毕业季等于分手季吗 #

54898次浏览 654人参与

# 牛客租房专区 #

160220次浏览 1921人参与

# 联想求职进展汇总 #

335042次浏览 2220人参与

# 牛友投递互助，不漏校招机会 #

439099次浏览 5243人参与

# 正在春招的你，也参与了去年秋招吗？ #

353078次浏览 2597人参与

# 你最讨厌面试被问什么 #

6236次浏览 81人参与

# 非技术er求职现状 #

139152次浏览 821人参与

# 你觉得今年春招回暖了吗 #

931265次浏览 7233人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务