2019-07-26 01:55 已编辑北京邮电大学算法工程师

关注

预测2011-2012年共享单车每小时使用数量（华盛顿）

数据集链接http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset
相关描述可以在网站上看到，我就不写啦～
分别使用线性回归/决策树/随机森林决策树进行预测，顺便比较了一下哪个模型预测更加精准。
在使用随机森林预测时，如果对时间要求不是很高的话，可以把n_estimators设置的稍微大一些，0-200之间都可以，因为模型准确率函数为一个对数函数。

代码：
读取csv文件

import pandas as pd 
import matplotlib.pyplot as plt


bike_rentals=pd.read_csv('./data/hour.csv')

#plt.hist(bike_rentals['cnt'])
#plt.show()
cnt_correlations=bike_rentals.corr()['cnt']
print("\n Reading success! cnt-correlations：\n")
print(cnt_correlations)

处理数据，生成模型并预测

import read_file
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

bike_rentals=read_file.bike_rentals

# Formatting 'hr' column
def assign_label(hour):
    if hour >=0 and hour < 6:
        return 4
    elif hour >=6 and hour < 12:
        return 1
    elif hour >= 12 and hour < 18:
        return 2
    elif hour >= 18 and hour <=24:
        return 3

bike_rentals['time_labels']=bike_rentals['hr'].apply(assign_label)

#Splitting data
train=bike_rentals.sample(frac=.8)
test=bike_rentals.iloc[~bike_rentals.index.isin(train.index)]

# Removing columns,such as indirect and unuseful columns
columns=list(bike_rentals.columns)
columns.remove('cnt')
columns.remove('casual')
columns.remove('dteday')
columns.remove('registered')

print("\n===========>>>>>>Predictting:\n")
#Predictting target column,selectting mse as metric.
#LinearRegression

model=LinearRegression()
model.fit(train[columns],train['cnt'])
predictions=model.predict(test[columns])
mse=mean_squared_error(test['cnt'],predictions)
print("MSE using LinearRegression:    ",end='')
print(mse,'\n')

#DecisionTreeRegression

model=DecisionTreeRegressor(min_samples_leaf=5)
model.fit(train[columns],train['cnt'])
predictions=model.predict(test[columns])
mse=mean_squared_error(test['cnt'],predictions)
print("MSE using DecisionTreeRegression:    ",end='')
print(mse,'\n')

#RandomForsetRegression

model=RandomForestRegressor(n_estimators=50,min_samples_leaf=2)
model.fit(train[columns],train['cnt'])
predictions=model.predict(test[columns])
mse=mean_squared_error(test['cnt'],predictions)
test['predictions']=predictions
print("MSE using DecisionTreeRegression:    ",end='')
print(mse,'\n')
print(test.iloc[:10][['cnt','predictions']])

结果：

全部评论

推荐最新楼层

02-05 20:38

蚌埠坦克学院嵌入式软件开发

刚入职不懂事，天天下班早

刚入职那会儿，真的是什么都不懂，下班时间特别守规矩，天天准点走。以为按部就班就没问题，结果绩效一看——低得心碎。后来才明白，刚入职不是光守时就行，还得主动学、主动问、多承担一些任务，把能力和价值表现出来。吃了低绩效也没关系，把它当作一面镜子：告诉你哪些地方需要加把劲，也提醒你别再只守时间，要守质量和效率。职场成长，很多时候都是从低绩效开始，慢慢学会主动和规划。

刚入职的你踩过哪些坑

点赞评论收藏

分享

02-02 10:46

网易游戏_游戏研发工程师(准入职员工)

网易互娱内推，网易互娱内推码

网易**不管问你啥，记住一个话术原则小小的提醒下各位留子：**时不要直来直去有啥说啥；千万得多思考别说太满给自己留个思考或回旋的余地・1、被问 “有没有接触过网易的产品”（哪怕了解不多）别直接说 “没有”（容易显得缺乏兴趣）试试：“之前用过网易云音乐和网易新闻，对产品的界面设计和功能逻辑有过留意。虽然没有深入研究，但能感受到网易产品注重用户体验的特点，入职后会系统学习相关产品知识”・2、被问 “能接受高强度的项目加班吗”别勉强说 “没问题”（后续可能难以承受）试试：“我理解互联网行业项目推进时需要集中精力，在关键节点愿意配合团队加班。但也会注重提升工作效率，合理规划时间，尽量在正常工作时间完成...

点赞评论收藏

分享

01-30 22:03

门头沟学院 Java

我这个简历春招有机会吗

大家觉得我这个简历能找到什么样的，中厂有希望吗，简历无水分全真实的

用微笑面对困难：我滴妈，【俩月】【实习】【主管】仨debuff吃满了，独立设计开发的项目写了绝大占比的运营板块，你独立开发，那维护、问题复盘、日志更新、bug、策划书全是自己整的？

不建议写那么大，可以从小出发更容易

点赞评论收藏

分享

02-05 15:07

学而思_HR(准入职员工)

学而思内推，学而思内推码

初试 HR打电话线上沟通 简单介绍了一下公司情况和工作内容 了解咱们的就业意向（年级和科目） 询问什么时候可以线下面试？ 试讲 HR会通过邮件发送试讲题目，从中任意选择一题即可 ps：建议浏览一遍，选比较简单的题目，不然时间有点紧张 8-10min，尽量脱稿 先讲一遍👉培训老师指导👉自主练习15min👉最终展示 终试 一对一面谈 1.自我介绍（尽量往教培经验和相关优势靠） 2.为什么跨专业考研，选择现在这个专业？ 3.为什么不从事本专业相关工作，选择教培行业？ 4.为什么选择学而思？ 5.教培行业需要在节假日上课，可能影响个人社交生活，你能接受吗？ 6.课后需要与家长沟通，给学生开小灶课...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客吐槽大会 #

28882次浏览 334人参与

# 一份好的简历长什么样？ #

24059次浏览 441人参与

# 春节前，你还在投简历吗？ #

1044次浏览 25人参与

# 春节提前走，你用什么理由请假？ #

625次浏览 19人参与

# 春招什么时候投？ #

312次浏览 9人参与

# 材料专业就业可以去哪些企业岗位 #

55146次浏览 379人参与

# 一上班就想____，这正常吗？ #

17471次浏览 147人参与

# 刚入职就____，这样正常吗？ #

127592次浏览 670人参与

# 校招入职后的感受 #

479114次浏览 3664人参与

# 现在还是0offer，延毕还是备考 #

1283601次浏览 7925人参与

# 设计人秋招体验最好的公司 #

81056次浏览 735人参与

# 招聘要求与实际实习内容不符怎么办 #

166488次浏览 922人参与

# 你觉得机械有必要实习吗 #

73588次浏览 487人参与

# 携程求职进展汇总 #

867065次浏览 5663人参与

# 找实习多的是你不知道的事 #

1790571次浏览 20673人参与

# 机械人选offer，最看重什么？ #

158608次浏览 798人参与

# 设计人的面试记录 #

187611次浏览 1607人参与

# 我的秋招总结 #

280653次浏览 4334人参与

# 聊聊你的职场新体验 #

319514次浏览 1862人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

8933次浏览 230人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务