2020-02-16 10:59 腾讯_数据平台部_算法工程师

关注

stochastic multi-armed bandits, regret minimization

chernoff bounds

$P(\hat{\mu_{n}}-\mu > \epsilon) = P(\lambda(\hat{\mu_{n}-\mu})>\lambda \epsilon)$

运用Markov inequality

$P(\hat{\mu_{n}} - \mu > \epsilon) \le e^{- \lambda\epsilon}\mathbb{E}[e^{\lambda(\hat{\mu_{n}-\mu})}]$

最后根据 $i.i.d$ 可以得到

$P(\hat{\mu_{n}} - \mu > \epsilon) \le e^{- \lambda\epsilon}\mathbb{E}[e^{\frac{\lambda}{n}(\hat{\mu_{n}-\mu})}]^n$

Hoeffding's equality
图片说明

Stochastic mult-armed bandits
图片说明

休息一下

全部评论

推荐最新楼层

昨天 20:45

阿里巴巴_算法工程师(实习员工)

面试时的“松弛感”装不出来！

如果只能说一个好处，我觉得是：它能让你在面试时，不再像一个等着老师打分的“学生”，而像一个来谈合作的“职场人”。没实习过的学院派小白，面试时往往是在背书：死磕概念，满口理论模型，生怕答错一个知识点，眼神里写满了“考官求放过“。而实习过的你，面试时其实是在复盘：因为你见过真实的业务流程，知道代码在测试上跑通和在项目里运行是两码事；你被甲方虐过、被Deadline追过，知道比起理论，领导更看重能提出解决问题的完整方案的能力。这种体感会给你一种天然的自信。当面试官问你一个难题时，你不会慌张地背定义，而是会从容地说：“我之前的实习中也遇到过类似的情况，当时我们的处理逻辑是……” 你们说的不再是“知识点...

一人说一个提前实习的好处

点赞评论收藏

12-19 08:26

天津大学 ARM工程师

26秋招嵌入式复盘

基础+学历 一般都会有offer复盘一下自己对于基础的总结重点一：C语言/STM 基础C 语言基础（有基础可跳过，推荐课程：鹏哥 C 语言，对新人非常友好）：只需掌握 if-else，指针，struct，其他内容做项目时再学；避免在 C 语言海洋里迷失，时间紧迫，先学会走再学会跑推荐课程：鹏哥 C 语言，对新人非常友好STM32 基础外设（推荐江科大，博主也是跟着他学的，逻辑非常清晰，细节非常到位）：学习顺序是：时钟→GPIO→中断→定时器→UART→I2C→SPI→DMA（限于篇幅原因，有哪些需要排除的细节章节可以评论区问博主，博主可以帮忙排查到底要不要学！）其他的外设比如 ADC，PWM ...

点赞评论收藏

11-19 17:50

西北政法大学新媒体运营

已听劝

如何呢

程序员花海：实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价其中项目经历注意要体现业务实习经历里面的业务更是要自圆其说简历模板尽可能保持干净整洁不要太花哨的

秋招吐槽大会

点赞评论收藏

12-24 20:42

西安邮电大学后端工程师

想进大厂暑期？这些东西你要准备好！

前言：我们会从五个维度开始介绍要求。分别是学历，八股，算法和实习，在校经历。当然了，不同的学历可能会在八股和算法这一块有不同的要求。这是一个很残酷的现实。如果你的学历比较弱。那你就要在其他方面付出更多的努力。对学历的要求  学历这一块我们已经改变不了了。因此我只介绍一下不同学历的现状。从事实上来讲，当你拥有一个比较好的985/211学历的时候，你就是可以很轻松的就进入大厂实习。这是你高中努力学习应得的。因此不用过于焦虑。  最近我在牛牛频道中总是看见很多985/211的同学焦虑自己在暑期实习之前没有一段日常会不会导致自己暑期找不到大厂实习。真的不用有这个担心。  能找到肯定是加分项。但是找不到...

代码之外的生存之道

点赞评论收藏

全站热榜

创作者周榜

正在热议