2020-02-16 05:33 已编辑腾讯_数据平台部_算法工程师

关注

Introduction to online optimization: introduction

online learning protocol:

图片说明
characteristic:
limited feedback

Exponentially weighed average forecaster

$p_t(i) = \frac{exp(-\eta\Sigma_{s=1}^{t-1}\ell(e_i,z_s))}{\Sigma_{j=1}^dexp(-\eta\Sigma_{s=1}^{t-1}\ell(e_j,z_s))}$

Bounded convex loss and expert regret

Hoeffding’s's inequality
lemma 2.1:

$log(\mathbb{E}exp(sX)) \le s\mathbb{E}X + \frac{s^2(b-a)^2}{8}$
Therorem: For any convex loss taking values in [0,1], the Exp strategy satisfies:

$R_n^E\le\frac{logd}{\eta} + \frac{n\eta}{8}$

Exp-concave loss and expert regret

$R_n^E \le \frac{logd}{\sigma}$

Lower bound

General convex and bounded loss is unimprovable.

$\lim_{d\to+\infty} \lim_{n\to+\infty} \frac{\mathbb{E}(max_{1 \le i \le d}\Sigma_{t=1}{n}\sigma_{i,t})}{\sqrt{2nlogd}}=1$
$\sup_{n,d}\sup_{adversary}\frac{R_n}{\sqrt{(n/2)logd}}\ge 1$

Anytime strategy

For any convex loss with values in [0,1], the exp strategy with time-varying parameter $\eta_{t}=2\sqrt{\frac{logd}{t}}$ satisfies for all $n\ge 1$ :

$R_{n}^E \le \sqrt{nlogd}$

Subdifferentiable loss with bounded subgradient

online finite optimization

For any loss with values in [0,1], the finite Exp strategy with parameter $\eta=2\sqrt{2\frac{logd}{n}}$ satisfies with probability at least $1-\delta$ :

$R_n \le \sqrt{\frac{nlogd}{2}} + \sqrt{\frac{nlog{\delta^{-1}}}{2}}$

全部评论

推荐最新楼层

12-22 21:17

正浩创新EcoFlow_海外销售(准入职员工)

正浩创新内推，正浩创新内推码

📦两个部分：上班感受+公司福利～ 上班感受：快节奏 体验感十足 ⭐️ 学习：每天时间很快也很累，感觉要学的要做的东西真的太多，我会不断的向内求，如果有问题我会及时记录然后及时询问前辈，作为刚入职小白，新知识根本学不完！抽空学！ ⭐️ 通勤：住在公司附近所以步行十分钟左右，早上9:30打卡 也可以十点（如果你前一天加班到十点）奈何早上床成了我的老家😭早上必须咖一杯 一月可以迟到60m很人性化 五次补卡哈哈哈 ⭐️ 两周感悟：高效办公！合理分配时间！任务清单明确！把更多的时间花在有意义的内容上！！！抽闲暇时间做一些赶进度工作！勇敢！ ⭐️ 部门氛围：同事和leader无敌好，来的第一周就请我们...

正浩创新EcoFlow公司福利 644人发布

点赞评论收藏

分享

12-22 23:37

复旦大学 Java

日常分析大厂面经-淘天一面

大家好，我是花海，B站技术专家，平时会在牛客分享一些面试复盘和技术思考。如果你在准备面试、修改简历，或者对职业规划有疑问，可以找我免费帮你看看简历、聊聊思路。目的是帮大家少走点弯路，今天我们来继续看面经。今天这份面经聚焦于操作系统和Linux底层原理，问题非常经典，从概念辨析到实战排查都有涉及，能系统性地考察候选人的基本功和解决问题的能力。1.Linux平常使用吗？线程和进程的区别，还有什么类似进程和线程的吗？什么是协程？这个问题旨在确认你的开发环境熟悉度，并深入考察对并发核心概念的理解层级。进程是系统资源分配的基本单位，拥有独立的虚拟地址空间、文件描述符等资源，隔离性强但创建和切换开销大。线...

查看9道真题和解析

点赞评论收藏

分享

12-02 16:43

门头沟学院 Java

谁把我offer抢了

昨天线上面的技术面，今天早上喊我去线下hr面，怎么下午就说有人接offer了谁把我offer抢走

诺亚方舟：先到先得那还面个什么劲

点赞评论收藏

分享

12-15 14:16

门头沟学院 Java

28届沟通1000+了

找不到到，根本找不到😭😭😭😭😭  ，没办法，只能伪装27了😿

回家当保安：发offer的时候会背调学信网，最好不要这样

。 “27届 ”和“28届以下 ”公司招聘的预期是不一样的。

实习简历求拷打

点赞评论收藏

分享

12-19 20:54

柠檬微趣_HR(准入职员工)

柠檬微趣内推，柠檬微趣内推码

柠檬微趣前端一面1. 自我介绍2. JS定义变量方式？let const var区别？3. 为什么用const定义变量不可以被修改？底层原理？一定不能改？4. `let a = 1; let a = 2;` 会发生什么？会报什么错？5. `var a = 1; var a = 2;` 可以吗？`var a = 1; let a = 2;` 呢？6. `var`特性（如变量提升）？`console.log(a); var a = 1;` 的结果是什么？7. JS中基本数据类型？分别存储在哪里（栈/堆）？8. `let a = {}; b = a; `修改b会影响a吗（会）如何避免（深拷贝）9. ...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客2025仙途报告 #

1820次浏览 75人参与

# 中美关系回暖，你会选择出海吗？ #

13911次浏览 141人参与

# 2025年终总结 #

175309次浏览 2968人参与

# 你面试体验感最差/最好的公司 #

20492次浏览 340人参与

# 秋招落幕，你是He or Be #

13996次浏览 272人参与

# 中美关税战对我们有哪些影响 #

49920次浏览 392人参与

# 一人说一个提前实习的好处 #

12250次浏览 215人参与

# 今年你最想重开的一场面试是？ #

4775次浏览 72人参与

# 重来一次，你会对开始求职的自己说 #

6557次浏览 165人参与

# 实习没事做是福还是祸？ #

17804次浏览 263人参与

# 找工作，行业重要还是岗位重要？ #

85556次浏览 1698人参与

# 机械制造秋招总结 #

97287次浏览 878人参与

# 礼物开箱Plog #

998次浏览 36人参与

# 团建是“福利”还是是 “渡劫” #

7714次浏览 155人参与

# 工作中听到最受打击的一句话 #

7484次浏览 122人参与

# 考公VS就业，你怎么选？ #

88040次浏览 496人参与

# 网易求职进展汇总 #

172449次浏览 1422人参与

# 你小心翼翼的闯过多大的祸？ #

11487次浏览 165人参与

# 哪些行业值得去? #

14346次浏览 74人参与

# 国央企薪资爆料 #

136515次浏览 597人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务