亚马逊沐神 | 博士这五年来源:https://zhuanlan.zhihu.com/p/25099638
12年8月提着一个行李箱降落在匹兹堡机场 。 没找住的地方 , 也不知道CMU应该怎么去 。 对未来一片迷茫 , 但充满乐观 。现在 , 刚完成了博士期间最后的一场报告 , 在同样的机场 , 不过是在等待离开的航班 。
回想过去的五年 , 是折腾的五年 , 也是自我感悟和提升的五年 。 这里我尝试记录这五年主要做过的事情和其中的感想 , 希望对大家有所启发 。
第0年:3/11-8/12
我第一次申请美国的博士是在11年 , 但拿到的offer并没有特别合适的导师 , 于是就北上投奔文渊去了 。我当时在百度商务搜索部门做广告的点击预估 。 具体是使用机器学习来预测一个广告是不是会被用户点击 。这时候离“大数据”这个词流行还有两年 , 但百度那时候的数据即使现在来看仍然是大的 。 我的任务是如何高效的利用数百台机器快速的在数十T的数据上训练出模型 。
当时产品用的算法基于LBFGS , 我于是想是不是可以换个收敛更快的算法 。 没几天就找到个不错。 但实现上发现了各种问题 , 包括性能 , 收敛 , 和稳定性 。 而且那时有的就是一个裸的Linux和很老版本的GCC , 什么都是需要从头开始写 。 花了大量时间做系统优化 , 算法改动 , 和线上实验 , 最后一年后在整个广告流量上上了线 。
现在再回顾会觉得整个一年时间都在打磨各种细节上 , 有时候为了5%的性能提升花上上千行代码 。 这些都导致算法过于复杂 , 有过度设计之嫌 。 但深入各个细节对个人能力提升很大 , 而且很多遇到的问题成为了之后研究方向的来源 。 一些算法上的思考曾写在这里 , 当时候深度学习刚刚出来 , 冥冥中觉得这个应该是大规模机器学习的未来 , 不过真正开始跟进是好几年以后了 。
11年12月中的时候突然心血来潮随手把材料重新寄了一遍 , 就选了CMU和MIT , 结果意外收到了CMU的offer 。 有天在百度食堂同凯哥(余凯)和潼哥(张潼)吃饭 , 我说收了CMU offer , 在纠结去不去 。 他们立马说去跟Alex Smola啊 , 他要要加入CMU了 , 我们给你引荐下 。
记得是离开的前一天才开始打包行李 , 早上去公司开完会 , 中午离职 , 跟小伙伴打招呼说出个国 , 然后就奔机场了 。 那天北京天气特别好 , 完全不记得前一天雾霾刚爆了表 。
第一年:9/12-8/13
第一年的主要事情是熟悉环境和上课 。 CMU课程比较重 , 博士需要学8门课 , 每门课工作量巨大 。 而且要求做两门课助教 , 做助教比上课更累 。
这一年上的课中对我最有用的是“高级分布式系统” 。 之前在上交ACM班的时候已经学过很多质量都还不错课 , 纯知识性的课程一般对我帮助不大 。 但这门课主要是读论文 , 然后大家讨论 。 不仅仅是关于知识 , 很多是对设计理念的领悟 。 大家知道对于系统而言 , 设计是一门艺术而不是科学 , 这是设计者审美和哲学理念的体现 。 同时系统界历史也是由一波又一波的潮流组成 , 了解历史的发展以及其中不断重复的规律非常有意义 。
那年这门课上课老师是Hui Zhang(神人之一 , 20多岁就在CMU任教了 , 学生包括了Ion Stoica , 他是Spark作者Matei的导师) , 他有非常好的大局观 , 对于“Why”这个问题阐述非常到位 。 我是通过这门课才对分布式系统有了比较清晰的认识 。 两年之后我偶然发现我的一篇论文也在这门课的阅读列表里了 , 算是小成就达成。
- 亚马逊|产品经理犯了这10个错误,产品会“死”得很惨
- DTC品牌拥抱亚马逊
- 上海天文馆开中秋直播,天文学博士刘博洋带你体验不一样的赏月形式
- 小米生态链|谷仓洪博士:新国货品牌是超越实用功能之上的情感和精神需求
- 医生|卖家突破100万!亚马逊加大印度市场砝码
- 亚马逊|同样是拍照手机vivoX80和OPPOReno8系列如何选?
- Twitter|全!亚马逊运营必须知道的108个难题解法(上期)
- 罗技|亚马逊广告为什么花不出去钱?Amazon广告费用花不掉的原因分析
- Buy with Prime,亚马逊的DTC野心
- 亚马逊|抖音推荐算法的底层逻辑,视频没有走到爆款中间经历了什么?