召集了两个项目的开发人员讨论了几次 , 有了大致的眉目 。 新项目取名MXNet , 可以叫做mixed-net , 是前面两个名字(Minerva和CXXNet)的组合 。 放弃开发了几年的项目不是容易的决定 , 但幸运的是小伙伴都愿意最求更好 , 所以 MXNet进展挺顺利 。 很快就有了可以跑的第一个版本 。
第四年:9/15-8/16
前半年为difacto和MXNet写了很多代码 。 其实一开始的时候我觉得difacto更重要些 , 毕竟它对于线性算法的提升非常显著而且额外的计算开销并不大 , 这对广告预估之类的应用会有非常大的提升 。 但有次遇到Andrew Ng , 我跟他说我同时在做这两个项目 , 他立即告诉我我应该全部精力放在MXNet上 , 这个的未来空间会大很多 。 我一直很佩服Andrew的眼光 , 所以听了他的建议 。
11月的时候MXNet就有了很高的完成度 。 写了个小论文投去了NIPS的workshop也算是歇了口气 。 但随后就听到了TensorFlow(TF)开源的消息 。 由 Jeff Dean领导大量全职工程师开发 , Google庞大的宣传机器支持 , 不出意料迅速成为最流行的深度学习平台 。 TF对我们压力还是蛮大 , 我们有核心开发者转去用了TF 。 不过TF的存在让我领悟到一点 , 与其过分关心和担忧对手 , 不如把精力集中在把自己的做得更好 。
NIPS的时候MXNet的小伙伴聚了一次 , 有好几个我其实是第一次见面 。 随后Nvidia的GTC邀请我们去做报告 。 在这两次之间大家爆发了一把 , 做了很多地方的改进 。 同时用户也在稳步增长 。 我们一直觉得MXNet是小开发团队所以做新东西快这是一个优势 , 但随着用户增加 , 收到抱怨说开发太快导致很多模块兼容性有问题 。 有段时间也在反思要在新技术开发速度和稳定性之间做一些权衡 。
这时一夜之间大数据不再流行 , 大家都在谈深度学习了 。
我也花了很多力气在宣传MXNet和争取开发者上 。 包括微博知乎上吼一吼 , 四处给报告 。 在大量的点赞声中有些陶醉 , 但很多中肯的批评也让我意识到重要的一点 , 就是应该真诚的分享而不是简单的吹嘘 。
因为大量的媒体介入 , 整个深度学习有娱乐化的趋势 。 娱乐化的报道很多都只是一些简单信息 , (有偏见)的观点 , 而没有太多干货 。 不仅对别人没营养 , 对自己来说也就是满足虚荣心 。 与其写这些简单的水文 , 不如静下心做一些有深度的分享 , 包括技术细节 , 设计思路 , 和其中的体会 。
此类分享一个容易陷入的误区是只关注自己做了什么 , 结果多么好 。 这些确实能证明个人能力 , 对于想重复这个工作的人来说会有很大帮助 。 但更多的人更关心的是适用范围在哪里 , 就是什么情况下效果会减弱;为什么结果会那么好;insight是什么 。 这个需要更多深入的理解和思考 , 而不是简单的展示结果 。
这个对写论文也是如此 。 只说自己的结果比基线好多少只能说明这是不错的工作 , 但结果再好并不能意味这个工作有深度 。
深度学习的火热导致了各种巨资收购初创司不断 。 Alex也有点按耐不住 ,结果是他 , Dave , Ash(曾经是YahooCTO)和我合伙弄了一家公司 , 拿了几十万的天使投资就开工了 。 Alex写爬虫 , Dave写框架 , 我跑模型 , 风风火火干了好一阵子 。 可惜中途Dave跑路去跟Jeff做TF了 。 后来这个公司卖给了一个小上市公司 。 再后来我们觉得这个公司不靠谱也就没考虑跟他们干了 。
第一次创业不能说很成功 , 从中学到几点:一是跟教授开公司一定要注意有太多想法但没死死的掐住一个做 , 二是找一堆兼职的博士生来干活不是特别靠谱 , 尤其是产品不明确的时候 , 三是即使要卖公司也一定要做一个产品出来 。 我们卖的时候给很多人的感觉是团队人太强但产品太弱 , 所以他们只想要人而已 。 四是试图想要通过技术去改变一个非技术公司是很难的事情 , 尤其是过于新的技术 。
- 亚马逊|产品经理犯了这10个错误,产品会“死”得很惨
- DTC品牌拥抱亚马逊
- 上海天文馆开中秋直播,天文学博士刘博洋带你体验不一样的赏月形式
- 小米生态链|谷仓洪博士:新国货品牌是超越实用功能之上的情感和精神需求
- 医生|卖家突破100万!亚马逊加大印度市场砝码
- 亚马逊|同样是拍照手机vivoX80和OPPOReno8系列如何选?
- Twitter|全!亚马逊运营必须知道的108个难题解法(上期)
- 罗技|亚马逊广告为什么花不出去钱?Amazon广告费用花不掉的原因分析
- Buy with Prime,亚马逊的DTC野心
- 亚马逊|抖音推荐算法的底层逻辑,视频没有走到爆款中间经历了什么?