综影视:魂穿乔卫东!我全都要!

第201章 展博的“代码”知音!

关谷的料理对决过去三天后,爱情公寓迎来了一位久违的住户——陆展博。

他是胡一菲的弟弟,在美国硅谷工作了好几年,这次回国休假一个月。本来计划好好放松,结果人还没倒完时差,公司的越洋电话就追过来了。

周六上午,乔卫东晨跑回来,看见一个戴着黑框眼镜、头发乱糟糟的年轻男人正坐在三楼楼梯口,抱着笔记本电脑疯狂敲代码,嘴里还念念有词。

“该死的……这个优化怎么就是不行……”

乔卫东认出这是陆展博,胡一菲给他看过照片。

“陆展博?”他停住脚步。

展博猛地抬头,眼镜滑到鼻尖:“你……你是?”

“乔卫东,新邻居。”乔卫东伸出手。

“哦哦!乔先生!一菲跟我提过你!”展博连忙合上电脑站起来握手,“她说你很厉害,什么都会!”

“过奖了。”乔卫东看了眼他的电脑,“工作很忙?”

“何止是忙……”展博苦着脸,“公司新项目,ai推荐系统优化,deadline就在下周。我都回国休假了,还被拉着远程debug……”

他看起来很疲惫,黑眼圈很重,身上的t恤皱巴巴的,一看就是熬了夜。

乔卫东想了想:“要不要来我那儿坐坐?我泡壶茶,你慢慢弄。”

“可以吗?不会打扰你吧?”展博有些犹豫。

“不会。”

五分钟后,两人坐在3603的客厅里。乔卫东泡了一壶普洱,展博重新打开电脑,屏幕上密密麻麻的代码让人眼花缭乱。

“具体是什么问题?”乔卫东给他倒了杯茶。

展博推了推眼镜:“是这样,我们在做一个电商平台的个性化推荐系统。传统的协同过滤算法准确率不够高,我们想引入深度学习,但训练成本太大,线上推理速度又跟不上……”

他说了一堆专业术语,语气越来越烦躁:“我试了三种模型架构,优化了七次参数,准确率才提升了0.3个百分点,根本达不到产品要求。老板说再搞不定就要换方案了……”

乔卫东安静地听着,偶尔点点头。等展博说完,他问:“能给我看看你们的数据特征工程吗?”

展博愣了一下:“乔先生也懂这个?”

“略懂一点。”乔卫东说,“以前投资过几家ai公司,看过一些。”

展博将信将疑,但还是调出了代码。乔卫东凑过去看,手指在屏幕上滑动,目光快速扫过一行行代码。

看了大概三分钟,他开口:“问题出在这里。”

“哪里?”

“特征交叉的方式。”乔卫东指着一段代码,“你们只用了一阶和二阶交叉,对于用户行为这种高维稀疏数据来说,信息损失太大了。”

展博眼睛一亮:“对!我也想过这个问题!但高阶交叉计算量太大……”

“可以用fm(factorization machines)。”乔卫东说,“或者更好的,deepfm,把深度神经网络和因子分解机结合起来。既保留了低阶特征交互,又能捕捉高阶非线性关系。”

展博张大了嘴巴:“deepfm……我听说过,但没实际用过……”

“现在用的人不多,但效果不错。”乔卫东拿过一张纸,开始画示意图,“你看,这里用dnn处理高阶特征,这里用fm处理低阶特征,最后融合。这样既能保证效果,又能控制模型复杂度。”

他在纸上写下几个公式和架构图。展博看得如痴如醉,眼镜后面的眼睛越来越亮。

“还有这里,”乔卫东又指向另一段代码,“负采样策略可以优化。你们现在用的是随机负采样,效果不稳定。可以试试基于流行度的负采样,或者更高级的,对抗式负采样。”

“对抗式?”展博完全没听过这个词。

“简单说,就是用一个生成器来产生‘难负例’。”乔卫东又画了个图,“这样模型能学到更有区分度的特征。”

展博彻底服了。他从硅谷回来,自以为算是技术前沿的人,但乔卫东说的这些,有些他都没听过!

“乔先生,您……您这些是从哪儿学的?”他结结巴巴地问。

“多看论文,多实践。”乔卫东轻描淡写,“ai发展很快,每天都有新东西。不过万变不离其宗,底层逻辑是一样的。”

他喝了口茶,继续说:“另外,我觉得你们的方向可以调整一下。”

“怎么调整?”

“现在大家都在做精排,就是最后那一步的排序模型。”乔卫东说,“但真正决定推荐效果的,往往是前面的召回阶段。如果召回池里没有好东西,再怎么精排也排不出花来。”

展博猛点头:“对对对!我们cto也说过这话!但召回怎么做?我们试过itemcf、usercf,效果都一般……”

“试试多通道召回。”乔卫东在纸上又画,“一条通道做协同过滤,一条通道做内容匹配,一条通道做热点补充,还有一条……做探索。最后用一个简单的模型做融合,把各通道的结果汇总到召回池里。”

他边说边写,思路清晰得像在说今天吃什么。展博赶紧打开笔记本,疯狂记录,生怕漏掉一个字。

“探索通道很重要。”乔卫东强调,“现在的推荐系统太‘功利’了,只推用户可能点击的,导致信息茧房越来越严重。得适当推一些用户可能喜欢但没接触过的内容,打破茧房。”

展博停下笔,若有所思:“这个思路……我们产品经理肯定喜欢。他一直说要增加推荐的多样性……”

“技术要为产品服务。”乔卫东说,“但也要有前瞻性。我猜,你们接下来应该会做多模态推荐吧?把图像、文本、视频都融合进来。”

展博瞪大眼睛:“您怎么知道?这是我们下一个季度的规划!”

“趋势而已。”乔卫东笑,“现在纯文本的推荐已经到瓶颈了,多模态是必然方向。不过要做好不容易,跨模态对齐是个大问题。”

“对对对!”展博激动起来,“我们就在为这个头疼!图像特征和文本特征怎么对齐?用什么损失函数?”

“可以试试clip那套思路。”乔卫东说,“用对比学习,拉近相关图像和文本的距离,推开不相关的。不过具体到推荐场景,得做一些调整……”

他又讲了十几分钟,从技术细节讲到工程实践,从算法优化讲到系统架构。展博听得如痴如醉,笔记本上记满了密密麻麻的要点。

讲完后,乔卫东问:“听懂了吗?”

展博用力点头:“听懂了!而且……我有种醍醐灌顶的感觉!乔先生,您太厉害了!这些思路,比我们公司那些资深架构师都超前!”

“只是站在巨人的肩膀上。”乔卫东谦虚地说。

“不!您就是巨人!”展博站起来,深深鞠躬,“谢谢您!真的谢谢您!这些建议,够我消化一个月了!”

“能帮上忙就好。”乔卫东看了眼时间,“快中午了,你该吃饭了。”

“我不饿!我要把这些思路整理出来,马上开始改代码!”展博抱着电脑,眼睛放光,“乔先生,我能……我能经常来请教您吗?”

“随时欢迎。”乔卫东微笑。

展博千恩万谢地走了。回到3601时,胡一菲正准备叫他吃饭。

“展博,你跑哪儿去了?一上午不见人。”

“姐!我遇到高人了!”展博激动地说,“乔先生!他太厉害了!他给我讲的推荐系统思路,比我在硅谷听的顶尖讲座都牛!”

胡一菲挑眉:“乔老师还懂这个?”

本章未完,点击下一页继续阅读。

人气小说推荐More+

出门捡到命运种子
出门捡到命运种子
蓝星灵气复苏,异界裂缝现世,妖兽肆虐,人类文明危在旦夕。少年林尘,痴傻八年,于生死关头觉醒体内“命运之种”,窥得一线未来,逆转死局。他从此踏上守护家园、探寻真相的征途。明悟“命运之子”身份,执掌无上大命运术,林尘的命运与世界的存亡紧密相连。他携手清冷剑仙苏沐晴、温柔治愈的唐灵儿等红颜知己,破阴谋,斩强敌,推动世界升维。从小千世界的挣扎求生,到中千世界的问道争锋,直至大千世界的主宰沉浮,他的脚步从
二百斤胖子
本人魔女才不是你的魔法少女老师
本人魔女才不是你的魔法少女老师
+++身为曾经月皓级的首席魔法少女,曼陀罗在一次任务不得不杀死队友,成为魔法王庭悬赏的通缉犯。由于被污染,手中的魔法几乎全部失效,只能使用不正经的触手魔法。为了躲避通缉,南郁离几乎放弃自己作为魔法少女的身份,彻底融入了碌碌无为的平凡人群体之中。直到某一天自己的妹妹突然立志要成为魔法少女,且隐约有要实现的趋势。这时候,南郁离慌了……你哥我是魔法王庭头号通缉犯,你要成为魔法少女,政审要把我老底查出来
拾叶小洛
穿越卡牌世界,我成了女寝楼管
穿越卡牌世界,我成了女寝楼管
(94章开始,卡牌少女拥有完整灵性)你说你野兽卡牌称霸秘境,无所不吞噬?你说你机械卡牌枪炮双绝,弹药洗地?你说你龙属性卡牌,龙游四海?很好,很不错。你问我?我的卡牌有点不一样。诡谲魅影的狼耳少女卡牌。沐浴着圣歌的神侍少女卡牌。洋溢龙之血气的苍龙少女卡牌。......各种美丽而又强大的美少女卡牌,都进入我的卡包吧。秦楚误入卡士世界,意外觉醒解析之眼。手握卡牌少女的他,最终将要登顶卡士的巅峰。这一切
别捅马蜂窝
我真不想当神剑主,妹妹逼的!
我真不想当神剑主,妹妹逼的!
十八年前,落日关一战,第十神剑主方星河与魔主同归于尽,成为人族永恒传说。十八年后,普通少年方洛为救被霸凌的少女,挨了一顿揍,却意外觉醒——他竟是重生的方星河!更离谱的是:养妹方清凝,白发蓝瞳天赋绝伦,却默认他是“无天赋废柴”,深夜潜入他房间,说要“留下方家血脉”再去复仇;救下的少女叶澜依,平民校花,卡在虚拟试炼第一关的“废物”,见他轻松通关后,当场跪地表态:“主人,我要做你剑侍!”而他发现,前世
喜欢五眼果的方飞龙
失控摄影师:客户都是危险女神
失控摄影师:客户都是危险女神
+??+??++??++++??+??+++林枫,一名游走在光影边缘的私房摄影师,擅长用镜头窥视这座城市最耀眼女神的秘密与欲望。公司女总裁用他祭奠青春,豪门千金找他窃取阴谋,职场女王借他打破枷锁,寂寞少妇求他记录存在。他周旋其间,自以为掌控一切,直至一次意外,他拍下了一组不该存在的照片,瞬间从猎手沦为整个权贵阶层追杀的猎物。当杀机降临,他才惊觉,那些曾与他交易身体和秘密的女神们,既是危机的源头,
涛清泽