致推算出用户的爱好。一旦用户搜索某些内容关键词,就把最符合用户审美习惯的内容优先排序在搜索结果的最前面。
最终的结果,就是“一千个人眼中有一千个哈姆雷特”,每个人搜索同一个关键词,得到的结果都不一样。
这事儿看着很美,不过没个两三年的苦功,是不可能做出成绩来的。
一方面,用户的喜好画像非常艰难,需要多年的深度学习型人工智能算法的打磨、砥砺。
另一方面,还要考虑用户看同类东西过多之后会不会形成“信息孤岛”,看多了会不会腻,会不会因为“重复/旧闻”而抵触,从而需要调整外部扰动的频次。
最后,处理如此海量的数据,所需要的云计算资源目前也不够。在计算资源变充分之前,“一千个人眼中有一千个哈姆雷特”是不现实的,只能先从“一千个人眼中有十个/一百个哈姆雷特”这种角度努力。
通过分析用户的行为数据,把用户每千人、百人……乃至最后数人归并到一个用户组里,默认同一组里的人兴趣爱好完全相同,然后渐渐深入……
这个项目顾诚定下的指标是2008年初步出成果,可见其难度了。
而且,yy网络科技会在这个项目中每年投注入数亿美元的科研经费——顾诚说了,从今年开始,他会拨出《魔兽世界》50%的运营毛利,来补贴这个内容分发算法的科研。
别觉得这点钱多,平行时空的2010年之后,扎克伯格的facebook在这方面(信息feed流领域)花的科研经费只会比这个价码更多。
喜欢被成就感和友人的羡慕所推着走的张一鸣,只能是破天荒头一遭地不断自己给自己找一个个小目标,让自己能够有成就感一点。
……
张一鸣进入新项目组已经有一个月。
在这里,他认识了无数的技术大牛,包括好几个杰夫辛顿教授带的深度学习算法博士生,还有曾经给人人网做图片搜索、人脸识别的项目组成员。
他曾经的少年张狂,很快被如饥似渴的求知欲给掩盖了过去,每天除了勤勤恳恳地写代码,就是找牛人请教。
刚刚入行的张一鸣,职场情商还比较低,一如所有的技术死宅型极客,不太在乎别人的看法。很快他就发现这是一个让人如鱼得水的领域——哪怕这个世界上最有经验的人,在这个领域的经验也不会超过两年。作为一个应届生,能够在刚毕业后短短工作磨合几个月,就进入这一领域,实在是太幸运了。
顾诚为这个团队拨付的首批科研经费,大约是3个亿人民币,已经到位了,主要是人员工资的开支,以及与之配合的虚拟云环境、数据模拟器花销。这种大手笔、巨投入,让所有参与者都振奋不已,有一种自己正在创造历史的豪迈感。
这天,已经是9月末了。
张一鸣跟一名杰夫辛顿教授带出来的博士生请教了几个问题,一看已经到晚上11点了,便准点下班。
忙归忙,他不喜欢加班。
他从包里翻出一台这个月刚刚作为公司福利下发的内部测试版kindle,激活蓝牙耳机,开始一边听歌,一边跟同事拼打车回家。
kindle是雷俊的yy电子公司刚出的,硬件已经调得差不多了了,距离正式上市就差一块墨水屏,可能还要换三星今年下半年即将上市的最新款物料。
旧版物料的试流9月份刚刚跑下去,做出了大约三千台非卖品,顾诚就发给旗下所有公司的员工人手发了一台,让大家测试反馈一下系统问题。
所以最近几乎人人下班都会拿这个东西听歌、看电子书。
张一鸣也不例外。
东部软件园门口,晚上11点还有很多出租车
『加入书签,方便阅读』