当前位置: 首页 > 太极名家 >
深度阅读
时间:2018-11-08 12:02 来源:网络整理 作者:都是自己过 点击:

  “算法”已成热词。

  《未来简史》作者赫拉利,就有个大胆的论断:生物就是算法,生命就是进行算法处理;人类将环境参数作为输入数据,经过认知能力的处理,输出感受和决策等数据,从而决定了我们的喜怒哀乐以及行动。这只是基于数据主义的概念转译。

  但毋庸讳言,作为智能技术的算法,确实已深度嵌入人们的生活。

  当下,算法分发已是搜索引擎、浏览器、资讯客户端等互联网产品的标配。

  那,“算法”究竟是什么?

  1月11日,国内最大的信息分发平台今日头条,以分享交流会的形式,首度对外公开了自己的算法原理。这是国内互联网企业公布算法原理的首例。

  今日头条资深架构工程师曹欢欢博士,在现场详细介绍了算法模型设计维度与策略,包括如何在线训练大规模推荐模型,典型召回策略的设计方法,多目标如何融合等核心问题。以及今日头条的内容安全机制及相关举措,并公开了风险内容识别技术以及泛低质内容识别技术。

  来自中央电视台、新华社、人民日报等媒体机构的从业者,和来自阿里巴巴、腾讯、百度、美团、新浪、网易等科技公司的算法工程师、产品经理等100多人参与了交流。

  作为“第一个吃螃蟹的”,此举聚拢了无数眼球。而这背后,则是一个行业“独角兽”对肩上责任的主动认领,这份责任指向对整个行业发展层次的拉升,对技术红利增量的供给。

  将“独门绝技”拆解给外界看,挺需要魄力

深度阅读

  首例意味着没有先例。为什么公开算法原理方面没有先例?究其原因,是算法历来属于企业机密。对很多以算法立身的企业来说,这属于“核心技术”,也是竞争力之源。

  正因如此,基于数据挖掘的推荐引擎型产品,在“算法信息分发”应用上堪称一骑绝尘的今日头条,能将算法原理对行业、社会公开,难能可贵。

  正如有些人说的,算法原理之于今日头条,就相当于七十二绝技之于少林、太极拳之于武当,是“独门绝技”。

  将“本门绝技”亮给外界看,犹如把独家“秘方”公布给其他“厨师”,没点魄力不行——要知道,台下很多都是一线互联网公司算法工程师、技术大拿。郭德纲同志老说:同行间才是赤裸裸的仇恨。将算法原理“一招一式”都拆解给他们看,“心够大”。

  例如在现场,京东的工程师提问:“做算法推荐,如何在符合用户兴趣之外给用户创造惊喜?”曹欢欢回应称,这是今日头条做了两年的事情:“干预模型非常难。你先画一个兴趣图谱,根据用户的兴趣图谱的覆盖度去探索从来没有探索过的东西。我们甚至曾经做过指标体系的图象,实际发现不够好,这块的帮助确实没有那么大。”

  可以说,今日头条开行业风气之先地公开算法原理,着眼的本就是大格局,而非一己一时之得失:这次公开,既是释疑,旨在消除不少人对算法的误解与歧见;也是问诊,冀望更多人给现有的算法模型挑刺、建言,以裨补阙漏、改善算法。

  公开算法原理,是释疑,是问诊,更是赋能

  如今,虽然很多人都在跟算法驱动的技术打交道,但对算法并不了解。不了解所以也就有了误解。有些人觉得,算法就是“机器说了算”,是机器引导人而非人引导机器;有些人认为,算法就没有价值取向,只围绕流量转;还有人直言,算法开启的是潘多拉的魔盒,而不是阿里巴巴的宝库。

  这些误解可以理解,作为企业也有责任去矫正那些偏颇认知。事实上,算法完全可以优化设计,来克服推荐的“准”和信息茧房的矛盾;算法也有价值观,可以将“有意思”和“有意义”结合。

  正如今日头条副总编辑徐一龙在现场说的,算法也是一种“法”,都是通过一定的规则和方法,达成预期的一种效果;算法和法律法规一样,如果施行得好,都很高效,也都要求透明。此次交流会中也讲到,今日头条会不断纠偏,设计、监督并管理算法模型,并建立了内容安全机制及相关举措,有着风险内容识别技术以及泛低质内容识别技术。也就是说,其“算法分发”模式也有价值介入,而非一切交给机器。

  就此看,将算法原理公开,也是一种技术释疑。让公众增进对算法本身的了解,消除许多疑虑。

深度阅读