8月12日下午,网信办公布首批根据《互联网信息服务算法推荐管理规定》(以下简称“《规定》”)完成备案的30个算法,并在互联网信息服务算法备案系统(https://beian.cac.gov.cn)公示相关文件。
对大多数企业而言算法备案系统犹如一个迷宫,不妨跟着首批走完流程的优等生们来一起抄抄作业吧。
本文将分为三个部分:第一部分对首批备案公示情况进行整体的分析;第二部分对浏览备案公示表后的收获进行分享;第三部分对算法备案公示谈谈自己的思考。
一、整体分析
(一)备案算法类型
应用算法推荐技术,是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。
《互联网信息服务算法推荐管理规定》第2条第2款
《规定》将“算法推荐技术”主要分为五种类型,在本次公示的首批备案中,“个性化推送类”最多(17/30),“合成生成类”最少(2/30)。
(二)备案完成主体
取得备案的主体如下图,30个备案由24家互联网大厂拿下。仅从数量上看,网易或以3个成为“备案榜”冠军。但由于阿里系分别由不同的主体进行备案,所以其实在集团层面,阿里系以4个荣登榜首。
(三)备案应用产品类型
本次备案的产品类型包括三类:APP、网站、小程序。使用算法相同的不同产品,如:西瓜视频(APP)、抖音短视频(APP)、今日头条(APP)或者同一产品的不同端,如:微博(APP、网站、小程序)均可在一个申请中进行备案。
因此,最终完成备案的应用产品数是超过30个的,其中:APP37个、网站11个、小程序4个。与目前的监管态势相符合,APP是监管重点,网站次之,小程序是新兴关注点。
二、个案分析
笔者浏览了30份备案材料,挑几个印象较深的点与读者分享。
(一)对“信息茧房”的回应
“信息茧房”曾被诟病多次,即指由于算法根据你的喜好,只推荐你爱看的内容,长此以往你接受的信息就只有这个类型,从而将桎梏于像蚕茧一般的“茧房”中的现象。部分APP对此予以回应。
1、抖音
为了避免“信息茧房”问题的出现,抖音个性化推荐算法专门设计了“兴趣探索”机制。一 方面 每次推荐都会选择用户过去不常观看的内容类目进行一定比例的推荐。 另一方面每次 获取推 荐内容的过程中会特别增加一条随机内容来保障用户可见内容的多样性。
2、优酷
为满足多元需求,我们会在排序过程中引入多样性打散机制,拓展推送的内容,避免同类型内容过度集中。
(二)百度搜索的排名指标公开
用户输入搜索词后,从相关性、时效性、权威性、页面质量等维度在网页候选库里找到更匹配用户搜索需求的检索结果集合,将检索结果返回,并在百度搜索结果页向用户进行排序展示,优化并提升用户的信息检索需求满足度。
遗憾的是,似乎还是没有回应为啥一个会有那么多广告放在最前面的问题。
(三)语音转文字算法亦须备案公示
钉钉将语音转文字算法,作为合成生成类算法进行公示,这超出了我原本对“算法推荐”的认知。但仔细一想,根据你的语音推荐最接近的字词,确实也是推荐。与之同理,微信、QQ、科大讯飞、各大输入法的备案是不是也要做起来了。
(四)推荐金融资讯须备案公示
富途牛牛属于在这三十份备案中最为另类,因为其是唯一一个具备“金融属性”的APP。
各大金融机构的APP进行资讯推送所使用算法是否需要备案也一直困扰着我。
尽管富途牛牛不属于持牌金融机构,但只要持牌金融机构APP中提供了与公示内容类似的资讯推荐服务,那么我推测大概率是需要做算法备案的。
不过我也还有个小疑问,既然富途牛牛都做了,支付宝怎么没做备案呢?
三、一些思考
算法备案制度的初衷就是为了提升算法透明度,告诉个人信息主体,你的信息将会被算法服务提供商如何使用,进而为你推荐服务。
浏览30份算法备案公示后,作为一个用户,我心中对于什么是一份好的算法公示已经有了点模糊的期待。
先说观感不好的:(1)有的公示使用晦涩的技术术语,让人看了等于没看;(2)有的公示上传了图片格式的PDF文件,仿佛在防贼。
再说观感好的:(1)告知使用哪些信息,足够透明。如:算法基于系统收集的用户设备信息、位置信息以及在使用产品时的行为信息(行为信息包括用户在访问 /使用 产品时的点击、关注、收藏、搜索、查询、浏览、下载、分享及交易的操作相关记录),通过对上述信息进行自动分析和计算。说得越详细,其实就越透明,用户的心里也越有底;(2)指标明确,足够客观。如:商品点击、加购、销量数据,按照不同的商品类目/属性,使用商品的客观数据排序以及对客观数据加权平均,来对商品进行排序。
总而言之,就是简单、透明、易懂即可。
但无论如何,这都是一个良好的开端。愿算法的黑盒可以渐渐被打开,算法向善的时代可以尽快来到。
给看到这的朋友来个小福利,可获得根据APP命名的30份算法备案PDF,密码“6666”。
https://pan.baidu.com/s/1RHBJqD3jgEiHPf_Zt7fPvA?pwd=6666
声明:本文来自数据何规,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。