浙江工人日报 数字报纸


00001版:一版要闻

20亿商品“读图”鉴定

揭秘阿里平台治理背后的数据力量

  杜志华报道  年度活跃消费者5亿余,福布斯“全球最具价值消费品牌”近八成入驻天猫,去年新创且有成交的中小商家超300万家……迈过18周岁的阿里巴巴早已超越电商平台,成为一个突破了线上线下界限和空间局限的经济体,也正肩负着艰巨的平台治理责任。昨日,在2017杭州·云栖大会“数据力量·社会治理的共享与共治”分论坛上,阿里巴巴平台治理部首次集中向公众展示大数据带来的社会治理变革。

  “2016年淘宝新开店铺为1020万家,有成交的就超过300万家,这其中约35%卖家是24岁以下的年轻人,30岁以下的创业者超60%。”阿里巴巴首席平台治理官郑俊芳表示,在这个繁荣多样的生态中“我们既要考虑消费者保护,又要保证市场活跃,营造健康的创新创业环境,也要为品牌权利人提供服务保障权益。”

  据郑俊芳介绍,如今的阿里巴巴正在充分利用数据力量,面向消费者能做到假货快速退款;为创业者提供平等创业机会和健康有序的市场环境,发现“小而美”卖家;面向社会通过数据做到快速合规,成为行业标杆。

  论坛上,阿里巴巴集团资深技术专家贾梦雷还首次向公众披露“雷音识字”技术。据其介绍,新广告法实施后海量的商品描述有了违规风险,而平台上90%的商品描述在图片里含有诸如“顶级”“最优质”“极品”等词汇。“‘雷音识字’技术就是一双智慧之眼,监控全网近20亿商品,并将违规商品揪出来。”贾梦雷说:“目前技术对详情图片识别准确率均为97.6%,已接近人眼识别能力。”

  阿里的图像识别能力到底有多强?平台治理部公布的一组数据可以说明。据统计,2016年全年阿里超强的图片识别技术已累计计算1000亿张图片,每日为20亿在架宝贝的图像安全保驾护航。每日计算商品图片约6亿张,每年计算图片面积约4.26平方公里,相当于48个澳门特别行政区的土地面积。每秒扫描图片文字23,546,287个,相当于每秒可扫描识别501本《康熙字典》的汉字量。

  目前,该图像识别技术已审核包括身份证、发票、营业执照、专利证书在内的23种资质图。“像专利证书的识别率高达99.3%,这让快速合法合规成为了可能。”贾梦雷说。

  在分论坛圆桌会议上,浙江省双打办主任徐高春、浙江省工商局副局长张雪林、浙江省质监局稽查总队总队长方华、浙江高院审判管理处处长姚海涛齐聚一堂,共同探讨“数据时代社会治理的浙江实践”。


浙江工人日报 一版要闻 00001 20亿商品“读图”鉴定 2017-10-12 2 2017年10月12日 星期四