当前位置: 首页> 旅游摄影

阿里安全图灵实验室在ICDAR2017MLT竞赛刷新世界最好成绩

发布时间:2020-05-21

ㄨ 近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competгition on Multi-lingual scene text detectioЭn)自然场景多语言文本检测▲竞赛中刷新了世界最好成绩,〤以73.52%的Hmean排名第一。(竞赛结果页面:ht≠tp://rrc.cvcΥ.uab.es/?ch=8&co△m=evaluation&t◁ask=1)

据了๑解,ICDAR(International☞ Cↇonfe▼rence on Document Analysis and Recognition)具有OCR领域的奥斯卡盛∴会之ω称,是全球『OCR领域公认最权威的比赛之一。

当前◣,▉OCR技术被广泛应用于Ψ多个领域。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌识别;再到图片、视频文字内容理解与内容安全,OCR技术都发挥着越来越重要的作用。

阿里安全图灵实验室研究人员称,在技术上,文本检测和识别需要应付各种考验和挑战,如自然场景下光照в的影响,物体的遮挡,文▂▃▅▆█字大小、比例、角度的变化,图像视频中文字的模糊等▽等。IC▀DAR2017 MLT竞赛包含了∈中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种语言,其图像采集自各种各样的场景,其中●的▔文本的长度、字体、尺寸、颜色千Ξ变万化,―同时还包含了许多│┃真实场景的噪声包括♯♮光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这对于OCR算法的适应能力更具挑战性。

┖为攻克这些难题,阿里安全图灵实验室的研究人员设计了基于深度学习的网络模型和算法。

据介绍,图灵实验室的研究人█员在文字检测模型方面,采用深度卷积神经网络获得更深层的图像特征;并利用多尺度特征和非对称卷┒积核获得更好的ε感受视野,从而适应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测策略,因▀此相较于传统的RCNN-basedⅣ方案,在检ω测速度上有很大提升。在文字识别模型,图灵实验室的研究人Я员在主流方案的基础上,做了全〇新的探索和研究,从而获得了更为有效的识别模型,在保证识别准确率的前提下,۩提高了识别效率。

阿里安全图↘灵实验ⓛ室研究人员表示,ATL Cangjie OCR提供μ在线同步、异步通用OCR文字检测和识别服务,以及离线★ODPS服务,为图片文字内容理解与内容安全提供强有力的技术支撑。该模型已经全面支@撑阿里生态中的商品内容安全、业务安全、平台治理、评价┘、交互、认证等多个业务场景,同时,还通过阿里云盾-内容安全(绿网)⊕产品,输出给第三方客户使用。

目前,ATLк Cangj۞ie OCR服务日均调用量几亿次▌,可为客户提供稳定的技术保障。

上一篇: 桃之夭夭 灼灼其华
下一篇: 高性价比的家居清洁必备神器!斐纳无线手持吸尘器评测
月挣10万项目_月赚一万偏门项目_月赚一万这么难吗 2019-2022版权所有