首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

当达摩院大牛学会抠图,这一切都不受控制了……

2020-01-02

在外界人眼中, 达摩院 人才辈出,大多是奇人异士,做着奥秘且高端的研讨,有如扫地僧一般的存在,可是如果有一天,当奥秘专家不再奥秘,你发现他们也开端玩抠图,且这一切都朝着不受操控的方向开展了的时分,那么抠图他们能玩出哪些把戏?

你看看,万物接可抠!

换成视频试试?能够!

视频链接: https://ucc-vod.alicdn.com/sv...

这要从 阿里巴巴智能规划实验室 自主研制的一款规划产品 鹿班 说起。 鹿班 的初衷是改动传统的规划方式,使其在短时刻内完结很多banner图、海报图和会场图的规划,进步作业效率。商家上传的宝物图良莠不齐,直接投进作用欠安,通过鹿班制图能够确保会场风格一致、高质视觉作用传达,然后提高产品吸引力和买家视觉体会,到达提高产品转化率的意图。

而在制图的过程中,咱们发现产品抠图是一项不可避免且繁琐的作业,一张人像精密抠图均匀需求消耗规划师2h以上的时刻,这样无需构思的纯膂力作业亟需被 AI 所替代,咱们的抠图算法应运而生。

近几年图画 抠图算法 逐渐进入人们的视界,如、百度等。而潜藏在其背面的职业:泛文娱,电商职业、笔直职业,比如在线餐饮、媒体、教育等职业商业价值不容小觑,能够满意各种战报、在线课程教师抠图、视频封面制造等不同方式的图片制造需求拓宽。市面上的一些抠图算法作用在人像发丝细节处理均不是很好,且对一些通用场景支撑也不是很好。咱们针对这两个问题一方面规划更具有泛化才能的体系、一方面深化发丝和高度镂空相关算法,均有更好的作用。

咱们最开端在上手 鹿班 “批量抠图”需求时,发现用户上传的图画质量、来历、内容形形色色,想用一个模型完成事务作用到达一了百了很难。在通过对场景和数据的很多剖析后,定制全体结构如下:

首要涵盖了 过滤、分类、检测、切割 四个模块:

怎么让作用更精准?

现在分类、检测模型相对比较老练,而评价模型则需求根据不同场景做一些定制,切割精度缺乏,是一切模块中最单薄的一个环节,因而成为了咱们的主战场。详述如下:

1、对特征金字塔每一层featuremap都交融上下相邻层特征,这样输出的特征潜在表征才能更强;

2、特征金字塔不同层特征别离猜测,候选anchors可添加对标准改变的鲁棒性,提高小标准区域召回;

3、对候选anchor的设定添加一些可预见的scale,在产品尺度份额比较极点的情况下大幅提高普适性;

与传统的只需求别离远景、布景的图画切割问题不同,高精度抠图算法需求求出某一像素详细的透明度是多少,将一个离散的0-1分类问题变成[0, 1]之间的回归问题。在咱们的作业中,针对图画中某一个像素p,咱们运用这样一个式子来进行透明度猜测:

得以商业使用的根底是咱们在使用层单点才能,如人像/人头/人脸/头发抠图、产品抠图、动物抠图,后续还会逐渐支撑卡通场景抠图、服饰抠图、全景抠图等。据此咱们也做了一些产品化作业,如 鹿班的批量白底图功用 、E使用证件照/战报/人物换布景等。

试用地址: https://ivpd.console.aliyun.com/api-image

接入阐明: https://help.aliyun.com/document_detail/139269.html

本文作者:机器智能技能

阅览原文

本文为阿里云内容,未经答应不得转载。

热门文章

随机推荐

推荐文章