中邦预备机视觉的前程正在哪?呆板视觉工程师

  • A+
所属分类:机器视觉
计算机视觉在国内已经研究几十年了,但把计算机视觉成功带入应用的大公司几乎没有。相比欧美的计算机视觉,中国计算机视觉的前途在哪?机器视觉工程师又何去何从? 深度学习,
中邦预备机视觉的前程正在哪?呆板视觉工程师

中邦预备机视觉的前程正在哪?呆板视觉工程师

  计算机视觉在国内已经研究几十年了,但把计算机视觉成功带入应用的大公司几乎没有。相比欧美的计算机视觉,中国计算机视觉的前途在哪?机器视觉工程师又何去何从?

  深度学习,人脸识别,人工智能如果你要从国内第一个做计算机视觉的人开始算,那时间跨度有可能比较长,但是从整体产业的角度,真正沉淀的时间不长,也就10年左右吧。首先我想纠正一点,准确地说,计算机视觉在国外其实也没有大公司,你说的大公司,有可能计算机视觉是其中一部分业务,仅此而已。但计算机视觉本身,不足以撑起一家大公司。以NEC为例,他们是从1974年左右开始做人脸识别算法,综合起来看,目前依然是业内无可争议的老大。我们看看它的主营业务:IT解决方案、网络解决方案和电子设备

  我们再把目光投向美国,目前公认做计算机视觉最强的几家公司:谷歌,微软,Facebook以及亚马逊等,他们的主营业务,不用我多说大家也很清楚。

  大公司要么靠解决方案(做B端业务),要么做普罗大众都能用到的东西(C端业务)

  ,光靠某个领域的算法,是不太可能成长为大公司的。当然,也要看你这个大公司怎么定义了,如果几百人也算大公司,或许有。但特别大的公司,就没有了。

  越大的公司,一般来说,做的业务越低层,越能满足人类基本需要。比如:搜索(获取信息),购物,社交,通讯等,具体做这方面业务的大公司就不用我多说了吧。这些业务都是高频高覆盖率的业务,所以公司能做大。

  而计算机视觉,相对来说,要小众许多。更何况,视觉本身是有条件的那类应用,光照,角度,像素等方面,根据业务和场景不同,或多或少都有一定附加条件。这意味着什么呢?意味着你很难把它做成标准品,也就不太容易规模化。这就比较要命,

  如果针对很多用户都需要做定制化,或者现场调参,那么边际成本就太高了。软件公司靠的就是很低的边际成本,比如微软,卖出一份Windows和卖出几个billion的拷贝,成本几乎一致。有人可能会问,jacky你自己也做这个,而且做了那么多年,既然有诸多问题,为啥选择继续坚持?你到底几个意思?有这么几个意思:

  1.这个领域的技术和应用都很有意思。从07年开始,我就迷上计算机视觉,一发不可收拾。

  2.不容易规模化也有他的好处,你不容易,别人也不容易,所以没有哪家公司能一统江湖,也就意味着你我都有机会。

  4.计算机视觉领域可商用的开源资源很强大,我有很多好的想法,也有实现的可能。

  5.我有强大的技术整合能力和经验,牛皮真的不是吹的。计算机视觉领域有很多好的技术,算法,开源软件等,虽然现在不见得尽善尽美,但一直在往前推进。如何把技术整合成产品?限于篇幅,这里就不展开了。而且确实需要具体情况具体分析。通用法则未必真的很适用。关于如何将技术转化为产品,我会在知乎上开专栏,敬请关注。暂时先卖个关子。

  如果你对技术转化为产品的环节有所困惑,也欢迎私信我或加我微信deepseetech

  另外,我最想做的一件事,就是与志同道合的朋友成立一个计算机视觉技术咨询机构,一边对接科研人员,一边对接产业链,客户需求。

  国内的计算机视觉人员出路在哪里?跟其他很多行业比,计算机视觉,其实很适合创业。刚才我讲了,没有一统江湖的大厂,这跟这个领域的特点有关。而且垂直领域的数据比算法更重要,大厂也不可能什么都做。

  每个人情况也不一样,如果你擅长做基础研究和算法,而且只是想找份稳定的工作,建议找机会去微软这样的大厂做研究。

  如果你有技术但暂时没产品没资源,但将来想自己干,建议去国内计算机视觉公司先练练手,积累各方面经验和人脉。

  虽然只以计算机视觉,要做成BAT那样的巨头不太可行,但它很可能会是你成功的起点!!!

  值得一提的是,以上建议只是针对普遍情况,再说,每个人的潜质也不一样,具体情况要具体分析,所以我都说试试,希望不会误导大家。

  用户标识1德堡大学 交叉学科计算中心离散与组合优化实验室研究员前途便是,关注底层数学模型,其次算法,最后才是调参数,讲真如果关注最后一点,譬如Deep Learning,神经网络,那么变成本末倒置,只能称作工程而不是科研。下面链接乃计算机视觉领军人物之一加州大学洛杉矶分校UCLA统计学和计算机科学教授Song-Chun Zhu的访谈录,非常有指导意义。初探计算机视觉的三个源头、兼谈人工智能|正本清源

  链接:图像处理专业的哪些方向就业比较好(硕士),主要去哪些公司? - Ruobing Shen 的回答 - 知乎

  楼主本科硕士应用数学+运筹学,博士海德堡交叉学科计算中心和图像处理中心,组合优化+图像处理的thesis topic,算是半正式地进军这个领域。

  先说方向,最好当然是计算机视觉里面各个方向都有所了解,这样才能融会贯通。

  1,Google, MS, Facebook, Apple,华为,阿里,腾讯,百度等世界一流科技公司,无一没有建立自己的AI实验室,AI里面,计算机视觉或图像处理是非常重要的一块,当然它们研究方向就多了,几乎会涵盖所有方向。

  2,世界各大汽车公司,如特斯拉,宝马。汽车公司开始发力自动驾驶,而自动驾驶里面最核心的技术就是“教”汽车里的电脑如何通过摄像头实时产生的图片和视频自动驾驶。因此视觉和图像处理便是核心技术所在,如行人探测,道路识别,模式识别。

  3,Adobe,美图秀秀等照片、winrar、real player等视频处理、压缩软件。这个不多说,最最直观的应用,比如降噪,图像分割、图像压缩、视频压缩。

  4,AR(增强现实)最近由于Pockman GO的风靡全球又被推到第一线,而google class或者三星Gear眼镜等等,也无不和图像处理、计算机视觉的科研有关。预测这将是未来几年主推的东西。

  5,迪士尼等各大电影制片公司。3-D电影,以及各种炫酷的电影特效,当然里面不光有图像处理,还有计算机图形学的东西在里面。

  6,索尼,华为,蔡司等照相机、摄像头生产商。大家可知道相机或手机的照片拍出来,一般不是raw格式,jepg等格式已经是被内置的图像处理软件处理过后的照片了,另外相机里的人脸追踪,快速对焦等等,无一不和图像处理有关;再引申点,相机的灵魂CMOS & CCD

  7,地平线,大疆无人机等机器人公司。和自动驾驶一个道理,机器人要通过摄像头“判断”并躲开前方障碍物,核心技术都在视觉和图像处理。8,医疗器械设备公司。医学图像处理,核磁共振,断层扫描等等,众所周知医疗行业都是暴利阿。9,工业级摄像头;包括高速路上的摄像头,机场火车站安检摄像头,工业流水线上的摄像头,嵌入了人脸或次品识别的芯片,智能地识别罪犯、次品,等等。

  最后插一句,想必大家也都听说北美计算机TOP4出来的深度学习的Ph.D.,基本都是被Google,FB,Apple等以150w美元年薪疯抢的状态;国内名师出来的硕士,基本也是被年薪50w人民币收割。这是一个大数据、计算机视觉最好的时代,因为入行即代表高薪;但也是最坏的时代,正如我开头所说,学术界的风气在被这个公司的功利性所引导,导致现在教授不做深度学习就拿不到funding..本人估计深度学习热5年内会见顶,因为入坑的太多太多。

  最后的最后亮观点:计算机视觉绝对可以入,但是请从运筹优化和统计分析的角度入,深度学习俩年后慎入。

  车载图像识别/创业中中国计算机视觉的前途1.不要只做系统集成,很多欧美,日韩的产品是可以超越的。2.计算机视觉做的最好的很多都是以色列的小公司,很多他们的产品是值得国内企业去借鉴的。

  1.知道未来的trend,譬如3D肯定是十分重要的一个方向。然后结合你目前所处的行业无论是工业检测还是其他,做一个这方面的延伸。

  君子知命不惧,日日自新翻出这个三年前的老问题来答一下今年(2015)ImageNet图像识别大赛中四类项目上夺得冠军的队伍是MSRA、Amax、CuVideo三个队里的人全是中国科学家,其中第三个是中国的sensetime公司,他们的队伍(CuVideo/CuImage)除了拿到视频检测的两个第一,还取得了其他任务四个第二和四个第三的成绩。所以哈,计算视觉这种新兴领域,中国形势一片大好啊!

  不仅是计算视觉,我敢打赌,再有5-10年,中国会在多个领域出现技术领先全世界的高科技公司。

  计算机视觉技术可以为许多工厂的流水线做非接触式检测,但所用的技术和论文以及国外的公司比要低级很多,据我了解,一些很简单的应用,比如检测一下流水线上某种饮料是否已经灌满,国外大公司看不上眼,国内做的公司和人都不多,市场需求还是挺大的。我一同学正在这个方面创业。要说国内计算机视觉的前途,我觉得这些相比较而言技术含量不高,但需求比较大的地方才是目前国内的前(钱)途所在。因为这个市场才刚起步,高新技术大多都是高校在用,而工业上连最基础的技术都还没普及。

  另外,如@李智辉 所说那样,国内在智能交通方面的视觉应用确实已经比较多了,似乎有几个公司也做得比较大,比如大华。最近听说华为也想参一脚。所以问题中所说的“把计算机视觉成功带入应用的大公司几乎没有”是不太准确的。如果题主在学校,可以关注一下校园招聘,应该可以发现一些做视觉的公司,一般能来学校招的,大公司和有钱的创业公司居多。

  除了交通方面的视觉应用,在医学图像方面应该也是有市场的,不过同样的,国内也是刚起步,去年就有个做医学仪器的创业公司联影来我们学校招聘,不过从他们笔试时的考卷和面试时的问题来看,他们目前也没用到很多计算机视觉的技术,还是图像增强技术为主。

  kinectgoogle最近也申请了很多专利。目前这个阶段更多是技术积累和布局的阶段,等待革命性应用的推出。

  其实现在国内市场还未成熟,正是相当好的机会啊;我一直觉得创业要想获得大成功,最方便的就是在处女地上耕耘;如果市场已经很成熟了,别人都做得好,那么一般人要想成功就很难了。。。

  极视角联合创始人,欢迎各种有趣的AI项目合作作为中国计算机视觉的从业者/创业者和人工智能的Phd(Pig has dreams)科研工作者,只能说,攻城狮永远不要过分依赖技术的前景,技术的发展几乎都不是线性增长的,要么突然发展,要么渐渐没落被取代,真正决定前途和去从从来不是技术,而是人,更具体的说,应该是人判断问题、解决问题的能力。技术大多时候只是手段,只要能解决问题,手段可以是多元的。以上纯属个人观点,希望对所有计算机视觉的同行有所帮助。

  我司组织了一个计算机视觉的开发者交流微信群,目标是汇集【计算机视觉,图像处理,3D图像,视频处理,深度学习,机器学习】的开发者,一起分享开发经验,共同探讨技术,有兴趣入群的可以加我微信(微信号LaurenLuoYun, 二维码如下),请注明“姓名-公司/学校-技术方向-加群”(纯属交流的不需要写“加群”,以免误会),谢谢。另外,也在招募有计算机视觉算法的合作伙伴。

  1. 国内的计算机视觉研究处于起步和增长期。如果你看好一些的会议,会发现09年以前,CVPR, ICCV国内基本上发不了几篇,而从09年开始,特别是近两年开始猛爆发。所以可以认为,现在的研究才开始与国际接轨,能做到一些鲁棒,真实生活中的计算机视觉问题。所以我觉得能把视觉带向现实应用的“大”公司也只是处于酝酿和起步期。2. 已经有一些现实应用的项目和公司有:微信扫一扫,美图秀秀,百度图搜图,Face++等。

  3. 做过一个小观察,在IOS上面的视觉应用大多都是照片编辑和美化,少量简单的图像识别(百度魔图,图标识别)。

  4. 扯远一点,一个比较现实的问题是,视觉还没有像NLP和语音(对应的产业有 搜索,机器翻译,SIRI等)一样有独立的拳头产品和公司出现。而其实图像的表意更丰富,携带的信息更多,处理方式也更与人类认知相近。一个主要的原因在于,对不限制场景的视觉问题上,现在的准确度还远不能让人满意。这个阻挡了重量级产品的出现。

  LNMP程序员,iOS开发者,图像视频算法工程师,Rails爱好者,阿森纳死忠谢谢邀请,在小公司做智能交通领域的CV应用,这方面的需求还是很多的,比如做隧道事件检测,隧道里,光照非常复杂(车前大灯,隧道的反光标志的反光灯),如何构建一个稳定的背景建模方法来检测停车事件,还是有很多的工程问题需要考虑的,又如果摄像机是带云台的,又如何去检测云台的转动并在停转后自动学习新的背景,这样就不会影响监控员去操作云台进行巡查业务,也无需画线圈。我觉得中国的机器视觉工程师要用自己的背景知识去解决社会需求的现实问题,在过程中积累工程经验,这样比较好

  大的应用不知道,但是计算机视觉的创业公司这两年还是很火的,比如格灵深瞳,商汤科技,旷世科技之类的,都还蛮有前景的~机器视觉工程师按我知道的情况应该都还蛮好找工作的啊,薪资待遇什么的也都很高,嘀嘀打车最近准备成立一个算法研究院,学习Uber搞算法计价,开的待遇非常诱人,还有BAT这种巨擘对机器学习的人才都是求知若渴啊,前面提到的几家创业公司也是一个很好的去处,基本都融了大笔的A轮,团队成员技术都很强,还有原始股可以拿,就看你愿不愿意冒险搏一搏了。再说说中国计算机视觉的前途,去看看CV的顶级会议CVPR上面的文章,超过一半的文章都是中国人投的,全世界优秀的CV人才中国占了很多,当然绝对顶级的那一层依旧在美国,美国大学的实验室以及Google研究院之类的地方还是有很多大牛的。

  以下是个人浅见,之前的工业革命、电力革命、信息革命、互联网、移动互联网等中国都没有抓住机会,日本、美国之类的就是抓住了这几次新的技术革命的机会一跃成为了世界强国。现在很明显的,人工智能的时代正在慢慢接近,中国如果能抓住这次机会的话,很有可能会打一场漂亮的翻身仗,这一届的政府也很给力,把人工智能的发展也列到了战略发展的地位。所以个人还是很看好国内的计算机视觉发展前景的,毕竟我Dang想做的事情,还没有做不成的。用钱就能砸出大片的水花了~

  计算机视觉现在没有出大的公司,可能原因有两方面,一是技术上仍然不够成熟,二是从业人员的视野不够开阔。这两方面可能相辅相成。我现在能看到的计算机视觉未来的应用,可能有自动驾驶(无人车、无人机)。这个行业的市值非常大,因为涉及到制造业,所以做起来的公司将比滴滴打车和Uber还要大很多。无论现在自动驾驶使用了什么样的技术,将来一定是计算机视觉技术来统治。为什么?因为我们所在的世界,并非自在世界,而是人为世界。只有以人的视角来感知、理解这个世界才是真正认识这个世界、与这个世界交互的正确打开方式。说个简单的例子,如果车的前方出现一个障碍物,这时候司机应该如何处置?如果是一块砖头且车速较慢,可能不减速直接开过去了;如果一块带铁钉的木板,可能车会绕着过去。这两个物体对雷达、红外或者激光来说可能都是一样的,能分辨两者属性不同的,只有在可见光这个波段,以人的智慧来判断是可以直接碾过去,还是需要躲避。

  另外一个方向就是机器人。机器人将来一定是很大的一个产业,特别是如果机器人能听会说能看的时候。能看就要依靠计算机视觉。要有SLAM、有对象识别。在对象识别上必须要依靠图像语义分割、图像分类这些基本的计算机视觉技术。

  最后说一个我司正在研究的项目,线上虚拟试衣,也是计算机视觉的一个应用。我们利用计算机视觉技术对人体和服装进行建模,然后做在线试衣、穿搭。欢迎大家一起探讨。也欢迎各路英才加入我司。

  最近精灵宝可梦火得不行,其实这个点我们也是早就想过。也许将来有一天游戏的形态会有大的改变,玩家可以通过手机(也许是Hololens这样的设备)对周围的场景进行扫描,建模,完成对象识别,这样就可以将现实世界生成游戏地图,在这个地图上开战。我觉得这里的对象识别的任务是很重要的。要能识别面前的一个圆形的东西是一个水塘,丢个石子进去就会有涟漪;如果是一间屋子,能识别出来哪里是门哪里是窗,从而允许玩家破门而入。

  过去几十年,计算机视觉的应用似乎主要集中在车牌识别、智能交通等大众不太了解的行业。做视觉的公司普遍比较专,而非大。就像在Google大力推无人车之前,又有几人知道早在十几年前这项研究就已经开始了。但近几年已经有很大的变化,各大互联网公司也开始在视觉领域发力,比如百度的IDL,可以看看他们的[主页链接](Research Topic)。现在大数据的和Deep Learning的兴起,视觉与机器学习的交叉融合,学术界与工业界的相互合作,机器视觉不火也不行了。

  机器视觉、图像处理、1、大公司不可能单独靠计算机视觉一个子模块来单独盈利,只会作为一个部分参与系统项目中发挥其作用。大公司搞的无人驾驶系统,计算机视觉是主要的核心,但只是一块而已,需要的是整合系统的很多技术。中国现在很多创业公司都在搞计算机视觉,就是由于不成熟的市场、技术未落地导致的,毕竟是风口,如码隆科技、 Linkface、Face++、格灵深瞳、旷世科技等都是创业公司。前途是非常有的,别担心2、计算机视觉与机器视觉不一样,别混淆了。计算机视觉是赋予计算机眼睛,如人脸识别等。机器视觉是赋予机器眼睛,如瑕疵检测等。但是本质是通用的,但别混为一谈

  近日,忽悠哥看到一篇文章,题目是《我们花了40个小时为计算机视觉“部分价值”做了个年中盘点》。全文罗列了国内部分计算机视觉企业及简介,还打了个分。各位看官先看文章,忽悠哥再点评。

  毫无疑问去年的风口在直播,今年转向人工智能,除了巨头们不约而同的开发布会宣布自己 AI 方向的战略布局,越来越多投资人和创业者也争先恐后的 ALL IN 入场,其中最火,也最具商业价值的非计算机视觉这一领域莫属。知道 AI 的人多,了解计算机视觉的人少,这究竟是个怎样的行业,又有哪些“有意思”的公司?

  自深度学习概念引入以来,人工智能的发展速度有目共睹,信息科技的发展按照指数规模爆炸,将导致存储能力、计算能力、芯片规模、带宽规模暴涨,引领第二次自动化浪潮,AI 得以逐渐成长为了游戏高手、围棋大师、语音转录专家、司机、翻译家、图像艺术家、鉴黄师、武器……,她正在以不可估计的力量改变着我们的生活。

  人们也开始尝试利用人工智能技术帮助改善一些劳动密集型工作,以及高精度业务,因为它能持续地像人类一样正确描述照片上发生的事,不会感到疲倦,还能阅读并概括出文本大意,最重要的是它还在不断的学习进步。

  就像谷歌的联合创始人拉里·佩奇早在2002年说的,谷歌不是用人工智能强化它的搜索能力,而是利用搜索来改善它的人工智能。

  计算机视觉是一门研究如何使机器“看”的科学,它能够用摄影机和电脑代替人眼对目标完成识别、跟踪和测量等工作。

  像素级的处理让算法得以伸展,我们可以从算法的发展来看计算机视觉的变化。传统算法大致可以分为以下4个步骤:图像预处理、特征提取、特征筛选、推理预测与识别,毫无疑问,这需要大量的经验,需要你对这个领域和数据特别了解,然后设计出来特征还需要大量的调试工作。而引入深度学习后,效果得到大幅度提升,一大批如“DeepID”人脸识别、“Region CNN”物体检测、DeepTrack物体跟踪等开源算法的出现让技术的商用变成可能。

  相比图像,视频拥有更多可能,而如今像素的世界已经延伸到图像以外,人工智能技术能够使得从视频中提取信息变得跟从图像中提取信息一样简单。

  这次我们在视频内容识别技术领域作了一个统一整理,挑选了其中做得比较好的24家公司进行比较,它们分别来自广告营销、游戏、企业服务、医疗健康、金融、娱乐、电子商务等领域,均已超过A轮,并且专注于文娱类的公司数量遥遥领先,其中以服务于直播监测和广告营销为主要发力方向。

  商汤科技是一家典型的深度学习算法公司,目前是国内该领域,技术团队规模最大、商业化订单、收入及融资额最多的公司。由国内顶尖的计算机视觉专家汤晓鸥、徐立创立于2014年,其中技术团队占比高达90%,其中包括5位微软研究奖获得者(Microsoft Research Fellow),两位A-star(阿里星人才计划),聚集了华人世界中一批深度学习和计算机视觉领域专家。

  商汤科技早期专注于安防领域,现在扩展到互联网+,应用最广泛也是受众群体最大的一个应用是为FaceU提供的精准的人脸检测和跟踪技术,能够将Face U 的装饰和贴纸准确的贴在人脸五官上。

  之后会将携手 Star VC 打造命名为“未来科技研究中心”的科技产业孵化器。

  这个成立于2012年的公司目前已完成C轮融资,总估值高达20亿美金,是目前估值最高公司,商汤科技第一竞争对手。

  Face++专注于人脸识别技术和相关产品应用研究,面向开发者提供服务。拥有一套非常强大的人脸检测系统。在世界最权威的人脸检测(FDDB评测)、人脸关键点定位(300-W评测),和人脸识别(LFW评测:99.6%)获得三个世界第一,在安防领域的成绩也是有目共睹,为支付宝、Uber、中信银行、万科等知名企业提供 SmartID 服务。

  最值得关注的是,2016年7月正式加入旷视(Face++)的首席科学家孙剑,曾经作为微软亚洲研究院首席研究员,带领的团队于2015年获得图像识别国际。

  格灵深瞳是第一梯队中唯一有在做硬件的公司,公司战略方向会重点放在两个应用领域,第一个最大的是安全领域,第二个领域是商业数据分析。

  短短3年时间,格灵深瞳逐步搭建完自己的“格灵深瞳系”——格灵深瞳继续深耕安防和商业数据分析领域。为了进一步扩大影响范围,于2016年与前英特尔研究院院长吴甘沙、北京理工大学姜岩教授,三方共同成立专注无人驾驶驭势科技;近期还会涉足智能医疗领域。

  码隆科技与前三家公司不同,是与时尚业接触最为紧密的一家公司,在面料识别和大数据色彩研究上优势非常明显,目前处于A轮状态,发展非常迅速。

  从码隆科技核心团队成员经历和A轮投资方不难看出与微软及英伟达的渊源颇深,今年5月刚刚发布了国际版加上与英伟达的合作,非常有节奏的扩大自己的海外版图。

  衣+ 主攻方向是在图像与视频中对场景、通用物体、商品、人脸的检测、识别、搜索及推荐,帮助内容和平台实现场景营销、智能分析和内容互动。

  从2014年创立以来,发展快速,产品线拉得也比较长,除了最开始的APP保留了下来,目前主打的产品有场景化营销、智能搭配等,除此之外还增加了相册分类和内容审核,几乎涵盖计算机视觉方方面面。

  近两年又凭借优酷在网生内容等领域的先行优势,快速完善了技术+电商+视频平台+内容的生态模式,形成完整的商业闭环。但这也成为他们一个羁绊,目前合作平台除了优酷土豆几乎没有与其它平台的合作。

  Video++专注于消费级视频领域的AI科技公司,近年来也是发布了许多成熟的点播视频方案以及一整套互动视频直播方案,也和乐视、芒果、搜狐、斗鱼直播、熊猫直播等各大视频网站进行了合作,将视频识别技术运用到各类电视节目中,让用户在不反感的前提下进行广告植入,据官方发布的数据,使用此类技术的月独立UV量达到2.8亿。

  在技术方面,Video++在跟踪和识别方面拥有自主创新算法,能够准确的识别出明星、物体、品牌、手机、场景等等,使机器像人类一样理解视频的内容,并发现其中有趣的点。用核心组件和视频应用将这些点进行商业化的变现,将机器识别出的结构化数据作为投放点,应用到广告和电商的场景中。

  最值得关注的是,Video++将视频行业与AI技术结合,打破以往的传统商业视频模式,通过为流量平台提供视频AI、视频电商、视频互动广告等系统应用,以视觉识别和大数据为基础,来实现视频场景匹配和广告自动投放。

  云从科技“国家队”的身份为其带来的优势非常明显,据了解,从 2015 年 4 月成立至今,云从的客户已经有上百家,客户群体主要集中在金融、公安和商业。光是金融行业就是 50 多家银行与非银机构,目前人脸识别产品已经成为银行业第一大供应商,并且由于在广州省公安厅与河北省厅的出色表现,正在用人脸识别技术引领公安战法变革。

  2017年,云从科技会大力拓展安防领域市场,以金融行业的业务为基础向其他行业拓展,为金融和安防领域的公司提供软硬一体化解决方案也是云从的两块核心业务。

  依图科技创立于 2012 年,最开始从图像识别入手,与全国省市级公安系统合作,对车辆品牌、型号等进行精准识别,随后扩展到人像识别,通过静态人像比对技术和动态人像比对技术,协助公安系统进行人员身份核查、追逃、监控、关系挖掘等。

  发展 4 年以来,依图科技的产品已经应用到全国二十多个省市地区的安防领域,安防领域之外,进入智慧城市领域和健康医疗领域,协助政府构建”城市大脑”,甚至未来家居、驾驶、图片搜索、购物等都是依图商业版图的一部分。

  小白世纪作为一家成立于2014年的人工智能公司,在业内可能太过低调,并没有太多声音。

  他们目前对自己的定位是一家致力于视频内容搜索的CBI(基于内容的互动)科技型创新公司。从产品发展脉络可以看出,从视频互动技术出发,经过两年的积累迈入人工智能行列,着力于智能搜索、广告、内容审核等视频内容识别相关技术研究,组建团队并拥有自己的深度学习网络模型,这些对小白世纪能够获得Pre-A轮融资至关重要。

  不过,从目前可以查到的信息可以看出,小白世纪在人工智能方向的核心人才并不突出,核心成员无技术背景,没有首席科学家坐镇,也未成获得高质量的技术奖项和榜单,对其技术水平存疑。

  智视VCA(视连通)是一家还处在天使轮阶段以计算机视觉和深度学习为基础的科技公司,虽然目前还只有“知·视”一款产品,技术却涉及计算机视觉的方方面面,场景识别、生物识别、泛物品识别、大数据、深度学习、VR/AR等计算机视觉、智能人机交互、人工智能等领域。

  尽管年轻,视连通有着清晰的商业模式,目标客户是面向视频产业的内容生产方、广告主、各类播放平台以及更广泛的电商、社交和信息类服务提供商。对收费标准也很理性,两种收费模式并行,一种是按照视频分析时长或内容量级进行计费,另一种则是按照一定场景化广告展示或交互的比例收取分成。

  不过在技术人才方面有所缺失,核心成员均非人工智能相关领域研究人员,也未与其他院校及研究机构合作,也没有自有数据库,但值得注意的是,他们已经申请了两项专利(由于时间原因尚未披露),具有一定的技术保护意识。

  计算机视觉技术的市场需求日益增多,投资风口也在继续扩张,为更多初创型技术公司带来希望。

  不过现实也是很残酷的,大量的计算机视觉技术创业公司都集中在智能安防、医疗等垂直领域,原因很简单,大量有价值的数据都掌握在BAT手中,初创公司无法仅凭一己之力建立一整套完善的数据样本库,这对实现商业化非常不利。另外计算机视觉的技术门槛高,研发周期长,容易造成资金链问题,这些都是创业者需要看见的,不能一味的 ALL IN 入场。