人工智能技术兴起,特别是深度学习发展,已经成为当今世界热门话题. 这一技术核心理念是通过反复学习和模仿来接近人类智能水平. 然而,在现实世界中,数据往往是非标准化且非结构化. 为了让计算机能够进行学习和模仿,需要将这些数据进行标准化和结构化处理,这一过程被称为数据标注。数据标注是建立人工智能模型必要步骤,没有它就无法进行深度学习. 可以说,如果人工智能是发动机,那么标准化数据就是其燃料.
根据艾瑞咨询调研数据显示,2019年人工智能基数据服务行业市场规模达到了30.9亿元. 根据需求方投入和供应方营收增长情况,预计到2025年,智能燃料管理系统市场规模将超过100亿元,年均增长率为22%. 作为提供自营和第三方数据采集与标注解决方案公司,智能燃料管理系统倍赛BasicFinder在这一行业中崭露头角。
倍赛BasicFinder创始人兼CEO杜霖毕业于上海交通大学ACM试点班。他选择从事数据标注行业创业方向,源于他一次经历. 在深度学习技术兴起后,他与几个同学想应用这项技术一个能够识别冰箱内食品系统,以提醒用户处理过期食材或及时补货. 为了实现这个系统,杜霖发动了周围朋友,共采集了五万多张冰箱内食材照片. 然而,他发现在整个过程中,采集和标注数据时间花了四个半月,而建模时间只有一个半月. 这使他意识到数据采集可能是当前人工智能领域发展主要痛点。
一些业内人士认为,尽管人工智能商业化在算力、算法和技术方面已经基达到了阶段成熟,但要想将其落地并解决行业具体痛点,仍需要大量经过标注处理数据作为算法训练支撑. 从某种程度上说,数据量决定了人工智能技术应用程度.
因此,2016年,杜霖创立了以数据采集和标注为核心业务倍赛公司. 该公司提供两种业务模式:一是根据客户需求提供从数据采集、标注到模型训练和评估全流程服务;另一种是推出了私有化数据标注平台BasicFinder Hive和在线数据标注平台BasicFinder SaaS,使客户能够将数据标注流程和标注工具集成到人工智能模型研发链条中.
截至目前,倍赛技术团队约有70人,数据标注团队约有2000人。2019年下半年,倍赛获得了五岳资和Talkingdata四千万币投资。
倍赛发展正是顺应了人工智能技术浪潮. 随着深度学习等技术不断进步,人工智能数据标注行业将迎来更大发展机遇. 倍赛BasicFinder将继续努力提供优质数据标注解决方案,推动人工智能技术应用与发展. 。