人工智能技术的兴起,特别是深度学习的发展,已经成为当今世界的热门话题. 这一技术的核心理念是通过反复学习和模仿来接近人类智能水平. 然而,在现实世界中,数据往往是非标准化且非结构化的. 为了让计算机能够进行学习和模仿,需要将这些数据进行标准化和结构化处理,这一过程被称为数据标注。数据标注是建立人工智能模型的必要步骤,没有它就无法进行深度学习. 可以说,如果人工智能是发动机,那么标准化数据就是其燃料.
根据艾瑞咨询的调研数据显示,2019年中国人工智能基础数据服务行业的市场规模达到了30.9亿元. 根据需求方投入和供应方营收的增长情况,预计到2025年,市场规模将超过100亿元,年均增长率为22%. 作为提供自营和第三方数据采集与标注解决方案的公司,倍赛BasicFinder在这一行业中崭露头角。
倍赛BasicFinder的创始人兼CEO杜霖毕业于上海交通大学ACM试点班。他选择从事数据标注行业的创业方向,源于他一次经历. 在深度学习技术兴起后,他与几个同学想应用这项技术开发一个能够识别冰箱内食品的系统,以提醒用户处理过期食材或及时补货. 为了实现这个系统,杜霖发动了周围的朋友,共采集了五万多张冰箱内食材的照片. 然而,智能燃料管理系统他发现在整个开发过程中,采集和标注数据的时间花了四个半月,而建模的时间只有一个半月. 这使他意识到数据采集可能是当前人工智能领域发展的主要痛点。
一些业内人士认为,尽管人工智能商业化在算力、算法和技术方面已经基本达到了阶段性的成熟,但要想将其落地并解决行业的具体痛点,仍需要大量经过标注处理的数据作为算法训练的支撑. 从某种程度上说,数据量决定了人工智能技术的应用程度.
因此,2016年,杜霖创立了以数据采集和标注为核心业务的倍赛公司. 该公司提供两种业务模式:一是根据客户需求提供从数据采集、标注到模型训练和评估的全流程服务;另一种是推出了私有化数据标注平台BasicFinder Hive和在线数据标注平台BasicFinder SaaS,使客户能够将数据标注流程和标注工具集成到人工智能模型的研发链条中.
截至目前,倍赛的技术团队约有70人,全职数据标注团队约有2000人。2019年下半年,倍赛获得了五岳资本和Talkingdata的四千万人民币的投资。
倍赛的发展正是顺应了人工智能技术的浪潮. 随着深度学习等技术的不断进步,人工智能数据标注行业将迎来更大的发展机遇. 倍赛BasicFinder将继续努力提供优质的数据标注解决方案,推动人工智能技术的应用与发展. 。