这家成立于2015年,来自上海的创业公司刚刚获得2.7亿元B+轮融资,这已是其成立四年来的第四轮融资。在达观数据的背后,不乏真格基金、深创投、软银赛富等头部投资机构的身影。
据陈运文介绍,达观数据是一家专注于文本智能处理技术的国家高新技术企业。其利用NLP(自然语言处理)、OCR(光学字符识别)、知识图谱等技术,为大型企业和政府机构提供
机器人流程自动化、文档智能审阅、垂直搜索、智能推荐、客户意见洞察等智能产品,旨在让计算机协助人工完成业务流程自动化,大幅度提高企业效率。
达观数据创始人兼CEO 陈运文
在陈运文看来,所谓智能,就是从数据中提炼出信息,再从信息里进一步提炼出知识,最终利用知识去模仿人类工作的过程,“人工智能很难一蹴而就,还是要扎扎实实从数据出发,不断提炼加工,耐心训练神经网络系统,才能一点一点的突破现有的技术瓶颈。”
文本处理行业“老兵”,
判断未来企业一半员工将是机器人
翻看陈运文的履历可以发现,他从在复旦大学攻读计算机博士开始,就一直扎根于文本数据处理行业,包括在百度、盛大文学、腾讯文学等巨头公司任职时都从事着与文本数据挖掘相关的工作。
“在盛大文学工作时,一开始文字录入和图书推荐都是手工完成,后来随着数据量暴增,每天处理数据超过1亿字,开始使用数据机器清洗、审核、分类各类文本自动化功能,通过文本挖掘技术提升人工效率。陈运文说道。
可以说,这是一位文本数据行业的“老兵”。
2015年选择创业的陈运文,依然把目光瞄向了文本智能处理赛道。“当时看到大量传统企业面临数字化转型升级,但恰恰这些行业缺乏智能化改造的能力,因此觉得可以在这个行业有所作为。”
陈运文表示,虽然彼时的互联网公司已经开始运用大量的文本处理技术,但传统行业还是相对落后。
“新商业时代下,数据类型和数据量都在激增,传统行业企业的计算能力、数据自动化处理能力此时就显得捉襟见肘。依然需要不少职员长期去做重复性的文字资料处理工作,比如填表、核对、找错别字、上传下载等,效率十分低下。”
另一方面,尽管传统行业企业一般都有内部独立的信息化系统,例如办公 OA、ERP、财务管理系统、CRM、销售管理系统等,但因为多种原因,这些系统之间的数据无法打通,导致形成信息孤岛效应。
而对于潜在的市场空间,陈运文也有着自己的判断,他认为未来10年里,如果有50%的基层工作将由机器人完成,文本智能化处理领域将有5000亿元人民币的市场规模,这也坚定了他加入赛道的信心。
“我知道这件事情很难,但是我觉得特别有意思,我们面临着很多的技术挑战,有很多的工作要做,有困难才有动力。”陈运文笑着说道。
而对于达观数据,陈运文给出的定位是“文本智能处理专家”,根本目的是帮助传统行业企业提升智能化能力,实现降本增效。
“在这其中主要有三个关键词,一是文本,代表达观数据是围绕文本处理展开的;二是智能,可以让计算机、RPA机器人能够自动化的进行文档资料的上传下载、阅读审核、信息填写等智能化操作;三是处理,我们希望能够更多地把文本智能系统嵌入到客户的日常办公流程当中去,帮助他们处理工作。”
自研底层开发框架,
“以机代人”提高数倍工作效率
据了解,从2015年开始,达观数据就一直专注于自然语言处理(NLP)、光学字符识别(OCR)、知识图谱等AI技术,提供文档审阅、智能推荐、资料搜索、知识图谱等多款文本自动化解决方案。并在2019年正式推出“达观智能RPA”,融合自研语义理解模块,打造了首款国产自研“NLP+OCR+RPA” 三位一体的智能化机器人。
据陈运文介绍,围绕文本处理场景下的“数据+AI能力”,达观数据目前构建了较为完整的文本数据采集、标注、训练体系。在数据知识层构建知识仓库和知识图谱;在数据应用层训练机器学习模型并结合业务场景来开发出一系列
智能机器人产品。
“我们揭开的不过是企业文本大数据的冰山一角。”陈运文认为企业的需求是一片蓝海,达观处理的文档数据中蕴含着诸多规律,而这些规律同样需要依靠计算机识别,形成“系统知识”运用到企业的服务中去。“我们希望能够努力满足各行各业的企业的需求,帮助他们解决数据挖掘问题。”
据悉,达观数据已经围绕银行、证券、保险、财税、政务、能源、物流、地产等行业构建了解决方案,合伙客户数百家,包括中国银联、深交所、人民网、万科等头部企业。
陈运文表示,以RPA机器人代替人工操作,可以实现节省成本、提高效率和准确率等诸多优势,这些都是经过实际测算得出的结论。首先,机器人系统的采购成本大概是普通白领工资待遇的1/4,但工作效率是普通白领的3-4倍。
“我们有一家电力企业客户,该公司财务部在对账过程中涉及多家银行,上千笔的对账业务量,数据量很大。在使用达观RPA机器人代替传统手工操作后,财务对账效率提升了600%。”
其次,机器人的犯错率与人工相比会低出很多。“人在连续长时间工作后,错误率容易上升。但机器人可以在非常稳定的状态下进行7×24小时工作,机器人系统内部的交叉核验,也可以保证准确率维持在较高水准。”
陈运文介绍,与同业相比,达观RPA产品的核心优势是市场上唯一不采用微软底层开发框架,完全独立自主研发的机器人。
“比起借用国外现成框架,虽然研发的过程代价更高更困难,但是回头来看是非常值得的,因为掌握了从底层向上的所有核心技术,软件的跨平台适应能力更强,能在国内外各种操作系统上运行。”
RPA成为最吸金赛道,
疫情加速企业数字化进程
据IDC预计,到2023年,全球RPA软件市场规模将达到39亿美元,2018-2023年复合增长率达36%。中国RPA市场也将高速发展,2023年市场规模将达到10.2亿美元,2018-2023年复合增长率为64%。
而此次新冠病毒肺炎疫情更是加速了无人办公、数字化建设进程,让RPA变得愈加炙手可热。根据Forrester针对企业的调研显示,2019年末,RPA技术在所有企业自动化系统部署中排名最低;而到2020年,RPA技术的排名则上升到了第一位。
广阔的市场空间也吸引了众多玩家入局,一时间,RPA成为创投圈最吸金的赛道。
日前,互联网巨头微软刚刚宣布收购一家美国RPA初创公司,另据投资界(ID:pedaily2012)不完全统计,国内RPA市场在今年以来,包括达观数据在内已有5笔融资事件发生,融资总额近8亿元。诸如红杉资本中国、光速中国、深创投等头部投资机构均有所布局。
作为达观数据B+轮融资的领投方,深创投董事长倪泽望表示:“智能化文本处理和RPA等前沿创新技术,是深创投特别看好的应用方向,达观数据是其中极为优秀的企业,我们非常欣赏团队扎实的作风和过硬的技术,并全力支持达观进一步向前发展。”
软银赛富管理合伙人阎焱也表示:“无论是从产品先进性,还是应用落地能力上,达观都处在行业领先地位。我们看好文本自动化的发展,也相信在陈博士的带领下达观将在这个领域做出了不起的成就。”
谈及今年年初爆发的新冠病毒肺炎疫情,陈运文表示,虽然对众多企业的正常经营都造成了一定影响,但这次危机同样也是RPA赛道的加速器。
“此次疫情让众多企业对数字化和自动化的需求再次升温,意识到了RPA机器人的重要性,相当于间接的教育了市场。往常,客户认为使用达观的产品是‘锦上添花’,但现在他们会觉得这是‘雪中送炭’。”陈运文说道。
对于接下来的发展规划,陈运文表示达观数据的目标一直都很明确,即成为国内文本智能处理行业第一,因此会在产品研发、交付质量、技术深度等方面持续投入,打造出更高品质的产品与丰富的场景来服务客户。
“文本智能处理是一条困难但正确的道路,正所谓‘板凳要坐十年冷,文章不写半句空’,低调务实是我们团队一直坚持的做事风格,达观也将沉下心来认认真真把产品做好,沿着这条赛道坚持下去。”陈运文最后说道。