中国高校SAS数据分析大赛2018宣讲会-华南赛区巡讲

迪奥NLP丨企业智能文本审查应用

发表时间:2021-01-22 20:00

迪奥科技致力于人工智能与大数据算法研发与应用领域的深度挖掘,聚焦“数字企业”应用场景,核心技术包含机器学习、计算机视觉算法、自然语言识别,为企业客户提供企业数字化与智能化改造应用解决方案,主要客户来自能源、证券金融、化工、政务、教育等行业。


迪奥产品拥有 4 项发明专利、1 项实用新型专利与 40 项著作权,涵盖计算机视觉算法、自然语言算法、知识图谱、机器学习、模型标注训练。




企业智能文本审查应用



迪奥NLP智能文档审查可应用于金融、制造、通信、法律、审计、媒体、政府等多种文档处理密集型行业,提供文档图像的文字识别、文档快速检索、文档差异比对、印章真伪识别等。


通识文字识别

支持识别各类文档扫描件、文档图像、照片中的文字信息。具体通用全文识别能力(文字定位、行分析、文字识别)能力,返回文字在图片中的位置信息。并支持文档图像自动倾斜矫正。


链接:http://ocr.text.eyedmp.com


应用场景

PDF、图像、函证识别金融行业是文档密集型的行业,不管是券商、银行、保险、基金、私募,这些企业都有大量的文书处理,文档格式繁杂,而且往往都是非结构化的文档,比如 pdf、扫描件,还有图片格式 jpg 这样的文件等,但因为监管条件严格,文档处理容错率低,通过通识文字识别应用,可以对PDF、图像、函证进行识别。


文档电子化储存使用通用文字识别技术,实现对各类文档图像的结构化存储处理,可满足医疗、金融、政务、法务、教育等行业文档快速录入、存档和检索的需求,有效降低企业人力成本,提高信息录入效率


文档内容检索与快速定位支持对海量PDF、图像文件进行准确检索并快速定位位置。


文本、表格、图像抽取实现对文档扫描件、文档图像、照片中的文本、表格、图像内容进行识别和拆分。


文本纠错检测


图片


对短文本进行纠错处理,标识文本出错部分给予高亮,并展示错误信息,可用于短文本辅助差错等,有效提高语言正确性,同时减少人工校验成本。


链接:http://check.text.eyedmp.com


应用场景


文档错误稽查

支持对文档错误进行自动稽查,包括语法错误、形似字错误、简繁体错误、谐音字错误以及字词动补全等,有效辅助文本编辑、校对工作,避免常见错误。


文档编写辅助

新闻媒体、商业文档撰写可在文档上内嵌纠错模块,可在编写文档时自动检查并提示错别字情况。从而降低因疏忽导致的错误表述,有效提升编写文档的严谨性,同时给用户更好的阅读体验。


违禁词检测

判断一段文本内容是否符合网络发文规范,识别文本中是否包含违禁类型里面的关键字/词,能够实现自动化、智能化的文本审核,大幅节省内容审核的人力成本。


文档比对图片


支持对不同短文本之间的相似度进行计算,输出的相似度,可用于文本分类,辅助预分类搜索、推荐相似信息、问答分类等。


支持对两份或多份文档差异进行比对,找出各文档差异之处,可用于合同审核校正等。


链接:http://similar.text.eyedmp.com


应用场景


文档要素提取

可以实现对多种类型文档的关键信息进行自动化抽取。对于抽取的每个类型的文档,可以设定多种不同的字段类型。通过定义不同文档的类型和字段的类型来更好的实现对项目文档关键信息的抽取。


以合同文档为例,可以设定包括甲方、乙方、金额大写、金额小写、起始时间、结束时间、签约地点、银行账号等重要信息。通过自然语言处理技术处理之后,可以自动的将相应的信息归档。在未来遇到类似项目的时候,可以方便的快捷的找到该项目的相关信息,利用旧有项目为新的项目提供更好的指导。


智能摘要生成

分析语句的相似度来完成文本摘要,直接利用语句中每个词的语法和语义来分析,对文本进行聚类,剔除重复主题,生成摘要精华。


文档差异比对

对文本之间内部差异的对比,通过自然语言处理技术,不仅可以显示出内容不同的部分,同时还支持对比包括新增、删除、不同这三大类的差异。同时通过自然语言处理技术,可以实现基于语义的文档比对,同时使用自然语言处理技术结合OCR技术,能够实现多种文件格式间的比对,更好的帮助项目文档管理。


印章比对图片

检测合同文件或常用票据中的印章的合规合法性,提高验证效率,降低合同签订过程的业务风险。


链接:http://seal.text.eyedmp.com


应用场景


合同、票据合法性检测

企业经营业务中,面临着大量的合同票据,其中可能有合同造假、票据篡改等业务风险。使用印章检测技术,可检测合同文件与常用票据中有无印章,用于快速确认合同及票据的合法性,并可定位印章位置进行印章图案抠取,有效提高验证效率,降低财税及商务合同签订过程的业务风险。


商务合作
BD@ibbd.net
简历投递
fuwu@ibbd.net
关于迪奥
产品中心
联系我们
行业应用
公司简介
新闻动态
人才招聘
自然语言理解
场景文字识别
文档OCR识别
金融行业
政府&公共事业
零售行业
020-29179586
工作日:9:30-18:30
广州市天河区华观路田头岗二路一横街起点国际三层
能源行业
文本数据挖掘