当前位置:首页 > 长寿风采 > 正文内容

纤离简介

关爱多2年前 (2022-07-27)长寿风采236

纤离品牌创建于2022年7月,纤离出自《史记·李斯列传》:“服太阿之剑,乘纤离之马”,为古之骏马的名称,也是深圳市行域信息技术有限公司在AI数据服务领域的品牌名称。

纤离聚焦自动驾驶商业化应用及数据标注的科创公司,“纤离”数据工场专注于AI数据服务,核心产品包括数据定包服务、数据众包服务,涵盖智能语音、无人车驾驶标注、文本数据标注清洗、3D点云等服务类型,现已为多家AI旗舰企业提供了数据加工处理服务,并成功应用于无人驾驶、智能语音、人脸识别等各类场景。

纤离数据业务主要围绕人工智能大数据,为人工智能研究提供数据采集、处理业务。数据应用方向主要有无人驾驶汽车、智能语音、智慧医疗、智慧城市、智能教育。

主要类别:

1、3D点云

通过卫星传输雷达3D场景图片,分类标注图片内车辆、行人、建筑物,应用于无人车识别电子系统真实街道信息数据转换,实现无人驾驶汽车自主上路识别。

2、语音类

1)、语音内容提取

机器无法精确识别出语音文件中的内容,故需要靠人工听取、记录、提交、交叉对比的方式,精确转写出语音文件中的有用信息,提供机器学习,助力语音识别。

2)、语音采集

使用常规手法对语音素材相对较难获取,尤其是针对特殊语种或内容的采样,平台通过真人朗读、采集符合要求的语音信息上传,在短时间采集完成大量特定信息。

3)、语音筛选

拥有海量语音资料是无法满足日益精准的机器学习,大量无用、错误、嘈杂信息只会让算法结果事与愿违。平台可准确对语音文件进行有效性筛选(如内容是否清晰、是否为正确的语音),或提供语音的属性筛选(如男声、女声、孩童、老人)。

4)、语义分析

语音标注是将不同地区,年龄和语言采集后进进行归类整理和分析,目的就是要提高语音识别系统的识别精度。例如手机中的讯飞语音识别系统,不仅能识别各种主流方言,而且准确度越来越高。

3、图片类

1)、图片归类

快速筛选海量图片使之符合特定的归类、去掉多余干扰图片,为机器学习提供精准的训练集,取其精华、弃其糟粕。

2)、图片内容标注

对图片里包含的元素进行精准标注,根据项目规则标注出图片中的所有元素或部分元素,提供精准数据做算法训练及优化,比如一张街道图片中的交通指示灯、行人、斑马线、各类车辆、指示牌等。

3)、图片标签标注

对图片打标签,使海量图片可针对性管理,如:针对商品服装宣传图片,可个图打上裙子、裤子等的标签,针对行人进行属性标签,打上头发、眼镜和帽子等标签。

4)、图像采集

根据机器训练需要,采集大量符合要求的图片,如各银行卡片照片、各车牌号图片、不同角度人脸照片、不同年龄段全身照片、二维码采集、福字采集、交通罚单采集、彩票采集、病历本采集等。

4、文本类

1)、文本归类

在互联网+大数据时代,拥有海量文本数据轻而易举,但从中归纳出有效信息才是机器学习所需要获取的,需把海量的评价内容归类为正面或反面,让信息变有效,平台提供大量文本归类服务,让文本符合要求。

2)、文本提取

从网页、书籍、文章里提取出特定文本,如概括每篇新闻主要内容、每个网页的关键词,根据项目规则进行加工处理,提供有效数据。

3)、文本校正

人工校正机器处理过存在较大误差的语音,比如机器翻译、转写后的错误校正,字幕错误校正等。

5、审核类

1)、内容审核

通过人工形式对即定内容进行涉黄、涉政、涉恐等涉及国家法律法规审核,把不符合规定的内容进行删除及修正处理,确保内容健康安全;

2)、质量审核

建立质检验收团队,针对已标注处理内容进行最终验收审核,保障提供至算法研究的数据质量达标,符合算法需求,达到其提高及优化作用。

扫描二维码推送至手机访问。

版权声明:本文由关爱多@行域发布,如需转载请注明出处。

本文链接:http://www.zgs.cc/post/7.html

分享给朋友:
返回列表

没有更早的文章了...

没有最新的文章了...