计算机视觉
语义分割是指根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应的属性,以帮助训练图像识别模型,常应用于自动驾驶汽车、人机交互、虚拟现实等领域。
2D/3D边界框能够标注物体在平面或立体中的位置和大小,帮助自动驾驶模型增强视觉和雷达的感知。
关键点标注是指通过人工的方式,在规定位置标注上关键点,例如人脸骨骼点、场景目标物体等,常用来训练面部识别模型以及统计模型。
多边形标注是指在静态图片中,使用多边形框,标注出不规则的目标物体,相对于矩形框标注,多边形标注能够更精准地识别目标。
目标跟踪是指在动态的图像中,进行抽帧标注,在每一帧图片中将目标物体标注出来,进而描述它们的运动轨迹,这类标注常应用于训练自动驾驶模型以及视频识别模型。
属性判别是指通过人工或机器配合的方式,识别出图像中的目标物体,并将其标注上对应属性。
OCR转写是对图像中的文字内容进行标记与转写,帮助训练和完善图片与文本识别模型。目前,景联文支持简体中文、繁体中文、英语、日语、韩语、法语、德语、西班牙语、阿拉伯语等十余种语言图片的转写。
语音工程
ASR语音转录是根据语音内容,转写为与之相对应的文本,多用于语音识别模型的训练。目前,景联文支持普通话、粤语等地区方言、英语、日韩法德西班牙阿拉伯等小语种的语音转写。
声纹识别标注是将语音人声中的声纹特征提取出来,并标注上对应属性,以帮助训练语音识别模型。
情绪判断能够对语音内容中说话人的情绪倾向进行判断,区分他们的情感态度,帮助训练NLP模型。
视频审核是由人工观看视频,审核视频内容要求是否符合要求。目前,景联文拥有多个标注基地,能够实现海量视频审核,助力智能识别模型训练。
韵律标注是指从语音数据中确定韵律信息,再对标注文本进行韵律符号标注,常见于语音合成技术。
自然语义
文本分类是指按照客户的规则,对文本信息进行属性分类。
文本信息抽取是将完整语句分块,再将文本中包含的信息进行结构化处理,按客户规则抽取相对应的内容,方便进一步分析处理。
意图判断是指标注员针对文本内容呈现的情绪、意图、目的进行判断,帮助训练NLP模型,常应用于智能客服、智能助手。
序列标注主要包括分词、词性标注两个步骤,先给定文本内容一个序列,再对序列中序列中每一个元素打上对应的标签。