阅读(288) 书签 (0)

文心千帆在线标注使用说明

2023-07-19 15:24 更新

平台提供在线标注功能。您选定数据集版本后,系统会根据数据集类型、选择的标注分类及模板,展示对应的标注操作页面。

登录到文心千帆大模型操作台,在左侧功能列选择在线标注,进入在线标注主任务界面。

当前仅有文本对话类数据类型需要标注,query问题集暂不支持。您可以在数据集列表选择指定未发布的数据集版本进行标注,也可在标注界面指定未发布的数据集版本进行标注。

什么是自动生成回答

当前平台支持回答自动生成,需要调用平台自有的LLM模型。

LLM模型(Large Language Model),也称为大型语言模型,是一种基于机器学习和自然语言处理技术的模型,通过大规模的无监督训练来学习自然语言的模式和语言结构,可以生成自然语言文本或理解语言文本的含义。

使用自动生成将会产生费用,可查看计费说明。为保证任务顺利进行,请保证您的账户开通付费,可点击开通付费

标注非排序文本对话类数据

在线标注中,当光标移动至回答框,会有“自动生成”按钮,回答支持调用平台的LLM模型为问题生成对应回答,可在左上角切换模型。

image.png

  • 您可以选择自动生成回答或手动生成回答,回答生成后“保存标注”即可。
  • 标注好的文本数据,将会在“有标注信息”页签下展示。
  • 此页面支持您添加问答对、删除问答对和问答的操作,还可在左上角进行数据集切换,切换前请保存当前标注,未保存标注切换后不生效。

标注含排序文本对话类数据

在线标注中,排序类文本对类数据,支持您一个问题对应多个回答标签。

当用户同一个对话框中多次问到相同(相近)的问题时,后台应答会按照既定顺序给出答案。

简单示例

用户:哪本书属于四大名著之一?答:您指的应该是《红楼梦》。用户:哪本书属于四大名著之一?答:您指得应该是《西游记》。

当光标移动至回答框,会有“自动生成”按钮,回答支持调用平台的LLM模型为问题生成对应回答,可在左上角切换模型。

image.png

  • 您可以选择自动生成回答或手动生成回答,回答生成后“保存标注”即可。
  • 每个问答对,至少要有两个排序问答,每个排序回答中最多生成4个并列回答。
  • 标注好的文本数据,将会在“有标注信息”页签下展示。
  • 此页面支持您添加问答对、删除问答对和问答的操作,还可在左上角进行数据集切换,切换前请保存当前标注,未保存标注切换后不生效。
  • 一个问答对最多生成5个排序,对于多余的排序,可将光标移动到“排序n”字样处,进行删除。