233
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
百度智能云全功能AI开发平台BML-代码模板升级及迁移说明

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/200G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>


点击这里点击这里申请百度智能云VIP帐号,立即体验BML>>>

百度智能云全功能AI开发平台BML-代码模板升级及迁移说明

一、代码模板升级整体说明

平台于2020年4月16日,对自然语言处理模型训练的代码模板进行了升级,建议您在5月1日前完成对旧版任务的迁移。本次升级,平台的自然语言处理任务将为您提供封装性和灵活性俱佳的开发体验,并支持了飞桨深度学习框架Paddle-Fluid 1.6.1的版本。

针对平台升级新版本模型代码框架,请您关注如下几个时间点:

  1. 平台于4月16日,更新上线新版代码框架,暂时保留对旧版任务的克隆功能
  2. 平台于5月1日,将不再提供旧版本代码模板的克隆。当您对旧版代码模板克隆任务时,平台仅提供新版代码框架,请您做好代码的迁移工作。

说明:您在5月1日前,基于旧版本代码模板发布的任务,可长期在线上进行云端调用或本地使用。

后续平台也将基于升级后框架,继续新增任务类型,您可以加入BML用户交流群,针对您在模型开发过程中的需要,提出您所需的功能需求。

二、如何操作迁移到新版任务下

将老版本任务迁移到新版本的任务,以分类任务为例可分为三步:

第一步:查看老版本的任务中,代码编辑部分,存在哪些字段的修改

在任务列表中,找到对应的任务详情:

image.png

在代码配置详情中,找到脚本内容部分,查看修改的代码内容:

image.png

第二步:在平台「自然语言处理」任务列表下,新建项目并新建任务,此任务将会是基于最新的代码模板创建

image.png

第三部:在下图中代码编辑部分,将第一步中对应修改过的代码部分,在新任务中进行逐一调整(关于新版代码模板的说明,详见下文)

image.png

三、新老版本的代码编辑模板区别说明

您可以通过了解旧版本的代码模板和新版本的代码模板的代码结构,来了解两版代码的编写逻辑,从而方便您将旧版本的代码迁移到新版本的代码模板中。我们将以文本分类任务中,使用ERNIE和BOW网络的设计进行讲解说明。

下面我们先看一下旧版本的代码编辑模板的内容:

3.1 旧版代码模板说明

1. 模型训练的配置信息

关于模型训练过程中,关于学习率、batch size等配置,代码如下:

def __init__(self):
        Config.__init__(self)
        self.batch_size = 8  # batch_size大小,尽量设置成2的整数倍
        self.learning_rate = 2e-5  # 学习率设置
        self.save_steps = 500  # 模型保存的间隔,即训练多少个batch之后保存一次模型,请设置成100的倍数
        self.epoch = 3  # 训练多少轮
        self.skip_steps = 10  # 间隔多少个batch时打印训练日志

组网部分,包括了ERNIE表示、BOW模型表示和分类任务几个部分,代码介绍如下:

2. 网络设计中ERNIE表示的代码部分

 emb = fluid.layers.sequence_unpad(ernie_output["sequence_output"], length=ernie_input["seq_lens"])

3. 网络设计中BOW的模型表示代码部分

  # bow layer
    bow = fluid.layers.sequence_pool(input=emb, pool_type='sum')
    bow_tanh = fluid.layers.tanh(bow)
    # full connect layer
    fc_1 = fluid.layers.fc(input=bow_tanh, size=hid_dim, act="tanh")
    fc_2 = fluid.layers.fc(input=fc_1, size=hid_dim2, act="tanh")

4. 网络设计中分类器的代码部分

 logits = fluid.layers.fc(input=fc_2, size=cfg.num_labels)

5. 网络设计中预测部分的内容

 if is_inference:
        probs = fluid.layers.softmax(logits)
        feed_targets_name = [
            ernie_input["src_ids"].name, ernie_input["sent_ids"].name,
            ernie_input["pos_ids"].name, ernie_input["input_mask"].name,
            ernie_input["seq_lens"].name, ernie_input["task_ids"].name        ]
        return feed_targets_name, probs

6. 网络设计中评估部分的代码

ce_loss, probs = fluid.layers.softmax_with_cross_entropy(
        logits=logits, label=label, return_softmax=True)
    loss = fluid.layers.mean(x=ce_loss)
    graph_vars = {
        "loss": loss,
        "classify_infer": probs,
        "label": label    }

3.2 新版代码模板说明

下文中,我们将介绍新升级的代码模板结构,您可以对比新旧版本对应的结构来进行代码的迁移:

1. 新版本代码结构:模型训练的配置信息

TrainerConfig = {
    "batch_size": 8, 
    "learning_rate": 2e-05, 
    "epoch": 3, 
    "train_log_step": 10, 
    "save_model_step": 500}

2. 新版本代码结构:数据读入的部分

 fields_dict = self.fields_process(fields_dict, phase)
        instance_text_a = fields_dict["text_a"]
        record_id_text_a = instance_text_a[InstanceName.RECORD_ID]
        text_a_src = record_id_text_a[InstanceName.SRC_IDS]
        text_a_pos = record_id_text_a[InstanceName.POS_IDS]
        text_a_sent = record_id_text_a[InstanceName.SENTENCE_IDS]
        text_a_mask = record_id_text_a[InstanceName.MASK_IDS]
        text_a_task = record_id_text_a[InstanceName.TASK_IDS]
        text_a_lens = record_id_text_a[InstanceName.SEQ_LENS]
        instance_label = fields_dict["label"]
        record_id_label = instance_label[InstanceName.RECORD_ID]
        label = record_id_label[InstanceName.SRC_IDS]

3. 新版本代码结构:读取ERNIE表示

        
        emb_dict = self.make_embedding(fields_dict, phase)
        emb = emb_dict["text_a"]
        text_a_emb = fluid.layers.sequence_unpad(emb, length=text_a_lens)

4. 新版本代码:模型超参数的设置

        hid_dim = 128
        hid_dim2 = 96
        num_labels = 2

5. 新版本代码:BOW模型表示部分

   # bow layer
        bow = fluid.layers.sequence_pool(input=text_a_emb, pool_type='sum')
        bow_tanh = fluid.layers.tanh(bow)

6. 新版本代码:分类器部分的代码

        fc_1 = fluid.layers.fc(input=bow_tanh, size=hid_dim, act="tanh")
        fc_2 = fluid.layers.fc(input=fc_1, size=hid_dim2, act="tanh")
        logits = fluid.layers.fc(input=fc_2, size=num_labels)

7. 新版本代码:预测部分的内容

if phase == InstanceName.SAVE_INFERENCE:
            """保存模型时需要的入参:表示预测时最终输出的结果"""
            probs = fluid.layers.softmax(logits)
            target_predict_list = [probs]
            target_feed_name_list = [text_a_src.name, text_a_pos.name, text_a_sent.name,
                                     text_a_mask.name, text_a_lens.name]
            emb_params = self.model_params.get("embedding")
            ernie_config = ErnieConfig(emb_params.get("config_path"))
            if ernie_config.get('use_task_id', False):
                target_feed_name_list.append(text_a_task.name)

            forward_return_dict = {
                InstanceName.TARGET_FEED_NAMES: target_feed_name_list,
                InstanceName.TARGET_PREDICTS: target_predict_list            }
            return forward_return_dict

8. 新版本代码:loss部分的设置

   cost, probs = fluid.layers.softmax_with_cross_entropy(
            logits=logits, label=label, return_softmax=True)
        avg_cost = fluid.layers.mean(x=cost)
        """PREDICT_RESULT,LABEL,LOSS 是关键字,必须要赋值并返回"""


这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!