Commit ab39bcbfa1d2d34e771cf4530269be87470efce4 - 64b5f592f83507e5f1ab5b7e - (('Mo Repos',), {'htdigest_file': None, 'use_smarthttp': 0, 'require_browser_auth': 0, 'disable_push': 0, 'unauthenticated_push': 0, 'ctags

pics 456764059 2 years ago

1 changed file(s) with 9 addition(s) and 9 deletion(s). Raw diff Collapse all Expand all

-9

_OVERVIEW.md less more

196	196
197	197	标签数量分布统计和可视化结果如下图：
198	198
199		![诗词标签-数据可视化.png](./pics/诗词标签-数据可视化.png)
	199	![诗词标签-数据可视化.png](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/诗词标签-数据可视化.png)
200	200
201	201	对无用标签进行清洗。去掉其中例如“唐诗三百首”、“高中必备古诗”这些无用的tag，只保留“送别”、“思乡”这类tag。
202	202

286	286
287	287	选择在HuggingFace上发布的`IDEA-CCNL/Wenzhong-GPT2-110M`模型，包含110M参数，使用BPE分词，在300G的悟道语料上进行预训练。该模型在封神榜系列模型中属于自然语言生成任务的通用模型。
288	288
289		![模型分类](./pics/fenshenbang-模型分类.png)
	289	![模型分类](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/fenshenbang-模型分类.png)
290	290
291	291	为了提升训练效率，使用peft库进行高效的微调，具体使用LoRA方法，最终仅训练1.02%的参数。
292	292

442	442
443	443	困惑度与测试集上的句子概率相关，其基本思想是：给测试集的句子赋予较高概率值的语言模型较好,当语言模型训练完之后，测试集中的句子都是正常的句子，那么训练好的模型就是在测试集上的概率越高越好，公式如下：
444	444
445		![PPL](./pics/PPL公式.png)
	445	![PPL](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/PPL公式.png)
446	446
447	447	其中S表示句子，w表示词语。
448	448

509	509
510	510	为了使微调更有效， LoRA通过低秩分解，用两个较小的权重更新来表示权重更新矩阵。这些新矩阵可以被训练以适应新数据，同时保持较低的更改总数。原始权重矩阵保持冻结状态，不会接收任何进一步的调整。
511	511
512		![lora](./pics/lora.png)
	512	![lora](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/lora.png)
513	513
514	514	```python
515	515	MODEL_PATH = r"IDEA-CCNL/Wenzhong-GPT2-110M"

563	563
564	564	训练过程截图如下：
565	565
566		![训练过程](./pics/训练过程.jpg)
	566	![训练过程](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/训练过程.jpg)
567	567
568	568	训练过程中的loss：
569	569
570		![loss](./pics/loss.png)
	570	![loss](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/loss.png)
571	571
572	572	## 第二阶段模型构建与训练
573	573

719	719
720	720	将输入提示和模型返回结果的过程设计成gradio的交互界面，已经部署在gradio上，链接为[huggingface.co/spaces/Wendyy/poem-generate](https://huggingface.co/spaces/Wendyy/poem-generate)：
721	721
722		![提示古诗生成](./pics/提示古诗生成.png)
723
724		![藏头诗生成](./pics/藏头诗生成.png)
	722	![提示古诗生成](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/提示古诗生成.png)
	723
	724	![藏头诗生成](https://mo.zju.edu.cn/repo/OZ2fxZukDanIbwK8WP7Ht_iyYx-iFiohusxaM3QPIs2m/raw/master/pics/藏头诗生成.png)
725	725
726	726	```python
727	727	css = """