{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:16:24.294684400Z",
     "start_time": "2023-07-09T03:16:24.202246900Z"
    },
    "collapsed": true
   },
   "outputs": [],
   "source": [
    "import json\n",
    "import re\n",
    "from tqdm import tqdm"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:18:02.028569800Z",
     "start_time": "2023-07-09T03:17:58.974851900Z"
    },
    "collapsed": false
   },
   "outputs": [],
   "source": [
    "all_data = []\n",
    "for i in range(1, 5):\n",
    "    for line in open(f\"data/poems{i}.json\", encoding='utf-8').readlines():\n",
    "        all_data.append(json.loads(line))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:19:20.712431100Z",
     "start_time": "2023-07-09T03:19:20.693393700Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "(220061,\n",
       " {'_id': {'$oid': '5c22086497880d3b825c968f'},\n",
       "  'content': ['\\n渡远荆门外，来从楚国游。',\n",
       "   '山随平野尽，江入大荒流。',\n",
       "   '月下飞天镜，云生结海楼。',\n",
       "   '仍怜故乡水，万里送行舟。\\n'],\n",
       "  'translate': ['乘船远行，路过荆门一带，来到楚国故地。',\n",
       "   '青山渐渐消失，平野一望无边。长江滔滔奔涌，流入广袤荒原。',\n",
       "   '月映江面，犹如明天飞镜；云彩升起，变幻无穷，结成了海市蜃楼。',\n",
       "   '故乡之水恋恋不舍，不远万里送我行舟。'],\n",
       "  'translate_res': ['张国举．唐诗精华注译评．长春：长春出版社，2010：128-129',\n",
       "   '裴斐．李白诗歌赏析集．成都：巴蜀书社，1988年2月：13-18',\n",
       "   '于海娣 等．唐诗鉴赏大全集．北京：中国华侨出版社，2010：116'],\n",
       "  'tags': ['唐诗三百首', '初中古诗', '长江', '送别', '思乡'],\n",
       "  'notes': ['渡远荆(jīng)门外，来从楚国游。荆门：山名，位于今湖北省宜都县西北长江南岸，与北岸虎牙三对峙，地势险要，自古即有楚蜀咽喉之称。远：远自。楚国：楚地，指湖北一带，春秋时期属楚国。',\n",
       "   '山随平野尽，江入大荒流。平野：平坦广阔的原野。江：长江。大荒：广阔无际的田野。',\n",
       "   '月下飞天镜，云生结海楼。月下飞天镜：明月映入江水，如同飞下的天镜。下：移下。海楼：海市蜃楼，这里形容江上云霞的美丽景象。',\n",
       "   '仍怜故乡水，万里送行舟。 仍：依然。怜：怜爱。一本作“连”。故乡水：指从四川流来的长江水。因诗人从小生活在四川，把四川称作故乡。万里：喻行程之远。'],\n",
       "  'reference': [],\n",
       "  'appreciation': ['\\u3000\\u3000这首诗是李白出蜀时所作。李白这次出蜀，由水路乘船远行，经巴渝，出三峡，直向荆门山之外驶去，目的是到湖北、湖南一带楚国故地游览。“渡远荆门外，来从楚国游”，指的就是这一壮游。这时候的青年诗人，兴致勃勃，坐在船上沿途纵情观赏巫山两岸高耸云霄的峻岭，一路看来，眼前景色逐渐变化，船过荆门一带，已是平原旷野，视域顿然开阔，别是一番景色：',\n",
       "   '\\u3000\\u3000“山随平野尽，江入大荒流。”',\n",
       "   '\\u3000\\u3000“山随平野尽”，形象地描绘了船出三峡、渡过荆门山后长江两岸的特有景色：山逐渐消失了，眼前是一望无际的低平的原野。著一“随”字，化静为动，将群山与平野的位置逐渐变换、推移，真切地表现出来。这句好比用电影镜头摄下的一组活动画面，给人以流动感与空间感，将静止的山岭摹状出活动的趋向来。',\n",
       "   '\\u3000\\u3000“江入大荒流”，写出江水奔腾直泻的气势，从荆门往远处望去，仿佛流入荒漠辽远的原野，显得天空寥廓，境界高远。后句著一“入”字，写出了气势的博大，充分表达了诗人的万丈豪情，充满了喜悦和昂扬的激情，力透纸背，用语贴切。景中蕴藏着诗人喜悦开朗的心情和青春的蓬勃朝气。',\n",
       "   '\\u3000\\u3000颔联这两句不仅由于写进“平野”、“大荒”这些辽阔原野的意象，而气势开阔；而且还由于动态的描写而十分生动。大江固然是流动的，而山脉却本来是凝固的，“随、尽”的动态感觉，完全是得自舟行的实际体验。在陡峭奇险，山峦叠嶂的三峡地带穿行多日后，突见壮阔之景，豁然开朗的心情可想而知。它用高度凝炼的语言。极其概括地写出了诗人整个行程的地理变化。',\n",
       "   '\\u3000\\u3000写完山势与流水，诗人又以移步换景手法，从不同角度描绘长江的近景与远景：',\n",
       "   '\\u3000\\u3000“月下飞天镜，云生结海楼。”',\n",
       "   '\\u3000\\u3000长江流过荆门以下，河道迂曲，流速减缓。晚上，江面平静时，俯视月亮在水中的倒影，好象天上飞来一面明镜似的；日间，仰望天空，云彩兴起，变幻无穷，结成了海市蜃楼般的奇景。这正是从荆门一带广阔平原的高空中和平静的江面上所观赏到的奇妙美景。如在崇山峻岭的三峡中，自非亭午夜分，不见曦月，夏水襄陵，江面水流湍急汹涌，那就很难有机会看到“月下飞天镜”的水中影像；在隐天蔽日的三峡空间，也无从望见“云生结海楼”的奇景。这一联以水中月明如圆镜反衬江水的平静，以天上云彩构成海市蜃楼衬托江岸的辽阔，天空的高远，艺术效果十分强烈。颔颈两联，把生活在蜀中的人，初次出峡，见到广大平原时的新鲜感受极其真切地写了出来。',\n",
       "   '\\u3000\\u3000颈联两句反衬江水平静，展现江岸辽阔，天空高远，充满了浪漫主义色彩。',\n",
       "   '\\u3000\\u3000李白在欣赏荆门一带风光的时候，面对那流经故乡的滔滔江水，不禁起了思乡之情：',\n",
       "   '\\u3000\\u3000“仍怜故乡水，万里送行舟。”',\n",
       "   '\\u3000\\u3000诗人顺着长江远渡荆门，江水流过的蜀地也就是曾经养育过他的故乡，初次离别，他怎能不无限留恋，依依难舍呢？但诗人不说自己思念故乡，而说故乡之水恋恋不舍地一路送我远行，怀着深情厚意，万里送行舟，从对面写来，越发显出自己思乡深情。诗以浓重的怀念惜别之情结尾，言有尽而情无穷。诗题中的“送别”应是告别故乡而不是送别朋友，诗中并无送别朋友的离情别绪。清沈德潜认为“诗中无送别意，题中二字可删”（《唐诗别裁》），这并不是没有道理的。',\n",
       "   '\\u3000\\u3000这首诗首尾行结，浑然一体，意境高远，风格雄健。“山随平野尽，江入大荒流”，写得逼真如画，有如一幅长江出峡渡荆门长轴山水图，成为脍炙人口的佳句。如果说优秀的山水画“咫尺应须论万里”，那么，这首形象壮美瑰玮的五律也可以说能以小见大，以一当十，容量丰富，包涵长江中游数万里山势与水流的景色，具有高度集中的艺术概括力。'],\n",
       "  'appreciation_res': ['何国治 等．唐诗鉴赏辞典．上海：上海辞书出版社，1983：302-303'],\n",
       "  'onlyId': '50b4388a212b8f42992a63458edbf3f7',\n",
       "  'name': '渡荆门送别',\n",
       "  'dynasty': '唐代',\n",
       "  'author': '李白',\n",
       "  'sourceLink': 'https://so.gushiwen.org/shiwenv_d50eb19399e6.aspx',\n",
       "  'type': '唐诗三百首',\n",
       "  'format': '五言律诗',\n",
       "  'updateAt': '2018-12-13T08:36:12.589Z'})"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(all_data), all_data[100]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:21:13.307818800Z",
     "start_time": "2023-07-09T03:21:13.226795400Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "(8637,\n",
       " {'_id': {'$oid': '5c22086397880d3b825c95db'},\n",
       "  'content': ['\\n<p>床前明月光，疑是地上霜。', '举头望明月，低头思故乡。</p>\\n'],\n",
       "  'translate': ['明亮的月光洒在床前的窗户纸上，好像地上泛起了一层霜。',\n",
       "   '我禁不住抬起头来，看那天窗外空中的一轮明月，不由得低头沉思，想起远方的家乡。'],\n",
       "  'translate_res': ['孙宏亮.李白《静夜思》考证. 延安大学学报(哲学社会科学版), 1998,02'],\n",
       "  'tags': ['唐诗三百首',\n",
       "   '小学古诗',\n",
       "   '月亮',\n",
       "   '思乡',\n",
       "   '早教古诗100首',\n",
       "   '小学生必背古诗70首',\n",
       "   '小学生必背古诗80首'],\n",
       "  'notes': ['床前明月光，疑(yí)是地上霜(shuāng)。疑：好像。床：今传五种说法。一指井台。二指井栏。三“床”即“窗”的通假字。四取本义，即坐卧的器具。五马未都等认为，床应解释为胡床。胡床，亦称“交床”、“交椅”、“绳床”。古时一种可以折叠的轻便坐具，马扎功能类似小板凳。',\n",
       "   '举头望明月，低头思故乡。举头：抬头。'],\n",
       "  'reference': [],\n",
       "  'appreciation': ['床前明月光，疑是地上霜。举头望明月，低头思故乡。',\n",
       "   '\\u3000\\u3000这首诗写的是在寂静的月夜思念家乡的感受。',\n",
       "   '\\u3000\\u3000诗的前两句，是写诗人在作客他乡的特定环境中一刹那间所产生的错觉。一个独处他乡的人，白天奔波忙碌，倒还能冲淡离愁，然而一到夜深人静的时候，心头就难免泛起阵阵思念故乡的波澜。何况是在月明之夜，更何况是月色如霜的秋夜。“疑是地上霜”中的“疑”字，生动地表达了诗人睡梦初醒，迷离恍惚中将照射在床前的清冷月光误作铺在地面的浓霜。而“霜”字用得更妙，既形容了月光的皎洁，又表达了季节的寒冷，还烘托出诗人飘泊他乡的孤寂凄凉之情。 ',\n",
       "   '\\u3000\\u3000诗的后两句，则是通过动作神态的刻画，深化思乡之情。“望”字照应了前句的“疑”字，表明诗人已从迷朦转为清醒，他翘首凝望着月亮，不禁想起，此刻他的故乡也正处在这轮明月的照耀下。于是自然引出了“低头思故乡”的结句。“低头”这一动作描画出诗人完全处于沉思之中。而“思”字又给读者留下丰富的想象：那家乡的父老兄弟、亲朋好友，那家乡的一山一水、一草一木，那逝去的年华与往事……无不在思念之中。一个“思”字所包涵的内容实在太丰富了。 ',\n",
       "   '\\u3000\\u3000明人胡应麟说：“太白诸绝句，信口而成，所谓无意于工而无不工者。”（《诗薮·内编》卷六）王世懋认为：“（绝句）盛唐惟青莲（李白）、龙标（王昌龄）二家诣极。李更自然，故居王上。”（《艺圃撷馀》）怎样才算“自然”，才是“无意于工而无不工”呢？这首《静夜思》就是个样榜。所以胡氏特地把它提出来，说是“妙绝古今”。',\n",
       "   '\\u3000\\u3000这首小诗，既没有奇特新颖的想象，更没有精工华美的辞藻；它只是用叙述的语气，写远客思乡之情，然而它却意味深长，耐人寻味，千百年来，如此广泛地吸引着读者。',\n",
       "   '\\u3000\\u3000一个作客他乡的人，大概都会有这样的感觉吧：白天倒还罢了，到了夜深人静的时候，思乡的情绪，就难免一阵阵地在心头泛起波澜；何况是月明之夜，更何况是明月如霜的秋夜！',\n",
       "   '\\u3000\\u3000月白霜清，是清秋夜景；以霜色形容月光，也是古典诗歌中所经常看到的。例如梁简文帝萧纲《玄圃纳凉》诗中就有“夜月似秋霜”之句；而稍早于李白的唐代诗人张若虚在《春江花月夜》里，用“空里流霜不觉飞”来写空明澄澈的月光，给人以立体感，尤见构思之妙。可是这些都是作为一种修辞的手段而在诗中出现的。这诗的“疑是地上霜”，是叙述，而非摹形拟象的状物之辞，是诗人在特定环境中一刹那间所产生的错觉。为什么会有这样的错觉呢？不难想象，这两句所描写的是客中深夜不能成眠、短梦初回的情景。这时庭院是寂寥的，透过窗户的皎洁月光射到床前，带来了冷森森的秋宵寒意。诗人朦胧地乍一望去，在迷离恍惚的心情中，真好象是地上铺了一层白皑皑的浓霜；可是再定神一看，四周围的环境告诉他，这不是霜痕而是月色。月色不免吸引着他抬头一看，一轮娟娟素魄正挂在窗前，秋夜的太空是如此的明净！这时，他完全清醒了。',\n",
       "   '\\u3000\\u3000秋月是分外光明的，然而它又是清冷的。对孤身远客来说，最容易触动旅思秋怀，使人感到客况萧条，年华易逝。凝望着月亮，也最容易使人产生遐想，想到故乡的一切，想到家里的亲人。想着，想着，头渐渐地低了下去，完全浸入于沉思之中。',\n",
       "   '\\u3000\\u3000从“疑”到“举头”，从“举头”到“低头”，形象地揭示了诗人内心活动，鲜明地勾勒出一幅生动形象的月夜思乡图。',\n",
       "   '\\u3000\\u3000短短四句诗，写得清新朴素，明白如话。它的内容是单纯的，但同时却又是丰富的。它是容易理解的，却又是体味不尽的。诗人所没有说的比他已经说出来的要多得多。它的构思是细致而深曲的，但却又是脱口吟成、浑然无迹的。从这里，读者不难领会到李白绝句的“自然”、“无意于工而无不工”的妙境。 '],\n",
       "  'appreciation_res': ['马茂元 等 ．唐诗鉴赏辞典 ．上海 ：上海辞书出版社 ，1983 ：249-250 ．',\n",
       "   '裴斐 ．李白诗歌赏析集 ．成都 ：巴蜀书社 ，1988 ：333-334 ．'],\n",
       "  'onlyId': '04bd64e728edf77275f90d8b6af1bfb9',\n",
       "  'name': '静夜思',\n",
       "  'dynasty': '唐代',\n",
       "  'author': '李白',\n",
       "  'sourceLink': 'https://so.gushiwen.org/shiwenv_c35a60c1a8e2.aspx',\n",
       "  'type': '唐诗三百首',\n",
       "  'format': '五言绝句',\n",
       "  'updateAt': '2018-12-13T08:34:52.078Z'})"
      ]
     },
     "execution_count": 11,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "tag_data = [i for i in all_data if len(i['tags']) > 0]\n",
    "len(tag_data), tag_data[10]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:28:58.448085300Z",
     "start_time": "2023-07-09T03:28:58.431858800Z"
    },
    "collapsed": false
   },
   "outputs": [],
   "source": [
    "from collections import Counter\n",
    "import re"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:25:17.243981400Z",
     "start_time": "2023-07-09T03:25:17.212628200Z"
    },
    "collapsed": false
   },
   "outputs": [],
   "source": [
    "cnt = Counter()\n",
    "for i in tag_data:\n",
    "    cnt.update(i['tags'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T03:25:18.938924400Z",
     "start_time": "2023-07-09T03:25:18.889510100Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Counter({'写景': 1790,\n",
       "         '抒情': 1569,\n",
       "         '抒怀': 657,\n",
       "         '写人': 649,\n",
       "         '唐诗三百首': 641,\n",
       "         '咏物': 560,\n",
       "         '婉约': 515,\n",
       "         '思念': 445,\n",
       "         '生活': 444,\n",
       "         '送别': 402,\n",
       "         '春天': 382,\n",
       "         '女子': 374,\n",
       "         '思乡': 346,\n",
       "         '怀人': 327,\n",
       "         '秋天': 327,\n",
       "         '离别': 325,\n",
       "         '爱情': 320,\n",
       "         '感慨': 317,\n",
       "         '诗经': 305,\n",
       "         '赞美': 304,\n",
       "         '相思': 293,\n",
       "         '宋词三百首': 291,\n",
       "         '古诗三百首': 281,\n",
       "         '爱国': 238,\n",
       "         '乐府': 236,\n",
       "         '古文观止': 223,\n",
       "         '宋词精选': 223,\n",
       "         '哲理': 210,\n",
       "         '友人': 208,\n",
       "         '怀古': 205,\n",
       "         '友情': 197,\n",
       "         '边塞': 194,\n",
       "         '讽刺': 184,\n",
       "         '孤独': 180,\n",
       "         '叙事': 180,\n",
       "         '写花': 179,\n",
       "         '伤怀': 171,\n",
       "         '感伤': 167,\n",
       "         '山水': 164,\n",
       "         '战争': 163,\n",
       "         '人生': 163,\n",
       "         '故事': 160,\n",
       "         '闺怨': 153,\n",
       "         '咏史怀古': 150,\n",
       "         '忧国忧民': 144,\n",
       "         '组诗': 142,\n",
       "         '怀才不遇': 139,\n",
       "         '梅花': 133,\n",
       "         '早教古诗100首': 132,\n",
       "         '豪放': 125,\n",
       "         '最美': 124,\n",
       "         '感叹': 123,\n",
       "         '初中古诗': 122,\n",
       "         '写雨': 114,\n",
       "         '田园': 111,\n",
       "         '小学生必背古诗80首': 109,\n",
       "         '羁旅': 108,\n",
       "         '饮酒': 107,\n",
       "         '妇女': 105,\n",
       "         '月亮': 100,\n",
       "         '愤懑': 99,\n",
       "         '怀念': 95,\n",
       "         '写鸟': 92,\n",
       "         '议论': 91,\n",
       "         '小学生必背古诗70首': 89,\n",
       "         '写雪': 89,\n",
       "         '孤寂': 89,\n",
       "         '追忆': 88,\n",
       "         '初中文言文': 88,\n",
       "         '赞颂': 87,\n",
       "         '同情': 87,\n",
       "         '写山': 81,\n",
       "         '冬天': 81,\n",
       "         '愁绪': 81,\n",
       "         '愁苦': 80,\n",
       "         '登高': 79,\n",
       "         '励志': 78,\n",
       "         '伤春': 78,\n",
       "         '隐居': 77,\n",
       "         '写水': 75,\n",
       "         '夏天': 75,\n",
       "         '重阳节': 73,\n",
       "         '优美': 73,\n",
       "         '柳树': 73,\n",
       "         '惆怅': 73,\n",
       "         '喜悦': 70,\n",
       "         '向往': 68,\n",
       "         '惜别': 67,\n",
       "         '小学古诗': 66,\n",
       "         '历史': 66,\n",
       "         '寓人': 64,\n",
       "         '地名': 63,\n",
       "         '闲适': 63,\n",
       "         '寓理': 63,\n",
       "         '咏史': 62,\n",
       "         '壮志未酬': 62,\n",
       "         '悼亡': 61,\n",
       "         '豪迈': 61,\n",
       "         '回忆': 61,\n",
       "         '惜春': 58,\n",
       "         '宴会': 56,\n",
       "         '中秋节': 54,\n",
       "         '壮志': 53,\n",
       "         '七夕节': 52,\n",
       "         '典故': 52,\n",
       "         '西湖': 52,\n",
       "         '寒食节': 51,\n",
       "         '小学文言文': 51,\n",
       "         '荷花': 50,\n",
       "         '言志': 50,\n",
       "         '辞赋精选': 49,\n",
       "         '赠别': 48,\n",
       "         '品格': 48,\n",
       "         '节日': 48,\n",
       "         '壮志难酬': 47,\n",
       "         '思归': 46,\n",
       "         '音乐': 45,\n",
       "         '写风': 45,\n",
       "         '自然': 45,\n",
       "         '寓言': 44,\n",
       "         '春节': 43,\n",
       "         '夜晚': 43,\n",
       "         '宴饮': 42,\n",
       "         '月夜': 42,\n",
       "         '政治': 42,\n",
       "         '高中文言文': 42,\n",
       "         '元宵节': 41,\n",
       "         '农民': 41,\n",
       "         '社会': 40,\n",
       "         '志向': 40,\n",
       "         '纪游': 39,\n",
       "         '抱负': 38,\n",
       "         '菊花': 38,\n",
       "         '宫怨': 37,\n",
       "         '无奈': 37,\n",
       "         '神话': 36,\n",
       "         '悲伤': 36,\n",
       "         '归隐': 35,\n",
       "         '友谊': 35,\n",
       "         '述志': 34,\n",
       "         '清明节': 34,\n",
       "         '失意': 33,\n",
       "         '写马': 32,\n",
       "         '高中古诗': 31,\n",
       "         '国家': 31,\n",
       "         '端午节': 30,\n",
       "         '岁月': 29,\n",
       "         '景点': 29,\n",
       "         '现实': 29,\n",
       "         '祭祀': 29,\n",
       "         '心情': 29,\n",
       "         '民谣': 29,\n",
       "         '评论': 29,\n",
       "         '惜时': 28,\n",
       "         '春游': 28,\n",
       "         '记梦': 27,\n",
       "         '寂寞': 27,\n",
       "         '江南': 27,\n",
       "         '书信': 27,\n",
       "         '少女': 27,\n",
       "         '序文': 27,\n",
       "         '民歌': 26,\n",
       "         '题画': 26,\n",
       "         '旷达': 26,\n",
       "         '想象': 26,\n",
       "         '农村': 26,\n",
       "         '登楼': 25,\n",
       "         '时光': 25,\n",
       "         '揭露': 25,\n",
       "         '伤感': 25,\n",
       "         '读书': 25,\n",
       "         '仕途': 24,\n",
       "         '哀怨': 24,\n",
       "         '悲秋': 24,\n",
       "         '怀远': 23,\n",
       "         '歌颂': 23,\n",
       "         '理想': 23,\n",
       "         '黄河': 22,\n",
       "         '长江': 22,\n",
       "         '贬谪': 22,\n",
       "         '时间': 22,\n",
       "         '勉励': 22,\n",
       "         '楚辞': 22,\n",
       "         '离愁': 22,\n",
       "         '将士': 21,\n",
       "         '人民': 21,\n",
       "         '愿望': 21,\n",
       "         '劝诫': 21,\n",
       "         '思妇': 21,\n",
       "         '儿童': 21,\n",
       "         '乡村': 21,\n",
       "         '宫廷': 20,\n",
       "         '怀旧': 20,\n",
       "         '命运': 20,\n",
       "         '忧国': 20,\n",
       "         '长诗': 19,\n",
       "         '地方': 19,\n",
       "         '赏花': 19,\n",
       "         '古诗十九首': 19,\n",
       "         '悲愤': 19,\n",
       "         '风俗': 19,\n",
       "         '忧愁': 19,\n",
       "         '吊古伤今': 18,\n",
       "         '猖狂': 18,\n",
       "         '游记': 18,\n",
       "         '学习': 18,\n",
       "         '祝福': 18,\n",
       "         '传记': 18,\n",
       "         '劝勉': 18,\n",
       "         '讽喻': 17,\n",
       "         '写狗古诗18首': 17,\n",
       "         '不舍': 17,\n",
       "         '苦闷': 17,\n",
       "         '自由': 17,\n",
       "         '访友': 16,\n",
       "         '竹子': 16,\n",
       "         '漂泊': 16,\n",
       "         '纪行': 16,\n",
       "         '愉悦': 16,\n",
       "         '劝谏': 16,\n",
       "         '狩猎': 15,\n",
       "         '散文': 15,\n",
       "         '喜爱': 15,\n",
       "         '游玩': 15,\n",
       "         '游子': 15,\n",
       "         '乐观': 15,\n",
       "         '忆旧': 15,\n",
       "         '怀古伤今': 15,\n",
       "         '牡丹': 15,\n",
       "         '惜花': 15,\n",
       "         '旅途': 14,\n",
       "         '寺庙': 14,\n",
       "         '借古讽今': 14,\n",
       "         '乐歌': 14,\n",
       "         '桃花': 14,\n",
       "         '愤慨': 14,\n",
       "         '古诗里的十二个月': 13,\n",
       "         '行舟': 13,\n",
       "         '分别': 13,\n",
       "         '对话': 13,\n",
       "         '歌女': 13,\n",
       "         '忧民': 13,\n",
       "         '批判': 13,\n",
       "         '妻子': 13,\n",
       "         '母亲': 12,\n",
       "         '将军': 12,\n",
       "         '望远': 12,\n",
       "         '愁闷': 12,\n",
       "         '赠友': 12,\n",
       "         '怨刺': 12,\n",
       "         '春愁': 12,\n",
       "         '悼念': 12,\n",
       "         '凄凉': 12,\n",
       "         '怅惘': 11,\n",
       "         '热爱': 11,\n",
       "         '淡泊': 11,\n",
       "         '神仙': 11,\n",
       "         '祝寿': 11,\n",
       "         '劝慰': 11,\n",
       "         '凭吊': 11,\n",
       "         '思亲': 10,\n",
       "         '规劝': 10,\n",
       "         '愁思': 10,\n",
       "         '植物': 10,\n",
       "         '舞蹈': 10,\n",
       "         '外交': 10,\n",
       "         '忧愤': 10,\n",
       "         '哀愁': 10,\n",
       "         '游历': 9,\n",
       "         '隐逸': 9,\n",
       "         '赞扬': 9,\n",
       "         '家乡': 9,\n",
       "         '文言文': 9,\n",
       "         '故国': 9,\n",
       "         '弃妇': 9,\n",
       "         '分手': 9,\n",
       "         '劳动': 9,\n",
       "         '感时': 8,\n",
       "         '军旅': 8,\n",
       "         '留恋': 8,\n",
       "         '故乡': 8,\n",
       "         '写云': 8,\n",
       "         '感恩': 8,\n",
       "         '亡国': 8,\n",
       "         '渔人': 8,\n",
       "         '秋夜': 8,\n",
       "         '写物': 8,\n",
       "         '借景抒情': 8,\n",
       "         '赠答': 8,\n",
       "         '写茶': 8,\n",
       "         '美人': 8,\n",
       "         '归乡': 8,\n",
       "         '新婚': 7,\n",
       "         '渡江': 7,\n",
       "         '忧思': 7,\n",
       "         '黑暗': 7,\n",
       "         '悲痛': 7,\n",
       "         '惋惜': 7,\n",
       "         '哀伤': 7,\n",
       "         '祝愿': 7,\n",
       "         '约会': 7,\n",
       "         '身世': 7,\n",
       "         '瀑布': 7,\n",
       "         '赏月': 7,\n",
       "         '感激': 7,\n",
       "         '农事': 7,\n",
       "         '颂歌': 7,\n",
       "         '少年': 7,\n",
       "         '史论': 7,\n",
       "         '水乡': 7,\n",
       "         '踏青': 7,\n",
       "         '思国': 7,\n",
       "         '感怀': 7,\n",
       "         '寻访': 6,\n",
       "         '考试': 6,\n",
       "         '秋雨': 6,\n",
       "         '坚贞': 6,\n",
       "         '游侠': 6,\n",
       "         '亲情': 6,\n",
       "         '': 6,\n",
       "         '老师': 6,\n",
       "         '艰难': 6,\n",
       "         '战士': 6,\n",
       "         '教育': 6,\n",
       "         '思想': 6,\n",
       "         '写鱼': 6,\n",
       "         '伤别': 6,\n",
       "         '闺情': 6,\n",
       "         '不满': 6,\n",
       "         '悠闲': 6,\n",
       "         '春景': 6,\n",
       "         '湖水': 6,\n",
       "         '重逢': 6,\n",
       "         '动物': 6,\n",
       "         '批评': 6,\n",
       "         '暮春': 6,\n",
       "         '凄苦': 6,\n",
       "         '抒愤': 6,\n",
       "         '咏怀': 6,\n",
       "         '忧虑': 6,\n",
       "         '松树': 6,\n",
       "         '垂钓': 6,\n",
       "         '青春': 6,\n",
       "         '追求': 6,\n",
       "         '期望': 6,\n",
       "         '慰勉': 5,\n",
       "         '人格': 5,\n",
       "         '古体': 5,\n",
       "         '游仙': 5,\n",
       "         '生命': 5,\n",
       "         '写竹': 5,\n",
       "         '记游': 5,\n",
       "         '习俗': 5,\n",
       "         '清明': 5,\n",
       "         '婚姻': 5,\n",
       "         '生死': 5,\n",
       "         '感悟': 5,\n",
       "         '眷恋': 5,\n",
       "         '美好': 5,\n",
       "         '怀乡': 5,\n",
       "         '登山': 5,\n",
       "         '散曲': 5,\n",
       "         '晚上': 5,\n",
       "         '忧伤': 5,\n",
       "         '月色': 5,\n",
       "         '哀思': 5,\n",
       "         '亲人': 5,\n",
       "         '山村': 5,\n",
       "         '退隐': 5,\n",
       "         '文学': 5,\n",
       "         '怀友': 5,\n",
       "         '少妇': 5,\n",
       "         '落寞': 5,\n",
       "         '声音': 5,\n",
       "         '托物言志': 5,\n",
       "         '地点': 4,\n",
       "         '写草': 4,\n",
       "         '和诗': 4,\n",
       "         '隐士': 4,\n",
       "         '迁谪': 4,\n",
       "         '月下': 4,\n",
       "         '依恋': 4,\n",
       "         '态度': 4,\n",
       "         '莲花': 4,\n",
       "         '哲学': 4,\n",
       "         '侠客': 4,\n",
       "         '困苦': 4,\n",
       "         '诚信': 4,\n",
       "         '写酒': 4,\n",
       "         '叙梦': 4,\n",
       "         '品质': 4,\n",
       "         '池塘': 4,\n",
       "         '雨夜': 4,\n",
       "         '道理': 4,\n",
       "         '寒夜': 4,\n",
       "         '乐曲': 4,\n",
       "         '积极': 4,\n",
       "         '冬至': 4,\n",
       "         '中秋': 4,\n",
       "         '郊游': 4,\n",
       "         '亡妻': 4,\n",
       "         '初夏': 4,\n",
       "         '书法': 4,\n",
       "         '祭文': 4,\n",
       "         '用人': 4,\n",
       "         '景色': 4,\n",
       "         '夫妻': 4,\n",
       "         '行军': 4,\n",
       "         '梨花': 4,\n",
       "         '喝酒': 4,\n",
       "         '边疆': 4,\n",
       "         '桂花': 4,\n",
       "         '爱慕': 4,\n",
       "         '理论': 4,\n",
       "         '悲凉': 4,\n",
       "         '应制诗': 4,\n",
       "         '怨别': 4,\n",
       "         '别离': 4,\n",
       "         '即景抒情': 3,\n",
       "         '托古讽今': 3,\n",
       "         '酬赠': 3,\n",
       "         '邀请': 3,\n",
       "         '酬答': 3,\n",
       "         '早朝': 3,\n",
       "         '应制': 3,\n",
       "         '望月': 3,\n",
       "         '唱和': 3,\n",
       "         '援引': 3,\n",
       "         '抒志': 3,\n",
       "         '写树': 3,\n",
       "         '拟古': 3,\n",
       "         '题咏': 3,\n",
       "         '叹息': 3,\n",
       "         '征人': 3,\n",
       "         '建筑': 3,\n",
       "         '写莲': 3,\n",
       "         '厌倦': 3,\n",
       "         '知音': 3,\n",
       "         '吊古': 3,\n",
       "         '求贤': 3,\n",
       "         '父母': 3,\n",
       "         '谋略': 3,\n",
       "         '祝贺': 3,\n",
       "         '赠序': 3,\n",
       "         '宽慰': 3,\n",
       "         '艰辛': 3,\n",
       "         '怀恋': 3,\n",
       "         '观点': 3,\n",
       "         '家训': 3,\n",
       "         '英雄': 3,\n",
       "         '情怀': 3,\n",
       "         '忠贞': 3,\n",
       "         '写柳': 3,\n",
       "         '愉快': 3,\n",
       "         '激励': 3,\n",
       "         '明月': 3,\n",
       "         '托志': 3,\n",
       "         '告诫': 3,\n",
       "         '豁达': 3,\n",
       "         '白菊': 3,\n",
       "         '隐喻': 3,\n",
       "         '景物': 3,\n",
       "         '咏柳': 3,\n",
       "         '追悼': 3,\n",
       "         '记事': 3,\n",
       "         '写江': 3,\n",
       "         '自白': 3,\n",
       "         '朋友': 3,\n",
       "         '哀悼': 3,\n",
       "         '荔枝': 3,\n",
       "         '兄弟': 3,\n",
       "         '悲愁': 3,\n",
       "         '行路': 3,\n",
       "         '乐器': 3,\n",
       "         '渔夫': 3,\n",
       "         '悲叹': 3,\n",
       "         '恋情': 3,\n",
       "         '劳作': 3,\n",
       "         '对月': 3,\n",
       "         '庐山': 3,\n",
       "         '公文': 3,\n",
       "         '悲壮': 3,\n",
       "         '传说': 3,\n",
       "         '男子': 3,\n",
       "         '赠诗': 3,\n",
       "         '聚会': 3,\n",
       "         '怨情': 2,\n",
       "         '调笑': 2,\n",
       "         '伤老': 2,\n",
       "         '年老': 2,\n",
       "         '敬爱': 2,\n",
       "         '风雨': 2,\n",
       "         '以景衬情': 2,\n",
       "         '相聚': 2,\n",
       "         '酬和': 2,\n",
       "         '待客': 2,\n",
       "         '凭吊古迹': 2,\n",
       "         '触景感怀': 2,\n",
       "         '托物寄情': 2,\n",
       "         '写塔': 2,\n",
       "         '戍边': 2,\n",
       "         '豪侠': 2,\n",
       "         '咏叹': 2,\n",
       "         '母爱': 2,\n",
       "         '禅隐': 2,\n",
       "         '送春': 2,\n",
       "         '民族': 2,\n",
       "         '和平': 2,\n",
       "         '消极': 2,\n",
       "         '厌恶': 2,\n",
       "         '秋叶': 2,\n",
       "         '钓鱼': 2,\n",
       "         '苦难': 2,\n",
       "         '新年': 2,\n",
       "         '祝酒': 2,\n",
       "         '写诗': 2,\n",
       "         '关怀': 2,\n",
       "         '相遇': 2,\n",
       "         '燕子': 2,\n",
       "         '修养': 2,\n",
       "         '童谣': 2,\n",
       "         '劝告': 2,\n",
       "         '奏议': 2,\n",
       "         '春光': 2,\n",
       "         '写桥': 2,\n",
       "         '春闺': 2,\n",
       "         '咏梅': 2,\n",
       "         '写灯': 2,\n",
       "         '怨妇': 2,\n",
       "         '游春': 2,\n",
       "         '盼春': 2,\n",
       "         '道士': 2,\n",
       "         '海棠': 2,\n",
       "         '表演': 2,\n",
       "         '艺术': 2,\n",
       "         '失望': 2,\n",
       "         '警世': 2,\n",
       "         '渔父': 2,\n",
       "         '坎坷': 2,\n",
       "         '精神': 2,\n",
       "         '遗憾': 2,\n",
       "         '弹琴': 2,\n",
       "         '长安': 2,\n",
       "         '采莲': 2,\n",
       "         '喻人': 2,\n",
       "         '哀叹': 2,\n",
       "         '长篇': 2,\n",
       "         '歌曲': 2,\n",
       "         '忧患': 2,\n",
       "         '寄语': 2,\n",
       "         '战乱': 2,\n",
       "         '丰收': 2,\n",
       "         '大自然': 2,\n",
       "         '感时伤事': 2,\n",
       "         '闲居': 2,\n",
       "         '希望': 2,\n",
       "         '离恨': 2,\n",
       "         '安慰': 2,\n",
       "         '爱人': 2,\n",
       "         '看花': 2,\n",
       "         '山川': 2,\n",
       "         '落花': 2,\n",
       "         '苦痛': 2,\n",
       "         '杜鹃': 2,\n",
       "         '贫穷': 2,\n",
       "         '坚强': 2,\n",
       "         '帝王': 2,\n",
       "         '艳情': 2,\n",
       "         '怅然': 2,\n",
       "         '伤今': 2,\n",
       "         '碑文': 2,\n",
       "         '怨愤': 2,\n",
       "         '柳絮': 2,\n",
       "         '说理': 2,\n",
       "         '墓志铭': 2,\n",
       "         '檄文': 2,\n",
       "         '谪居': 2,\n",
       "         '情思': 2,\n",
       "         '谴责': 2,\n",
       "         '山林': 2,\n",
       "         '山居': 2,\n",
       "         '遭遇': 2,\n",
       "         '歌辞': 2,\n",
       "         '游仙诗': 2,\n",
       "         '赠言': 2,\n",
       "         '痛苦': 2,\n",
       "         '鼓励': 2,\n",
       "         '幽怨': 2,\n",
       "         '怀春': 2,\n",
       "         '端午': 2,\n",
       "         '祈祷': 2,\n",
       "         '高尚': 2,\n",
       "         '愤恨': 2,\n",
       "         '贫困': 2,\n",
       "         '食物': 2,\n",
       "         '郊外': 2,\n",
       "         '伤悼': 2,\n",
       "         '游园': 2,\n",
       "         '浪漫': 2,\n",
       "         '抚今忆昔': 2,\n",
       "         '游览': 2,\n",
       "         '状物': 2,\n",
       "         '山峰': 2,\n",
       "         '警示': 2,\n",
       "         '竞渡': 2,\n",
       "         '乡思': 2,\n",
       "         '留别': 2,\n",
       "         '策略': 2,\n",
       "         '迎春': 2,\n",
       "         '思慕': 2,\n",
       "         '渡河': 2,\n",
       "         '忧郁': 2,\n",
       "         '夜景': 2,\n",
       "         '题诗': 2,\n",
       "         '秋日': 2,\n",
       "         '即景': 2,\n",
       "         '感情': 2,\n",
       "         '嘲讽': 2,\n",
       "         '即事': 2,\n",
       "         '哀痛': 2,\n",
       "         '建功立业': 2,\n",
       "         '自传': 2,\n",
       "         '联想': 2,\n",
       "         '咏古': 2,\n",
       "         '官吏': 2,\n",
       "         '悔恨': 2,\n",
       "         '元宵': 2,\n",
       "         '颂扬': 2,\n",
       "         '憧憬': 2,\n",
       "         '美景': 2,\n",
       "         '叙志': 2,\n",
       "         '写鬼': 2,\n",
       "         '离情': 2,\n",
       "         '赞语': 2,\n",
       "         '歌谣': 1,\n",
       "         '美德': 1,\n",
       "         '洛阳': 1,\n",
       "         '借物言志': 1,\n",
       "         '写剑': 1,\n",
       "         '性格': 1,\n",
       "         '友好': 1,\n",
       "         '艰苦': 1,\n",
       "         '话旧': 1,\n",
       "         '交友': 1,\n",
       "         '抒情友情': 1,\n",
       "         '祈盼': 1,\n",
       "         '中元节': 1,\n",
       "         '写月': 1,\n",
       "         '咏雪': 1,\n",
       "         '念旧': 1,\n",
       "         '胸怀': 1,\n",
       "         '写雷': 1,\n",
       "         '婚恋': 1,\n",
       "         '奴隶': 1,\n",
       "         '写羊': 1,\n",
       "         '父亲': 1,\n",
       "         '悼古伤今': 1,\n",
       "         '乐舞': 1,\n",
       "         '祷词': 1,\n",
       "         '道德': 1,\n",
       "         '认知': 1,\n",
       "         '治国': 1,\n",
       "         '月光': 1,\n",
       "         '悲歌': 1,\n",
       "         '选官': 1,\n",
       "         '制度': 1,\n",
       "         '伤今追昔': 1,\n",
       "         '祭奠': 1,\n",
       "         '用兵': 1,\n",
       "         '艳遇': 1,\n",
       "         '胜利': 1,\n",
       "         '南方': 1,\n",
       "         '钱塘江': 1,\n",
       "         '寻花': 1,\n",
       "         '伤今感昔': 1,\n",
       "         '船夫': 1,\n",
       "         '酒宴': 1,\n",
       "         '怨恨': 1,\n",
       "         '铭文': 1,\n",
       "         '思怀': 1,\n",
       "         '组曲': 1,\n",
       "         '缅怀': 1,\n",
       "         '惜人': 1,\n",
       "         '抚昔伤今': 1,\n",
       "         '秋风': 1,\n",
       "         '志士': 1,\n",
       "         '泰山': 1,\n",
       "         '寓言诗': 1,\n",
       "         '写燕': 1,\n",
       "         '触景伤情': 1,\n",
       "         '西施': 1,\n",
       "         '知己': 1,\n",
       "         '关切': 1,\n",
       "         '咏竹': 1,\n",
       "         '湖光': 1,\n",
       "         '山色': 1,\n",
       "         '寓志': 1,\n",
       "         '渴望': 1,\n",
       "         '对弈': 1,\n",
       "         '怜惜': 1,\n",
       "         '好友': 1,\n",
       "         '落魄': 1,\n",
       "         '叙述': 1,\n",
       "         '橘子': 1,\n",
       "         '胸襟': 1,\n",
       "         '集句': 1,\n",
       "         '乡风': 1,\n",
       "         '慨叹': 1,\n",
       "         '思索': 1,\n",
       "         '答别': 1,\n",
       "         '抚事': 1,\n",
       "         '抚今追昔': 1,\n",
       "         '积怨': 1,\n",
       "         '饯别': 1,\n",
       "         '早春': 1,\n",
       "         '他乡': 1,\n",
       "         '故人': 1,\n",
       "         '眺远': 1,\n",
       "         '写景怀古': 1,\n",
       "         '江边': 1,\n",
       "         '居民': 1,\n",
       "         '困难': 1,\n",
       "         '丈夫': 1,\n",
       "         '风土': 1,\n",
       "         '人情': 1,\n",
       "         '凄婉': 1,\n",
       "         '悠然': 1,\n",
       "         '过往': 1,\n",
       "         '伤情': 1,\n",
       "         '无题': 1,\n",
       "         '春色': 1,\n",
       "         '写笋': 1,\n",
       "         '宴游': 1,\n",
       "         '乘船': 1,\n",
       "         '四季': 1,\n",
       "         '忠告': 1,\n",
       "         '勤奋': 1,\n",
       "         '辛苦': 1,\n",
       "         '期盼': 1,\n",
       "         '追怀': 1,\n",
       "         '思人': 1,\n",
       "         '才女': 1,\n",
       "         '赋税': 1,\n",
       "         '论述': 1,\n",
       "         '孤单': 1,\n",
       "         '登上': 1,\n",
       "         '推崇': 1,\n",
       "         '儒道': 1,\n",
       "         '论说文': 1,\n",
       "         '避讳': 1,\n",
       "         '小岛': 1,\n",
       "         '劝学': 1,\n",
       "         '论诗': 1,\n",
       "         '借凭吊屈': 1,\n",
       "         '感想': 1,\n",
       "         '兄妹': 1,\n",
       "         '写史': 1,\n",
       "         '改革': 1,\n",
       "         '杏花': 1,\n",
       "         '史评': 1,\n",
       "         '蝴蝶': 1,\n",
       "         '夕阳': 1,\n",
       "         '愁怨': 1,\n",
       "         '朋党': 1,\n",
       "         '淡泊名利': 1,\n",
       "         '冬季': 1,\n",
       "         '家人': 1,\n",
       "         '禅意': 1,\n",
       "         '沙漠': 1,\n",
       "         '荷塘': 1,\n",
       "         '忆人': 1,\n",
       "         '咏剑': 1,\n",
       "         '客人': 1,\n",
       "         '美女': 1,\n",
       "         '迁徙': 1,\n",
       "         '边将': 1,\n",
       "         '远游': 1,\n",
       "         '怜悯': 1,\n",
       "         '知识': 1,\n",
       "         '修身': 1,\n",
       "         '立志': 1,\n",
       "         '小品文': 1,\n",
       "         '黄昏': 1,\n",
       "         '宫人': 1,\n",
       "         '做人': 1,\n",
       "         '军队': 1,\n",
       "         '思夫': 1,\n",
       "         '日出': 1,\n",
       "         '秋千': 1,\n",
       "         '赠酬': 1,\n",
       "         '腊梅': 1,\n",
       "         '抒己': 1,\n",
       "         '螃蟹': 1,\n",
       "         '回信': 1,\n",
       "         '寓情于景': 1,\n",
       "         '荷叶': 1,\n",
       "         '借古抒怀': 1,\n",
       "         '情人': 1,\n",
       "         '过年': 1,\n",
       "         '企盼': 1,\n",
       "         '山乡': 1,\n",
       "         '失恋': 1,\n",
       "         '触景生情': 1,\n",
       "         '萧瑟': 1,\n",
       "         '孝道': 1,\n",
       "         '湖山': 1,\n",
       "         '启示': 1,\n",
       "         '眷念': 1,\n",
       "         '寻春': 1,\n",
       "         '抚今思昔': 1,\n",
       "         '春天｜写人': 1,\n",
       "         '自省': 1,\n",
       "         '图画': 1,\n",
       "         '演习': 1,\n",
       "         '同僚': 1,\n",
       "         '前途': 1,\n",
       "         '忧心': 1,\n",
       "         '托物抒怀': 1,\n",
       "         '哀歌': 1,\n",
       "         '写狼': 1,\n",
       "         '地震': 1,\n",
       "         '小说': 1,\n",
       "         '技艺': 1,\n",
       "         '饮宴': 1,\n",
       "         '公子': 1,\n",
       "         '艺妓': 1,\n",
       "         '遗恨': 1,\n",
       "         '小品': 1,\n",
       "         '歌咏': 1,\n",
       "         '童年': 1,\n",
       "         '祈雨': 1,\n",
       "         '春社': 1,\n",
       "         '离家': 1,\n",
       "         '出征': 1,\n",
       "         '修行': 1,\n",
       "         '留客': 1,\n",
       "         '饥荒': 1,\n",
       "         '行旅': 1,\n",
       "         '自然写景': 1,\n",
       "         '壮丽': 1,\n",
       "         '元曲': 1,\n",
       "         '离别｜抒情｜伤感｜怀人': 1,\n",
       "         '原野': 1,\n",
       "         '暮色': 1,\n",
       "         '归家': 1,\n",
       "         '珍惜': 1,\n",
       "         '春意': 1,\n",
       "         '关塞': 1,\n",
       "         '国破家亡': 1,\n",
       "         '山寺': 1,\n",
       "         '隐者': 1,\n",
       "         '变化': 1,\n",
       "         '春夜': 1,\n",
       "         '祭歌': 1,\n",
       "         '太阳': 1,\n",
       "         '秋思': 1,\n",
       "         '札记': 1,\n",
       "         '种树': 1,\n",
       "         '儿歌': 1,\n",
       "         '感物兴怀': 1,\n",
       "         '农业': 1,\n",
       "         '礼教': 1,\n",
       "         '君主': 1,\n",
       "         '豪强': 1,\n",
       "         '江河': 1,\n",
       "         '闻声': 1,\n",
       "         '画竹': 1,\n",
       "         '委婉': 1,\n",
       "         '闲雅': 1,\n",
       "         '遣怀': 1,\n",
       "         '惭愧': 1,\n",
       "         '借古伤今': 1,\n",
       "         '悲剧': 1,\n",
       "         '旅人': 1,\n",
       "         '纳谏': 1,\n",
       "         '情歌': 1,\n",
       "         '渔家': 1,\n",
       "         '暮归': 1,\n",
       "         '长城': 1,\n",
       "         '文集': 1,\n",
       "         '雨后': 1,\n",
       "         '比喻': 1,\n",
       "         '借古论今': 1,\n",
       "         '争论': 1,\n",
       "         '往事': 1,\n",
       "         '散心': 1,\n",
       "         '叹恨': 1,\n",
       "         '寓情': 1,\n",
       "         '闺妇': 1,\n",
       "         '抒情思乡': 1,\n",
       "         '江峡': 1,\n",
       "         '深秋': 1,\n",
       "         '山河': 1,\n",
       "         '女童': 1,\n",
       "         '杂剧': 1,\n",
       "         '冬日': 1,\n",
       "         '愁病': 1,\n",
       "         '叙旧': 1,\n",
       "         '科举': 1,\n",
       "         '写船': 1,\n",
       "         '梦想': 1,\n",
       "         '田园诗': 1,\n",
       "         '答谢': 1,\n",
       "         '湖泊': 1,\n",
       "         '别愁': 1,\n",
       "         '工人': 1,\n",
       "         '荐书': 1,\n",
       "         '流放': 1,\n",
       "         '杂言': 1,\n",
       "         '暮年': 1,\n",
       "         '侠义': 1,\n",
       "         '送人': 1,\n",
       "         '洞庭湖': 1,\n",
       "         '复仇': 1,\n",
       "         '以古讽今': 1,\n",
       "         '游猎': 1,\n",
       "         '儿女': 1,\n",
       "         '青年': 1,\n",
       "         '秋游': 1,\n",
       "         '言怀': 1,\n",
       "         '奔放': 1,\n",
       "         '亲友': 1,\n",
       "         '拜访': 1,\n",
       "         '异乡': 1,\n",
       "         '怀古伤心': 1,\n",
       "         '社交': 1,\n",
       "         '矛盾': 1,\n",
       "         '忆昔': 1,\n",
       "         '讽今': 1,\n",
       "         '打鱼': 1,\n",
       "         '郁闷': 1,\n",
       "         '杯古': 1,\n",
       "         '杨柳': 1,\n",
       "         '自嘲': 1,\n",
       "         '士卒': 1,\n",
       "         '激动': 1,\n",
       "         '花草': 1,\n",
       "         '晚年': 1,\n",
       "         '肖像': 1,\n",
       "         '山水诗': 1,\n",
       "         '军人': 1,\n",
       "         '题赠': 1,\n",
       "         '芍药': 1,\n",
       "         '媳妇': 1,\n",
       "         '婆婆': 1,\n",
       "         '夜市': 1,\n",
       "         '相逢': 1,\n",
       "         '以景结情': 1,\n",
       "         '饮茶': 1,\n",
       "         '留念': 1,\n",
       "         '春雨': 1,\n",
       "         '情郎': 1,\n",
       "         '大雁': 1,\n",
       "         '假日': 1,\n",
       "         '夏至': 1,\n",
       "         '舟中': 1,\n",
       "         '骚体': 1,\n",
       "         '赞赏': 1,\n",
       "         '出游': 1,\n",
       "         '民俗': 1,\n",
       "         '唱歌': 1,\n",
       "         '舒怀': 1,\n",
       "         '傍晚': 1,\n",
       "         '汤圆': 1,\n",
       "         '感昔伤今': 1,\n",
       "         '新乐府': 1,\n",
       "         '牧童': 1,\n",
       "         '胞弟': 1,\n",
       "         '凄清': 1,\n",
       "         '策论': 1,\n",
       "         '游赏': 1,\n",
       "         '忆往': 1,\n",
       "         '恩师': 1,\n",
       "         '写鼠': 1,\n",
       "         '讽谕': 1,\n",
       "         '皇宫': 1,\n",
       "         '美学': 1,\n",
       "         '抚今': 1,\n",
       "         '追昔': 1,\n",
       "         '演奏': 1,\n",
       "         '托物咏志': 1,\n",
       "         '碑记': 1,\n",
       "         '忠义': 1,\n",
       "         '重阳': 1,\n",
       "         '恋人': 1,\n",
       "         '懊悔': 1,\n",
       "         '贞洁': 1,\n",
       "         '奏疏': 1,\n",
       "         '离思': 1,\n",
       "         '花落': 1,\n",
       "         '春残': 1,\n",
       "         '闺思': 1,\n",
       "         '写琴': 1,\n",
       "         '残春': 1,\n",
       "         '恨别': 1,\n",
       "         '悲苦': 1,\n",
       "         '写梅': 1,\n",
       "         '心理': 1,\n",
       "         '屈原': 1,\n",
       "         '豪情': 1,\n",
       "         ...})"
      ]
     },
     "execution_count": 14,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "cnt"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 68,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T07:42:56.324130800Z",
     "start_time": "2023-07-09T07:42:56.305801400Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['唐诗三百首',\n",
       " '早教古诗100首',\n",
       " '小学生必背古诗70首',\n",
       " '小学生必背古诗80首',\n",
       " '初中古诗',\n",
       " '小学古诗',\n",
       " '古诗里的十二个月',\n",
       " '高中古诗',\n",
       " '写狗古诗18首',\n",
       " '初中文言文',\n",
       " '诗经',\n",
       " '高中文言文',\n",
       " '古诗十九首',\n",
       " '宋词精选',\n",
       " '小学文言文',\n",
       " '古诗三百首',\n",
       " '宋词三百首',\n",
       " '春天｜写人',\n",
       " '离别｜抒情｜伤感｜怀人']"
      ]
     },
     "execution_count": 68,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "ban_tags = []\n",
    "for tag in cnt.keys():\n",
    "    if re.search(r'\\d', tag):\n",
    "        ban_tags.append(tag)\n",
    "    elif '唐' in tag or '宋' in tag:\n",
    "        ban_tags.append(tag)\n",
    "    elif len(tag) >= 5:\n",
    "        ban_tags.append(tag)\n",
    "    elif '小学' in tag or '中学' in tag or '高中' in tag or '初中' in tag:\n",
    "        ban_tags.append(tag)\n",
    "    elif '诗经' in tag:\n",
    "        ban_tags.append(tag)\n",
    "ban_tags"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 77,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T07:47:47.102472500Z",
     "start_time": "2023-07-09T07:47:47.013853Z"
    },
    "collapsed": false
   },
   "outputs": [],
   "source": [
    "tag_poems = []\n",
    "for item in tag_data:\n",
    "    # 太长的删去\n",
    "    if len(item['content']) > 6:\n",
    "        continue\n",
    "    if '诗经' in item['tags']:\n",
    "        continue\n",
    "    # 无意义tag删去\n",
    "    refined_tags = [i for i in item['tags'] if i not in ban_tags]\n",
    "    if len(refined_tags) == 0:\n",
    "        continue\n",
    "    refined_content = ''.join(item['content'])\n",
    "    refined_content = re.sub(r'[A-Za-z0-9\\s/<>《》〔〕]', '', refined_content)\n",
    "    refined_content = re.sub(r'（.*?）', '', refined_content)\n",
    "    refined_content = re.sub(r'\\(.*?\\)', '', refined_content)\n",
    "    # refined_content = re.sub(r'[，。？,]', ' ', refined_content)\n",
    "    refined_content.replace(',', '，').replace('?', '？').replace('!', '！')\n",
    "    refined_content = refined_content.strip()\n",
    "    # 词删去（字数不一）\n",
    "    if len(set([len(i) for i in re.split(r'[，。？！]', refined_content)[:-1]])) > 1:\n",
    "        continue\n",
    "    # 太长的删去\n",
    "    if len(refined_content) > 150:\n",
    "        continue\n",
    "\n",
    "    tag_poems.append({\n",
    "        'tags': ' '.join(refined_tags),\n",
    "        'content': refined_content\n",
    "    })"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 78,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T07:47:47.612845300Z",
     "start_time": "2023-07-09T07:47:47.590257700Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "(3767,\n",
       " [{'tags': '送别',\n",
       "   'content': '生涯岂料承优诏，世事空知学醉歌。江上月明胡雁过，淮南木落楚山多。寄身且喜沧洲近，顾影无如白发何。今日龙钟人共弃，愧君犹遣慎风波。'},\n",
       "  {'tags': '怀古 迁谪 生活',\n",
       "   'content': '三年谪宦此栖迟，万古惟留楚客悲。秋草独寻人去后，寒林空见日斜时。汉文有道恩犹薄，湘水无情吊岂知。寂寂江山摇落处，怜君何事到天涯。'},\n",
       "  {'tags': '贬谪 触景感怀',\n",
       "   'content': '汀洲无浪复无烟，楚客相思益渺然。汉口夕阳斜渡鸟，洞庭秋水远连天。孤城背岭寒吹角，独树临江夜泊船。贾谊上书忧汉室，长沙谪去古今怜。'},\n",
       "  {'tags': '咏史怀古',\n",
       "   'content': '王濬楼船下益州，金陵王气黯然收。千寻铁锁沉江底，一片降幡出石头。人世几回伤往事，山形依旧枕寒流。今逢四海为家日，故垒萧萧芦荻秋。'},\n",
       "  {'tags': '写景 抒情 战争 思乡',\n",
       "   'content': '云开远见汉阳城，犹是孤帆一日程。估客昼眠知浪静，舟人夜语觉潮生。三湘愁鬓逢秋色，万里归心对月明。旧业已随征战尽，更堪江上鼓鼙声。'},\n",
       "  {'tags': '援引',\n",
       "   'content': '二月黄莺飞上林，春城紫禁晓阴阴。长乐钟声花外尽，龙池柳色雨中深。阳和不散穷途恨，霄汉长怀捧日心。献赋十年犹未遇，羞将白发对华簪。'},\n",
       "  {'tags': '宫怨',\n",
       "   'content': '十二楼中尽晓妆，望仙楼上望君王。锁衔金兽连环冷，水滴铜龙昼漏长。云髻罢梳还对镜，罗衣欲换更添香。遥窥正殿帘开处，袍袴宫人扫御床。'},\n",
       "  {'tags': '游历 向往',\n",
       "   'content': '仙台初见五城楼，风物凄凄宿雨收。山色遥连秦树晚，砧声近报汉宫秋。疏松影落空坛静，细草香闲小洞幽。何用别寻方外去，人间亦自有丹丘。'},\n",
       "  {'tags': '月亮 怀人',\n",
       "   'content': '高卧南斋时，开帷月初吐。清辉澹水木，演漾在窗户。冉冉几盈虚，澄澄变今古。美人清江畔，是夜越吟苦。千里共如何，微风吹兰杜。'},\n",
       "  {'tags': '田园 归隐',\n",
       "   'content': '斜阳照墟落，穷巷牛羊归。野老念牧童，倚杖候荆扉。雉雊麦苗秀，蚕眠桑叶稀。田夫荷锄至，相见语依依。即此羡闲逸，怅然吟式微。'},\n",
       "  {'tags': '友情 送别 写景 抒情', 'content': '下马饮君酒，问君何所之？君言不得意，归卧南山陲。但去莫复问，白云无尽时。'},\n",
       "  {'tags': '山水 托物寄情',\n",
       "   'content': '言入黄花川，每逐清溪水。随山将万转，趣途无百里。声喧乱石中，色静深松里。漾漾泛菱荇，澄澄映葭苇。我心素已闲，清川澹如此。请留磐石上，垂钓将已矣。'},\n",
       "  {'tags': '春天 妇女 坚贞 思念', 'content': '燕草如碧丝，秦桑低绿枝。当君怀归日，是妾断肠时。春风不相识，何事入罗帏。'},\n",
       "  {'tags': '写景 写山 写鸟 励志 哲理 最美',\n",
       "   'content': '岱宗夫如何？齐鲁青未了。造化钟神秀，阴阳割昏晓。荡胸生曾云，决眦入归鸟。会当凌绝顶，一览众山小。'},\n",
       "  {'tags': '秋天 登高 怀人',\n",
       "   'content': '北山白云里，隐者自怡悦。相望试登高，心随雁飞灭。愁因薄暮起，兴是清秋发。时见归村人，沙行渡头歇。天边树若荠，江畔洲如月。何当载酒来，共醉重阳节。'},\n",
       "  {'tags': '夏天 怀人 友情',\n",
       "   'content': '山光忽西落，池月渐东上。散发乘夕凉，开轩卧闲敞。荷风送香气，竹露滴清响。欲取鸣琴弹，恨无知音赏。感此怀故人，中宵劳梦想。'},\n",
       "  {'tags': '写景',\n",
       "   'content': '夕阳度西岭，群壑倏已暝。松月生夜凉，风泉满清听。樵人归欲尽，烟鸟栖初定。之子期宿来，孤琴候萝径。'},\n",
       "  {'tags': '生活 孤独',\n",
       "   'content': '久为簪组累，幸此南夷谪。闲依农圃邻，偶似山林客。晓耕翻露草，夜榜响溪石。来往不逢人，长歌楚天碧。'},\n",
       "  {'tags': '叙事 抒情 同情',\n",
       "   'content': '客从东方来，衣上灞陵雨。问客何为来，采山因买斧。冥冥花正开，飏飏燕新乳。昨别今已春，鬓丝生几缕。'},\n",
       "  {'tags': '写景 抒情 思乡',\n",
       "   'content': '落帆逗淮镇，停舫临孤驿。浩浩风起波，冥冥日沉夕。人归山郭暗，雁下芦洲白。独夜忆秦关，听钟未眠客。'},\n",
       "  {'tags': '春天 生活',\n",
       "   'content': '吏舍跼终年，出郊旷清曙。杨柳散和风，青山澹吾虑。依丛适自憩，缘涧还复去。微雨霭芳原，春鸠鸣何处。乐幽心屡止，遵事迹犹遽。终罢斯结庐，慕陶直可庶。'},\n",
       "  {'tags': '离别 依恋',\n",
       "   'content': '凄凄去亲爱，泛泛入烟雾。归棹洛阳人，残钟广陵树。今朝此为别，何处还相遇。世事波上舟，沿洄安得住。'},\n",
       "  {'tags': '怀念',\n",
       "   'content': '今朝郡斋冷，忽念山中客。涧底束荆薪，归来煮白石。欲持一瓢酒，远慰风雨夕。落叶满空山，何处寻行迹。'},\n",
       "  {'tags': '山水 隐逸',\n",
       "   'content': '清溪深不测，隐处唯孤云。松际露微月，清光犹为君。茅亭宿花影，药院滋苔纹。余亦谢时去，西山鸾鹤群。'},\n",
       "  {'tags': '写鸟 寓人 抒怀 生活 哲理',\n",
       "   'content': '孤鸿海上来，池潢不敢顾。侧见双翠鸟，巢在三珠树。矫矫珍木巅，得无金丸惧？美服患人指，高明逼神恶。今我游冥冥，弋者何所慕！'},\n",
       "  {'tags': '植物 抒志 生活 哲理',\n",
       "   'content': '兰叶春葳蕤，桂华秋皎洁。欣欣此生意，自尔为佳节。谁知林栖者，闻风坐相悦。草木有本心，何求美人折！'},\n",
       "  {'tags': '寓言 写鸟 寓人 哲理',\n",
       "   'content': '幽人归独卧，滞虑洗孤清。持此谢高鸟，因之传远情。日夕怀空意，人谁感至精？飞沈理自隔，何所慰吾诚?'},\n",
       "  {'tags': '咏物 写树 寓人 人格',\n",
       "   'content': '江南有丹橘，经冬犹绿林。岂伊地气暖？自有岁寒心。可以荐嘉客，奈何阻重深。运命惟所遇，循环不可寻。徒言树桃李，此木岂无阴？'},\n",
       "  {'tags': '抒情',\n",
       "   'content': '幽意无断绝，此去随所偶。晚风吹行舟，花路入溪口。际夜转西壑，隔山望南斗。潭烟飞溶溶，林月低向后。生事且弥漫，愿为持竿叟。'},\n",
       "  {'tags': '离别 饮酒',\n",
       "   'content': '风吹柳花满店香，吴姬压酒唤客尝。金陵子弟来相送，欲行不行各尽觞。请君试问东流水，别意与之谁短长。'},\n",
       "  {'tags': '宴会 音乐',\n",
       "   'content': '主人有酒欢今夕，请奏鸣琴广陵客。月照城头乌半飞，霜凄万树风入衣。铜炉华烛烛增辉，初弹渌水后楚妃。一声已动物皆静，四座无言星欲稀。清淮奉使千馀里，敢告云山从此始。'},\n",
       "  {'tags': '写景 归隐',\n",
       "   'content': '山寺钟鸣昼已昏，渔梁渡头争渡喧。人随沙岸向江村，余亦乘舟归鹿门。鹿门月照开烟树，忽到庞公栖隐处。岩扉松径长寂寥，惟有幽人自来去。'},\n",
       "  {'tags': '山水 写人',\n",
       "   'content': '渔翁夜傍西岩宿，晓汲清湘燃楚竹。烟销日出不见人，欸乃一声山水绿。回看天际下中流，岩上无心云相逐。'},\n",
       "  {'tags': '边塞 写景 将士 思乡 优美', 'content': '黄河远上白云间，一片孤城万仞山。羌笛何须怨杨柳，春风不度玉门关。'},\n",
       "  {'tags': '边塞 写景 战争 爱国 忧国忧民', 'content': '秦时明月汉时关，万里长征人未还。但使龙城飞将在，不教胡马度阴山。'},\n",
       "  {'tags': '乐府 边塞 写景 讽刺 游侠',\n",
       "   'content': '蝉鸣空桑林，八月萧关道。出塞入塞寒，处处黄芦草。从来幽并客，皆共尘沙老。莫学游侠儿，矜夸紫骝好。'},\n",
       "  {'tags': '战争 乐府',\n",
       "   'content': '饮马渡秋水，水寒风似刀。平沙日未没，黯黯见临洮。昔日长城战，咸言意气高。黄尘足今古，白骨乱蓬蒿。'},\n",
       "  {'tags': '乐府 友情 送别', 'content': '渭城朝雨浥轻尘，客舍青青柳色新。劝君更尽一杯酒，西出阳关无故人。'},\n",
       "  {'tags': '秋天 女子 思念', 'content': '桂魄初生秋露微，轻罗已薄未更衣。银筝夜久殷勤弄，心怯空房不忍归。'},\n",
       "  {'tags': '乐府 赞美 女子 优美', 'content': '云想衣裳花想容，春风拂槛露华浓。若非群玉山头见，会向瑶台月下逢。'},\n",
       "  {'tags': '乐府 女子', 'content': '一枝红艳露凝香，云雨巫山枉断肠。借问汉宫谁得似，可怜飞燕倚新妆。'},\n",
       "  {'tags': '写花 写人', 'content': '名花倾国两相欢，常得君王带笑看。解释春风无限恨，沉香亭北倚栏杆。'},\n",
       "  {'tags': '宫怨 孤独', 'content': '玉阶生白露，夜久侵罗袜。却下水晶帘，玲珑望秋月。'},\n",
       "  {'tags': '乐府 春天 赞美 女子', 'content': '秦地罗敷女，采桑绿水边。素手青条上，红妆白日鲜。蚕饥妾欲去，五马莫留连。'},\n",
       "  {'tags': '乐府 夏天 荷花 写人 哲理',\n",
       "   'content': '镜湖三百里，菡萏发荷花。五月西施采，人看隘若耶。回舟不待月，归去越王家。'},\n",
       "  {'tags': '乐府 秋天 月亮 妇女 闺怨 思念',\n",
       "   'content': '长安一片月，万户捣衣声。秋风吹不尽，总是玉关情。何日平胡虏，良人罢远征。'},\n",
       "  {'tags': '乐府 冬天 妇女 思念', 'content': '明朝驿使发，一夜絮征袍。素手抽针冷，那堪把剪刀。裁缝寄远道，几日到临洮。'},\n",
       "  {'tags': '写山 边塞 征人 思乡',\n",
       "   'content': '明月出天山，苍茫云海间。长风几万里，吹度玉门关。汉下白登道，胡窥青海湾。由来征战地，不见有人还。戍客望边邑，思归多苦颜。高楼当此夜，叹息未应闲。'},\n",
       "  {'tags': '闺怨', 'content': '嫁得瞿塘贾，朝朝误妾期。早知潮有信，嫁与弄潮儿。'},\n",
       "  {'tags': '乐府 冬天 边塞 生活',\n",
       "   'content': '白日登山望烽火，黄昏饮马傍交河。行人刁斗风沙暗，公主琵琶幽怨多。野云万里无城郭，雨雪纷纷连大漠。胡雁哀鸣夜夜飞，胡儿眼泪双双落。闻道玉门犹被遮，应将性命逐轻车。年年战骨埋荒外，空见蒲桃入汉家。'},\n",
       "  {'tags': '励志 惜时', 'content': '劝君莫惜金缕衣，劝君惜取少年时。花开堪折直须折，莫待无花空折枝。'},\n",
       "  {'tags': '闺怨 思念',\n",
       "   'content': '卢家少妇郁金堂，海燕双栖玳瑁梁。九月寒砧催木叶，十年征戍忆辽阳。白狼河北音书断，丹凤城南秋夜长。谁谓含愁独不见，更教明月照流黄。'},\n",
       "  {'tags': '赞颂 妇女', 'content': '梧桐相待老，鸳鸯会双死。贞女贵殉夫，舍生亦如此。波澜誓不起，妾心古井水。'},\n",
       "  {'tags': '乐府 赞颂 母亲 母爱', 'content': '慈母手中线，游子身上衣。临行密密缝，意恐迟迟归。谁言寸草心，报得三春晖。'},\n",
       "  {'tags': '女子 孤独 思乡', 'content': '君家何处住，妾住在横塘。停船暂借问，或恐是同乡。'},\n",
       "  {'tags': '女子 热爱 家乡', 'content': '家临九江水，来去九江侧。同是长干人，生小不相识。'},\n",
       "  {'tags': '边塞 赞美 将军', 'content': '鹫翎金仆姑，燕尾绣蝥弧。独立扬新令，千营共一呼。'},\n",
       "  {'tags': '边塞 狩猎 赞美 将军', 'content': '林暗草惊风，将军夜引弓。平明寻白羽，没在石棱中。'},\n",
       "  {'tags': '边塞 冬天 战争 赞美 将军', 'content': '月黑雁飞高，单于夜遁逃。欲将轻骑逐，大雪满弓刀。'},\n",
       "  {'tags': '边塞 宴饮 赞颂 将士', 'content': '野幕敞琼筵，羌戎贺劳旋。醉和金甲舞，雷鼓动山川。'},\n",
       "  {'tags': '歌谣 生命 无奈 感叹', 'content': '泰山其颓乎。梁木其坏乎。哲人其萎乎。'},\n",
       "  {'tags': '写人 妇女',\n",
       "   'content': '小姑织白纻，未解将人语。大嫂采芙蓉，溪湖千万重。长兄行不在，莫使外人逢。愿学秋胡妇，贞心比古松。'},\n",
       "  {'tags': '典故 抒情', 'content': '三百六十日，日日醉如泥。虽为李白妇，何异太常妻。'},\n",
       "  {'tags': '咏物',\n",
       "   'content': '橘柚垂华实，乃在深山侧。闻君好我甘，窃独自雕饰。委身玉盘中，历年冀见食。芳菲不相投，青黄忽改色。人倘欲我知，因君为羽翼。'},\n",
       "  {'tags': '社会 人民 生活',\n",
       "   'content': '翠柏苦犹食，晨霞高可餐。世人共卤莽，吾道属艰难。不爨井晨冻，无衣床夜寒。囊空恐羞涩，留得一钱看。'},\n",
       "  {'tags': '感时', 'content': '昨夜圆非今夜圆，却疑圆处减婵娟。一年十二度圆缺，能得几多时少年。'},\n",
       "  {'tags': '乐府 民歌', 'content': '种瓜黄台下，瓜熟子离离。一摘使瓜好，再摘使瓜稀。三摘犹自可，摘绝抱蔓归。'},\n",
       "  {'tags': '揭露 社会 现实 黑暗',\n",
       "   'content': '垅上扶犁儿，手种腹长饥。窗下抛梭女，手织身无衣。我愿燕赵姝，化为嫫母姿。一笑不值钱，自然家国肥。'},\n",
       "  {'tags': '春游 写景', 'content': '万树江边杏，新开一夜风。满园深浅色，照在绿波中。'},\n",
       "  {'tags': '写景 吊古伤今 优美',\n",
       "   'content': '一上高城万里愁，蒹葭杨柳似汀洲。溪云初起日沉阁，山雨欲来风满楼。鸟下绿芜秦苑夕，蝉鸣黄叶汉宫秋。行人莫问当年事，故国东来渭水流。'},\n",
       "  {'tags': '写景 咏史怀古',\n",
       "   'content': '铁马云雕久绝尘，柳营高压汉营春。天清杀气屯关右，夜半妖星照渭滨。下国卧龙空寤主，中原逐鹿不由人。象床锦帐无言语，从此谯周是老臣。'},\n",
       "  {'tags': '写景 抒怀 政治', 'content': '天际乌云含雨重，楼前红日照山明。嵩阳居士今安否，青眼看人万里情。'},\n",
       "  {'tags': '夜晚 写景 抒情 孤寂 壮志未酬',\n",
       "   'content': '夜到清溪宿，主人碧岩里。檐楹挂星斗，枕席响风水。月落西山时，啾啾夜猿起。'},\n",
       "  {'tags': '地方 洛阳 夜晚 写景',\n",
       "   'content': '已从招提游，更宿招提境。阴壑生虚籁，月林散清影。天阙象纬逼，云卧衣裳冷。欲觉闻晨钟，令人发深省。'},\n",
       "  {'tags': '写景 女子', 'content': '冷烛无烟绿蜡干，芳心犹卷怯春寒。一缄书札藏何事，会被东风暗拆看。'},\n",
       "  {'tags': '写景 自然',\n",
       "   'content': '小榖城荒路屈盘，石根寒碧涨秋湾。千章秀木黄公庙，一点飞雪白塔山。好景落谁诗句里，蹇驴驮我画图间。膏肓泉石真吾事，莫厌乘兴数往还。'},\n",
       "  {'tags': '夜晚 写景',\n",
       "   'content': '微风萧萧吹菰蒲，开门看雨月满湖。舟人水鸟两同梦，大鱼惊窜如奔狐。夜深人物不相管，我独形影相嬉娱。暗潮生渚吊寒蚓，落月挂柳看悬蛛。此生忽忽忧患里，清境过眼能须臾。鸡鸣钟动百鸟散，船头击鼓还相呼。'},\n",
       "  {'tags': '写景 怀古',\n",
       "   'content': '清于池水净于苔，会府潭潭暂作台。夜月半庭人未宿，春云满眼杏将开。榆关道路犹堪走，麟阁功勋岂易陪。莫信蓬莱相离远，塞鸿多自日边来。'},\n",
       "  {'tags': '夜晚 写景', 'content': '山白鸟忽鸣，石冷霜欲结。流泉得月光，化为一溪雪。'},\n",
       "  {'tags': '写景 赞美 抒情',\n",
       "   'content': '浪动灌婴井，寻阳江上风。开帆入天镜，直向彭湖东。落景转疏雨，睛云散远空。名山发佳兴，清赏亦何穷？石镜挂遥月，香炉灭彩虹。相思俱对此，举目与君同。'},\n",
       "  {'tags': '写景 讽刺',\n",
       "   'content': '此地曾经翠辇过，浮云流水竟如何？香销南国美人尽，怨入东风芳草多。残柳宫前空露叶，夕阳川上浩烟波。行人遥起广陵思，古渡月明闻棹歌。'},\n",
       "  {'tags': '写景 喜悦 抒怀', 'content': '宿云散洲渚，晓日明村坞。高树临清池，风惊夜来雨。予心适无事，偶此成宾主。'},\n",
       "  {'tags': '自然 写景 山水',\n",
       "   'content': '轨息陆途初，枻鼓川路始。涟漪繁波漾，参差层峰峙。萧疏野趣生，逶迤白云起。登陟苦跋涉，䁹盼乐心耳。即玩玩有竭，在兴兴无已。'},\n",
       "  {'tags': '游记 写景 抒情',\n",
       "   'content': '寺忆曾游处，桥怜再渡时。江山如有待，花柳自无私。野润烟光薄，沙暄日色迟。客愁全为减，舍此复何之？'},\n",
       "  {'tags': '写景', 'content': '雨余春涧水争分，野雉双飞过古坟。眼见人家住深坞，梅花绕屋不开门。'},\n",
       "  {'tags': '写景 建筑',\n",
       "   'content': '高阁逼诸天，登临近日边。晴开万井树，愁看五陵烟。槛外低秦岭，窗中小渭川。早知清净理，常愿奉金仙。'},\n",
       "  {'tags': '登高 望远 写景 抒怀 怀才不遇',\n",
       "   'content': '北楼西望满晴空，积水连山胜画中。湍上急流声若箭，城头残月势如弓。垂竿已羡磻溪老，体道犹思塞上翁。为问边庭更何事，至今羌笛怨无穷。'},\n",
       "  {'tags': '春天 写景 生活', 'content': '松下柴门闭绿苔，只有蝴蝶双飞来。蜜蜂两股大如茧，应是前山花已开。'},\n",
       "  {'tags': '咏物 写山',\n",
       "   'content': '中原一孤石，地理不知年。根含彭泽浪，顶入香炉烟。崖成二鸟翼，峰作一芙莲。何时发东武，今来镇蠡川。'},\n",
       "  {'tags': '咏物', 'content': '绿阵连烟垠，风雨化精节。玉露含青紫，沁彻哲人心。'},\n",
       "  {'tags': '咏物',\n",
       "   'content': '秋风揽辔下边城，万里河流绕骑清。樽俎试看酬壮节，壶觞到处迓行旌。寒骄强弩云传箭，飚转轻车火作营。慷慨十年长剑在，登楼一笑暮山横。'},\n",
       "  {'tags': '咏物 竹子', 'content': '此君志欲擎天碧，耸出云头高百尺。只恐年深化作龙，一朝飞去不留迹。'},\n",
       "  {'tags': '咏物 竹子 赞美', 'content': '擢擢当轩竹，青青重岁寒。心贞徒见赏，箨小未成竿。'},\n",
       "  {'tags': '咏物 抒情',\n",
       "   'content': '可怜池内萍，葐蒀紫复青。巧随浪开合，能逐水低平。微根无所缀，细叶讵须茎？飘泊终难测，留连如有情。'},\n",
       "  {'tags': '咏物 柳树 抒情', 'content': '大堤杨柳雨沉沉，万缕千条惹恨深。飞絮满天人去远，东风无力系春心。'},\n",
       "  {'tags': '咏物 竹子 组诗',\n",
       "   'content': '寒飞千尺玉，清洒一林霜。纵是尘心重，相看亦顿忘。矫矫凌云姿，风生龙夜吼。霜雪不知年，真吾岁寒友。霜干寒如玉，风枝响似琴。潇湘一夜雨，滴碎客中心。叶落根偏固，心虚节更高。一林寒吹发，清夜伴松涛。淇澳春云碧，潇湘夜雨寒。虚窗人静听，飒飒响琅玕。'},\n",
       "  {'tags': '咏物 抒情 愤懑 怀才不遇', 'content': '一片琼英价动天，连城十二昔虚传。良工巧费真为累，楮叶成来不直钱。'},\n",
       "  {'tags': '咏物 莲花', 'content': '素蘤多蒙别艳欺，此花端合在瑶池。无情有恨何人觉？月晓风清欲堕时。'},\n",
       "  {'tags': '咏物 写竹 借物言志',\n",
       "   'content': '竹生荒野外，梢云耸百寻。无人赏高节，徒自抱贞心。耻染湘妃泪，羞入上宫琴。谁能制长笛，当为吐龙吟。'},\n",
       "  {'tags': '咏物 讽喻', 'content': '芳草和烟暖更青，闲门要路一时生。年年点检人间事，唯有春风不世情。'}])"
      ]
     },
     "execution_count": 78,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(tag_poems), tag_poems[200:300]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 79,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T07:47:50.648670700Z",
     "start_time": "2023-07-09T07:47:50.632983200Z"
    },
    "collapsed": false
   },
   "outputs": [],
   "source": [
    "with open(\"tag_poems_v2.txt\", \"w+\", encoding='utf-8') as f:\n",
    "    for i in range(len(tag_poems)):\n",
    "        item = tag_poems[i]\n",
    "        f.write(f'{item[\"tags\"]}|{item[\"content\"]}')\n",
    "        if i != len(tag_poems) - 1:\n",
    "            f.write('\\n')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 82,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T07:52:46.328012700Z",
     "start_time": "2023-07-09T07:52:46.298031500Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "送别 赞美 友人 友谊|岑公相门子，雅望归安石。奕世皆夔龙，中台竟三拆。至人达机兆，高揖九州伯。奈何天地间，而作隐沦客。贵道能全真，潜辉卧幽邻。探元入窅默，观化游无垠。光武有天下，严陵为故人。虽登洛阳殿，不屈巢由身。余亦谢明主，今称偃蹇臣。登高览万古，思与广成邻。蹈海宁受赏，还山非问津。西来一摇扇，共拂元规尘。\n",
      "\n",
      "写景 抒怀 无奈 愁苦|鹤鸣楚山静，露白秋江晓。连袂度危桥，萦回出林杪。西岑极远目，毫末皆可了。重叠九疑高，微茫洞庭小。迥穷两仪际，高出万象表。驰景泛颓波，遥风递寒筱。谪居安所习，稍厌从纷扰。生同胥靡遗，寿比彭铿夭。蹇连困颠踣，愚蒙怯幽眇。非令亲爱疏，谁使心神悄。偶兹遁山水，得以观鱼鸟。吾子幸淹留，缓我愁肠绕。\n",
      "\n",
      "纪游 写景 愉悦|落日山水好，漾舟信归风。探奇不觉远，因以缘源穷。遥爱云木秀，初疑路不同。安知清流转，偶与前山通。舍舟理轻策，果然惬所适。老僧四五人，逍遥荫松柏。朝梵林未曙，夜禅山更寂。道心及牧童，世事问樵客。暝宿长林下，焚香卧瑶席。涧芳袭人衣，山月映石壁。再寻畏迷误，明发更登历。笑谢桃源人，花红复来觌。\n",
      "\n",
      "叙事 战争 同情 人民|暮投石壕村，有吏夜捉人。老翁逾墙走，老妇出门看。吏呼一何怒，妇啼一何苦。听妇前致词，三男邺城戍。一男附书至，二男新战死。存者且偷生，死者长已矣。室中更无人，惟有乳下孙。有孙母未去，出入无完裙。老妪力虽衰，请从吏夜归。急应河阳役，犹得备晨炊。夜久语声绝，如闻泣幽咽。天明登前途，独与老翁别。\n",
      "\n",
      "登高 写景 抒情|高标跨苍天，烈风无时休。自非旷士怀，登兹翻百忧。方知象教力，足可追冥搜。仰穿龙蛇窟，始出枝撑幽。七星在北户，河汉声西流。羲和鞭白日，少昊行清秋。秦山忽破碎，泾渭不可求。俯视但一气，焉能辨皇州。回首叫虞舜，苍梧云正愁。惜哉瑶池饮，日晏昆仑丘。黄鹄去不息，哀鸣何所投。君看随阳雁，各有稻粱谋。\n",
      "\n",
      "写景 怀古 组诗|露气寒光集，微阳下楚丘。猿啼洞庭树，人在木兰舟。广泽生明月，苍山夹乱流。云中君不降，竟夕自悲秋。惊鸟去无际，寒蛩鸣我傍。芦洲生早雾，兰隰下微霜。列宿分穷野，空流注大荒。看山候明月，聊自整云装。野风吹蕙带，骤雨滴兰桡。屈宋魂冥寞，江山思寂寥。阴霓侵晚景，海树入回潮。欲折寒芳荐，明神讵可招。\n",
      "\n"
     ]
    }
   ],
   "source": [
    "for line in open(\"tag_poems_v2.txt\", encoding='utf-8').readlines():\n",
    "    line: str\n",
    "    # if ',' not in line:\n",
    "    #     print(line)\n",
    "    # if line.count(',') != 1:\n",
    "    #     print(line)\n",
    "    if len(line) > 150:\n",
    "        print(line)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 80,
   "metadata": {
    "ExecuteTime": {
     "end_time": "2023-07-09T07:47:54.849817300Z",
     "start_time": "2023-07-09T07:47:54.838900900Z"
    },
    "collapsed": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "3767"
      ]
     },
     "execution_count": 80,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "open(\"tag_poems_v2.txt\", encoding='utf-8').read().count('|')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": false
   },
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
