五万七千首唐诗:大数据告诉你,谁才是唐代十大诗人

纵横百科 104 0

子曰:一图胜千言。“安安小小姐姐”,一个专注于将生活中见闻感想用数据来展现的原创型自媒体。

有网友在GitHub上分享了《全唐诗》的json文本,号称收录了58000多首唐诗。经去重技术处理后,大约有57300多首。

刚好近日看到一个讨论,讨论唐代的十大诗人。今日的数据,分析这57300多首诗中,谁才是作品数量最多的诗人。

并用这组数据,与《唐诗三百首》作对比,分析出谁才是含金量最高的唐代诗人。

一,《全唐诗》中作品数量最多的十大诗人

经过上千年历史,代代传承下来的《全唐诗》,本身就意味着经典。

《全唐诗》保存的各诗人的作品数量,某种程度上反映了诗人在当时的受欢迎程度。毕竟不太受欢迎的作品,很可能在历史的长河中被淘汰掉了。

五万七千首唐诗:大数据告诉你,谁才是唐代十大诗人

有网友反馈说,看不懂这种图表,在此略做说明。

1,饼图:饼图是所有诗人作品的分布比例,对于比例较低的诗人,统一划归到其他中;

2,方形树地图:对其他中的诗人,按照作品数量的多少绘制成方块,数量越多,方块面积越大,剩下比例更低的诗人划归在剩余不在列表中的。

通过一张图,可以最大限度地展现诗人的分布比例。

从上图中,可以看出,按照《全唐诗》收录作品数量的排名,白居易、杜甫、李白、元稹、刘禹锡、齐巳、贯休、易静、陆龟蒙和李商隐是整个唐代的十大诗人。

易静这位诗人,现存的相关信息非常少,其传世的作品数量在720首左右,算是很高产的诗人。

二,《唐诗三百首》中作品数量最多的十大诗人

在唐诗的多个选辑版本中,《唐诗三百首》是流传最广、知名度最高、受众人群最多的选集。

其收录的各诗人作品数量,更能反映诗人的受欢迎程度,可以算成另一个版本的唐代诗人排名。

五万七千首唐诗:大数据告诉你,谁才是唐代十大诗人

《唐诗三百首》共收录了78位诗人的319首作品,从3700多位诗人中遴选出78位,从57300首唐诗中选出319首,本身就是对诗人的巨大认可,一定程度上代表着唐诗的最高水平。

从图表看,收录作品数量最多的十大诗人,分别是:杜甫、李白、王维、李商隐、孟浩然、韦应物、刘长卿、杜牧、王昌龄和岑参。

按照这个排名,公认的唐代三大诗人之一的白居易,居然没能进入前十名。

三,一种更加合适的对比

取《唐诗三百首》中排名靠前的15位诗人,对比其作品在《全唐诗》和《唐诗三百首》中的比例,可以看出哪位诗人的作品更受欢迎。

五万七千首唐诗:大数据告诉你,谁才是唐代十大诗人

上图中,如果左边比例比右边高,表示其作品更受欢迎,反之则意味着受欢迎程度偏低。

在上榜的15位诗人中,白居易共创作了27%的作品篇数,但只有2.7%的篇数入选了《唐诗三百首》。表明他的作品,在遴选《唐诗三百首》的时代,不是那么受欢迎。

李白和杜甫,基本维持了本人作品在《全唐诗三百首》和《唐诗三百首》中受欢迎的局面。

受欢迎程度最高的是王维,他只创作了15位诗人作品篇数的3.7%,但有13%的作品被选入了《唐诗三百首》。

次之的是李商隐,其比例由5.7%上升到10%。其忧伤的行文风格,还是颇受各时代“为赋新词强说愁”的文艺青年们喜爱。

综合以上来看,唐代的十大诗人应该是:杜甫、李白、王维、李商隐、孟浩然、韦应物、刘长卿、杜牧、王昌龄和岑参。

你对这个排名有何看法?

本文图片和内容均为作者原创,感谢阅读,欢迎关注。

标签: 唐朝英雄排名

抱歉,评论功能暂时关闭!