在以chat-gpt为首的语言大模型支持下,AI画图有了巨大的进步,从以前画面混乱的笑料料,变成了可以精准理解语义,绘出出以假乱真写实图片的人工智能。

在国产文生图图大模型中,字节跳动开发的豆包AI因为其对提示词理解正确,绘图有逻辑,图片拟真效果好,而且完全免费成为了目前最受欢迎的文生图大模型。

豆包文生图大模型生成实例:

提示词:繁华的纽约夜景,写实风

可以说是近乎完美!

但是中华民族的古诗文因为其极度简练,含义丰富,感情复杂,一词多义,让现有的AI大模型很难理解

我使用目前最强的豆包AI文生图模型测试其对古诗词的画面生成能力

第一回,古代叙事文(《记承天寺夜游》)

提示词:请生成以下古文生成描述的画面“元丰六年十月十二日夜,解衣欲睡,月色入户,欣然起行。”只生成画面。

结果令人大为无语,可以说是彻底崩坏

1.没有理解到提示词说的只生成画面,愣是把古文也添加进画面里了!!

2.更可笑的是居然把文字也生成错了!!

3.图片部分也完全没有体现“解衣欲睡”

4.是还直接把月亮画在屋子里去了!,月色本来指月光,ai却理解成了月亮本身。

5.船只画了半条,细节部分也非常不清晰。

可以说AI完全无法全部观察到简短古诗文中的大量信息,也不知道该如何用非文字的方式表达古诗词。

第二回:古诗词(《蜀道难》)

提示词:请生成以下古文生成描述的画面“蜀道难,难于上青天”只生成画面。

比上回好一些了,但还是很让人无语

1居然还是把古诗词直接加入了画面里,字还是写错了!

2从画面里看不出哪里“难于上青天”,不是有道路吗?

3桥末尾凭空消失了

还是不知道如何用图画去表现古诗词,细节把控也很不到位

第三回抽象古诗文(《茅屋为秋风所破歌》)

提示词:请生成以下古文生成描述的画面“安得广厦千万间,大庇天下寒士俱欢颜”,只生成画面。不要把诗词直接加入图中。

这回表现比较优秀,基本体现了文章大意。

1确实画出了无数亭台楼阁

2暖黄色灯光也表现了温暖

细节把控也很不到位

1桥只画了半边

2屋子直接靠着水

总结

AI在理解白话文上非常出色,对于博大精深的文言文还缺乏理解。

并不会抽象思考,经常画出一些啼笑皆非的画面

对不够精确的正面提示词经常视而不见。

国产AI任重而道远!

免责声明

仅做技术探讨,没有任何主观意见,请不要做过多理解!

测试网址:豆包,自行测试,愿意接受不同意见愿意接受不同意见

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐