腾讯代理的AI绘画软件到底咋样？我用元宝捏了一天图，有话要说！

说实话，我一直觉得自己跟“画画”这俩字儿八字不合。上学的时候美术课让画静物，人家画的是苹果，我画的那叫“有痣的土豆”。工作以后更别提了，做个PPT想配个应景的图，去素材网搜不是要付费就是要留着水印，求设计部的同事帮忙吧，人家回一句“排期到下周了”，直接把我噎死。

所以我那会儿就在想，啥时候能有个东西，你跟它说人话，它给你出好图？这不，念叨久了，它还真来了。最近这段时间，

腾讯代理的AI绘画软件在圈子里头火得不行，特别是那个“混元”系列，还有各种集成在“元宝”里的功能，简直是咱们这种“手残党”的救星。今儿咱就好生聊聊，我用这几天玩下来的真实感受，不整那些虚头巴脑的参数，就说点咱老百姓听得懂的体己话。

最开始，我其实是抱着“看笑话”的心态去的

为啥这么说呢？因为早些年我也玩过一些AI生成图片的工具，那叫一个智障。你输入“一只猫坐在沙发上”，它能给你生成“一只长了猫头的沙发坐在沙发上”，逻辑完全是鬼扯。更别提那个手了，AI画手那简直就是恐怖片现场，六个指头都是标配，偶尔还能给你整出个“鸡爪风”。

所以我一开始用腾讯元宝里的绘图功能时，压根没抱啥希望。我就随便输了句话：“一个重庆崽儿，坐在路边的板凳上吃小面，脸上流着汗，背景是夏天，要有烟火气。”

咱就是说，这种描述非常“人话”对吧？充满了咱方言的灵动性。结果你猜咋的？

它给我生成了四张图。其中有一张，直接把我看愣了。一个精瘦的小伙子，穿着一件有点发黄的白背心，端着个土碗，额头上的汗珠子清晰可见，背景里虽然模糊但能看出是那种老居民楼下的梯坎儿。那感觉一下子就对了！

那一刻我晓得，这腾讯代理的AI绘画软件，怕是真的开了窍了-2。

后来我才晓得，这背后用的是混元3.0模型，这玩意儿跟以前的AI最大的不同，是它学会“思考”了-8。以前的AI是你说啥它干啥，像个闷头干活不管对错的实习生；现在的它会先“看图”，再“理解”，最后在大脑头规划一下“先改哪里、后改哪里、哪里千万不能动”，然后才下手-2-8。这个就叫啥“思维链”机制，听着玄乎，说白了就是它长脑子了！

最让我这种懒人爽翻天的，是那个“一句话P图”

以前我想把照片里的路人甲抠掉，要么得打开Photoshop学一堆通道蒙版，要么得下个美图秀秀在那慢慢涂，涂不好就像在身上打了个马赛克，看着更窝火。

现在在元宝里，你就直接发号施令就行-9。我这几天玩了个花的，把我家狗子的照片翻出来，输了句：“给我把背景换成故宫，给我狗子穿上龙袍，让它看起来像个微服私访的皇上。”生成之后我笑得捶桌，那狗子的表情本来就拽，配上龙袍和红墙黄瓦，还真有一股“朕很满意”的架势。

而且它不止是粗暴地换背景，连光影和毛发的边缘都处理得顺顺溜溜的，这点确实让我意外-8。后来我看那些技术大牛的解读，说这个模型有足足800亿的总参数，但干活的时候很“抠门”，只激活那最懂行的130亿参数，也就是“好钢用在刀刃上”-2-8。难怪它又聪明跑得又快。

当然，咱也不是光捡好听的说，翻车的时候也不少

有回我想做个复杂的，让它“把一碗牛肉面里的牛肉变多，但面条的数量不能变，还要保持香菜的位置不变”。结果它给我端出来一碗“牛肉开会”——牛肉倒是多了，但面条只剩下两根，香菜直接飞到了碗外面。那一刻我深刻体会到了啥叫“人工智能，人工智障”，它在数数这块儿，跟我那个小学学数学的表弟有得一拼-5。

还有一次刷到新闻，说有个律师大哥用元宝生成拜年海报，结果因为多问了几句，给AI问毛了，生成的海报上直接骂脏话-6。虽然官方解释说这是模型在多轮对话里的异常输出，但我看到那新闻的时候还是笑得不行，心想这AI莫不是也有了“情绪”？这事儿也提醒咱，跟AI交流，有时候还得客气点，毕竟它们现在还在成长期，脾气摸不透。

不过话说回来，腾讯把这些AI绘画功能整合进微信里，确实方便。不用另外下什么乱七八糟的陌生软件，在聊天框里就能使唤它，这种“入口优势”确实是独一份的。像我爸妈那种连输入法都玩不明白的人，现在居然也能在家庭群头发“AI生成”的山水画了，虽然画得确实不咋地，但老人家高兴啊！

写在最后：工具越聪明，我们就越懒？

我在这几天疯狂“捏图”的过程中，其实一直在想一个问题：当P图变得像说话一样简单，我们到底是在创作，还是在“下指令”？

以前费半天劲做一张海报，哪怕做得再丑，发朋友圈的时候心里也美滋滋的，因为那是自己一像素一像素扣出来的。现在倒好，十分钟能出几十张图，看着都挺美，但心里总觉得空落落的，好像少了点啥“人味儿”。

不过转念一想，技术迭代不就是为了把人从繁琐里解放出来吗？就像以前还得自己生火做饭，现在有了电饭煲，我们才有时间去研究更复杂的菜式。当腾讯把AI绘画这个门槛彻底给你砸碎了，我们普通人能做的，可能就是腾出更多精力，去琢磨点更有意思的“指令”，比如“用北宋山水画的感觉，画一张重庆夜景”。

这可能就是咱们这代人的宿命——比的不再是谁手艺好，而是谁想象力更野。你们说，是不是这个理儿？

好了，以上就是我这个“手残党”这几天玩AI绘画的一点碎碎念。我知道在座的各位都是大神，肯定也有不少自己的高见或者翻车经历。来来来，咱们在评论区摆一摆，我有几个问题特别想听听大家的想法：

网友1：“大坪花店老板”提问：
我就是个开花店的，平时想给花拍点好看的照片做宣传，但这摄影技术实在是拿不出手。你说的这玩意儿，能把我那十几块钱一把的满天星，P成那种ins风的高大上感觉吗？会不会P得太假，把花的品种都给我改了？

我的回答：
老板你这问题问到点子上了！我虽然不是开花店的，但我给我家那盆半死不活的绿萝试过。你这种情况，用现在的混元3.0图生图功能正合适。你注意不要用那个“文生图”，也就是不要光靠打字，要用“图生图”-7。你先把你的满天星拍一张，光线稍微好点，然后上传上去，在指令里强调：“保留花的真实形态和品种，把背景换成干净的纯色或原木色，增加一点柔光滤镜，风格要高级简约。”它那个“先思考后干活”的特性这时候就起作用了，它会死死锁定你花的形状，只去动背景和光影-8。我试过改绿萝，改完别人还真以为我是养花高手。不过切记，不要一次性把图里的花数量变多，AI在数数上容易犯晕-5，咱就“原图优化”，效果绝对巴适！

网友2：“观音桥打工人”吐槽：
我看了你写的，但这玩意儿收费不？不会是那种前面免费，后面用一次就要充一个月工资的那种“割韭菜”软件吧？咱打工人赚点钱不容易，要是收费我就不去试了。

我的回答：
哈哈，这位兄弟一看就是经历过社会的“毒打”。你放心，目前腾讯在这块的策略还算“温柔”。不管是混元官网还是元宝App里，基础功能都是免费开放的-9。当然，它肯定有个次数限制，就像你薅羊毛不能逮着一只羊薅秃噜皮了一样。我用了这几天，日常玩玩、做个头像、P个海报啥的，免费额度完全够用。你要是想搞那种商用的大批量、高精度的活儿，可能才会有收费的考量。而且哪怕以后真推付费，参考腾讯这体量，价格应该也不会太离谱。咱就是说，既然现在免费，那还不赶紧去“白嫖”一波，等啥呢？哪怕生成两张图发朋友圈装个文艺青年，那也是赚了啊！

网友3：“沙坪坝码农”提问：
作为一个程序员，我对应用层不感兴趣，但对底层技术很好奇。文中提到的那个“TAG-MoE”到底是什么黑科技？它怎么就能让AI在不同任务里切换得那么自然，不串台呢？求科普。

我的回答：
哎呀，遇到懂行的了！我试着用咱重庆话给你翻译翻译这个“TAG-MoE”。你可以把以前的普通AI想象成一个“万金油”学徒，啥活都干，但干啥啥不精，让他修个钟表，他给你上大锤。而这个TAG-MoE，是中科院和腾讯混元一起搞出来的一个“智能调度中心”-10。它的牛逼之处在于，它不再是“瞎子摸象”了。以前那些所谓的多专家模型，选专家是盲目的，只能根据图像的一小块颜色纹理来决定用谁，根本不晓得整体任务是要“换脸”还是“改背景”，所以经常喊错了人-10。TAG-MoE不一样，它先给你的任务贴上三个标签：“作业范围”（是改局部还是全局）、“任务类型”（是换颜色还是改形状）、“保护要求”（哪里不能动）-10。有了这张“任务说明书”，它再去喊专家，就精准得很。处理人像时喊细节专家，处理风景时喊色彩专家，各干各的绝不打架。这就好比你开了一家火锅店，以前的店长是瞎子，只能摸到啥菜就做啥；现在的店长眼睛雪亮，看到客人点毛肚，他就晓得去喊“火候专家”来烫，看到客人点脑花，就去喊“耐心专家”来慢慢煮。这效率，能不高吗？