
在 AI 图像生成领域,从"能画"到"画得好",再到"画得惊艳",技术迭代的速度远超想象。7 月 10 日,快手发布了最新的图像生成模型 Kolors 2.1(暂时仍未开放 API 接口)。在对新版本进行接入测试前,让我们回顾下 2025 年 4 月推出的 Kling V2.0 模型,看看 90 天前发布的上一代模型,在当下是否依然能与各个顶级模型具有一战之力。

kling 2.0 的主要特色和亮点在于:
-
超高写实度与细节表现力: 这是 kling 2.0 最突出的特点。它生成的图像在光影、材质、纹理等方面极为逼真,尤其在人像生成上,能达到照片级质量,毛发、皮肤纹理、眼神等细节处理精湛,几乎可以以假乱真。
-
亚洲人像与中国特色优化: 针对亚洲人种的面部特征、肤色、发型以及中国传统文化元素(如服饰、建筑、山水、水墨画等)进行了深度优化和偏好性训练,使其生成效果更符合东方审美,避免了西方模型在生成亚洲人像时可能出现的刻板印象或不自然问题。
-
强大的语义理解与控制能力: 能够精准理解用户输入的复杂文本描述,并将其转化为视觉内容。同时,它在图像生成过程中提供了更精细的控制能力,用户可以更好地引导图像的风格、构图、主体姿态等。
-
风格多样性与泛化能力: 不仅限于写实风格,也能生成动漫、插画、概念艺术等多种艺术风格的图像,且在不同场景和主题下表现出良好的泛化能力。
302.AI 团队已接入 kling V2.0 模型,我们今天就用上一代模型与最新版本的主流竞品进行实测,一探究竟。
I. 实测模型基本信息
本次选取以下 3 个模型进行实测对比:
Kling V2.0,Doubao General V3.0,Midjourney V7
(备注:Midjourney 在绘画机器人和 API 中一次输入,会输出 4 张图片)
测评方法:使用英文提示词,取第一次生成结果。
Ⅱ. 测评案例
【文生图】
1. 人物写实
提示词:A close-up beauty photo taken by a cover magazine shows the model's skin shining brightly and she is wearing shiny jewelry. She looked straight into the camera with a mysterious expression. The picture was enveloped in soft, diffused light, emitting an ethereal glow. Her hair is smooth and wavy, with an overall blend of modernity and noble texture
(为封面杂志拍摄的一张特写美颜照,女模特的皮肤闪闪发光,身上戴着闪亮的珠宝首饰。她带着一种神秘的表情直视着镜头,画面笼罩在柔和的、漫射的光线中,散发出一种空灵的光芒。她的头发呈光滑的波浪状,整体现代和高贵质感融合)
生成效果:

对比分析:

测评点 | Kling V2.0 | Doubao General V3.0 | Midjourney V7 |
---|---|---|---|
皮肤真实度 | ★★★★★ | ★★★★ | ★★★★★ |
表情情绪 | ★★★★★ | ★★★ | ★★★★☆ |
光影氛围 | ★★★★★ | ★★★ | ★★★★ |
简评:Kling V2.0 胜。 在未定义模特人种,年龄的情况下,Midjourney 默认生成了黑人女性,国产模型则都默认生成亚洲女性,算是模型的天然偏好。Kling V2.0 的人物皮肤在高光下保留了细微的毛孔与细纹,模特的"神秘"感除了眼神外,侧头倚肩的动作,光影的表达也都是加分项。
2. 场景生成
提示词:The courtyard after the rain, the sky is grey and the air is filled with a fresh scent. Scene: The rose bushes, nourished by the rain, are even more vivid. Water droplets hang on the petals, and the vines cover the fence. There is water on the ground reflecting the flowers. Style: Realistic, with a fresh atmosphere. Shot: Medium shot, focusing on the rose bushes. The background is blurred but the details are clear. Light effect:The soft scattered light shines through the clouds, the water drops reflect the glimmering light, and the standing water reflects the color art style of the flowers: the combination of naturalism and modern digital art, the picture is fresh and real
(雨后的庭院,天空灰蒙蒙的,空气中弥漫着清新的气息。场景:蔷薇花丛在雨水的滋润下更加鲜艳,花瓣上挂着水珠,藤蔓爬满篱笆,地面上有积水倒映着花朵。画风:写实主义,带有清新氛围。镜头:中景,聚焦蔷薇花丛,背景虚化但细节清晰。光效:柔和的散射光透过云层洒下,水珠反射出微光,积水倒映出花朵的色彩。艺术风格:自然主义与现代数字艺术的结合,画面清新而真实)
生成效果:

对比分析:
测评点 | Kling V2.0 | Doubao General V3.0 | Midjourney V7 |
---|---|---|---|
花朵表现 | ★★ | ★★★★ | ★★★ |
积水倒影表现 | ★★★★ | ★★★★ | ★★★★ |
背景虚化表现 | ★★ | ★★★★ | ★★★★ |
简评:Doubao 表现最佳。 花朵鲜艳,花瓣上挂着水珠,篱笆上的藤蔓,积水倒影,天空灰蒙均准确生成。构图合理,景深虚化自然,花朵的主体能够很好吸引观众视线,相较之下MJ的构图明显空洞。Kling V2.0 存在着虚化生硬,花朵塑料感强等问题。
3. 绘画风格
提示词:Ink wash painting style, A Chinese wandering xia dressed in flowing traditional robes, holding a sword with grace, standing on the edge of a misty mountain peak during dawn. The scene is painted with delicate brush strokes and soft ink transitions, with swirling clouds and distant mountains subtly depicted in the background. The flowing robe and sword reflect the values of righteousness and loyalty. Soft lighting, atmospheric perspective, ink splash effects, traditional Chinese painting aesthetics, Dynamic Flow, Ultra Detailed, Masterpiece, Watercolor Wash Effects, High Quality Ink Rendering.
(水墨画风格,一名身穿飘逸传统长袍的中国侠客,手持宝剑,站在黎明时分雾气缭绕的山巅。场景以细致的笔触和柔和的墨色过渡绘制,背景中悠远的山峦和云雾若隐若现。侠客的长袍与宝剑体现出正义与忠诚的精神。柔和灯光,氛围透视效果,溅墨效果,传统中国画美学,动态流动感,超精细,杰作,水彩晕染效果,高质量墨渲染。)
生成效果:

对比分析:
测评点 | Kling V2.0 | Doubao General V3.0 | Midjourney V7 |
---|---|---|---|
人物形象 | ★★★ | ★★★ | ★★★★ |
黎明雾气氛围 | ★★★★ | ★★★★ | ★★★ |
墨色层次 | ★★★ | ★★ | ★★★★ |
溅墨效果 | ★★ | ★★★ | ★★ |
简评:Midjourney 美感最佳,人物,山体,云雾的水墨笔触风格一致,整体感强。无论人物细节的笔触还是背景的浓墨晕染,都表达得写意而自然,极具东方美感。缺点在于没有明确的"黎明时分"体现以及溅墨效果,瑕不掩瑜。
【图生图】
1. 参考角色产品设计
提示词:Based on the uploaded trendy figurine characters, design a high-end limited edition packaging box. The packaging should adopt a combination of geometric structures and irregular cuts, with a double-layer material on the surface: the outer layer is a semi-transparent matte material, and the inner layer is a reflective metal material, creating a sense of depth and shade. The surface of the packaging should be printed with pattern elements related to the figurine character, and a local UV coating process should be used to highlight the key visual elements.
(基于上传的潮玩手办角色,设计一款高端限定版包装盒。包装应采用几何结构与不规则切面的组合,表面使用双层材质:外层为半透明磨砂材质,内层为反光金属材质,创造出深浅层次。包装表面应印有与手办角色相关的图案元素,使用局部UV上光工艺突出关键视觉。)

生成效果:

对比分析:
测评点 | Kling V2.0 | Doubao General V3.0 | Midjourney V7 |
---|---|---|---|
角色一致性 | ★★ | ★★★★ | ★ |
包装盒设计创意性 | ★★ | ★★★ | ★ |
提示词理解 | ★★ | ★★★★ | ★ |
简评:Doubao 表现最佳。 Doubao 生成的包装盒基本符合提示词要求:几何结构,金属感,透明包装礼盒,且保持了角色的一致性,缺点在于包装盒比例与玩偶并不写实。
2. 修改文字及场景
提示词:Please change "good morning" on the cup to "lucky day 幸运日", and then add a light rainbow above the cup. Flowers of different colors will grow on the grass of the original cup.
(请将杯子上的"good morning"改成"lucky day 幸运日",然后在杯子上方加一道浅浅的彩虹,原本杯子的草地上长出不同颜色的花。)

生成效果:

对比分析:
测评点 | Kling V2.0 | Doubao General V3.0 | Midjourney V7 |
---|---|---|---|
文字生成准确性 | ★★★ | ★★★★★ | ★ |
提示词遵循准确性 | ★★★★★ | ★★★★★ | ★★★☆ |
整体美感 | ★★★★ | ★★★ | ★★★★ |
简评:Doubao 综合表现最佳。 主体一致性和文字生成准确性上 Doubao 无疑轻松取胜,但在整体美观度上(前景的花朵,浅浅的彩虹),Mj无疑还是维持着自己美学天花板的地位。
3. 风格转换
提示词:Please convert the picture to a realistic style.
(请将图片转换成写实风)

生成效果:

对比分析:
测评点 | Kling V2.0 | Doubao General V3.0 | Midjourney V7 |
---|---|---|---|
风格转换准确性 | ★★★★★ | ★★★★ | ★★ |
场景一致性 | ★★★ | ★★★★ | ★ |
整体美感 | ★★★★★ | ★★★★ | ★★ |
简评:Kling 胜。 在场景一致性上,Doubao 依旧遥遥领先,船上人物的位置,船帆的细节都一比一保持一致。但从整体美感上,晚霞或朝霞时分的天空,映红了海面,远处洁白的冰山,鲜艳的船帆,这些美学要素 Kling 进行了足够出色的还原
Ⅲ. 测评结果

经过本次对比实测,即便距离发布已过去3个月的时间,Kling V2.0 无疑展现了其仍可作为一线 AI 图像模型的实力与美学底蕴。在绝大多数测试案例中,它都能带来出色的视觉效果,尤其在人物塑造上,能够精准捕捉人像肤色的质感与细腻情感,使得图像在复杂光影下显得自然生动。这种对细节的精妙把控,以及对用户指令的深刻理解,使其具有能够在多样化的应用场景中,生成商用级视觉作品的能力。
当然,Kling V2.0 也存在着明显的硬伤。其中,角色一致性是其当前面临的主要挑战 ,同一角色在不同任务或连续画面中的形象难以保持高度统一。此外,模型的文字生成能力也有待加强,尤其是在处理结构复杂的中英文时,其完整性与准确性尚需进一步优化。
综合来看,Kling V2.0 在发布了 90 天后,仍是一款优点突出,与当下各家最新版本竞品具有竞争力的模型。随着其迭代版本 Kolors 2.1 图片生成模型的发布,我们有理由相信,它的整体质量将迎来新的突破,进一步拓宽AI影像创作的边界。
