用AI打造历史故事短剧,新手也能轻松上手!附保姆级教程
我们常常能刷到这样的留言:“以前背课文只当是应付任务,今天刷到这个视频,鼻子竟莫名泛起酸意。” 这正是AI+国学正在实现的魔力:它为那些流传千年的汉字,赋予了具象的画面、鲜活的声音和饱满的情绪,让尘封的故事瞬间走到了我们眼前。
如今,制作这类视频已经有了一套相当成熟的标准化流程,不少创作者都在沿用:
“豆包”负责打磨创作脚本“即梦”负责将文字转化为极具电影质感的画面最后用“剪映”完成剪辑合成
一条完整的短视频就这样诞生了。
在摸透这套流程之前,我自己摸索了很久——工具该怎么选、如何让画面传递出精准情绪、怎样稳定获取流量、又怎么顺利接到商单,这些细节恰恰是拉开创作者差距的关键所在。
直到加入知乎知学堂的「AI漫剧创作营」,我才系统掌握了从提示词撰写到变现渠道拓展的全链路知识。
毕竟是官方正规课程,没有套路,报名入口放在这里:
0基础上手AI漫剧
短视频平台上不少账号,靠这套方法深耕历史人物内容,仅发布60多条视频,就积累了60多万粉丝,几乎每条视频的播放、互动数据都表现亮眼。

下面我就以《愚公移山》为例,拆解整个制作流程——哪怕你是零基础,也能跟着做出一条完整的AI历史短剧。
第一步:用豆包AI生成专业级脚本和分镜
我们无需从零开始构思剧本,善用AI工具就能事半功倍。
核心工具:豆包(AI对话助手)
具体操作:
打开豆包后,给它下达清晰明确的指令。千万别只说“写一个愚公移山的脚本”,那样得到的只会是粗糙的故事梗概,一定要用“爆款视频结构”来引导它创作。
输入关键提示词:
“请以《愚公移山》的故事为蓝本,创作一份适配3分钟短视频的详细分镜头脚本,需包含旁白文案、每个镜头的画面描述(明确景别、视角、运镜方式),以及对应的AI绘画提示词。整体风格要兼具电影质感与史诗感,情感基调厚重且励志。”

优化与调整:豆包生成的第一版脚本往往不够精细,你可以通过继续对话来打磨:“比如,强化第二个镜头(愚公宣布决定)的冲突感,具体描述妻子与儿子反对时的表情和动作;把AI绘画提示词写得更细致,补充光影效果和细节刻画。”
经过几轮优化后,你就能得到类似以下的分镜脚本节选——这便是整个视频的核心骨架:
【开场镜头】旁白:在华北腹地,矗立着两座巍峨大山,它们不仅挡住了愚公一家的出行路,更仿佛阻断了他们的未来。画面提示词(用于即梦AI):航拍视角,连绵险峻的太行、王屋二山,山脚下是渺小如蚁的村落与屋舍,晨雾氤氲缭绕,整体色调偏灰蓝,以此凸显大山的压迫感与人类的渺小。电影质感,8K超清。【核心镜头-愚公宣言】旁白:年近九旬的愚公,召集全家人,做出了一个震惊所有人的决定。画面提示词:中近景,愚公(白发苍苍,脸上皱纹如沟壑般深刻,但眼神却灼灼有神)站在简陋厅堂中,双手激动地比划着。家人围坐一旁,妻子不住摇头叹息,儿子们面露迟疑与疑虑。一束从破窗斜射的阳光打在愚公身上,形成强烈的明暗对比。中国古代农村服饰,真实感皮肤纹理。
第二步:用即梦AI将文字“拍”成电影级画面
有了脚本,下一步就是将文字转化为具象画面。这里我们会用到剪映旗下的即梦AI,它尤其擅长生成这类具备叙事连贯性的画面。
这里要提一句,即梦只是合适的工具之一,想要做出连贯自然的漫剧短剧,仍需要反复琢磨与实践。我刚开始尝试时,生成的画面总是缺乏连贯性,人物形象也经常前后不一,后来系统学习后才发现,从提示词的精准度到参考图的运用,其中都有不少门道。
而知乎知学堂的课程,把这部分内容讲得非常透彻,链接放在这里,有需要的朋友可以了解下:
核心工具:即梦AI(文生图/图生视频)
这一步我们就用「即梦」工具,将豆包生成的文字剧本,逐一转化为极具真实感的画面。
操作起来十分简单:只需将豆包生成的每一段场景描述“画面提示词”,逐一复制粘贴到即梦的输入框中。比如对应开场镜头的“航拍视角,雄伟险峻的大山”,就可以先输入这段提示词。

点击生成后,工具会一次性输出4张图。这时候千万别将就,要像挑选演员一样,仔细选出那张最贴合你预期、愚公表情最精准、构图最具氛围感的画面——毕竟开头、结尾这类关键镜头的画面质感,直接决定了整个视频的水准。

这里分享一个让画面“活”起来的小技巧:对于大山航拍这类重要空镜,可以使用即梦的“首尾帧”功能。具体来说,就是在原提示词后补充画面的起始与结束状态,比如“初始状态为浓雾遮蔽一切,结束状态为浓雾渐散,露出雄伟山形”。这样就能自动生成一段约5秒的动态视频片段,瞬间赋予画面满满的电影感。

此外,如果你想让愚公的形象在整个视频中保持统一,还有个实用技巧:先上传一张你心目中理想的“愚公”参考图,在生成后续场景画面时,让AI以此形象为基准创作,这样愚公出现在不同画面中时,形象就不会前后不一了。

希望这个更流畅、更具指导性的版本能帮到你,如果对特定步骤的表述还有调整需求,我们可以进一步优化。
第三步:用剪映完成最终合成
所有画面生成后,还只是零散的图片或短视频片段,而剪映就是将它们串联起来、打造成一部动人作品的关键工具。
核心工具:剪映(视频剪辑与合成)
在剪映里,真正能让视频“活”起来的关键,是为其配上契合的声音与音乐。你可以先用剪映的“朗读”功能,挑选一个富有故事感的音色,将文案转化为旁白,记得调整语速,让旁白与画面节奏保持同步。接着,到音效库中添加细节音效:比如呼啸的风声、挖土的铿锵声、人们劳作时的喘息声,最后再点缀几声鸟鸣,这些细节音效能瞬间将观众代入场景。背景音乐则可以选择一首有起伏变化的中国风纯音乐,让音乐从开篇的压抑缓慢,逐步过渡到激昂,最终转向开阔明亮,让整个视频的情绪随故事脉络自然流动。完成这些步骤后,一部有画面、有声音、有节奏、有情感的AI版《愚公移山》短剧就正式诞生了。

总而言之,用“豆包-即梦-剪映”这套流程来创作故事类短视频,门槛其实并不高。而其中最难能可贵的,始终是你想要传递的那个核心故事与真挚情感。
希望这套方法,能帮助大家将心中的好故事,转化为可见、可感的精彩视频。

