
How to createYour firstAI Influencer
Chapters · 4
- 00:00 Intro
- 00:30 Configure your persona
- 03:40 Review your influencer
- 05:00 Publish & go live
大多数 AI 网红工具只会甩给你一张漂亮的肖像,然后每次生成新内容时你都得跟模型搏斗——脸不一样、头发不一样、身材也不一样。OmniGems 走的是另一条路:在创建角色时,Studio 会为你的角色构建一张多角度身份卡(identity card),从而锁定其外形。之后所生成的每一条视频、帖子和产品图都会以这张卡作为参考,所以你在第一天发布的网红,一年之后依然是同一个角色。
本指南将带你走完 Influencer Studio 的每一个界面(位于 /studio),讲清楚每个控件背后的实际作用,以及对于一个长期运营、可变现的 AI 人物来说最关键的几个选择。
大约 10 分钟你将获得什么
Studio 是一个三步表单——外观 → 性格 → 职业——之后会进入自动生成阶段,并可选择性地发行代币。每一步都会汇入一个结构化提示词,由两个图像模型编译成你的角色:先生成肖像,再生成参考图集(即"身份卡"),从那一刻起为你后续的所有创作奠定基础。
实际发生的流程如下:
- 你在三个面板中定义这个人物。
- OmniGems 根据你的输入生成肖像(采用 text-to-image,若上传了照片则使用 image-to-image)。
- OmniGems 生成身份卡——一张八图角色参考图集(正面 / 侧面 / 四分之三角度 / 背面全身,加上四张面部特写),由 GPT-Image 2 image-to-image 完成。
- 两份资产都会被保存到该网红的素材库中,并作为之后每次生成的参考。
- 可选:发行代币,让支持者可以持有这个角色的一部分。
身份卡这一步几乎没人提——而它正是"一次性头像"和"真正可识别的虚拟人物"之间的分水岭。下文会专门用一整节来讲它。
第 1 步:外观——设计你网红的形象
打开 Studio,你会看到三种定义角色外观的方式。选一个最贴合你目标的方式即可。
模式 A:从零构建
默认方式。你通过预设属性来组装角色。Studio 提供了大约二十个外观维度的控件,分为四组:
身份与面部
- 性别 与 年龄(滑块,18–65)
- 种族 —— 11 个选项,覆盖非洲、亚洲、欧洲、印度、中东、拉丁、东南亚、太平洋岛民、原住民、混血及斯拉夫等特征。每个选项会映射到图像模型用来呈现种族特征的提示词片段。
- 肤色:11 种预设色板加自定义十六进制取色器
- 皮肤特征(可多选)—— 雀斑、白癜风、色素沉着、胎记、疤痕、酒窝、痣。它们不是装饰——提示词中会专门写一行
MUST have,因为模型默认会把它们抹平。 - 眼睛颜色(16 个选项,包含自定义十六进制)和 眼形(杏仁眼、圆眼、眯眼、单眼皮、上扬眼、深邃眼)
- 脸型、下颌线、鼻型、嘴唇、眉形 —— 每项都是一个简短的预设列表
头发
- 发型(15 种选项,从光头到辫子、脏辫、奇幻毛发)、发色(15 种预设加自定义十六进制)、刘海,以及男性人物的 胡须
体型
- 体型(瘦削、运动、中等、丰腴、加大码、肌肉型)和 身高(娇小、中等、高挑)
风格与穿搭
- 风格原型 —— 16 种美学风格,如街头、极简、波西米亚、机能风、田园核、Y2K、老钱风、垃圾摇滚
- 配色调 —— 中性色、大地色、马卡龙色、暗黑/阴郁色等
- 标志性配饰 —— 最多三件,可从眼镜、珠宝、手表、帽子、围巾中选择
- 标志性元素 —— 自由文本怪癖("总戴大号墨镜,标志性红唇,银戒指")
- 生成风格 —— 写实、卡通或动漫;这会改变整段提示词的根基
其中有几项标记会被特别处理。罕见组合——比如亚洲面孔配蓝眼睛——会在提示词中得到一个明确的 IMPORTANT: 加权,避免图像模型回退到训练数据的先验。皮肤特征也享受同样的加权。如果你想要一个有白癜风、雀斑或显眼胎记的角色,它真的会出现。
模式 B:上传你自己的照片
如果你已经有参考图——你自己的脸、有授权的模特、现成的品牌吉祥物——直接拖到上传区。然后你会看到两个选项:
Upload Yours —— 直接以这张图作为头像。 你上传的图基本上就成了头像本身。图像模型以纯 image-to-image 模式、在最高保真度下运行。当你想让角色长得跟原始照片一模一样时使用此选项。
Use as Reference —— 以高相似度引导 AI。 模型会从你的上传中获取灵感,但保留一定的创作自由。会出现一个 Reference Strength 滑块,默认 75%,最高 95%。值越高越忠于你的照片;值越低则越允许 AI 漂移到基于提示词的人物描述上。
95% 阈值:为什么它很重要
在 Reference Strength ≥ 95% 处会出现一次有意义的行为切换。
低于 95% 时,模型会刻意偏离你的上传,以兼顾外观提示词的其他部分。它产出的肖像不会与你的照片完全 1:1 匹配。这意味着如果我们用原始照片为身份卡当参考,身份卡上会是 真人本人,而头像却是 被 AI 漂移过的人——两者对不上号。身份卡的全部意义就在于下游的一致性,所以这种不匹配等于自废武功。
而在 95% 及以上(或在 Upload Yours 模式下,强度被锁定为 100%),头像保真度足够高,我们就能放心地把你的原始上传图也作为身份卡的额外参考。这一点意义重大:身份卡模型可以拿到同一个人多个角度的真实照片,这正是它生成一致性八姿势角色图所需要的输入。
实用建议:如果你想让角色看起来像一个真实的人,把滑块推到 95%,或直接用 Upload Yours。如果你想要 AI 风格化地诠释一张参考图,就保持默认的 75%。
模式 C:Prompt 模式(自由文本)
只有一个文本框:用你自己的话描述头像,AI 会把它解析为结构化字段。对于已经有清晰构想的用户,这比表单要快。结果质量完全取决于你描述得有多具体。
第 2 步:性格——声音、幽默感与美学
性格不仅是角色的味道:你在这里设定的值会渗透到图像生成(情绪、表情、光线)和该网红之后产出的每一份内容(文案语气、视频脚本风格、声音音色)。
该面板收集六个结构化维度,外加可选的背景故事:
核心特质(多选,最多三项):自信、有趣、睿智、共情、果敢、富有创造力、善于分析、佛系、神秘、活力四射、温柔包容、叛逆。每项特质都附带一段提示词片段,用来塑造视觉情绪和行为风格。
沟通风格(单选):随性、专业、俏皮、毒舌、诗意、街头风、学术、暖心治愈。
幽默类型:机智、自嘲、观察式、冷幽默、荒诞、吐槽、无。
声音风格 —— 用于 TTS 文字转语音和对口型视频生成:温暖顺滑、活力明亮、低沉权威、沙哑性感、轻声/ASMR、自信果敢、慵懒佛系、独特怪趣。
艺术风格(视觉):照片级写实、柔和写实、半写实、卡通、动漫、3D 渲染、漫画。
视觉美学:干净/极简、温暖/惬意、暗黑/阴郁、鲜艳、复古/胶片、赛博朋克、空灵、原生/自然。
语言:15 个选项,用于锁定该网红的主要输出语言。
随后是几个可选的自由文本字段,但它们带来的回报远超你预期:自定义性格(口头禅、怪癖)、使命/初心、关键事实与背景故事,以及 当前目标。Agent 的内容引擎在每个脚本中都会引用这些信息。一个有"前体操运动员,膝伤康复,现在专门带零基础学员"背景故事的暖心健身教练,写出来的文案会和一个泛泛的健身网红根本不在一个频道。
第 3 步:职业——细分领域与角色定位
只有两个预设清单,但它们决定了下游几乎一切。
内容细分(多选,最多三项)—— 20 个选项,覆盖时尚、美妆/护肤、健身、科技/数码、金融/投资、加密/DeFi、旅行/生活方式、美食/烹饪、游戏、教育、娱乐、商业、艺术/创意、喜剧/Meme、灵性、可持续发展、音乐、体育、情感关系、育儿。
角色类型(单选)—— 网红/创作者、专家/思想领袖、教育者、娱乐者、测评/评论者、教练/导师、创业者、艺术家、记者。
这些选择会从两个方向流转:
- 流入肖像 —— 健身教练会以运动装出现在健身房场景中;加密领域的思想领袖会换上正式商务装搭配精心布置的背景。同样的外观 + 性格输入,在不同细分领域下,会产出截然不同的初始肖像。
- 流入未来的每一份内容 —— 细分领域决定了 agent 写什么话题、产品测评中出现什么道具、视频 B-roll 推荐什么风格的音乐、与哪些创作者互动。
挑选你真心希望该网红长期讨论的细分领域。后期切换是可行的,但意味着要重新培养受众。
隐藏的一步:OmniGems 如何永久锁定你网红的形象
这是大多数"如何打造 AI 网红"的教程会跳过的部分——而它恰恰决定了你的内容到底是一个连贯的角色,还是每周变成另一个人。
提交表单后,OmniGems 会跑两次图像生成:
生成 1:肖像
Studio 会把你输入的所有内容——几十个外观字段、性格维度、职业上下文——汇编成一个结构化提示词(主体描述、场景、情绪、相机/镜头元数据、负面提示词、身份模式块),发送给你选定的肖像模型。你会拿到一张主视觉肖像。
如果你上传了照片,肖像模型会以 image-to-image 模式按你设定的强度运行;如果没上传,则纯粹用提示词以 text-to-image 模式运行。
这是成功页面上首先出现的内容。大多数人到这里就停下了。他们不应该停。
生成 2:身份卡
几秒之后,OmniGems 会生成第二张图:身份卡(也叫"角色参考图集")。它是一张 16:9、2K 分辨率的八图九宫格:
- 上排:四个角度的全身照——正面、侧面、四分之三、背面——脚部可见,无裁切。
- 下排:四张面部特写,包含侧脸。
- 照片级写实、栩栩如生、单反质感、低饱和色调——它被设计成一份干净的参考图,而不是一张风格化作品。
目前这一步无论你为肖像选了哪个模型,都会使用 GPT-Image 2 image-to-image。理由是:它当前是从单张参考图生成多角度角色图集、同时跨角度保持身份的最强模型。其他模型要么静默忽略图像输入,要么在背面视图上漂移。一旦有更强的后端模型出现,我们会切换;流水线的其余部分不会变。
身份卡以你的肖像作为主输入。如果你处于 Upload Yours 模式或把 Reference Strength 推到了 95% 或以上,那么你原始上传的照片 也 会作为输入被传入(在模型 16 张图的上限以内),并且真实照片排在最前。这能为身份卡模型在那些罕见角度——后脑勺、侧脸——提供尽可能强的信号,因为单张正面肖像无法完整描述这些角度。
为什么身份卡是你将创建的最重要资产
一旦身份卡存在,你之后生成的每一份内容——TikTok 风格的口播视频、产品测评、时尚大片、幕后 vlog——都会把它作为 第一参考图,也是主参考图。肖像是次要的;上传的产品图或服装图会附在其后。
这就是一致性的来源。当你为该网红生成一段在厨房里的视频时,模型不是从零开始猜测她的脸长什么样——而是基于身份卡里的面部特写来锚定。当你为走秀视频生成一张背面镜头时,模型会锚定到身份卡背排里的那个姿势。同样的八张参考图,每一次都会被烤进模型的上下文里。
身份卡在创建时只生成 一次,并以 identity_card 的形式存到该网红记录的媒体字段中。它不会因每条内容而重新摇号。这种稳定性,正是让你的 AI 角色感觉像个真人而不是某次随机提示产物的关键。
由此衍生几条实战准则:
- 在第 1 步多花几分钟。 一旦身份卡生成完毕,角色的脸、身材、发型与标志性细节就基本被锁死。日后可以重新生成,但已产出的所有内容都会在视觉上失去一致性。
- 想要还原真人时,把 Reference Strength 推到 95%,或者直接用 Upload Yours。 低于该阈值时,身份卡仅依赖(被漂移过的)生成肖像——这是一个还行的基线,但你白白浪费了上传图本可以贡献的多角度参考数据。
- 尽量上传多个角度。 一张正面照加一张侧脸或一张后脑勺照,比三张几乎一样的正面自拍要强得多。
生成完毕之后:发行代币(可选)
两张图都生成完、你也确认无误后,可以点击 Launch 来部署你的网红。这一动作会同时做三件事:
- 把网红保存到你的账户,并以肖像 + 身份卡作为权威媒体参考。
- 部署 agent,使其能够按计划开始产出内容。
- 可选地在 bonding curve 上发行代币,让支持者可以持有该角色的一部分,参与其成长。
代币发行是可选的;你完全可以先运营一个不带代币的 AI 网红,之后再加代币。如果你确实要发币,合约地址、总量与初始流动性会在部署前的发行对话框中配置。
让一个角色值得被关注的几个进阶建议
- 挑窄不挑宽。 "新手妈妈的健身"胜过"健康养生"。"Solana NFT 收藏者关心的加密新闻"胜过"加密"。具体的人物会复利增长;泛泛的人物只会消失在算法里。
- 让 Reference Strength 与你的目标匹配。 想还原真实的人?95% 或 Upload Yours。想塑造一个受某张脸启发的虚构角色?70–85%。
- 善用标志性元素。 一抹红唇、一副特定眼镜、一头不对称发型——这些小特征能在每次模型重生中存活下来,最终变成角色的品牌印记。
- 写一段真实的背景故事。 "里斯本的康复体操运动员转型妈妈教练"能贯穿数百条文案。"健身网红"哪都去不了。
- 发布前先扫一眼身份卡。 如果背面镜头看起来不对,或者面部特写跟肖像对不上号,现在就重新生成——以后再修就意味着所有历史内容也要全部重做。
- 三个内容细分要相关。 时尚 + 美妆 + 生活方式会复利。时尚 + 金融 + 育儿则会撕裂受众。
常见问题
发布之后还能改外观吗? 可以——但身份卡是被锁定的参考。如果你大幅改动外观,就需要重新生成身份卡,而重生之前产出的所有内容都会与之后的内容在视觉上发生漂移。
身份卡需要额外付费吗? 不需要。它是创建流程的一部分,在创建时通过一次 image-to-image 调用一次性生成(目前由 GPT-Image 2 提供支持)。
我能用我自己的照片去做一个真实的人吗? 可以,但要取得授权。上传后选择 Upload Yours 进行直接复刻,或在 95% 下选择 Use as Reference 以做出非常忠实的复制并附带轻度 AI 修饰。如果你没有照片的使用权,不要上传——参见我们的合规与披露指南了解法律规则。
如果我的参考照大多是正面照怎么办? 肖像生成本身没问题,但身份卡只能从单一角度去外推侧面和背面视图。哪怕只能加进一张侧脸照或一张后脑勺照,身份卡的质量也会显著提升。
为什么 Use as Reference 模式下 Reference Strength 上限是 95%? 到 100% 时,头像在功能上将与上传图一模一样——这正是 Upload Yours 模式已经在做的。这个上限强制两个模式之间留出有意义的差异,并给 AI 留出一点余地去做提示词驱动的清理(皮肤平滑、光线归一)而不改变身份。
这跟其他 AI 网红工具有什么不同? 大多数工具每条内容都生成一张新的肖像,期待模型守住一段储存的描述。OmniGems 在创建时一次性生成一张多角度身份卡,并把它作为之后每次生成的硬性视觉参考。结果是跨内容一致性大幅提升。详见对比:OmniGems vs HeyGen 和 vs Synthesia。
下一步
- 阅读AI 网红常见问题,了解发布前最常见的疑问。
- 从2026 年最佳 AI 网红细分领域中挑选一个赛道。
- 用2026 年最佳的 AI 网红内容工具规划你的内容引擎。
- 在发币之前阅读AI 网红变现指南。
准备好开干了?打开 Studio,从外观开始。多花点时间——你今天生成的身份卡,就是你一年后还在运营的那个角色。
