type
status
date
slug
summary
tags
category
icon
password
URL
January 20, 2023 • 19 min read
by Simon的白日梦, mp.weixin.qq.com • See original
Editor's Note
感谢三项式的采访,和大家聊了很多AI技术以外的内容:如何借助AIGC实现创作者增益+品牌赋能。希望新的一年,大家都能借助AI提高效率和收益,而不是被AI抢走饭碗 (手动狗头)。
《专访100位创作者》 第二期直播
我们邀请到了嘉宾蒙胜宇
和大家畅聊了关于「关于AIGC的一切」
不止是分享技术的发展与应用
AI 与人类如何和谐共处也成为这次直播中
始终在涉及到的话题
这场关乎「现实」与「未来构想」的讨论
让在线的观众都激动不已
Simon Meng(蒙胜宇)
建筑设计、艺术、人工智能及生物学跨领域研究者;奥地利因斯布鲁克大学(UIBK)建筑学在读博士,伦敦大学学院(UCL)建筑学硕士,UCL及UIBK技术课程助教及特邀评图嘉宾;作品曾在伦敦、爱丁堡、威尼斯等多地展出;国家地理中文网、周大福数字藏品合作艺术家。
- 直播回顾要点 -
- AIGC的市场发展?
- 可以用哪些AIGC工具来提升工作效率?
- 由 AI 技术革新衍生出的新兴职业?
- 用 AI 驯服 AI ?用 AI 创造「世界上的另一个我」?
- 品牌方如何应用 AI 技术带来增益?
- 品牌布局元宇宙?(宏大但非遥远的议题)
Open topic:基于AI技术,未来的消费场景是如何?
最近小红书、抖音很火的图片生成动漫头像让AI的应用进入大众视野,chatGPT的刷屏也是让大家更近一步感受到的AI的神奇;不过在此之前,AI的应用似乎只是局限在专业人员之间,大众无法用想象AI可以做什么……
>>>>>>>>>>>>
Q1
AIGC的市场发展?
以前AIGC的不管是对软件还是硬件的要求门槛是比较高的,很难被大众快速掌握,所以基本局限在专业人员之间实验,而且那时候良品率低、质量参差不齐,专业人员去创作作品时都需要耗费不少的时间和精力;随着机器环境上升和技术的进步,AIGC的门槛开始降低,而且良品率和质量都有了显著提升,这两个因素让AIGC慢慢从一个实验状态进入到一个大众可用的状态的这么一个临界点。
Simon Meng,2022
守护海洋生物原住民 X“国家地理中文网”,(AI将美国国家地理摄影师作品与彩色油膜风格混合)
网址来源:
Q2
大众可掌握的AIGC工具**?**
- 文字生成工具
- 图片生成工具
提及目前市场上成熟的可以帮助大家来提高工作效率的AI内容工具,我们先把 AI 区域分成好几块,图片生成,音乐生成,视频生成,3D的资产生成。再复杂一点,可能还包括元宇宙游戏里面的互动行为,角色互动行为的生成。
在这几块里目前最接近成熟的就是对话式文字生成,以及图片生成。
图片生成
目前市场上的图片生成工具大家都知道很多了,如果我们只讨论网页端能使用,那就是 midjourney、Dalle2,还有 stable diffusion(它的网页端叫Dreamstudio)。
但是从我个人来讲,我用的最多的是 stable diffusion,因为它是几个主要的模型中唯一一个完全开源的。于是会有很多个人开发者在开源版本的基础上开发各种衍生版,能够满足你各种各样的需求,你想到的所有功能都会有人做出来,而且你能够在你自己的电脑上完整地去运行它,你可能就不会受限于服务器性能或者服务提供商在license上的一些限制。
- 这里提一下很多人没有注意到的一件事:比如你在 midjourney 生成的图,如果你并非它的付费用户,即便从云服务的协议上说,你也并不拥有这张图的完整版权,而是从midjourney获得了一个必须注明出处的非商用许可(CC BY-NC 4.0),这是很多人可能没有注意到这一点。
Simon Meng,《会呼吸的房子》
文字生成
本来还稍微差一些,但是这个月(12月) chatGPT出现了,确实是应该是用恐怖来形容。不管它编程也好,对答也好,写文章也好,中文英文全部通吃。但是它还有个问题,它现在主要还是运行在云端,而且它模型比较大,据说有千亿参数。这样的模型如果它不能下放到个人端,大家的使用还是会受限于服务提供商。所以从生成的结果来看, chatGPT 应该说是质量是非常够用的,但是从个人对它的掌控和定制化能力来看,可能还稍微差一些。
刚才提到其他方面,音乐、视频、游戏、资产等等都有一定的进展,但是目前来说还没有到一个像图片的文字那样,大众都可以非常简单地参与,得到一个相对满意的结果的这么一个阶段,还是处于半实验的状态。
Q3
由 AI 技术革新衍生出的新兴职业****?****
- Prompt Engineering 引导词工程师
- CAO*(Chief Artificial Intelligence Officer)**首席人工智能官
因为目前市面上的AI工具基本是由我们发出指令后AI工具给出反馈,但其实同一类问题不只有一个回答,所以可能我们提问的方法会没有跳出边界,所以现在还有一种人叫做**「 prompt engineering ——引导词工程师」**,这岗位甚至不去改代码,他就去试着用不同的方法去给 AI 提问。现在 GitHub 上有一个《 awesome-chatgpt-prompts》的项目,大家感兴趣的可以去看看。
因为现在一些大型NLP模型没有开源,人们没有办法从很深的层次去对模型进行解析,所以大家现在跟这些大模型的交互就全部是局限在提问的方法或者对话上面。于是,这个东西也变成一门有研究价值的学问,因为它还没有变成一个自然而然的人们可以轻易去掌握的一个东西。
未来可能会有一个新的公司,里面会出现一个新的的 title 叫做「CAO」 。
我们知道有CEO,COO 这些,CAO —— A for AI,帮助老板去更好地和 AI “对话”的这么一个岗位。性质和上述提及的引导词工程师类似,但是所谓的“对话”应该包括更多维度的和AI的交互,例如AI模型的选型,调参,finetune,交互方式设置等。
人类和 AI 之间现在还是需要有这么样的一个角色去引导,让 AI 更好地为人类来服务。
这些听起来感觉是未来比较有发展前景的一个职业,但是任何一个职业的存在都需要经过一段时间的检验。比如之前之前用文字生成图片的时候,大家也要用很长的引导词去得到一个比较好的结果,但现在大家已经找到了工具—— chatGPT本身就能生成很好的图片描述词。所以这个岗位如果它出现,五六年之后还是稳定存在,可能真的是一个新的职业,但搞不好可能两三年或者甚至一两年又被另一个 AI 淘汰了,那就尚未可知了。
Simon Meng,AI 人工智能生成
被植物重新占据的赛博朋克伦敦,2021
Q4
用 AI 驯服 AI ?
用 AI 创造**「世界上的另一个我」**
- 角色互动行为生成工具
- 复刻世界上的另一个自己
像上文提到,也许未来我们可以用 AI 来驯服 AI (eg:用文字生成工具来让图片生成工具做图),我们是不是可以通过训练大量的 AI 工具来创造出无数个和自己具有一样能力和行为的模型出来帮助自己提升效率呢?
针对这一个问题,我们直播里聊到许多实现的路径,截选其中部分仅供大家讨论:
AI工具中,也有是角色互动行为生成工具的应用,分有两种 —— 一种有个网站叫character.ai ,当这个模型已经具备了对话能力之后,用户可以用比较少的参数量跟样本去对它进行训练,去塑造一个有角色个性的对话式AI。所以在这个网站上你可以跟亚瑟王对话,可以跟外星人对话,可以跟明星对话,可以跟侦探小说家对话等等。它每一个对话 AI 会有不同的人格。
另外一种就是我们现在在元宇宙也好,在开放世界游戏里面也好,本来我们就有很多NPC,其实以前大家会觉得 NPC 就是木偶或者缺乏智能的一个代名词。但是你会发现我们现在如果想在沉浸在里面,除了画面提升以外,你也需要提升里面角色的互动性。所以现在好多游戏开始尝试,甚至可能已经有了 NPC 的互动是由 AI 去驱动。这样的应用并不是遵循一定固定的反应逻辑,而是给他赋予的一个角色或者一个活动范围,他会有一定的自主性。
目前捏脸类工具很多了,但依旧停留在2D或3D的一个呈现。想要利用AI工具来创作人物形象,不管是二维到三维形象的塑造都反而没那么重要,最重要的还是NPC 的”人格”,也就是你与一个虚拟人对话时候的能够感知到他的“情感”和行为模式。
关于「世界上的另一个我」
有这么一个case是通过 AI 工具创造出了已故的亲人,并且可以让这个虚拟人模仿人的语气、性格和他的家人进行对话(出处:我用AI“复活”了外公,是为了与他告别)。但是这仅仅是局限在一些比较小的任务里,如果真的要用 AI 去做人的复制是一个复杂且涉及到大量法律法规的操作。所以你说全盘替换,现在肯定做不到了,但是你在局部的一些任务、情绪上或者某一些小的任务上去替换,是有可能的。
Simon Meng,无垠星空 X 周大福,2022
(AI 根据 NASA 天文望远镜图像生成 5000 个不存在的星空图片及 1500 个星空漫游视频)
Q5
品牌方如何应用 AI 技术带来增益?****
- 利用 AI 技术提升与客户的交流互动
- 用 AI 来辅助运营工作
品牌们可以怎么样去应用 AIGC 的工具?在这个问题的思考上Simon的建议是可以将 AI 的应用介入到跟客户的交互上面。
现在很多牌子喜欢搞共创,比如王者荣耀中经常会有皮肤共创,它就出两款,让你选一款继续往下开发。但是你会发现所谓的共创,大部分不过是给消费者一个很简单的选择权益,并没有真正做到定制化。究其原因,是因为面对千人千面的客户群体,品牌方很难做到提供无限多的高质量的选项,因为每一个选项都是要花很多时间去打造的。
但如果是介入 AI 生成工具,品牌可以将其作为一个非常高效且智能的客服,可以去引导并启发消费者说出自己真正的需求。
消费者很多时候其实也不知道或者没有办法表达自己想要什么,如果加了一个 AI 在中间把这些东西快速地延展或者具象化出来,相信是能够去消除鸿沟的。并且通过提前预设好的资料和反馈机制不断去收集到客户的真实反应,也可以将资料用作改进产品的依据和数据来源。
比如诶,你希望有一个什么样的护肤霜?可能消费者会说我想需要一个保湿一点的,AI 可能再启发一点,保湿一点的话,你希望是水润一点还是干爽一点?就可能就可以引申出很多信息。
于此同时,AI工具的应用也能和运营工作结合。
比如刚才举的游戏皮肤的例子,品牌方是不是可以做一个生成角色皮肤的模型让大家去玩,大家在社区里边分享创作并点赞投票,我们最后就把票数最高的发行出来。生成皮肤的玩家你还可以给他送一套 SSR 皮肤之类的,这样一来就能让运营工作可用的工具变得更加多样。
还有发起二次的创作,因为其实对于很多用户,他们本身可能一本身是不太具备创作的能力,但是通过 AI 工具,他们可以进行一个创作。
Simon Meng,
人工智能生成赛博朋克海底生物进化视频
- 认清元宇宙的根本概念
- 给到品牌方的建议
- 关于元宇宙的搭建
元宇宙的根本概念是什么?是大家越来越多地把本来发生在线下的活动给迁移到线上了。
比如最开始的现在是购物、文字聊天,可能未来很多聚会,包括现在很多会议,包括我们现在的对谈,都迁移在线上了。但这第一步整合我们现在每一个地方的东西是破碎的。比如我们在腾讯会议,或者是在视频号里面聊天,我在另外一个网站看视频,又在另外一个地方打游戏,未来可能需要有个平台把这东西整合起来。
回到品牌,其实蛮难回答的,因为元宇宙结构还没有成型。比如如果现在做品牌营销,首先要考虑的就是要抢占流量。抢占流量要么去线下——即商圈和商业街区的概念;要么是线上——找到各领域的 KOL 做宣传获得对应客流。这样的策略是因为我们知道线下和web2.0的流量在哪里、知道大家的消费习惯是怎样。但是元宇宙现在它统一的平台没有建起来,它整个活动的形态还比较模糊,所以这个问题现在很难回答,因为它的新的社会结构还没有成型。
给到品牌方的建议:
我建议品牌方要保持在这方面的嗅觉,比如当年网购平台的兴起,先入局的人就能赢得自然流量的红利,所以作为品牌来讲,要一直保持嗅觉 —— 比如哪个元宇宙平台能起来?或者哪一种形式会成为主流?比如是区块链游戏的形式,还是 NFT的形式?哪一种形式可能成为元宇宙新的代表?目前还没有一定能够改变游戏玩法的东西,按时可以持续去做一些尝试,去保持这方面的嗅觉。
讨论元宇宙的平台搭建:
目前关于元宇宙没有全球性质的平台存在(但是存在一些已经被广泛承认的底层技术),我们国内现在的各个大厂不管是在资金也好,技术也好,人力层面也好,他们是具备这样的一个条件去发展这样的一个平台的初步条件的。但是从开发到最后跑出来的路径会比较长,要做事情非常多,而且因为是一个比较新的东西,它的发展很可能会不完全遵循原有的一些趋势,但是我们必须时刻关注这个趋势。
关于未来web3平台的成型我们在直播中提到有两个要点:一个是基础设施的搭建,第二个是关于用户的迁移。
(更多关于元宇宙平台搭建的更多讨论,欢迎观看直播回放)
结语
CONCLUSION
AI 技术会不断发展,人类对于科技的想象也不再局限。AI 之于人,是工具,是时代革新的助力。
「AIGC」的发展让内容创作的效率大幅提升,但好内容的「灵魂」依旧是需要注入情感与生活的观察,这一点 AI工具无法代替。
用 Simon 直播中分享的一句话源自《道德经》的话来作为本期的结语:
有术无道止于术
有道无术尚可求
关于 AI 和 AIGC 的相关内容,我们将会持续关注。
更多直播详情
扫码点击视频号主页【直播回放】即可查看
三项式专栏往期回顾
内容统筹:减减
内容编辑:减减
视觉编辑:Bessie & 姗姗
- 作者:Simon阿蒙
- 链接:https://shengyu.me//article/3functions
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章