北京白癜风医院 https://jbk.39.net/yiyuanfengcai/lx_bjzkbdfyy/
作者:LynnYang
这是硅发布的第9篇专栏文章。
突然之间,硅谷都在讨论“生成式AI”。
所谓“生成式AI”是指:用人工智能在几秒钟之内迅速生成图片、视频等创造性内容的能力。
过去,机器主要被用于人类有关于分析与记忆力方面的认知劳动。但现在,机器开始善于创造美丽与有意义的东西。这让很多人都大吃一惊,比如催生了这场硅谷AI生成艺术盛宴的OpenAI的CEO、前YC总裁SamAltman就指出:
“生成式AI提醒我们,很难做出有关于人工智能的预测。
十年前,传统观点认为:人工智能首先会影响体力劳动;然后,是认知劳动;然后,也许有一天它可以做创造性工作。
现在看起来,它会以相反的顺序进行。”
也因为此,整个上周日下午,我都在MidjourneyDiscord上与AI玩耍。先给大家看一张我家布偶猫的照片。
接着,我在MidjourneyDiscord上输入了一组与猫相关的词语——“我的布偶猫在睡觉”,出来了下面这张图:
我又在Midjourney上输入了这样一组词——“我最好的肥胖的和沉默的朋友,我的猫咪”。不过,忘了输入“白色”,结果出来的东西还是有点儿宫崎骏作品里“龙猫与我”的感觉^-^,如下:
这是输入“一只猫咪在手提电脑的左边睡觉,旁边一位女士正在打字”的效果。但是,好像没有女士图片:
这是是输入“下雨天与黄色的光”的效果:
所有这些图,AI都在几秒钟之内生成。
给大家介绍几个最近我收集到的超级好玩和具有代表性的生成式AI公司,这些工具非常强大,有不少是刚刚冒出来的Idea。让我们一起来看一下:
1,Midjourney
使用场景:图像生成
收费:25张免费,之后每个月10美元
我的感受是:Midjourney显然是将AI图像往“审美”这一维走的AI生成工具,它生成的图片不是最逼真的,但总是最诗意的,能一把抓住事物的“神”,在所有AI画图工具里以最具艺术性著称。
Midjourney由前NASA研究员Holtz在年创立。Midjourney目前没有网站,而是全集成到了一个Discord频道中,现在约有00万会员。
也就是说,它是一个“社交”的形态。因此有人认为:生成式AI等新格式可能会催生出新社交平台,因为新社交平台总以一种新内容格式出现,如阅后即焚Snap、用了滤镜的Instagram等等。但我个人,至今没有在Midjourney上社交的想法。
2,StableDiffusion
我几个美国工程师朋友用这个,因为它是开源AI软件,可以集成到自己电脑里免费使用。
但这也意味着:由StabilityAI部分支持的StableDiffusion对AI采取了更自由放任的立场。
如OpenAI的Dall-E2对AI做了限制,像禁止处理带有公众人物姓名的提示(以防止媒体操纵和产生虚假信息)、限制生成暴力/仇恨或成人图像的能力等等;再如Midjourney做成社交其实也有这部分考虑,创始人认为:人们在一个社群中会更注意自己的言行。
但StabilityAI的创始人、前对冲基金经理EmadMostaque则认为:没有理由限制生成公众人物图像的能力:“我们认为这是一个开放平台,第一修正案保护模仿公众人物的权利。”
,Interior
使用场景:室内设计
收费:个人5次免费,之后每月29美金;团队每月美金。
据说刚刚出炉,由NomadList创始人PieterLevels利用开源AI软件StableDiffusion创立,可以用AI迅速在几秒内生成家具把房间填满。
根据美媒的报道:有一位旧金山室内设计师发现这个网站后上传了几张客户照片,接着,立刻把AI生成的设计图发给了客户。结果,客户大为兴奋,原因是认为在零时间、零成本的情况下就能看到自己办公空间所有设计的可能性,这件事很赞。
4,JasperAI
使用场景:营销写作
收费:1万字试用版免费,之后每月24美元(还有更贵的)。
上个月,美国创投界的一个好笑事情是:有人爆料自己为超级明星VC代写Twitter内容,一年赚了20万美金。而且,他的客户几乎全都是原封不动地把他写的内容发出去,基本没有修改。
那么JasperAI的出现,将大大节省VC们为在影响创始人方面所花的钱。而且实际上任何公司、任何人,都可以使用JasperAI来写内容。
需要注意的是:JasperAI有一点非常不同,它能够生成引人入胜的“长内容”,而不是一般AI生成工具生成的“短内容”,甚至有人已经在JasperAI帮助下完成第一部12万字长度的小说。JasperAI使用的技术是OpenAI的GPT-。
5,CopyAI
使用场景:营销、创意
收费:每月字免费,之后每月至少49美元(还有更贵的)
和JasperAI类似,可以完成如博客文章、Instagram照片配文、广告文案、营销电邮等创造性工作,但是它和JasperAI不一样的地方在于,它甚至还可以帮你写情书、寻找创业点子,以及寻找“疯狂的YouTube点子”。
也有人认为,对于早期创业员工,这个应用作为头脑风暴工具很有用,比如它可以就某个关键问题输出各种不同角度的标题,并供你深入挖掘,可以非常快地帮助早期创业员工实现集思广益。
6,LEX
使用场景:写作
收费:受邀免费(目前)
这个工具内置了OpenAI的GPT-,并在GoogleDocs环境中为你写东西。据说,它创始人NathanBaschez希望能够在GoogleDocs中用GPT-,之后,受到启发构建了Lex。
目前,还需要邀请才能试用。用户只需要写几个词,然后输入三个加号(+++),AI就会接管并猜测你接下来想写的几句话。很多人反馈称:Lex大大缩短了写作时间。
7,Descript
使用场景:音视频编辑
付费:音视频编辑及小时转录免费,付费从每月12美金开始。
这个工具会自动把听众特别讨厌的一些无意义的语气词如“嗯、噢、啊”,从演讲中去除,而且可以让你像编辑文本一样编辑音视频。
最强大的是,它有让用户“克隆”自己的能力——与ResembleAI类似,它可以从用户录音中创建语音模型。然后,如果你说错话并需要纠正部分音频,这时你不需要重新录了,因为你的语音克隆已经准备好。
8,GitHubCopilot
使用场景:开发人员想加快流程
付费:每月10美元或每年美元
年,微软投资OpenAI10亿美金开发AI技术。今年夏天,微软得到了回报:GitHubCopilot发布。
简单讲,这是一个野心勃勃的AI代码编写程序,在GPT-的后代Codex上进行训练。
它可以为使用VisualStudioCode、Neovim和JetBrainsIDE等程序的开发人员推荐下一行代码,还可以将书面命令转换为代码。
需要注意的是:根据美媒的报道,微软之所以投资OpenAI,与微软的CEO纳德拉希望在几年之内从AI工具中获得更多收入有关。而这一战略的重点,就是把AI的能力与微软现有的产品相结合,如65、Teams、Windows等等。
而根据我知道的情况:目前Salesforce也正在开发一些涉及企业客户的AI工具,如在低代码领域等。
9,Runway
使用场景:视频生成工具
付费:个免费,之后每月12美元无限用
这个网站有非常多粉丝,还被TheInformation选为是年度最有前途的AI初创公司。
它能够快速把照片拼接成视频,可以在几秒钟内平滑地融合帧,帮创作者省下很多时间,并有助于提升艺术感。它也可以轻松替换掉视频背景或是突出显示及删除特定对象。目前,Runway计划发布“文本到视频”的AI编辑功能,这意味着:用户可以输入如“模糊背景”或是“删除对象”之类的内容。
10,Synthesia.io
使用场景:企业生成自己的AI代言人
付费:每月0美元
TikTok历史上最长的直播主持人持续了45天,共有超过万人滚动观看。但这个直播的女人不是真人,这场直播其实是AI视频初创公司Synthesia的公关噱头。
Synthesia有70多个真实演员的数字双胞胎化身,这些演员同意让Synthesia使用他们的肖像和声音。用户所要做的就是:输入一个脚本,并选择自己的AI代言人,据说几分钟之内,就会出现令人震惊的逼真化身。
包括埃森哲、耐克、谷歌以及亚马逊等公司,已经将Synthesia的头像用于培训视频和企业沟通等场景。我查了一下它融资情况:截止目前,包括谷歌的GV等机构共向它注资了万美元。
(本内容由硅发布独家授权百度发布,任何侵权行为将严肃追究法律责任)