https://github.com/tangly1024/NotionNext
参考别人的网站: https://hrefgo.com/chatgpt/
GPT-SoVITS:只需要5秒语音就能模仿你,1分钟数据就能生成TTS模型克隆你的声音! https://new.qq.com/rain/a/20240120A011ZE00
http://stock.10jqka.com.cn/20231205/c652848493.shtml
不久前,视觉中国官宣了与华为云的合作,双方将以华为云盘古大模型为基础打造视觉大模型,加速人工智能在互联网行业的创新应用,为不断拓展无限创意的内容产业未来开辟新的前景。
近日,视觉中国总裁柴继军受邀出席“2023数智科技沙龙”,并从AIGC时代内容产业的机遇与挑战、视觉大模型的应用落地角度,发表了题为“推动视觉大模型落地 加速人工智能创新应用”的主旨演讲。
柴继军表示,在内容产业里,从PGC(专业生成内容)到UGC(用户生成内容)到AIGC(人工智能生成内容)的趋势,目前来看是不容逆转的。据预测,在未来五年,全世界的内容可能有10%-30%为AI生成或AI辅助生成,据此估算其市场规模可能超过600亿。
https://news.sina.com.cn/shangxunfushen/2024-02-08/detail-inahhxhk7207516.shtml
万兴科技还与燧原科技等算力行业领先者、湘江实验室等科研机构达成合作
在文本生成视频之外,万兴“天幕”还拓展了视频生成视频能力,创作出《百变girl》;AI扩图能力升级,创作出《名画秘境》;AI歌手翻唱,15秒即能生成一个可以超逼真自然的定制AI歌手……
万兴“天幕”的全面赋能之下,每个人都能成为自己的“导演”。
万兴“天幕”一定程度降低了多媒体创意内容生产的门槛,提高了效率,还通过在跨境电商、办公、教育等场景的应用,探索着重塑传统多媒体创意内容生产模式的路径。
比如,视频剪辑软件Wondershare Filmora 13全新版本利用天幕大模型能力落地了AI Copilot智能剪辑助手、AI文字快剪、AIGC音乐生成等备受海外用户好评的功能,从去年8月份至12月底,使用AI功能的用户数增加了243%。
再比如,为解决出海企业营销痛点,万兴播爆通过万兴“天幕”大模型数字人能力的应用,使AIGC更好地服务于出海视频创作者,去年1月至今年1月,该应用月活数实现了超700%的增长。
本次万兴“天幕”的发布,除了应用的能力有了升级之外,还有合作方面的升级。在会上,万兴科技与马投算力、华为云达成三方算力合作,并与中广天择达成大模型算料合作,在底层的算力、算据等方面都做了夯实加码。
再往前,万兴科技还与燧原科技等算力行业领先者、湘江实验室等科研机构达成合作。
很显然,万兴科技正在搭建起了一个以“天幕”为中心的多媒体大模型应用生态架构,包含底层的算据算力支撑,应用场景的落地,及更针对领域的影响辐射。比如其研发中心所落地的马栏山视频文创产业园即是中国音视频领域的桥头堡,湖南卫视、芒果TV等等都在园区内,被称之为“中国v谷”,势必可衍生出系列的合作机会。
鸣响首枪的为什么是“天幕”?
4个多月时间的进化,进化的是能力、是生态搭建,更是定位和价值。“天幕”用“音视频多媒体创作垂类大模型”,回答了“百模大战”下,究竟会打造成一个怎样的大模型。
李彦宏在去年年末举行的“WAVE SUMMIT+深度学习开发者大会2023”上提到,一定要去卷AI原生应用,只有依附于应用的模型才有价值,“在AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”
周鸿祎、王小川等大佬也持同样的观点,在不同场合不约而同地强调,应用才是AI的沃土。
于是,我们可以看到,字节跳动推出“豆包”“小悟空”等,侧重搜索与视频编辑;腾讯推出“小琴”“未伴”“AI一起听”等,侧重社交与音乐;京东推出“京言”等、阿里巴巴推出“淘宝问问”等,双双侧重电商购物;百度更为彻底,旗下产品全部重塑,此外还推出了“百度GBI”“云一朵”等AI原生应用……
上述案例多为以文本、语义理解以及图绘为主的通用大模型在具体场景的落地,我们可以将其视为大模型落地的1.0阶段。
而现在,伴随大模型向垂类场景发展,大模型落地进入到2.0阶段,生成内容也从文本进化到音视频多媒体。与文本生成为主的大模型相比,多媒体大模型的主要难度在于,音视频内容的组成元素更多,内容结构和层级也更加复杂。
即便只是一段几十秒,甚至只有几秒的视频,也要包括动画、字幕、音乐、特效、转场、封面、画中画等几十种元素。
视频制作需内容构思、资源获取、生成、编解码等,链路与技术门槛高视频制作需内容构思、资源获取、生成、编解码等,链路与技术门槛高 虽然不少厂商在多媒体赛道也有发力与探索,部分多媒体大模型也具备了一定的优质音视频生产能力,但在生成内容的长度、一致性,画面内容的质量与算力成本的平衡,生成式可控性等方面还是存在尚未解决的挑战,因而一直未能迈出商业落地的关键一步。
“天幕”能够在大模型2.0阶段率先落地,其中的关键主要有两点,一是有强大的研发能力作为支撑,产品确实能打;另外一个则是对应用场景的理解。
研发能力是基础,每个跑出的厂商都有自己的独到之处;“天幕”真正的护城河还是在于万兴科技20多年的出海经验、全球超15亿用户行为的洞察。
一面是对行业痛点的洞察,另一面是对用户需求的响应,双向循环下,“天幕”也就越跑越快。
上文提到的月活大幅增长的万兴播爆就是其中典型。
做跨境业务的企业在开展业务时,经常会要拍摄具有当地特色的营销视频,此时就会遇到外籍演员选择有限、国外取景拍摄沟通执行不便等问题,由此产生制作成本高、时效低的痛点。
万兴播爆/Wondershare Virbo在产品中内置了涵盖不同肤色和人种的超逼真数字人,用户只需要几分钟时间就可以快速生成一条营销视频,其中的数字人AI视频翻译等能力就来自“天幕”。