| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

黄页/二手

旅游

把国产剧卖到非洲,80后小伙冲进福布斯榜

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
回到2021年,趣丸内部讨论过后,成立了一个叫“X”的项目组。宋克说,这是个探索技术的团队,对他们没有KPI及任何的考核,也不设置盈利目标,任务只是去调研市场上最新的技术,项目组有十几个人,“不能说是技术很牛的人,但一定是对技术很有兴趣和追求的人”。


宋克的想法是,既然用户的需求已经被解决了,那么趣丸能做的,是找到新的技术再“反攻”。这表明,趣丸针对的还是“老的”互联网市场,只是在探索过程中,发现一些需求只能由AI来满足,或者AI能够更好地满足。

2021年,OpenAI的GPT-3已经震惊AI圈内,但大模型还不是一门显学。趣丸一开始的探索,也不是冲着AI去的。




OpenAI的GPT-4o模型评估

“大事都是从一个很小的点开始。”宋克说。趣丸拿住了语音赛道,但短视频明显正在升温,宋克想到,很多声音好听的人,不一定希望以真人形象出镜,“我们当时想到直播时,把主播的脸换成动漫脸这样的技术”。2021年、2022年,“换脸”还不像今天这样普遍。

但是技术攻克下来,产品上线以后,用户不买账。用户会觉得,换脸的主播一定不好看,不然为什么换脸呢?于是,这项技术就被搁置起来。

2023年,元宇宙爆火,让宋克灵光一闪。元宇宙打造的“数字孪生”,把真人数字化,实质也是换脸,只不过是把真人脸换成同一张数字人脸。“我们储备好了这项能力,甚至所有工程都不用再开发。”宋克说,于是趣丸快速切入,成为美团数字人直播的第一家技术提供商。


入局以后,关于声音的技术问题自然浮出。

数字人直播早期,可选音色少,语音复制也很粗糙,更关键的是,虚拟的声音“机器味”太重,“说话没有人味”,观众自然不爱看。




数字人直播早期并不受欢迎

此时,大模型已凭借对自然语言的理解能力大为火热,宋克想到,越过“恐怖谷”的最好办法,可能是将大模型对文本的理解与输出能力,平移到语音领域。

这就是趣丸“音频大模型”MaskGCT的序章,也是趣丸转型AI的脉络。如今的X项目组改名为人工智能事业部。宋克在采访中一直强调,趣丸不是为了AI而AI,而是在发现用户需求与解决问题的逻辑下,顺其自然。

AI前后,同与不同

宋克还记得ChatGPT带来的震撼,它把AI分出前后两个时代。趣丸最开始做数字人的时候,用的是传统建模技术,“特别麻烦”。宋克说,过程中用到很多相机,对一个人拍个半天,这人还要说很多的话,才能做出来。
点个赞吧!您的鼓励让我们进步     这条新闻还没有人评论喔,等着您的高见呢
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0325 秒 and 5 DB Queries in 0.0024 秒