V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
yushuxin
V2EX  ›  分享创造

AnyVoice - 3 秒语音即可克隆的任何声音,用你朋友的声音回复她的语音消息

  •  2
     
  •   yushuxin · 44 天前 · 6767 次点击
    这是一个创建于 44 天前的主题,其中的信息可能已经有所发展或是发生改变。

    老铁们好!最近搞了一个 AI 克隆声音产品,只需要 3 秒的原始语音,就可以克隆音色!在这里想跟大家分享一下。

    事情是这样的: 我一个朋友老给我发语音,我想调戏一下她,想着能不能用她自己的声音回复她?正好现在 AI 技术成熟了,我就做了一个,哈哈哈,可好玩了。

    来试试看吧

    https://anyvoice.net/ai-voice-cloning

    是什么让 AnyVoice 与众不同?

    • 只需 3 秒音频就可以复刻! 没错,就是这么简单。你在网页界面里录个"今天天气真好,我们晚上去吃火锅吧"的就够了,随便说点什么都行。网上其他方案动辄要求录音几十句话,谁有耐心啊...

    • 支持中日韩英四种语言:测试下来,中文效果特别自然,连我朋友听到这个声音时,自己都吓傻了,觉得是被电话诈骗了

    实际使用场景分享

    1. 调戏朋友:用朋友的声音,回复她的语音消息。你只需要把她的语音录下来(一般来说一条语音信息是超过 3 秒的吧?),然后在网站里录音,就直接复刻好了。 小窍门:根据我的实战经验,你用两台手机操作比较方便。手机 A 播放朋友声音、手机 B 打开 https://anyvoice.net/ai-voice-cloning 录制和复刻声音;复刻好后,手机 B 播放声音,手机 A 长按微信发送语音,朋友立马吓傻。

    2. 短视频配音:做视频的朋友们应该懂,配音要么找人要么自己来,累。如果从剪映或者其他地方想找一些自己喜欢的声音,往往是收费的。我们主打全免费、任何声音你都可以得到!

    3. 语言学习:把外语课文用自己的声音念出来,感觉特别神奇,激发了不少学习兴趣。

    4. 假装自己会说外语:你用中文录音,复刻自己的声音,装 x 。然后输入英文、日文、韩文,你就可以得到用你的音色说的外文了。

    使用体验

    界面设计得很简洁,就三步:

    1. 上传/录制语音样本( 3-10 秒)
    2. 选择想要生成的文本,每次不超过 200 字符 (毕竟是免费服务,大家请理解,未来如果我做收费版,会加长)
    3. 等待生成(一般几秒钟就好)

    体验地址

    https://anyvoice.net/ai-voice-cloning

    最后

    目前处于公测阶段,完全免费,没有做任何收费功能!欢迎各位 V2EX 的朋友试用反馈。如果觉得好用请帮忙点个赞 ❤️

    有什么建议或者遇到问题都可以在下面留言,我会一一回复。

    89 条回复    2025-02-21 12:06:46 +08:00
    DigitaIOcean
        1
    DigitaIOcean  
       44 天前
    (我有点怕这种技术)
    4BVL25L90W260T9U
        2
    4BVL25L90W260T9U  
       44 天前   ❤️ 3
    不建议提供中文版,更不建议在中文社区宣传。你这个东西万一被诈骗团伙用了,抓不到诈骗分子,还抓不到你吗?分分钟用你的项上人头冒功。
    pol
        3
    pol  
       44 天前
    我很想知道这些是不是套的那种 gpts-vits ,这种东西
    yushuxin
        4
    yushuxin  
    OP
       44 天前
    @pol 类似的,但不是,现在技术都差不多
    yushuxin
        5
    yushuxin  
    OP
       44 天前
    @ospider 谢谢建议,你说得有道理。
    Eddiegaao
        6
    Eddiegaao  
       44 天前
    字符限制太严格了,不够玩,一次只能生成一句话
    sakujo
        7
    sakujo  
       44 天前
    有点意思 玩玩看
    pol
        8
    pol  
       44 天前
    @yushuxin #4 大佬。不会是自己开发的吧
    yushuxin
        9
    yushuxin  
    OP
       44 天前
    @Eddiegaao 是啊,成本有点高,所以做了限制。回头我想想办法。谢谢反馈
    ChefIsAwesome
        10
    ChefIsAwesome  
       44 天前   ❤️ 5
    "妈,我出车祸受伤了,现在在医院,你给我转 5 万。"
    “王会计,你往这个账户打 30 万。”

    这个世界有点疯狂。
    spiffing
        11
    spiffing  
       44 天前
    可别让诈骗团伙看到
    server
        12
    server  
       44 天前
    CosyVoice ?
    RobinzzZ
        13
    RobinzzZ  
       44 天前
    感觉离进去不远了,OP 肉身应该不在国内吧
    sunmacarenas
        14
    sunmacarenas  
       44 天前
    通过免费体验方式,采集声纹?
    rick2c
        15
    rick2c  
       44 天前
    大家防范意识还挺强的,但其实这类的 ai 应用已经一搜一大把了,所以别想太多
    panxi
        16
    panxi  
       44 天前
    你有备案吗? 没有的话请规避钱还没到手,银手镯先到手
    shmilypeter
        17
    shmilypeter  
       44 天前   ❤️ 3
    克隆了前女友的声音。
    哎~
    barantt01
        18
    barantt01  
       44 天前
    @sunmacarenas 细思极恐,但应该不至于哈哈
    zlife116
        19
    zlife116  
       44 天前
    你以为园区的技术人员,都是那里来的?都是我们 v 站的,谢谢你了,技术可以升级了
    idblife
        20
    idblife  
       44 天前
    @shmilypeter
    出息
    yushuxin
        21
    yushuxin  
    OP
       44 天前   ❤️ 1
    @shmilypeter 我隔着屏幕感到了你的心酸
    liqinliqin
        22
    liqinliqin  
       44 天前
    @yushuxin #21 我有订制需求,可以加 V 吗 andy433928
    barantt01
        23
    barantt01  
       44 天前
    想请问一下,这个服务是你自己搭的吗?租的 GPU 吗?
    meeop
        24
    meeop  
       44 天前
    这个技术基本没啥有价值的合法的使用场景
    ixcode
        25
    ixcode  
       44 天前
    @panxi 域名和服务器都在国外的话,不需要备案
    damonzhang
        26
    damonzhang  
       44 天前   ❤️ 1
    有点可怕,用这个过了微信的声音锁验证。。
    guisheng
        27
    guisheng  
       44 天前
    要是能私有部署就好了,好家伙现在还不能泄漏自己的声音了。
    cat
        28
    cat  
       44 天前   ❤️ 2
    @damonzhang 于是楼主也拥有了你的声音……
    woorz
        29
    woorz  
       44 天前 via Android
    @guisheng 自已可部署啊,一大把
    guisheng
        30
    guisheng  
       44 天前 via iPhone
    @woorz 你说的是使用付费的 sdk 套一层么
    securityCoding
        31
    securityCoding  
       44 天前
    @meeop 这个市场已经非常非常卷了,比如阅读类应用
    tangping
        32
    tangping  
       44 天前 via iPhone
    能克隆新闻联播中那个人物的声音吗 狗头🐶
    yushuxin
        33
    yushuxin  
    OP
       44 天前
    @tangping 当然可以啊。你试试看。
    yushuxin
        34
    yushuxin  
    OP
       44 天前
    @damonzhang …… 快收起你的虎狼之词,我感觉,你离踩缝纫机越来越近了 😂
    lwldcr
        35
    lwldcr  
       44 天前
    能提供对方言的支持就好了

    我把父亲生前的语音上传,尝试生成了一个语音,效果感觉还有很大提升空间
    x86
        36
    x86  
       44 天前
    睿声那个平台八成因为克隆这玩意给整治了,维护了 1 个多月
    meeop
        37
    meeop  
       44 天前
    @securityCoding 这类应用的重点在于生成语音,而不是模拟语音呀
    模拟语音,或者说复制某个人的声音,更直白一点,假装某个人的声音说话,通常都不是啥正经用途
    coshawn
        38
    coshawn  
       44 天前 via iPhone
    在 ios17 和 ios18 上面录音,即使允许了 safari 的麦克风权限,录音还是没有声音,导致复制的声音也没有声音。这是为何
    wyman222
        39
    wyman222  
       44 天前
    @yushuxin #5 说实话,不支持中文,我觉得你在国内就不好卖,当然你在国外卖当我没说。 支持中文,你应该添加内容审查,所有敏感词都该限制,打钱,银行卡,账户, 出车祸等等等
    vfx666
        40
    vfx666  
       44 天前 via iPhone
    @yushuxin 楼主可以透露一下用了什么技术吗?
    Kolar
        41
    Kolar  
       44 天前
    就是不知道成本咋样
    Donaldo
        42
    Donaldo  
       44 天前
    @spiffing #11 早就有了
    yushuxin
        43
    yushuxin  
    OP
       43 天前
    @wyman222 有道理
    sublime8
        44
    sublime8  
       43 天前
    之前国内唯一提供音频上传克隆的公司“睿声”目前处于无限期停业整顿状态,其他大大小小的类似服务提供商都只能读固定文本来克隆,就是为了避免克隆其他人的声音
    gletec
        45
    gletec  
       43 天前 via Android
    这很刑,楼主却挺有成就感的
    twinsant
        46
    twinsant  
       43 天前
    Coys? F5 ? GPT-Sovits?
    SaltyMouse
        47
    SaltyMouse  
       43 天前
    vfx666
        48
    vfx666  
       43 天前 via iPhone
    @twinsant 这些工具想要克隆的好最少要几条样本一起训练,他这个就一条音频,效果还是很不错的
    liyafe1997
        49
    liyafe1997  
       43 天前 via Android
    @ospider 要是 op 不在中国/非中国籍呢
    panxi
        50
    panxi  
       43 天前
    @vfx666 #40 开源的主要还是 sovits 和 cosyvoice 吧, 其他的或多或少技术方向和这两个差不多
    Seanfuck
        51
    Seanfuck  
       43 天前
    @twinsant 是 GPT-Sovits 拉
    ZsmHub
        52
    ZsmHub  
       43 天前
    @ospider 完全没必要说这种。工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~
    ZsmHub
        53
    ZsmHub  
       43 天前
    @yushuxin 工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~
    ynwx
        54
    ynwx  
       43 天前
    这个太强了,给楼主点赞
    4BVL25L90W260T9U
        55
    4BVL25L90W260T9U  
       43 天前
    @ZsmHub 不是我担心啊,是有人钳住我们的手脚。我也没说这个东西不好,我是说在国内没法弄。大公司大不了接受下窗口指导下架就行了,或者罚酒三杯,小公司可能就得牢狱之灾了。你搞清楚源头是啥比较好,怼我没用的……
    zbowen66
        56
    zbowen66  
       43 天前
    @spiffing #11 AI 视频诈骗早就有了。
    zhangsimon
        57
    zhangsimon  
       43 天前
    关注了,最近在玩影视配音的恶搞
    在用 GPT-soVoice ,但是太繁琐了
    请问楼主的效果和 GPT-soVoice 比,会更好吗?
    还有就是能模仿语气吗?
    GPT-soVoice 比较烦人的是,不能自定义语气
    如果想要某个语气,就要用某个语气来训练,这样一个人就要训练好几次
    yushuxin
        58
    yushuxin  
    OP
       43 天前
    @ZsmHub 谢谢鼓励
    yushuxin
        59
    yushuxin  
    OP
       43 天前
    @zhangsimon 可以一定程度模仿语气,您可以试试看。每个语气你录几秒钟就行
    nimingyonghu
        60
    nimingyonghu  
       43 天前
    楼上那么多说刑的怎么回事?与技术脱节这么久了?
    各种 XXTTS 都出来多长时间了
    ZsmHub
        61
    ZsmHub  
       43 天前
    @yushuxin 你官网这个字数限制对中文很不友好,一个中文就占了 3 个字符,200 字符最多支持 66 个中文
    zuotun
        62
    zuotun  
       43 天前
    @nimingyonghu #60 那么类似的技术到底有没有先例呢?在特色国是肯定有的而且不止一种技术一个先例。
    cowcomic
        63
    cowcomic  
       43 天前
    这种东西不敢用个人制作的
    dvz
        64
    dvz  
       43 天前
    大佬牛逼,试了一下,跟我九成相似,普通话比我还标准
    nimingyonghu
        65
    nimingyonghu  
       43 天前
    @zuotun #62 太多了,GPT-SoVITS ,GPT-SoVITS ,FireRedTTS ,F5TTS ,CosyVoice
    op 这个就是无法调整任何参数的 WebUI 整合包。
    Jaeger
        66
    Jaeger  
       43 天前
    第一次觉得一项新技术并不是很酷的事
    KimiArthur
        67
    KimiArthur  
       43 天前 via Android
    @yushuxin 感觉怎么保证数据安全,可信计算(用完销毁)是个大头😂
    Fruktozka
        68
    Fruktozka  
       43 天前
    之前做过这一块的调研,睿声已经凉了,微软的 responsible AI 团队对这块也很谨慎
    ZsmHub
        69
    ZsmHub  
       43 天前
    @Fruktozka 在国内做这块技术,就需要投入内容审核的人力,在国外就自由很多。睿声凉就是因为用户乱搞导致的。
    beiguo
        70
    beiguo  
       43 天前
    @nimingyonghu #65 剪映就可以录,但仅限于固定的文本并且需要人脸识别证明是你本人。为什么这么多门槛?就是因为在国内,你不得不这么设计。你说的这么多 TTS 都需要具备一定技术能力的人自己用用。你一旦封装成产品,给大众用,然后发生诈骗案件,你根本跑不了
    sn0wdr1am
        71
    sn0wdr1am  
       43 天前
    你想喝最苦的咖啡了?😅
    nimingyonghu
        72
    nimingyonghu  
       43 天前
    @beiguo #70 op 这个也就是玩票,搞不好一个月之内就打不开了 😅

    关于技术门槛你可以在 B 站搜一下这些 TTS 的教程,里面都有别人做好的整合包,一张 20 系以上的 N 就能本地一键启动开玩了,整合包是没什么门槛的。
    fyq
        73
    fyq  
       43 天前
    @shmilypeter 好汉不提当年勇,好男不提前女友
    lance07
        74
    lance07  
       43 天前
    这也太哈人了, 用户语音特征你拿了直接开盒诈骗怎么搞, 如何让最终用户信任你。。
    xiaohusky
        75
    xiaohusky  
       43 天前 via iPhone
    楼主请问可以透露一下怎么做到的吗?我做视频剪辑有用
    nasa
        76
    nasa  
       43 天前
    我之前用过 https://dash.reecho.ai/overview

    至今还在维护中....
    yushuxin
        77
    yushuxin  
    OP
       43 天前
    @ZsmHub 好的,为了方便大家体验,我放宽了限制: 每次可以生成 200 个中文字,仍然免费! 希望大家玩得开心
    yushuxin
        78
    yushuxin  
    OP
       43 天前
    @nimingyonghu 您向大家教科书级别的演示了什么叫「以小人之心度君子之腹」,相比未来你自己如果有能力做产品的话,你一定会做一款一个月内跑路的产品。
    lthero
        79
    lthero  
       43 天前
    试了下英文输入+英文输出的效果,还是不错的;您是自行训练的模型吗?我有试过 E2-tts 它的效果也挺好的
    TellMeWHY
        80
    TellMeWHY  
       43 天前
    还是可以做中文市场的,仅支持 USDT 充值不就行了(手动摊手)
    再建个 TG 频道,等网站被墙之后,群里告诉我们回家的路
    nimingyonghu
        81
    nimingyonghu  
       42 天前
    @yushuxin #78 误会误会,对你的产品无任何意见。你可以翻一下 [分享创造] 节点下其他的帖子,看看以 web 形式发布的 side project 的平均存活时间,我自己以前是收藏了不少,但是偶尔再翻看的时候很多就打不开了。再加上这个不是多少有点灰色地带游走的意思。
    kios
        82
    kios  
       42 天前
    太刑了
    skyonedot
        83
    skyonedot  
       42 天前
    有意思,蛮不错的。
    yushuxin
        84
    yushuxin  
    OP
       42 天前
    大家太踊跃了,晚上 8 点的时候 GPU 爆炸了,过去 3 个小时使用起来会慢。
    刚才我新增了 GPU 。谢谢大家的支持
    coderwink
        85
    coderwink  
       39 天前
    大佬太强了
    yushuxin
        86
    yushuxin  
    OP
       39 天前
    @coderwink 谢谢支持
    xming
        87
    xming  
       38 天前
    有群吗
    lht1936
        88
    lht1936  
       8 天前
    现在好像不能用了
    yszz
        89
    yszz  
       1 天前
    好像不能用了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1567 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 16:45 · PVG 00:45 · LAX 08:45 · JFK 11:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.