Home 25秒,极速克隆你的声音,逼真,免费!.md
Post
Cancel

25秒,极速克隆你的声音,逼真,免费!.md

大家好,我是长期大量网上冲浪🏄的章北海

继续分享发现的好玩AI项目

25秒,极速克隆你的声音

Fish Audio项目可以线上玩耍了

https://fish.audio/zh-CN/text-to-speech/

先听一下效果

大家可以听一下效果,连口气都有点神似,我测试了很多次,缺点还是蛮明显的:吞字、杂音、电音等等。

吞字我试了,可以通过调整标点符号来缓解。杂音是应该是项目故意加上去的,防止侵权和滥用,这个可以通过音频软件修正。

它内置了很多经典声音可以直接使用,最火热的居然是丁真

也可以上传自己的声音,仅需25秒时长的音频,分分钟就能完成克隆

ChatTTS 稳定音色/区分男女

基于 ChatTTS 的 2000 条音色库 稳定性打分🥇 区分男女年龄👧 支持在线试听🎶

https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker/summary

ChatTTS 资源大全

包括音色,赚钱方法,各种 WebUI 和 API 等。 https://github.com/panyanyany/Awesome-ChatTTS

和 GPT 4o 匹敌 世界上最快的语音机器

能实现500毫秒的语音到语音响应 接近人类对话的自然速度

为达到这种低延迟,开发团队优化了网络架构、AI模型性能和语音处理逻辑。

使用WebRTC网络发送音频,部署了Deepgram的快速转录和语音生成模型,并将所有AI模型在Cerebrium的容器中自托管,以减少延迟。

在线体验:https://fastvoiceagent.cerebrium.ai

一个开源的图片去水印解决方案

一个开源的图片去水印解决方案:Watermark-Removal。

项目基于机器学习的图像修复方法,自动去除图片水印。经处理后的图片,与原图几乎一致。

GitHub:https://github.com/zuruoke/watermark-removal

Google 字体,1644 个字体提供下载

👉 https://fonts.google.com

一些开箱即用的好看的组件

https://cult-ui.com 一些开箱即用的好看的组件,动画都给写好了 😃

ColorfulX

ColorfulX 是一个使用 Metal 实现的工具,用于创建多色渐变。 https://github.com/Lakr233/ColorfulX

非常优雅的Mac屏幕窗口管理软件—— Loop

Loop 是一款 macOS 应用程序,可帮助您简化窗口管理!您可以使用通过简单按键触发的径向菜单轻松选择窗口方向,并根据您的喜好使用个性化的颜色和设置进行自定义。只需单击几下,您就可以轻松移动窗口、调整窗口大小和排列窗口,从而节省您宝贵的时间和精力。

brew install mrkai77/cask/loop 即可安装

浅浅的试了一下, 按下一个键, 之后根据鼠标的方向去放置窗口的逻辑非常优雅

默认的修饰键是左下角的🌐键, 用外接键盘可能就得修改了

如果有学习 SwiftUI 开发的朋友,感觉 Loop 这个软件的代码可能是个不错的学习资源: https://github.com/MrKai77/Loop

This post is licensed under CC BY 4.0 by the author.