大家好,我是长期大量网上冲浪🏄的章北海
继续分享发现的好玩AI项目
25秒,极速克隆你的声音
Fish Audio项目可以线上玩耍了
https://fish.audio/zh-CN/text-to-speech/
先听一下效果
大家可以听一下效果,连口气都有点神似,我测试了很多次,缺点还是蛮明显的:吞字、杂音、电音等等。
吞字我试了,可以通过调整标点符号来缓解。杂音是应该是项目故意加上去的,防止侵权和滥用,这个可以通过音频软件修正。
它内置了很多经典声音可以直接使用,最火热的居然是丁真
也可以上传自己的声音,仅需25秒时长的音频,分分钟就能完成克隆
ChatTTS 稳定音色/区分男女
基于 ChatTTS 的 2000 条音色库 稳定性打分🥇 区分男女年龄👧 支持在线试听🎶
https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker/summary
ChatTTS 资源大全
包括音色,赚钱方法,各种 WebUI 和 API 等。 https://github.com/panyanyany/Awesome-ChatTTS
和 GPT 4o 匹敌 世界上最快的语音机器
能实现500毫秒的语音到语音响应 接近人类对话的自然速度
为达到这种低延迟,开发团队优化了网络架构、AI模型性能和语音处理逻辑。
使用WebRTC网络发送音频,部署了Deepgram的快速转录和语音生成模型,并将所有AI模型在Cerebrium的容器中自托管,以减少延迟。
在线体验:https://fastvoiceagent.cerebrium.ai
一个开源的图片去水印解决方案
一个开源的图片去水印解决方案:Watermark-Removal。
项目基于机器学习的图像修复方法,自动去除图片水印。经处理后的图片,与原图几乎一致。
GitHub:https://github.com/zuruoke/watermark-removal
Google 字体,1644 个字体提供下载
👉 https://fonts.google.com
一些开箱即用的好看的组件
https://cult-ui.com
一些开箱即用的好看的组件,动画都给写好了 😃
ColorfulX
ColorfulX 是一个使用 Metal 实现的工具,用于创建多色渐变。
https://github.com/Lakr233/ColorfulX
非常优雅的Mac屏幕窗口管理软件—— Loop
Loop 是一款 macOS 应用程序,可帮助您简化窗口管理!您可以使用通过简单按键触发的径向菜单轻松选择窗口方向,并根据您的喜好使用个性化的颜色和设置进行自定义。只需单击几下,您就可以轻松移动窗口、调整窗口大小和排列窗口,从而节省您宝贵的时间和精力。
brew install mrkai77/cask/loop 即可安装
浅浅的试了一下, 按下一个键, 之后根据鼠标的方向去放置窗口的逻辑非常优雅
默认的修饰键是左下角的🌐键, 用外接键盘可能就得修改了
如果有学习 SwiftUI 开发的朋友,感觉 Loop 这个软件的代码可能是个不错的学习资源: https://github.com/MrKai77/Loop