FunAudioLLM SenseVoice语音转录与CosyVoice语音合成及语音克隆使用案例

news/2024/7/23 16:41:06 标签: asr, tts, stt, 语音合成, 语音识别, ai语音

参考:
https://fun-audio-llm.github.io/
在这里插入图片描述

1、SenseVoice语音转录

在线体验:https://modelscope.cn/studios/iic/CosyVoice-300M
参考:https://github.com/FunAudioLLM/SenseVoice

下载:

pip install -U funasr

在这里插入图片描述
使用:

from funasr import AutoModel

model_dir = "iic/SenseVoiceSmall"

model = AutoModel(model&

http://www.niftyadmin.cn/n/5546680.html

相关文章

C++的模板(十):shared_ptr的上锁问题

CSTL中的智能指针shared_ptr以前没用过,它是不是线程安全过去也没关注过。很多说它是不安全的,也有说是安全的。线程安全的问题,简单测试是测不出,到底怎么样,需要直接看代码。 从代码看,shared_ptr是个简…

Hook 实现 Windows 系统热键屏蔽(二)

目录 前言 一、介绍用户账户控制(UAC) 1.1 什么是 UAC ? 2.2 UAC 运行机制的概述 2.3 分析 UAC 提权参数 二、 NdrAsyncServerCall 函数的分析 2.1 函数声明的解析 2.2 对 Winlogon 的逆向 2.3 对 rpcrt4 的静态分析 2.4 对 rpcrt4…

SRC实战:改个返回包就严重了?

生活就像自行车,要想保持平衡,必须不断前进。—— 爱因斯坦 周一仿佛就是那个提醒你“不能停”的日子,哪怕你的心灵还没准备好继续前进。 0x00 经过长达一天的周末过后,又要开始上班啦。大周一的,还是老样子&#xff…

华为云生态和快速入门

华为云生态 新技术催生新物种,新物种推动新生态 数字技术催生各类运营商去重塑并颠覆各行业的商业模式 从业务层面看,企业始终如一的目标是业务增长和持续盈利,围绕这些目标衍生出提质、增效、降本、安全、创新和合规的业务诉求&#xff0c…

算力狂飙|WAIC 2024上的服务器

7月7日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海落下帷幕。这场备受瞩目的AI盛宴与热辣夏日碰撞,吸引了全球科技、产业及学术界的广泛关注,线下参观人数突破30万人次,线上流量突…

uniapp父页面调用子页面 组件方法记录

文章目录 导文如何点击父页面,触发子页面函数先写一个子页面的基础内容父元素 如何点击父页面,修改子页面的值先写一个子页面的基础内容父元素 导文 如何点击父页面,触发子页面函数? 如何点击父页面,修改子页面的值&am…

C# —— FileStream文件流

一个文件进行读写的时候,会变成一个文件流 FileStream类 输入流 用于从文件进行读取文件 输出流,向文件写入操作 I/O 类就是对应文件的操作的类 I/O类 包含各种不同的类 用于执行各种文件操作,创建文件删…

认识并理解webSocket

今天逛牛客,看到有大佬分享说前端面试的时候遇到了关于webSocket的问题,一看自己都没见过这个知识点,赶紧学习一下,在此记录! WebSocket 是一种网络通信协议,提供了全双工通信渠道,即客户端和服…