深度学习笔记

白天 夜间 首页 下载 阅读记录
  我的书签   添加书签   移除书签

语音增强(去噪)

浏览 136 扫码 分享 2023-02-18 14:03:55
  • 传统方法
    • 谱减法
    • 为纳滤波
  • 基于深度学习
    • FullSubNet

    传统方法

    谱减法

    为纳滤波

    基于深度学习

    FullSubNet

    InterSpeech 2020 / ICASSP 2021

    论文地址:https://arxiv.org/pdf/2010.15508.pdf 可用项目:https://github.com/haoxiangsnr/FullSubNet

    开源项目直接可以用于语音去噪,及其方便!

    若有收获,就点个赞吧

    0 人点赞

    上一篇:
    下一篇:
    • 书签
    • 添加书签 移除书签
    • vim
      • vim 常用命令
      • vim 插件
    • 神经退行性疾病语言分析
    • 周志华-机器学习
      • 概率图模型
    • 算法导论
      • 数字分裂证明
      • 字符串
    • 传统CV
      • 插值算法(几何变换)
      • 特征提取
        • HOG(Histograms of Oriented Gradient)_2005_CVPR
      • 成像原理
        • 张正友标定
        • PPM图像格式
        • 坐标系
      • 图像运动模糊去除
        • 几个重要问题
        • 基于倒频谱的匀速直线运动模糊去除
        • High-quality Motion Deblurring from a Single Image_2008
    • 基础知识
      • 信息论
        • 信息相关
      • 语音分析
        • 语音识别简介
      • 数字图像处理
        • 图像的仿射变换
        • 图像复原
        • 频域图像增强
        • 图像双线性插值
        • 空间域图像增强
      • 数据处理方法总结
      • Pytorch框架
        • pytorch问题总结
          • inplace 操作问题
          • 如何使得每个epoch需要dataloader不同
          • cuda相关
        • pytorch常用库
          • nn.Module
          • nn库
          • torch库
            • torch.sparse
            • torch.einsum()
            • torch.autograd
        • pytorch实现常用操作
          • Pytorch matrix reshape
          • 数据增强
          • Pytorch可视化
          • 模型截取
            • 模型初始化
          • Pytorch模型移植
          • 混合精度训练
          • GPU训练模型转到CPU
      • Python库
        • Python图像处理
          • cv2
          • Image库
          • 图片数据处理
          • python-opencv
        • Python数组
          • numpy库
            • numpy图像处理
            • numpy总结
          • 数组操作
        • 其它库
          • Python 数据分析图
          • Python 处理 Excel 文件
          • Python网站开发
            • Tornado
          • python注意事项
          • python实现常见功能
            • python文件读取
            • list索引
            • Python时序分析
            • python实现多位数字递增编号
          • python常用库
            • EasyDict
            • Path
            • glob
            • sys
            • argparse
            • OS库
            • random库
            • shutil
          • Python内置函数
          • lambda表达式
          • 好代码学习
          • Python高阶
      • 深度学习基本概念解释
        • 重学深度学习
          • 动手学深度学习
        • 模型训练
          • 模型调优
        • 数据篇
          • K折交叉验证
          • 数据归一化
        • 网络原理篇
          • 模型融合
          • 网络权值初始化
            • 网络权值初始化
          • 正则化
          • 优化算法
          • 自动求导
          • 卷积操作
          • 常见损失函数
        • 模型分类篇
          • DNN、CNN and RNN
        • 效果评价篇
          • 模型表现分析
          • IOU、AUC、ROC
          • 混淆矩阵
        • 模型常见问题
          • 结果可重复
          • Domain Shift
        • 网络理解篇
          • 卷积神经网络结构解释
          • 待补充...网络可视化分析
        • 模型超参数
    • 计算机基础
      • pip 装包
      • Orange Pi 文件保存
      • Ubuntu 网络设置
      • 通过 FTP 服务器实现程序的远程更新
      • Windows 设置 FTP 服务器
      • Ubuntu firefox 浏览器开机启动
      • Linux 开机自启动脚本
      • 网络技术
      • 通过无线网卡以及网线实现网络的共享
      • Windows系统利用linux命令
      • 操作系统
      • Linux命令
    • 优化理论基础
      • 线性优化
    • 论文&概念
      • 新的趋势
        • 深度学习趋势
      • 语音分析
        • audio classification
          • [2021] PaSST: Efficient Training of Audio Transformers with Patchout
        • NLP 技术
          • Wav2vec
          • 多模态论文
          • 语音模型
          • 文本语音预处理
          • 序列模型
        • 梅尔对数谱图
        • 语音增强(去噪)
        • 传统语音信号处理方法
        • transformer简介
        • 2015_A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification
        • OpenSMILE 进行语言特征提取
        • Parallel Representation Learning for the Classification of Pathological Speech
      • 模型调优
        • TODO_2016_On Calibration of Modern Neural Networks
        • TODO_2017_Bag of Tricks for Image Classification with Convolutional Neural Networks
        • TODO_2020_ICML_Do We Need Zero Training Loss After Achieving Zero Training Error?
        • TODO_2017_focal loss
      • Transformer
        • Vision Transformer
        • transformer简化
        • 原始Transformer
      • 常用数据集
        • 常用数据集
      • GAN系列
        • 2021 Generative Adversarial Graph Convolutional Networks for Human Action Synthesis
        • 条件变分自编码器(CVAE)
        • 2014Generative Adversarial Nets
      • 语义分割&实例分割
        • ICLR_2015_Deeplab
        • U-Net_2015MICCAI
        • FCN_2015CVPR
        • BlendMask_2020CVPR
      • 经典网络
        • Deconvolution_2011ICCV
        • AlexNet_2012
        • Network in Network_2013
        • VGG_2014ILSVRC
        • GoogLeNet_2014
        • GoogLeNet_V2_2015
        • ResNet_2016CVPR
        • UberNet_2017CVPR
      • CV领域注意力机制
        • 2018 CVPR Non-local neural network
        • GSoP-Net_2018
        • CBAM(Convolutional Block Attention Module)_2018ECCV
        • SE-Net_2017
      • 理解卷积网络
        • BN-待补充
        • 深度学习优劣势
        • 可视化及理解卷积网络_2013
      • 深度学习技巧
        • 深度学习常用网络设计技巧
      • 视频分析
        • 一些 Tricks
        • 三维卷积法
          • Learning spatiotemporal features with 3d convolutional networks_2015ICCV
          • C3D-2013ICML
        • 双流法
          • Two-Stream Convolutional Networks for Action Recognition in Videos_2014NIPS
          • Temporal Segment Networks_2016ECCV
        • 图卷积
          • SGN
          • HCN
          • 图卷积动作识别总结
          • 2020_CVPR Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition
          • ICCV 2021 Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action Recognition
          • 2019 CVPR Two-Stream Adaptive Graph Convolution Networks for Human Action Recognition
          • TODO_2020_Shift_GCN
          • AS-GCN_2019CVPR
          • St-gcn_2018AAAI
          • GCN
          • Graph U-Nets_ICML2019
          • HOPE-Net: A Graph-based Model for Hand-Object Pose Estimation_2020CVPR
          • STSGCN_2020AAAI
        • Action Detection
          • Action Recognition VS Action Detection
        • 3D skeleton-based human action classification: A survey-2016
        • X3D:Expanding Architectures for Efficient Video Recognition_2020CVPR
        • 光流法
        • Large-scale Video Classification with Convolutional Neural Networks_2014CVPR
        • Compositional Action Recognition with Spatial-Temporal Interaction Networks_CVPR_2020
      • 目标跟踪
        • DeepSort
      • 目标检测
        • Fast R-CNN_2015ICCV
        • Faster R-CNN_2017IEEE
        • R-CNN_2014CVPR
        • YOLO Algorithm_2016CVPR
        • yolov2_2017IEEE
        • yolov3
      • 少样本学习
        • Improved Few-Shot Visual Classification
      • 人体姿态估计
        • 2D人体姿态估计
          • 单人人体姿态估计
            • 2014_MoDeep: A Deep Learning Framework Using Motion Features for Human Pose Estimation
            • 2014_Articulated Pose Estimation by a Graphical Model with Image Dependent Pairwise Relations
            • 2014_Joint Training of a Convolutional Network and a Graphical Model for Human Pose Estimation
            • DeepPose_2014_CVPR
            • 2015_CVPR_Efficient Object Localization Using Convolutional Networks
            • IEF_2016_CVPR
            • 2016_CVPR_CPM
            • ECCV_2016_Stacked Hourglass Network
          • 多人人体姿态估计
            • 2016ECCV_DeeperCut
            • 2016CVPR_DeepCut
            • 2017_CVPR_Towards Accurate Multi-person Pose Estimation in the Wild
            • OpenPose_2017CVPR
            • AlphaPose_2017ICCV
            • 2018_CVPR_Cascaded Pyramid Network for Multi-Person Pose Estimation
            • 2018_Simple Baselines for Human Pose Estimation and Tracking
            • 2021_Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression
          • 2D人体姿态估计总结
          • 各种方法的特点
          • 《基于深度学习的人体姿态估计方法综述》
          • MPII_2014_CVPR
          • HRNet
          • TODO_2021_Deep Learning-Based Human Pose Estimation:A Survey
        • 3D人体姿态估计
          • 基于深度图
            • 2019_ICCV_A2J: Anchor-to-Joint Regression Network for 3D Articulated Pose Estimation from a Single Depth Image
            • Real-Time Human Pose Recognition in Parts from Single Depth Images_2011_CVPR
            • Towards Viewpoint Invariant 3D Human Pose Estimation_2016_eccv
            • V2V-PoseNet_CVPR_2018
          • 基于单帧RGB
            • TODO_LCR-Net : Multi-person 2D and 3D Pose Detection in Natural Images
            • TODO_2016_Deeper Depth Prediction with Fully Convolutional Residual Networks
            • TODO_Camera Distance-aware Top-down Approach for 3D Multi-person Pose Estimation from a Single RGB Image
          • 基于视频序列
            • CVPR2019_3D human pose estimation in video with temporal convolutions and semi-supervised training
          • 3D 人体姿态估计总结
          • 基于单目RGB摄像头的3维人体姿态估计
          • 基于深度图3维人体姿态估计经典算法
          • 3D人体姿态估计综述
      • 其它
        • [2022] Equalization Loss for Long-Tailed Object Recognition
        • Tricks
        • TODO_Non-local Neural Networks
        • TODO_2018_CVPR_MegaDepth
        • 1989_TDNN
        • TODO_2018_TCN
        • 2018_IJCAI_STGCN-Traffic frocasting
    • C 学习笔记
      • 学习C 之前
        • 几个常用名词解释
        • 编译工具
        • C 代码编写与编译
        • VS Code C 编译
        • 预处理器编译指令
        • C 数据类型
        • 输入输出
        • 指针和自由存储空间
        • 一个案例看C 类
      • 开始学习C
        • OpenCV学习记录
        • 函数----C 编程模块
        • 函数探幽
        • 内存模型和名称空间
        • 对象和类
        • 使用类
    • Git版本管理
      • Git 简单命令
    • 其它
      • 网站推荐
      • 草稿本
    暂无相关搜索结果!

      让时间为你证明

      展开/收起文章目录

      分享,让知识传承更久远

      文章二维码

      手机扫一扫,轻松掌上读

      文档下载

      请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
      PDF文档 EPUB文档 MOBI文档

      书签列表

        阅读记录

        阅读进度: 0.00% ( 0/0 ) 重置阅读进度

          思维导图备注