Felix的个人博客

基于深度学习的端到端的文字识别 CRNN

在 CRNN 的网络结构中包含了三个组成部分，分别为卷积层，循环层和转录层，而至关重要的是转录层。在转录层中不得不提的便是 CTC 算法，文中也知识对 CTC 算法做了简要的概述，通过实验过程，可以发现，在具体的实现的过程中仍然存在很多的 tricks，但不得不提的是，模型的大小确实很小。不得不让人惊叹如此小的模型能有如此的效果。

发布博客 2025-06-21 16:30:53

93 次阅读

OpenCV，PIL，Tensor 及 Base64 之间的格式转化

在做图像相关的应用时，在 Python 环境下通常会使用到 OpenCV，PIL，PyTorch 等库，这些库在读取到图像时，涉及到的存储格式也会有所不同。

发布博客 2025-06-08 21:44:08

221 次阅读

使用自己的数据 Finetune TorchVision 中的 Faster R-CNN

文章主要是基于 TorchVision 中的 fasterrcnn_resnet50_fpn 模型，在新的数据集上 Finetune，完成基本的 Fast R-CNN 在口罩检测任务上的实践，这其中只是对 Faster R-CNN 的原理有粗略的涉及，要想理解其中的具体过程，还需要对其源代码做详细的理解。

发布博客 2025-06-04 23:57:19

216 次阅读

深入理解全卷积网络 FCN

全卷积网络（Fully Convolutional Networks，FCN）是 Jonathan Long 等人于 2015 年提出，也是首个基于卷积神经网络的图像语义分割的方案，实现了由卷积网络实现的端到端的图像语义分割。

发布博客 2025-05-28 22:41:37

293 次阅读

深入理解 U-Net 网络

U-Net 网络的基本原理以及 PyTorch 实现

发布博客 2025-05-25 23:58:20

311 次阅读

Uvicorn 原理及源码分析

Uvicorn 是一个基于 ASGI（Asynchronous Server Gateway Interface）的轻量级 Web 服务器，专为异步 Web 应用程序而设计。