2025-08-14
数据处理
00

在日常的开发和运维工作中,我们经常需要传输大量文件。当传输单个大文件时,网络带宽通常能被充分利用,速度令人满意。然而,一旦面对成千上万个小文件,传输速度便会急剧下降,令人抓狂。这背后的原因在于,每次文件传输都伴随着网络连接建立、元数据读写等额外开销。对于小文件而言,这些固定开销所占比例远超实际数据传输的时间. 本文参考美团技术团队的博客:https://tech.meituan.com/2021/01/07/pack-gzip-zstd-lz4.html 选择isa-l算法和Pigz算法进行测试。

2025-08-13
计算机网络
00

有时候服务器没有安装显示器,无法提供ui界面,想要使用mihomo,就必须通过命令行操作,以下是具体教程:

2025-08-13
环境配置
00

在使用 Docker 的过程中,从 Docker Hub 拉取镜像是我们日常操作的一部分。然而,由于网络环境的复杂性,我们常常会遇到镜像拉取速度缓慢,甚至因网络波动导致下载中断的问题。这篇博客将为你详细介绍如何通过更换国内镜像源来加速 Docker 镜像的拉取,并探讨在遇到下载中断时如何实现类似“断点续传”的效果。

2025-08-12
环境配置
00

对于在Ubuntu系统上进行深度学习、科学计算或任何需要GPU加速的任务,正确安装NVIDIA显卡驱动、CUDA Toolkit和cuDNN是至关重要的第一步。本教程将为您提供一个详尽的、逐步的指南,在Ubuntu系统上顺利完成安装。

2025-08-06
算法
00

深入浅出:解密GPT-2,从模型结构到源码实现

在人工智能的星辰大海中,GPT-2(Generative Pre-trained Transformer 2)无疑是一座耀眼的灯塔。它的出现,标志着自然语言生成技术的一次重大飞跃,也为我们今天所熟知的ChatGPT等大型语言模型奠定了坚实的基础。

尽管GPT2推出的时间在2019年,截止目前已经过去了6年了。但是其对于理解transformer和大语言模型具备一定意义。本文将详细的讲解GPT2的模型结构和代码实现,尽管GPT2与现代大模型的结构存在很大差异,但是作为初学者的一个学习样本依旧足够。