Skip to content

Index

如何在墙内快速部署 CentOS 7 的 MySQL

MySQL 被 Oracle 收购后,CentOS 的镜像仓库中提供的默认的数据库也变为了 MariaDB,所以默认没有 MySQL,需要手动安装。

其实安装 MySQL 也并不是一件很难的事情,但是由于一些实际存在的问题 (比如某墙),让默认通过 yum 安装 MySQL 的速度太慢。这里提出一种可行的方案来快速部署 MySQL,此方案同样适用于其他 rpm 包软件的手动安装。

本文实际在讲的是,如何利用各种手段,加速和改善 yum 的安装过程。

(BP 算法)Feed forward neural network and back propagation

AI Generated Abstract

本文介绍了 BP 算法(反向传播算法)的基本原理及其在神经网络中的应用。内容包括神经元结构、网络结构、损失函数的定义与计算,以及 BP 算法的数学推导和实现过程。最后,通过一个简单的 3 隐层神经网络实现,展示了 BP 算法在手写数字分类任务中的实际应用。

Distributed Tensorflow

AI Generated Abstract

本文介绍了 TensorFlow 的分布式计算方法,包括单机和多机场景下的配置与优化。在单机模式中,讲解了如何通过 log_device_placement 参数查看设备分配、使用 tf.device 指定设备,以及通过设置 CUDA_VISIBLE_DEVICES 环境变量优化显存使用。在多机模式中,分析了 In-graph 和 Between-graph 两种分布式训练模式的特点及应用场景。

Quick Guide to CUDA Profiling

在并行计算领域,很难通过纯理论的分析来确定程序的性能,GPGPU这种基于特定计算架构的计算任务更甚。事实上,很多制约并行算法性能的瓶颈很可能不在算法本身(比如资源调度障碍)。因此,对给定程序进行充分的性能测试与后续分析是相当必要的调优方法。

Nvidia提供了nvprofnvvpNsight三种 cuda 可用的性能分析工具,本文将简述配合使用nvprofnvvp的 cuda 程序性能分析方法。

CUDA 内存管理总结 (一)

AI Generated Abstract

本篇博客总结了 CUDA 内存管理中的寄存器和共享内存的基本概念、优化方式及其在 GPU 编程中的应用。通过对寄存器映射方式、共享内存的存储体架构以及优化策略的详细分析,结合归并排序的示例代码,展示了如何利用共享内存和寄存器提升 GPU 程序性能。此外,文章还探讨了 atomicMin 函数、并行归约以及混合算法在共享内存优化中的实际应用,为 CUDA 编程提供了实用的优化思路。

浙江大学超算队博客...活了?

这里是浙江大学超算队的官方博客

记录一些前沿的 Tech 姿势、大家平时的 DeBug 经历、还有 ASC 世界超算大赛的经验分享!

希望这个博客不仅仅是给以后的小盆友们提供宝贵的经验 更是诸君技术的记录与提升的大好机会

平时我们写着代码 总是不愿意写文档 遇到了非常 Tricky 又神奇的 Bug 花了一下午终于解决了 却没有记录下来

很有可能很多的无谓的时间就会在以后被重复 这样的时间浪费 我们完全可以节省下来!

希望大家能享受在超算队一起学习的时光~ 从现在开始 把这段美好的时间变成字符 记录下来叭~~