深度学习技巧总结

news/2024/7/24 4:58:24 标签: 深度学习, 人工智能

1、监控GPU使用情况

pip install nvitop
nvitop -m full

https://zhuanlan.zhihu.com/p/577533593

2、本地拉取服务器上tensorboard数据并进行可视化显示

https://blog.csdn.net/Thebest_jack/article/details/125609849

3、服务器打不开pycharm软件

在这里插入图片描述
这个是已经有一个软件在运行了,可能的原因是:
远程连接服务器后不是手动退出ide环境,而是远程连接被中断

  • 查看进程 ps u
  • 关闭进程 kill -9 PID
  • 重启软件 ./pycharm.sh(或sh pycharm.sh)

4、通过sftp在两台服务器上互传数据

连接登录:

sftp -o port=xxxx username@remote_ip

这里port感觉可以随便填,我一般都填22
username指的是你要远程连接对方服务器的用户名,remote_ip是要远程连接对方服务器的IP地址
上传文件

sftp> lcd /www/wwwroot
sftp> put study.log /www/server

lcd是进入你自己的文件夹,我理解是local cd 命令,如果要操作对方服务器直接用常用的linux命令即可,如果需要对本机服务器操作,一般是l+指令

上传文件夹

sftp> put -r test /www/server

下载

#下载文件
sftp> get /www/server/study.log /www
#下载文件夹
sftp> get -r /www/server/test /www

退出传输模式

sftp> exit

参考:https://www.cnblogs.com/lsr-mark/p/15672002.html

5、添加参数–deterministic后出错

RuntimeError: Deterministic behavior was enabled with either
torch.use_deterministic_algorithms(True) or
at::Context::setDeterministicAlgorithms(true), but this operation is
not deterministic because it uses CuBLAS and you have CUDA >= 10.2. To
enable deterministic behavior in this case, you must set an
environment variable before running your PyTorch application:
CUBLAS_WORKSPACE_CONFIG=:4096:8 or CUBLAS_WORKSPACE_CONFIG=:16:8. For
more information, go to
https://docs.nvidia.com/cuda/cublas/index.html#cublasApi_reproducibility

解决办法,在
torch.use_deterministic_algorithms(True)前加上这一句

os.environ['CUBLAS_WORKSPACE_CONFIG']=':16:8'    

os.environ['CUBLAS_WORKSPACE_CONFIG']=':4096:8'

即可


http://www.niftyadmin.cn/n/5427945.html

相关文章

中国城市力量图鉴:26个万亿城市主导产业一览及产业图谱下载指南!

官.网地址:合合TextIn - 合合信息旗下OCR云服务产品 随着2023年中国大陆地区31个省市自治区GDP的公布,有26座城市迈入了“万亿GDP俱乐部”。 那么,这26城凭什么能“跑赢”全国?据合肥日报统计,在这26座万亿城市的开年…

关于Python除法保留小数点那点事

背景: 现在有一组数据,需要对相除后的结果进行百分化,百分化后的数字保留一位小数,比如99.9%这种,那么就会有一些数据需要处理,比如 5/90.55555... 现在需要变成 55.5 方法一:使用round方式&am…

python 实现阿里云OSS文件上传

因为我们出口的带宽限制,测试经常找我给他上传个包到阿里云的对象存储,虽然传起来也不是很费事,但是出于运维的职业素养,特意写了一个自动上传的接口,代码如下: # -*- coding: UTF-8 -*- from flask imp…

分布式一致性算法

在分布式系统中,确保数据在不同节点之间保持一致性是一项至关重要的任务。由于网络延迟、节点故障和并发操作等因素的存在,实现这一目标变得尤为复杂。为了解决这个问题,业界提出了一系列分布式一致性算法。本文将深入剖析这些算法的原理&…

Web举例:VXLAN在数据中心中的应用——华为配置

Web举例:VXLAN在数据中心中的应用 VXLAN特性在数据中心组网中经常和双机热备、虚拟系统以及NAT等特性一起使用。 组网需求 如图1所示,在数据中心中,同一个VPC(Virtual Private Cloud)的VM(虚拟主机&#…

Uni-app跟学笔记(三):样式、Vue基础、请求、数据缓存

Uni-app跟学笔记(三):样式、Vue基础、请求、数据缓存 文章目录 Uni-app跟学笔记(三):样式、Vue基础、请求、数据缓存1)样式2)vue基础1:数据绑定2:v-bind 动态…

SRTT-220VDC-2H2D通电延时继电器1-999S工作电压220VDC JOSEF约瑟

系列型号: SRTT-24VDC-2H2D-A通电延时继电器;SRTT-24VDC-2H2D-B通电延时继电器; SRTT-24VDC-2H2D-C通电延时继电器;SRTT-24VDC-2H2D-D通电延时继电器; SRTT-110VDC-2H2D-A通电延时继电器;SRTT-110VDC-2H2D-…

源聚达科技:抖音今年开店有没有什么新政策

随着电商行业的蓬勃发展,抖音平台作为新兴的社交电商平台,近年来推出了多项新政策以吸引商家入驻,提升用户体验。今年,抖音在开店政策上又有了新的调整和优化,这些变化对于商家来说无疑是重要的风向标。 最新的政策中&…