网站首页 > 编程文章 正文
环境:
centos7.8
python3.8
vllm0.5.5
显卡Quadro RTX 6000
驱动NVIDIA-SMI 570.124.04 Driver Version: 570.124.04
cuda版本为 Cuda compilation tools, release 12.4, V12.4.131
通过ollama安装
用docker安装ollama比较顺利
docker pull registry.cn-hangzhou.aliyuncs.com/zrng/ollama:0.4.6
docker run -d -v ollamagpu:/root/.ollamagpu -e OLLAMA_HOST=0.0.0.0 -e OLLAMA_ORIGINS=* --gpus all --ulimit memlock=-1 --ulimit stack=67108864 \ -v /usr/lib/x86_64-linux-gnu/libcuda.so:/usr/lib/x86_64-linux-gnu/libcuda.so -p 11435:11434 --name ollamagpu registry.cn-hangzhou.aliyuncs.com/zrng/ollama:0.4.6
docker exec -it ollamagpu ollama run deepseek-r1:32b
通过vllm安装
安装一定要注意python、cuda、驱动、vllm、pytorch版本要匹配!!!
vllm serve /home/admin/deepseek/modles/DeepSeek-R1-Distill-Qwen-7B --host=0.0.0.0 --port=8000 --trust-remote-code --max-model-len=8172 --block-size=8 --gpu-memory-utilization=0.75 --swap-space=4 --max-num-seqs=2 --dtype=half --max-parallel-loading-workers=1
vllm跑14b就报显存溢出了。
curl测试
curl http://localhost:8000/v1/completions -H "Content-Type: application/json" -d '{
"model": "/home/admin/deepseek/modles/DeepSeek-R1-Distill-Qwen-7B",
"prompt": "Hello!",
"max_tokens": 50
}'
curl -X POST http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "/home/admin/deepseek/modles/DeepSeek-R1-Distill-Qwen-7B",
"messages": [
{"role": "user", "content": "用一句话解释量子计算"}
]
}'
chatbox测试
使用jmeter做一下压力测试
猜你喜欢
- 2025-04-09 centos安装(centos安装磁盘分区)
- 2025-04-09 CentOS 7 目录介绍(centos设置目录权限)
- 2025-04-09 centos7上安装python3(centos6安装python3.7)
- 2025-04-09 如何在centos7中搭建 ISCSI 服务(centos7配置iscsi服务)
- 2025-04-09 CentOS 7从零开始:2、网络设置与安装
- 2025-04-09 VMware Workstation Pro安装CentOS7(二)
你 发表评论:
欢迎- 05-142014年最流行前端开发框架对比评测
- 05-14七爪源码:如何使用 Next.js 构建 Shopify 店面
- 05-14Web 前端怎样入门?
- 05-14我为什么不建议你使用框架
- 05-14推荐几个好用的React UI 框架
- 05-14PDFsharp:强大的 .NET 跨平台 PDF 处理库
- 05-14一组开源免费的Web动画图标,荐给需要的设计师和程序员
- 05-14salesforce 零基础学习(二十九)Record Types简单介绍
- 最近发表
- 标签列表
-
- spire.doc (59)
- system.data.oracleclient (61)
- 按键小精灵源码提取 (66)
- pyqt5designer教程 (65)
- 联想刷bios工具 (66)
- c#源码 (64)
- graphics.h头文件 (62)
- mysqldump下载 (66)
- sqljdbc4.jar下载 (56)
- libmp3lame (60)
- maven3.3.9 (63)
- 二调符号库 (57)
- 苹果ios字体下载 (56)
- git.exe下载 (68)
- diskgenius_winpe (72)
- pythoncrc16 (57)
- solidworks宏文件下载 (59)
- qt帮助文档中文版 (73)
- satacontroller (66)
- hgcad (64)
- bootimg.exe (69)
- android-gif-drawable (62)
- axure9元件库免费下载 (57)
- libmysqlclient.so.18 (58)
- springbootdemo (64)
本文暂时没有评论,来添加一个吧(●'◡'●)